Восприятие высоты звука

Высота и частота. Когда мы слышим чистый тон, то воспринимаем не только его громкость, но и высоту. Подобно тому как цвет — главное качество света, так и высота — главное качество звука, ранжированного по шкале от низкого до высокого. И подобно тому как цвет определяется частотой света, высота определяется частотой звука. При возрастании частоты высота увеличивается. Как и длину световой волны, частоту звука человек различает очень хорошо. Молодой взрослый может слышать частоты в диапазоне от 20 до 20 000 герц (колебаний в секунду), причем ЕЗР составляет менее 1 герца при частоте 100 герц и возрастает до 100 герц при 10 килогерцах.

Однако в слуховом восприятии нет ничего похожего на смешение цветов. Когда две и более частот звучат одновременно, можно слышать высоту каждой частоты при условии, что они достаточно различаются. Если частоты различаются несильно, ощущение будет более сложным, но все равно звук не будет похож на один чистый тон. При изучении цветового восприятия обнаружение того факта, что смешение трех цветных источников света дает ощущение одного цвета, привело к идее о трех типах рецепторов. Отсутствие аналогичного явления в слуховом восприятии позволяет предположить, что если есть рецепторы, настроенные на различные частоты, то типов таких рецепторов должно быть множество.

Теории восприятия высоты звука. Как и в случае цветового зрения, для объяснения того, как частота кодируется ухом в высоту звука, были предложены две теории.

Первая теория была создана британским физиком Резерфордом в 1886 году. Он предположил, что: а) звуковая волна заставляет вибрировать всю базилярную мембрану и частота вибраций соответствует частоте звука; б) частота вибраций мембраны задает частоту нервных импульсов, передаваемых по слуховому нерву. Так, тон частотой 1000 герц заставляет базилярную мембрану вибрировать 1000 раз в секунду, в результате чего волокна слухового нерва разряжаются с частотой 1000 импульсов в секунду, а мозг интерпретирует это как определенную высоту. Поскольку в этой теории предполагается, что высота зависит от изменений звука во времени, ее назвали временной теорией (ее называют также частотной теорией).

Гипотеза Резерфорда вскоре встретилась с серьезными проблемами. Было доказано, что нервные волокна могут передавать не более 1000 импульсов в секунду, и тогда неясно, как человек воспринимает высоту тона с частотой более 1000 герц. Вивер (Weaver, 1949) предложил способ спасения временной теории. Он предположил, что частоты выше 1000 герц кодируются различными группами нервных волокон, каждая из которых активируется в несколько разном темпе. Если, например, одна группа нейронов выдает 1000 импульсов в секунду, а затем 1 миллисекунду спустя другая группа нейронов начинает выдавать 1000 импульсов в секунду, то комбинация импульсов этих двух групп даст 2000 импульсов в секунду. Эту версию временной теории подкрепило открытие, что паттерн нервных импульсов в слуховом нерве повторяет форму волны стимульного тона, несмотря на то, что отдельные клетки реагируют не на каждое колебание (Rose et al., 1967).

Однако способность нервных волокон отслеживать форму волны обрывается примерно на частоте 4000 герц; тем не менее мы можем слышать высоту звука, содержащего гораздо более высокие частоты. Отсюда следует, что должно существовать другое средство кодирования высотного качества звука, по крайней мере на высоких частотах.

Другая теория восприятия высоты звука относится к 1683 году, когда французский анатом Жозеф Гишар Дювернье предположил, что частота кодируется высотой звука механически, путем резонанса (Green & Wier, 1984). Чтобы разобраться в этом предположении, полезно сначала рассмотреть пример резонанса. Когда ударяют по камертону, который находится рядом с пианино, струна пианино, настроенная на частоту камертона, начинает колебаться. Если мы говорим, что ухо работает по тому же принципу, это значит, что в нем есть некая структура, сходная по конструкции со струнным инструментом, причем различные ее части настроены на различные частоты, так что когда на ухо предъявляется некоторая частота, соответствующая часть этой структуры начинает колебаться. Эта идея была в общем правильной: такой структурой оказалась базилярная мембрана.

В XIX веке Герман фон Гельмгольц, исходя из гипотезы резонанса, предложил для объяснения восприятия высоты теорию локальности. Согласно этой теории, каждый конкретный участок базилярной мембраны, когда он начинает реагировать, создает ощущение определенной высоты тона. Предполагаемое множество участков на мембране согласуется с фактом существования множества рецепторов высоты. Заметьте, что теория локальности не означает, что мы слышим звук базилярной мембраной; просто от того, какие участки мембраны вибрируют, в наибольшей степени зависит, какую высоту мы услышим. Это пример органа чувства, в котором кодирование качества осуществляется путем «включения» тех или иных нервных волокон.

Как именно колеблется базилярная мембрана, не было известно до 1940 года, когда Георг фон Бекеши измерил ее движения при помощи маленьких отверстий, просверленных в улитках морских свинок и человеческих трупов. Учитывая результаты Бекеши, потребовалось модифицировать теорию локальности; базилярная мембрана вела себя не как пианино с раздельными струнами, а как простыня, которую встряхнули за один конец. В частности, Бекеши показал, что при большинстве частот вся базилярная мембрана приходит в движение, но место наиболее интенсивного движения зависит от конкретной частоты звучания. Высокие частоты вызывают вибрацию в ближнем конце базилярной мембраны; по мере повышения частоты паттерн вибрации сдвигается к овальному окошечку (Bekesy, 1960). За это и другие исследования слуха Бекеши получил в 1961 году Нобелевскую премию.

Как и временные теории, теория локальности объясняет многие, но не все явления восприятия высоты звука. Основные затруднения у теории локальности связаны с тонами низких частот. При частотах ниже 50 герц все части базилярной мембраны вибрируют примерно одинаково. Это значит, что все рецепторы активируются в равной степени, из чего следует, что у нас нет способа различения частот ниже 50 герц. На самом же деле мы можем различать частоту всего в 20 герц.

Таким образом, теории локальности затрудняются объяснить восприятие низкочастотных звуков, а временные теории — восприятие высоких частот. Все это навело на мысль, что восприятие высоты звука определяется как временными паттернами, так и паттернами локализации, причем временная теория объясняет восприятие низких частот, а теория локальности — восприятие высоких частот. Ясно, однако, что там, где один механизм отступает, начинает преобладать другой. На самом деле не исключено, что частоты от 1000 до 5000 герц обслуживаются обоими механизмами (Coren, Ward & Enns, 1999).

Поскольку наши уши и глаза играют столь важную роль в нашей повседневной жизни, были предприняты значительные усилия, направленные на то, чтобы заменить их на искусственные у индивидуумов, страдающих неизлечимыми дефектами этих органов. Некоторые из этих усилий описаны в рубрике «На переднем крае психологических исследований».