2. Проблемы анализа закономерностей восприятия сложного звука
2.1. Основные результаты исследований в психоакустике
Анализ современного состояния психофизики показывает, что, стремясь к получению точных количественных описаний изучаемых явлений, исследователи оказались в достаточно жестко ограниченных рамках. Проявилось это в том, что основные работы в психофизике направлены на изучение закономерностей отражения человеком воздействий, предполагаемых как простые (одномерные) сигналы. Данное ограничение сказалось и в исследованиях психофизики слуха - в психоакустике.
Следует отметить, что психоакустика представляет, пожалуй, одну из самых разработанных областей психофизики, если судить но количеству опубликованных работ. Достаточно сказать, что за последние годы вышло более двух десятков книг только обзорного характера [см., например: 41, 215, 218, 232, 236, 241, 279, 287, 293, 318 и др.]. Число же различного рода статей и монографий, посвященных частным проблемам, измеряется сотнями, если не тысячами.
Разумеется, отразить все многообразие опубликованных в области психофизики слуха работ в столь ограниченных рамках невозможно. Поэтому мы поставили перед собой задачу показать основные направления проводимых в психоакустике исследований, используя наиболее значительные, по нашему мнению, в теоретическом отношении работы, а также наиболее характерные для того или иного направления психоакустики исследования. Сразу отметим, что предлагаемый анализ рассчитан на читателя, знакомого с имеющимися в психофизике слуха представлениями, и предназначен для их обобщения с целью облегчения изложения последующего материала книги. В связи с этим мы не будем подробно останавливаться на обосновании тех или иных концепций, определении применяемой терминологии и на детальном обсуждении конкретных экспериментальных результатов. Желающие получить более полную информацию могут обратиться к упомянутым выше руководствам по психоакустике, а также к двум достаточно обширным обзорам, опубликованным в последние годы [292, 338].
В данном разделе мы ограничимся обсуждением результатов, полученных при изучении таких субъективных качеств восприятия звука, как высота и громкость. Именно в этом направлении осуществлена основная масса психофизических исследований. Что касается работ, связанных с изучением бинаурального и пространственного слуха, восприятия тембра и некоторых более частных вопросов исследования слуха, то они будут рассматриваться в последующих главах, посвященных системному анализу проблем слухового восприятия (эти работы выходят за рамки традиционных для психофизики представлений).
2.1.1. Высота звука
(Настоящий раздел написан совместно с И. А. Даниленко, которого мы считаем соавтором данного раздела.)
Еще в 1963 г. Г. Бекеши [186] утверждал, что до некоторой степени наши так называемые теории слуха являются, по существу, только теориями восприятия высоты. Двенадцать лет спустя Р. Пломп [292], ссылаясь на приведенное высказывание, посвятил большую часть своего обзора по психофизике слуха рассмотрению этой проблемы, подчеркивая таким образом ее значимость среди всех прочих исследований. С тех пор положение мало изменилось.
Формально высота звука рассматривается как психологическая коррелята частоты [41, 90 и др.]. Однако в действительности характер этой связи до сих пор остается во многом неясным. Так, ощущение высоты звука определенной частоты различно в зависимости от того, одиночный ли это тональный сигнал или элемент последовательности или аккорда; значение при этом имеют интенсивность и длительность сигнала. Существует еще множество факторов в той или иной степени определяющих ощущение высоты звука.
Выяснению характера связи частоты и высоты звука посвящены эксперименты, описанные в работах С. С. Стивенса и др. [331]. С использованием методов фракционирования и установки равных интервалов высоты была построена субъективная шкала высоты - так называемая шкала мелов. При этом высота в 1000 мел соответствует высоте тона с частотой 1000 Гц при громкости 40 фон. Звук высотой 2000 мел в 2 раза превышает по высоте 1000 мел, при этом соответствует частоте 3000 Гц. Таким образом, связь высоты и частоты оказалась нелинейной, а весь слышимый диапазон частот до 20 000 Гц по высоте уложился в 3500 мел. Позднее методом оценки величины были получены сходные, хотя и несколько отличающиеся шкалы высоты звука [184, 185]. Хотя полученные шкалы высоты неоднократно воспроизведены в повторных экспериментах, У. JI. Гулик [236] отмечает, что они не лишены некоторых недостатков. В частности, если звук высотой N/2 мел вдвое меньше по частоте звука в N мел, то тогда и звук, высотой N мел должен быть вдвое выше звука частотой N/2 мел, однако такие результаты далеко не всегда подтверждаются экспериментом.
Другой интересный момент заключается в том, что психоакустическая шкала высоты не совпадает с музыкальной шкалой высоты, выработанной человечеством в течение многолетней практики.
В связи с этим Е. Терхардт [336] предлагает различать спектральную и фактическую высоту звука. Хотя и та и другая зависят от спектра звука, ощущение фактической высоты связано, согласно Терхардту, в первую очередь с распознаванием предварительно заученных интервалов высоты некоторым "процессором" высоты в центральной нервной системе.
Влияние интенсивности звука на ощущение его высоты изучалось С. С. Стивенсом [327]. Он предъявлял последовательно два тона немного отличающейся частоты и просил испытуемого подстраивать интенсивность одного из них до тех пор, пока ощущение его высоты не достигнет высоты другого тона. В результате
С. С. Стивенс построил семейство контуров равной высоты. Оказалось, что высота звуков с частотой выше 3000 Гц при увеличении интенсивности повышается, а с частотой ниже 1000 Гц - понижается. Изменение интенсивности практически не влияет на высоту звуков частотой от 1000 до 3000 Гц. Похожие результаты, хотя и показывающие меньшую степень влияния, получены в другой работе [236]. Однако А. Коэн [204] выявил лишь незначительные изменения высоты звуков при увеличении их интенсивности.
Другим фактором, оказывающим влияние на ощущение высоты тонального сигнала, является длительность стимула. В частности, стимулы, имеющие очень короткую длительность (щелчки), не сопровождаются ощущением высоты, поскольку спектр таких звуков скорее напоминает спектр шума. Для выявления ощущения определенной высоты длительность звучания должна достигнуть некоторого критического значения, причем эта критическая длительность различна для разных частот [41, 163, 236].
При определении дифференциальной чувствительности слуховой системы человека к изменению частоты звука особую трудность составляла проблема переходных процессов, возникающих при подаче стимулов. Переходные процессы во время атаки или затухания звуковых сигналов связаны со значительным расширением спектра, поэтому не всегда можно быть уверенным в том, что явилось основой для ответа испытуемого. В некоторой степени эта проблема была решена Е. Шауэром и Р. Биддулфом [41, 236], которые применили в качестве стимулов частотно-модулированные тоны. Однако и в этом случае частотная модуляция приводила к расширению спектра. Более поздние исследования [278, 347], в которых использовались пульсирующие тоны, дали несколько отличающиеся результаты, особенно для низкочастотных и высокочастотных тонов. В целом обнаружено ухудшение дифференциальной чувствительности с увеличением частоты и ее улучшение с повышением уровня звукового давления.
Нелинейность слуховой системы приводит к появлению ощущений так называемых субъективных обертонов (или слуховых гармоник), кратных частоте исходного тона [29, 146, 153, 163]. Источником нелинейности амплитудной характеристики большинство исследователей называют улитку внутреннего уха [41, 229, 232, 245]. Как правило, ощущение субъективных обертонов возникает, если уровень звукового давления достигает 40 дБ [29]. При одновременном предъявлении нескольких тональных звуков образуются комбинационные (суммационные и разностные) тоны. При этом наибольшее значение имеют разностные тоны, поскольку суммационные тоны, как правило, очень слабы и не всегда находятся в слышимом диапазоне частот [41, 84, 163, 290]. Важное свойство комбинационных тонов - это их стимулоподобная природа. Поэтому они могут взаимодействовать как между собой, так и с основными тонами, образуя вторичные комбинационные тоны [231].
Если поступающие одновременно звуковые сигналы или гармоники достаточно близки по частоте, то возникают биения. В зависимости от того, насколько велика разница сигналов по частоте, биения могут восприниматься как "качание" или пульсация звука, придавать звуку определенные тембровые качества или восприниматься как "шероховатость" звука [84, 241]. Наличие и характер биений, в частности, играет роль в определении консонантности-диссонантности музыкальных интервалов [84, 255, 274, 294, 336].
Большое внимание исследователей привлекает в последнее время проблема высоты сложных звуков, хотя первые исследования в этой области восходят к классическим работам А. Сибека и Г. Гельмгольца, проведенным в прошлом веке [41].
Сложные звуки, такие, как, например, звучание музыкальных инструментов, характеризуются высотой, как правило, равной высоте основного тона. В то же время присутствие основного тона далеко не всегда обязательно. Так, например, в случае полной маскировки основного, тона шумом или его фильтрации высота не изменяется. Разными авторами в зависимости от экспериментальных условий и предпочитаемых объяснений эта высота называется по-разному: резидуальная высота, высота периодичности, высота повторений, низкая высота, виртуальная высота и др. [41, 292]. Существуют две группы теорий, объясняющих происхождение низкой высоты (по-видимому, это наиболее нейтральное ее обозначение). Первая группа исходит из гипотезы, что низкая высота связана с анализом временных интервалов между пиками интенсивности в структуре звуковой волны [41, 322 и др.]. Вторая группа основывается на предположении, что низкая высота выделяется из спектра мощности на основе частотного анализа релевантных гармоник [230, 348 и др.]. Более детальный обзор подобных исследований можно найти во многих работах [41, 232, 241, 292, 338 и др.]. Как отмечает Р. Пломп [292], результаты, полученные в ряде последних исследований, скорее подтверждают вторую гипотезу.
На этом мы завершаем рассмотрение основных исследований ощущения высоты звука. Как видим, типичные тенденции осуществленных в этой области работ направлены на выявление жестких зависимостей между субъективным качеством высоты звука и физическими характеристиками звукового воздействия. Основными физическими параметрами звука, от которых зависит ощущение его высоты, являются частота тона, интенсивность и длительность звучания. Вместе с тем из приведенного обзора следует, что нелинейность слуховой системы приводит к возникновению сложного ощущения даже при воздействии тонального звучания; т. е. представление об однозначной связи между каким-либо параметром звука и ощущением его высоты является упрощением реально существующей ситуации. Особенно заметно это ограничение при попытке распространить полученные данные на закономерности восприятия более сложных, чем тональные, воздействий. В этом случае оказывается уже недостаточным выделение одного субъективного параметра высоты. Появляются разные понятия высоты, такие, как фактическая, спектральная, резидуальная и т. п. Однако, несмотря на полученные в экспериментах факты, в большинстве работ по психоакустике субъективное качество высоты рассматривается как независимая характеристика отклика слуховой системы. Практически не ставится задача построения системы субъективных качеств слухового образа, тем более в связи с проблемой его предметности и целостности. В этом смысле рассмотренные нами работы никак нельзя отнести к исследованиям слухового восприятия.
Перейдем теперь к обсуждению результатов исследований громкости, другого субъективного качества звука, также выделяемого в психоакустике как независимое.
2.1.2. Громкость звука
Обычно громкость рассматривается как психологическая коррелята интенсивности звука [90, 236]. Можно с уверенностью сказать, что громкость - один из наиболее излюбленных объектов исследования в психоакустике. Это обусловлено в первую очередь рядом практических задач, возникающих при разработке средств телефонной и радиосвязи, при введении средств звуковой сигнализации и индикации в системах "человек - машина" и др. Во всех этих случаях знание закономерностей субъективного отражения энергетических характеристик звука имело первоочередное значение для реализации технических решений. Громкость оказалась удобным объектом и для построения некоторых теоретических концепций психофизики [233, 329]. И наконец, громкость является одним из важнейших субъективных качеств звука, поэтому ее изучение важно и при построении теории слухового восприятия.
Зависимость громкости от интенсивности звука изучалась С. С. Стивенсом [328, 329]. Используя прямые методы шкалирования (удвоения, фракционирования, оценки величины), он показал, что для тона частотой 1000 Гц эта зависимость может быть выражена степенной функцией (с показателем степени 0,6), которую предложено считать стандартной функцией громкости. Позднее значение показателя степени было несколько уточнено (0,67) и С. С. Стивенс предложил использовать в качестве стандарта полосу шума с центральной частотой 3150 Гц, поскольку в этом случае более строго, чем на тоне 1000 Гц, соблюдается степенной закон и существенно ниже порог чувствительности [330]. Необходимо отметить, что громкость возрастает с увеличением интенсивности звука заметно быстрее вблизи порога, в связи с чем рядом авторов сделаны попытки как-то модифицировать формулу Стивенса [312].
Величина громкости сильно зависит от частоты звука. Такую зависимость в психоакустике принято изображать кривыми равной громкости, впервые предложенными X. Флетчером и В. А. Мансоном в 1933 г. [41], а позднее уточненными Д. В. Робинсоном и Р. С. Дадсоном [303] и другими исследователями. С. С. Стивенс, объединив данные 25 определений контуров равной громкости (и "шумности"), произведенными разными авторами, получил Усредненные кривые [330].
Громкость сложных (или комплексных) звуков зависит от эффекта, получившего название суммации громкости [41, 163, и др.]. При этом громкость многокомпонентных звуков или полос шума зависит не от ширины полосы частот, а только от уровня звукового давления центральной частоты данной полосы до некоторого критического ее значения. Это значение получило название критической полосы, ширина которой зависит от частотного диапазона [29, 41, 163]. Если же компоненты сложного звука или полосы шума попадают в разные критические полосы, то громкость такого звука заметно увеличивается [163]. Эффект суммации громкости выражен незначительно при интенсивностях звука, близких к пороговым и максимален при средних интенсивностях [41, 163, 240, 312]. Кроме того, громкость наибольшая, когда все компоненты имеют примерно равную интенсивность [310, 312], а также равномерно распределены по критическим полосам [163]. Б. Шарф [309] показал, что при равенстве занимаемых сложными звуками (как со сплошным, так и с линейчатым спектром) полос частот количество компонентов не играет роли при определении суммарной громкости. Однако другими авторами [217] обнаружено влияние числа компонентов на суммацию громкости.
На ощущаемую громкость звуков оказывает влияние и его длительность. Так, при увеличении длительности тона примерно до 200 мс пороговая интенсивность звука прямо пропорционально уменьшается. Таким образом, общее количество поступаемой звуковой энергии остается постоянным [41, 175, 176, 312]. Подобная временная интеграция громкости наблюдается и мри надпороговых уровнях громкости [193, 214, 272, 299, 325, 355]. Сводку данных многих исследователей, касающихся изменения громкости при изменении длительности звука, приводит Б. Шарф [312]. В типичном эксперименте испытуемых просят подравнивать громкости сигналов большой длительности (эталонного) и тестовых коротких сигналов (длительности которых меняются) [193, 299 и др.]. Другой метод - оценка величины громкости [214]. В результате получают контуры равной громкости как функции длительности сигнала. Суммируя данные многих исследований, можно сказать следующее: нарастание громкости звукового сигнала при увеличении его длительности происходит до некоторой критической величины, после чего громкость становится постоянной и независимой от длительности. Критическая длительность весьма различна, по данным разных авторов, и находится в пределах 60 - 500 мс (обычно же принимается величина 80 мс [41, 312]. Очень часто такой переход наступает постепенно, и его трудно определить. Не обнаружено также выраженного влияния интенсивности и частоты сигнала на критическую длительность.
Что касается влияния длительности звучания на ощущение громкости звуков большой продолжительности, то большинством исследователей не было зарегистрировано ожидаемого снижения громкости при длительном (до 30 мин) воздействии звука [219, 288, 349]. Таким образом, сомнению подвергается существование явления адаптации громкости. Подобный эффект имеет место только тогда, когда испытуемому в одно ухо поступает непрерывный звук, а в другое - звук, прерываемый на достаточно большое время. В этом случае наблюдается снижение ощущения громкости адаптирующего тона [41]. Считают, что указанный эффект имеет центральную природу и обусловлен бинауральным взаимодействием, которое может включать те же механизмы, что лежат в основе латерализации [312].
Среди прочих факторов, в той или иной степени влияющих на громкость звука, можно назвать такие, как акустическая обстановка, на фоне которой испытуемому поступает тестовой звуковой сигнал, а также индивидуальные особенности или особенности состояния испытуемых [152]. Значение фоновой стимуляции на величину ощущаемой громкости обусловлено в первую очередь явлениями маскировки, а при действии достаточно сильных фоновых стимулов перед предъявлением тестового звукового сигнала, также и слуховым утомлением (хотя утомление можно рассматривать и как одно из состояний человека) [312]. Определенное влияние на громкость оказывают некоторые особенности экспериментальной процедуры, в частности эффекты последовательности [244, 340].
Высокая межиндивидуальная изменчивость в оценках и шкалах громкости отмечается многими авторами [133, 177, 181, 234, 265, 314, 315]. С. Д. Стефенс [326] связывает полученные индивидуальные различия в шкалах громкости со степенью тревожности испытуемых, измеренной при помощи стандартного теста. Так, высокотревожные испытуемые имели более пологий наклон функции громкости, как и более возбудимые испытуемые в исследовании, других авторов [181]. Т. А. Ратанова [133] связывает индивидуальные различия с таким показателем, как сила нервной системы.
Таким образом, проведенный анализ показывает, что исследования громкости осуществлялись, как правило, в рамках традиционных для психофизики представлений о независимых субъективных качествах. Основными физическими параметрами звука, от которых зависит ощущение его громкости, являлись интенсивность сигнала, частота тона или спектр широкополосного звука, длительность звучания, акустическая обстановка. В отличие от исследований закономерностей ощущения высоты звука, где рассматривался преимущественно тональный сигнал, громкость изучалась с использованием достаточно широкого диапазона звуков, имеющих как простой, так и сложный состав. Однако и в случаях применения сложного звука для изучения слуховой системы нельзя говорить об этих исследованиях как об исследованиях слухового восприятия. В рассмотренных работах обсуждаются закономерности слуховых ощущений на примере одного из субъективных параметров - громкости. При изучении этих закономерностей (касающихся как громкости, так и высоты звука) анализ процесса формирования слухового образа с присущими ему качествами предметности и целостности не проводился.
В связи с этим, ограничившись пока представленным материалом, обсудим некоторые вопросы, непосредственно касающиеся проблемы изучения слухового восприятия.