logo search
656776_82A75_maryutina_t_m_psihofiziologiya

4.1. Акустические параметры и восприятие речи

Основной психоакустической характеристикой речи человека является ее разборчивость, т. е. степень правильного восприятия слушателем звуков, слов и смысла речи. Максимальная разборчивость характерна для восприятия связной речи в виде предложений - фразовая разборчивость. Если человек воспринимает изолированные слова, процент разборчивости оказывается меньше. Он еще больше снижается при передаче изолированных фонетических элементов речи типа слогов - логотомов. Это объясняется высокой информационной избыточностью связной речи, позволяющей слушателю догадываться о нечетко произнесенных и даже вообще не произнесенных звуках по ее смыслу. Это значит, что восприятие речи не сводится к последовательной оценке отдельных речевых элементов (звуков, слогов, слов и предложений), а в каждый данный момент является вероятностным процессом.           Важнейшей акустической характеристикой речи, обуславливающей восприятие слушателем речевой информации, является спектр звука и его динамика во времени. Спектром звука называется представление сигнала в координатах "частота - амплитуда", т. е. зависимость амплитуд основного тона голоса и его обертонов от их частоты. Наименьшая частота колебаний звука при его прохождении через сомкнутые края голосовых складок в процессе фонации (вокализации), называется частотой основного тона голоса, которая измеряется в герцах. Частота основного тона воспринимается на слух как высота голоса человека. Частота основного тона позволяет идентифицировать личность по голосу. Изменения частоты основного тона во времени определяют интонацию голоса - ударение, вопрос, повествование, восклицание и др., а также индивидуальные и эмоциональные особенности речи.           Обертоны - ряд тонов, возникающих при звучании основного тона и придающих звуку особый оттенок или тембр. Голосовой источник (гортань, голосовые связки) формирует звук с линейно уменьшающейся амплитудой обертонов. Резонаторная система речевого тракта (ротовая полость, глотка) обладает свойством усиливать отдельные полосы частот звука, порождаемого голосовыми связками.           В результате прохождения звуковой волны от голосовых связок через ротоглоточный резонатор ее спектр преобразовывается: максимумы акустической энергии сосредоточены в частотных полосах, соответствующих резонансному усилению речевого тракта, минимумы - в частотных полосах, где акустическая энергия подавляется. Максимумы акустической энергии на спектрах звуков называются формантными максимумами или речевыми формантами. На основе речевых формант человек опознает звук речи.           Средний уровень разговорной речи при измерении на расстоянии 1 м колеблется от 60 до 80 дБ, относительно стандартного нулевого уровня, за который принято звуковое давление 2 х 10-5 Па. Разница между наиболее слабыми звуками речи, встречающимися в 1% случаев, и наиболее сильными звуками, также встречающимися в 1% случаев, составляет 47 дБ. Эта разница называется динамическим диапазоном речи.           Эффективность восприятия речи зависит от ее громкости. Для того, чтобы сигнал был хорошо разборчив, он должен превышать уровень средних и громких шумов приблизительно на 30 дБ. В случае слабых шумов (до 40 дБ) это превышение достаточно на 20 дБ.           Речевой сигнал поставляет слушателю информацию двух видов. Это, во-первых, собственно речевая или лингвистическая (языковая, семантическая, вербальная) информация, носителем которой является слово. Во-вторых, звуковая речь содержит информацию о поле, возрасте говорящего, о его физическом состоянии, здоровье, об эмоциональном состоянии и т. д., причем эта информация не зависит от того, что говорит человек. Подобная информация называется экстралингвистической (внеязыковой). Она содержится в характерных особенностях организации речи и акустики голоса говорящего - тембре, высоте, громкости, интонации, темпо-ритмических характеристиках и т. д.           Звуки речи, замещение которых изменяет смысл слова, принято называть фонемами. Например, слова "зов", "ров", "шов" отличаются только первыми звуками, слова "бак", "бук", "бок" - вторыми, а слова "воз", "вол", "вор" - третьими звуками (фонемами). Обычно фонемы используются лингвистами как минимальные единицы для характеристики языка.           Интерпретация слова может определяться не лингвистическими фонемами, а содержанием предложения. Так, слова совершенно идентичные по составу и звучанию (например, "коса" - "коса", "ласка" - "ласка"), имеют разное смысловое значение в зависимости от контекста, в котором они представлены.