Специальные вопросы фонологического моделирования

жүктеу/скачать 148.5 Kb.

Дата	12.07.2016
өлшемі	148.5 Kb.
	#194901

ГЛАВА 3. Специальные вопросы фонологического моделирования

3.1. Фонологические взгляды И. А. Бодуэна де Куртенэ

И. А. Бодуэн де Куртенэ, создавая теорию фонем, трактовал фонологические единицы как некие сущности, наличествующие в психологической системе человека, пользующегося соответствующим языком.*(Пр54в) Придерживаясь материалистической трактовки природы психического,*(Пр54н) Бодуэн де Куртенэ «только тогда считал возможным говорить о существовании тех или иных внутриязыковых закономерностей, когда представлял себе их психофизический механизм, и только тогда выдвигал то или иное понятие, когда мог определить его, хотя бы в самых общих чертах, с помощью материального психофизиологического субстрата». [ЛЕОНТЬЕВ 1969, с. 178].

Естественно, что понятию фонемы Бодуэн де Куртенэ дал определение, имеющее чёткую психофизиологическую интерпретацию. «Фонема … есть однородное, неделимое в языковом отношении антропофоническое представление, возникающее в душе путём психического слияния впечатлений, полученных от произношения одного и того же звука» [БОДУЭН 8, с. 355]. Если сделать поправку на принятую в то время фразеологию, то станет ясно, что это понятие логически выводится из Сеченовских представлений о деятельности высшей нервной системы. Тот факт, что материалистический взгляд И. М. Сеченова оказался плодотворным в пограничной с психофизиологией области знания, явился ещё одним убедительным подтверждением всей концепции в целом.

В книге «Рефлексы головного мозга», где были заложены основания материалистического учения о психических процессах, И. М. Сеченов объяснял возможность человека осуществлять произвольные движения, в том числе и речь, тем, что в частности центральная нервная система человека сохраняет в себе следы воспринимавшихся ранее ощущений, т. е. эти ощущения представлены в виде некоторых изменений в нервной ткани. Причём «от частоты повторения реального ощущения, или рефлекса, ощущение делается яснее, а через это и самое сохранение его нервным аппаратом в скрытом состоянии становится прочнее. Скрытый след сохраняется долее и долее, ощущение труднее забывается.» [СЕЧЕНОВ с. 62]. Поэтому, воспринимая речь, нервный аппарат должен запечатлевать те её отрезки, которые повторяются в стандартном виде чаще всего. Такими отрезками являются звуки, примерно соответствующие буквам в обычной графике.*(Пр55) Однако наилучшие условия запоминания создаются тогда, когда не только сами звуки подобны, но и сходна деятельность, к которой приводит реакция на данное звучание. Из таких отрезков слагается каждое высказывание как из кирпичиков, поэтому повторение их в речи максимально частотно, а численно множество таких отрезков не слишком велико, что не делает задачу сохранения их следов в памяти нервного аппарата слишком обременительной. Такое представление и послужило для Бодуэна и его учеников основанием для введения понятия фонемы.

Система дискретных звуковых образов, в которых обобщены конкретные звучания речи, связанные единым значением, и составляют набор фонем данного языка.

Однако по Сеченову существует и другой аспект запоминания образов реальных ощущений. Функция запоминания образов – в том, что они используются для их воспроизведения. «Сохранение есть, так сказать, начало воспроизведения. если бы действительное ощущение в самом деле совершенно кончалось с удалением внешнего субстрата, тогда нечему было бы воспроизводиться». [СЕЧЕНОВ с. 59]. Далее Сеченов пишет: «Итак, что такое акт воспроизведения психических образований? Со стороны сущности процесса это столь же реальный акт возбуждения центральных нервных аппаратов, как и любое резкое психическое образование, вызванное действительным внешним влиянием, действующим в данный момент на органы чувств.» [СЕЧЕНОВ с. 68].

Поскольку фонемы записываются в памяти именно для того, чтобы воспроизводиться в процесса произвольных речевых действий, они могут быть определены также и как элементы, из которых строятся высказывания при производстве речи. Такая трактовка понятия фонемы была второй отправной точкой построения теории. Как нетрудно видеть, последовательное развитие первой концепции фонемы должно привести к построению структуры блока единиц речевосприятия на схеме языкового механизма, принятой в главе 2. Вторая точка зрения должна привести к построению единиц внутренней записи языковых знаков, которая является ведущей формой знака в процессе речепроизводства. Сам И. А. Бодуэн де Куртенэ не дал чёткого представления о соотношении этих подходов, но он постоянно учитывал обе функции фонем, склоняясь в разных работах к опоре либо на одну из них, либо на другую.

Хотя общее определение фонемы И. А. Бодуэн де Куртенэ не меняет, принципы, по которым фактически выделяются фонемы, и различные конкретные звуки распределяются по разным фонемам, претерпели определённое изменение. Первоначально, в 1870-1880-х гг. при установлении фонем он исходит из сопоставления морфем [ПАНОВ с. 368], т. е. минимальных неделимых значащих элементов языка, из которых строится любое высказывание. Фонологические единицы, получаемые из сопоставления фонем, являются собранием способов производства определённых компонентов морфем независимо от конкретного характера используемого при этом звука. Такие единицы носят черты подпрограмм речевой реализации языковых знаков. Дальнейшее развитие указанная теория получила в Московской фонологической школе (МФШ), о чём речь пойдёт ниже.

Но трудности с объективным установлением исходного понятия – морфемы – в дальнейшем привели Бодуэна к отказу от морфемного подхода в фонологии [ПАНОВ с. 372]. Поэтому для установления фонемного состава в позднейших работах он берёт не элементы высказываний, а сами полные высказывания, или слова, как минимальные возможные высказывания. При этом основанием для объединения звуков в одну фонему или для распределения их между разными фонемами служит критерий их близости в языковом механизме говорящих («в механизме языка для чутья народа»), и критерий способности этих звуков различать высказывания, имеющие разное значение. Первый из этих критериев говорит о том, что исследователь становится на точку зрения слушающего, которому ничего не известно о высказывании до того, как он поймёт его. Второй же критерий реализует требование к способности слушающего различать звуки необходимые для того, чтобы понять высказывание. Таким образом фонология И.А. Бодуэна де Куртенэ позднего периода очерчивает теорию фонологических единиц речевосприятия. В дальнейшем мы обсудим развитие этой теории в работах учёных Ленинградской фонологической школы и дадим формальное теоретико-множественное описание процедуры нахождения системы фонем речевосприятия, разработанной дескриптивным направлением американской лингвистики.

Впрочем два этапа фонологической работы И.А. Бодуэна де Куртенэ не противопоставлены друг другу самим Бодуэном. Имеются места в его работах , заставляющие предполагать, что он задумывался над тем, что в психофизическом механизме языка есть место различным фонологическим единицам. Так ещё в 1881 году он писал: «Понятие фонема разлагается на два существенно различные: 1) просто обобщение антропофонических акустико-артикуляционных свойств; 2) подвижный компонент морфемы». [БОДУЭН, 6]. А в дальнейшем, развивая фонологию восприятия И.А. Бодуэн де Куртенэ разрабатывает представление о фонеме как о сложной единице, характеризующейся как набором акустических, слуховых признаков – акусм, так и набором артикуляционных, мышечно-двигательных команд – кинем. Более того, наряду с термином фонема был введён ещё термит кинакема для обозначения единства акустических и артикуляционных свойств звука. таким образом, мы видим, что И.А. Бодуэн де Куртенэ был на пороге создания теории, предполагающей наличие множества разнородных систем фонологических единиц в пределах единого языкового механизма. Причём уже вырисовывались основания функционального разграничения между этими системами.

Заметим, что до сих пор, несмотря на значительный прогресс в технике фонологического анализа, фонология в целом только поднялась до того же уровня представления об общих контурах фонологической структуры языка, на котором остановился основоположник этой науки около 100 лет тому назад. Признаками этого уровня является наличие различных фонологических учений, описывающих порознь фонологические единицы разного характера, и первые попытки синтезировать разнородные фонологические теории в пределах одной модели. Определённым достижением в этом направлении является теория М.В. Панова [1], который совершенно справедливо замечает, что труды И.А. Бодуэна де Куртенэ сейчас следует оценивать как труды современника, который, может быть, перерос и нашу эпоху.

Изложенная выше интерпретация фонологических воззрений Бодуэна де Куртенэ, по-видимому, расходится со сложившимися представлениями [КАСЕВИЧ, стр. 51] *(Пр58), однако целесообразность и необходимость переинтерпретации понятий фонологии в указанном направлении показана Г.П. Мельниковым [МЕЛЬНИКОВ 7] с точки зрения системного подхода в лингвистике.

3.2. Соотношение различных моделей фонологического механизма

Таким образом, И. А. Бодуэн де Куртенэ ввёл в науку и начал разрабатывать не одно, а два представления о фонеме. Лингвисты, продолжавшие развивать теорию фонем, ориентировались в дальнейшем либо на то, либо на другое из направлений, указанных Бодуэном. Однако при этом не уделялось достаточно внимания обоснованию развиваемых теорий с точки зрения реальной структуры материального механизма, осуществляющего языковое поведение.

Бодуэновское психологическое обоснование фонологии было отброшено как ненаучное. В самом деле, господствовавшие тогда в психологии представления, не давали оснований для надежды на помощь в верификации лингвистических теорий, Но это не может быть оправданием тому, что структуральные лингвистические школы отвергли саму постановку вопроса о соответствии лингвистических теорий данным других наук для построения единой научной картины мира. *(Пр59)

Положение изменилось лишь в послевоенное время (со второй половине ХХ века) в связи с развитием таких синтезирующих дисциплин как кибернетика, теория систем, бионика. Например, явно не без влияния указанных дисциплин Ч. Хоккет предложил модель языкового механизма в виде «блок-схемы, используемой радиоинженерами» [HOCKETT p. 3] (рис. 9). Эксплицитно выражает влияние идей кибернетики и методологии естественнонаучного исследования Л. Н. Засорина: «Весьма существенной чертой современного естественнонаучного познания является единство наук, интеграция знаний, противостоящая тенденции к их дифференциации. Интеграция знаний выражается в математизации, «кибернетизации» наук, в возникновении комплексных научных дисциплин. … Новейшая революция в естествознании, начавшаяся на пороге нашего века и продолжающаяся до наших дней, приводит к новым философским обобщениям, которые имеют важнейшее методологическое значение для каждой из эмпирических наук и, в частности, для языкознания.» [ЗАСОРИНА с. 21].

Работы, связанные с исследованиями механизмов звуковой речи, ведутся не только и не столько в рамках чистой лингвистической теории, но, главным образом, представителями прикладных направлений, задача которых – практическое создание технических устройств, способных производить или понимать человеческую речь.

Рис. 9. Блок-схема языкового механизма по Ч. Хоккетту

(вернуться к тексту?)

С Е М А Н Т И К А

грамматический штаб

морфемизатор

источник фонем

приёмник речи

передатчик речи

кинестетическая
обратная связь

акустическая
обратная связь

Р Е Ч Ь

В этой связи нужно отметить следующие коллективы:

Хаскинские лаборатории в США (см. например [ИССЛЕДОВАНИЕ…];
шведские учёные Королевского психологического института в Стокгольме (о работах это группы можно составить представление по монографии Г. Фанта (см. библ.);

3) ленинградские фонетисты и психологи, объединяемые Л.А. Чистович;

группа работников Института математики СО АН СССР в Новосибирске (о работах советских исследователей дают обширную информацию публикации [РЕЧЬ…; АНАЛИЗ…; РАСПОЗНАВАНИЕ…].

В этих коллективах, работающих в сотрудничестве друг с другом, сложились сходные взгляды на структуру механизмов речи. Общим мнением является вывод о многоступенчатом преобразовании сигнала между уровнями смысла и звука как при восприятии, так и при производстве высказывания. Иллюстрацией может служить рассмотренная выше модель восприятия, предложенная ленинградско-новосибирской группой (ЛН-группа). Общее представление о материальных нейродинамических механизмах порождения речи описано, например, в [ЛИБЕРМАН и др. 1]. Недостаток этих моделей, на мой взгляд, - в слабой привязке к положениям лингвистической теории и в отсутствии разработанной модели механизма речевого звукопроизводства.

Впрочем, ведутся работы по осуществлению автоматического механического речеобразования по правилам фонологического синтеза. [ДЕРГАЧ и др.; ЛОБАНОВ и ПАНЧЕНКО, КУЛЯ и др.]. В этих работах ставится цель создать такую электромеханическую систему, которая бы синтезировала правильно звучащую речь на основании последовательности фонемных команд, определяющих основные акустические признаки звука: основной тон, шум, форманты, антиформанты. Но эти работы полностью привязаны к заданной субстанции, а которой предполагается осуществить речевую способность, и не дают оснований для такого обобщения, которое могла бы прояснить устройство речевого механизма, заключённого в нейродинамической субстанции. Важным для нас является тот факт, что в модели порождения предполагается наличие определённого склада звуковых программ, которые определяются независимо от склада звуковых эталонов, предполагаемых моделью речевосприятия.

Итак, мы видим, что в проблеме построения модели языкового механизма человека в его фоническом аспекте наблюдается определённый разрыв между теоретической лингвистикой, которая недостаточно учитывает критерий материальной реализуемости своих моделей, и прикладными работами, в которых отсутствует стремление сопоставить используемые модели с представлениями «чистой» теории. Очевидно, что такое положение не может способствовать успеху ни теоретических, ни прикладных исследований. Объясняется указанный разрыв тем, что в теоретическом языкознании до сих пор господствует идеология структурализма, ортодоксальная интерпретация которой влечёт за собой непризнание вопросов субстантного существования лингвистических объектов предметом лингвистики. Однако логика развития науки, требующая объединить различные направления лингвистических исследований единой концептуальной основой, вынуждает отказаться от игнорирования языковой субстанции. Одним из выводов, сделанных при этом, является необходимость возвратиться к Бодуэновским представлениям о психофизиологической онтологии фонологических единиц и пересмотреть на этой основе современную теоретическую фонологию.

3.3. Комбинаторные модели фонологического анализа

В противоположность грамматическому уровню языкознания на фонологическом уровне строгие процедуры, эквивалентные теоретико-множественным моделям структуры элементов языкового механизма, были установлены ещё на «доматематическом» этапе развития теории. Впервые достаточно полная система предписаний для процедуры фонологического анализа была разработана в Пражской школе [ТРУБЕЦКОЙ 1]. Наиболее строгое описание процедуры анализа дано лингвистами дескриптивного направления [HARRIS], а для системы взглядов Московской фонологической школы – М. В. Пановым [ПАНОВ 1].В работах других фонологов также тмеются достаточно ясные указания относительно фонологических методов [ЩЕРБА, ЗИНДЕР, JONES, АВАНЕСОВ, РЕФОРМАТСКИЙ, КУЗНЕЦОВ, БЕРНШТЕЙН, МАРТИНЕ, MARTINET]. Во всех указанных работах фонемой называется абстрактный звук, или класс звуков, обладающий определёнными комбинаторными, физическими и семантическими характеристиками. Однако, конкретные процедуры выделения фонем, принятые разными школами, не совпадают, оставаясь внутренне непротиворечивыми в самих себе. Критикуя представителей других направлений, авторы фонологических моделей не дают исчерпывающего анализа необходимости именно той системы операций, которую они предлагают сами. Аргументы обычно апеллируют к функциям языка или языковых единиц. Но в силу полифункциональности языка очевидно, что результат рассуждений изменяется а зависимости от того, какая функция признаётся основополагающей.

Так, если считать, что основной функцией языковых звуков является отличение одного высказывания от другого, то мы прийдём к построению теории, разные варианты которой находим у Ленинградской фонологической школы, у Джоунза и у дескриптивистов.

Если же в качестве основной принять противоположную функцию единиц – отождествлять в разных высказываниях знаки, имеющие одну семантику, то мы прийдём ко взглядам Московской фонологической школы, либо (при большей жёсткости требования однозначности соответствия формы и семантики) к построению варианта генеративной морфофонологии.

Стремление более равномерно учесть обе функции языковых единиц заставляет учитывать роль контекста в выполнении единицей своих функций и приводит к теории позиционных фонем (Пражская школа, сильные-слабые фонемы Р. И. Аванесова, синтагмофонемы М. В. Панова).

Пока основания различных фонемных построений были выражены недостаточно явно, постоянно шли дискуссии о том, какая концепция более правильно отражает действительность. Эти дискуссии оканчивались безрезультатно, ибо отсутствовал общий критерий истинности теории. По мере выявления логических основ фонологических процедур становилось всё более очевидно, что каждая из названных теорий разрабатывает особую важную сторону фонической структуры языка и не является конкурентом для других. Окончательно это стала ясно с построением математических моделей фонологического анализа на теоретикомножественной основе.*(Пр64)

В самом деле, все математические модели строятся на единой исходной базе. Считается заданным: 1) множество звуков, 2) признаки звуков, 3) множество правильных последовательностей звуков (слов), 4) отношение равнозначности слов, 5) способ сравнивать близость звуков. Модель С. Маркуса [MARCUS 1] дала формальное определение фонем и архифонем Пражской школы как совокупностей признаков, релевантных в данном звуковом контексте. В качестве меры близости звуков С. Маркус брал просто совпадение релевантных признаков. Модель В. А. Успенского [УСПЕНСКИЙ 3] определила понятие фонемы в Ленинградской школе (или, что практически то же самое, понятие фонемы по Джоунзу) как класс максимального смыслоразличительного разбиения алфавита звуков. В качестве меры близости В. А. Успенский ввёл отношение «соседства» звуков. Одновременно с В. А. Успенским автор диссертации также построил формальное определение фонемы ленинградского толка. Преимуществом последней модели является использование более точной характеристики близости звуков, что позволило достичь единственности построения, отсутствующей в модели Успенского. Недостатком моей модели являлась некоторая незаконченность построения, так как алгоритм не гарантировал наличия взаимной противопоставленности всех фонем в одинаковых контекстах. Этот недостаток был ликвидирован в дальнейших работах [БЕЛООЗЕРОВ 2 - 4].

В двух последних моделях в отличие от модели Маркуса признаки звуков явно не фигурируют, но их наличие предполагается существенным при установлении метрики или для однозначного выбора одной из множества возможных систем фонем (у В. А. Успенского). Окончательная формализация фонологической процедуры Московской школы до сих пор не была установлена, но её основы неоднократно излагались автором [БЕЛООЗЕРОВ 2 - 4].

Тот факт, что на одном и том же материале удаётся построить математические модели разных фонологических концепций подтверждают мнение, что указанные концепции не противоречат, а дополняют друг друга, показывая разные стороны исследуемого материала.

Математические алгоритмы фонемного анализа вначале строились (так же как и вербальные лингвистические процедуры) без обоснования необходимости тех, а не иных операций. Верификация алгоритмов достигалась совпадением результатов со сложившейся практикой лингвистики. Однако взгляд на фонологические единицы как на гипотетические конструкты, описывающие структуру скрытого от наблюдения языкового механизма, позволил обосновать фонологические построения с точки зрения оптимальности устройства этого механизма.*(Пр65)

Первые шаги обоснования фонологических единиц с точки зрения их оптимальности для механизма языка были сделаны исследователями, работающими над проблемой реализации языкового механизма в материале автоматического устройства. В качестве алфавита звуков, которые должен распознавать автомат, следует использовать классы звучаний (звукотипы), выделяемые согласно методике Ленинградской школы. Н. Г. Загоруйко и В. Н. Елкина на основе этой методики построили алгоритм объединения конкретных звуков в звукотипы, что являлось фактически уточнением формального определения фонемы [ЗАГОРУЙКО и ЕЛКИНА].

Алгоритм Загоруйко-Елкиной минимизирует число звукотипов и ожидаемое количество ошибок распознавания. В этом и состоит обоснование истинности предлагаемого решения, ибо согласно коммуникативной функции языка его механизмы должны обеспечить наилучшие возможности для передачи речи в условиях максимальной экономии ресурсов.

3.4. Принцип оптимальности языкового механизма

В исследованиях, посвященных проблеме создания искусственных речевых аппаратов для людей, лишённых возможности пользоваться отдельными видами устной речи (глухих, немых, слепых), выяснилось, что звуки речи являются наиболее эффективным способом акустической передачи языковой информации. Все другие виды сигналов (азбука Морзе, например) уменьшают скорость передачи сообщений по крайней мере в 10 раз [ЛИБЕРМАН и др. 2]. Это свойство естественной речи образовалось в результате многовекового отбора средств, наиболее удобных для реализации в физиологической субстанции человека и наиболее отвечающих задачам функции общения.

Стремлением к минимизации времени, затрачиваемого на донесение информации до собеседника могут быть объяснены даже некоторые видимые избыточности языковой системы. Так, известно, что во всех языках большая часть фонетически возможных коротких слов не используется, а используются гораздо более длинные слова и словосочетания. Казалось бы это должно приводить к замедлению возможного темпа языкового общения, однако теоретиковероятностный расчёт показывает, что это не так, и распределение длин языковых знаков в языках мира близко к оптимальному с точки зрения скорости коммуникации.

В самом деле. На всех участках коммуникативного кольца к речевому сигналу примешиваются шумы разного происхождения и разных свойств, но общим результатом наличия шумов является частичное нарушение коммуникации, проявляющееся в том, что вероятность правильного приёма сигнала всегда меньше единицы. Вот эти ошибки передачи и компенсируются удлинением речевых сигналов против минимально возможной длины. Избыточность звуковой формы сигнала позволяет восстанавливать его индивидуальность даже при условии лишь частичного опознавания. Это приводит к возможности общаться с минимальным числом переспросов и повторений и в конечном итоге приводит к экономии времени общения, несмотря на увеличение среднего времени передачи каждого языкового знака.

Чтобы подтвердить этот вывод, примем следующую упрощённую модель диалога. Говорящий называет некоторое понятие (сообщение, представление, образ, …), для выражения которого имеется много способов, а самый лаконичный содержит N звуков. Если говорящий выбирает из них для передачи знак, содержащий M звуков (M > N), то будем считать, что слушающему достаточно правильно опознать в сигнале любые N звуков. Величина N таким образом является некоторой характеристикой информационного объёма сообщения. По реакции слушающего говорящий определяет, понял ли тот сообщение, и если нет, то говорящий снова называет то же понятие, заново выбирая способ его речевого описания (вне зависимости от того, каким способом он пользовался до этого) так, чтобы сообщение содержало прежнее число звуков М. Повторные переформулировки повторяются до тех пор, пока слушающий не опознает сообщение правильно. Будем также полагать, что при этом слушающий не сохраняет в памяти ничего из информации предыдущих попыток расшифровать сообщение. Интересно выяснить, сколько потребуется в среднем повторений, чтобы слушающий правильно принял сообщение, сколько при этом будет произнесено говорящим звуков и сколько на это уйдёт времени, если вероятность, что слушающий правильно принимает каждый звук, равна Р.

Таблица 1. Оптимальная длина слов в зависимости от минимальной возможной длины N

и коэффициента восприятия звука Р%

Р % =	20	30	40	50	60	70	80	90
N = 1	1	1	1	1	1	1	1	1
2	9	6	5	4	3	3	2	2
3	17	11	8	7	6	5	4	3
4	21	16	12	9	8	7	6	5
5	31	20,5	15	12	10	8	7	6
6		24	19	15	12	10	9	7
7		30	22	17	14	12	10	9
8
9		38	18	22	18	15	13	11

Несложный вероятностный расчёт показывает, что среднее число произнесённых звуков с учётом повторений нерасслышанных (непонятых) слов при длине слова равной М определяется формулой

Т = М / Σ_k=N^M[C_M^k P^k (1 – P)^k–M ] (☼)

Здесь Σ_k=N^M - символ суммирования по всем значениям k от N до М и C_M^k - число сочетаний по k элементов из М возможных.

На рис. 10 показаны графики, расчитанные по формуле (☼) для информационного объёма сообщений, равного 2 и 9, и для разных коэффициентов правильного восприятия Р. По графикам видно, что существует оптимальная избыточность числа звуков в сообщении, при которой общение происходит с максимальной скоростью. Оптимальному М соответствует минимум на кривых рис. 10. Значения оптимальной длины слова при разных значениях минимальной длины N и коэффициента восприятия Р сведены в таблицу 1. В таблице 2 показаны значения средней длительности общения (с учётом повторений) при использовании слов оптимальной длины.

Таблица 2. Средняя длительность общения при использовании оптимальных слов

(в зависимости от N и Р)

Р % =	20	30	40	50	60	70	80	90
N = 1	5	3,3	2,5	2	1,7	1,4	1,25	1,11
2	16	10,4	7,5	5,8	4,6	3,8	3,1	2,4
3	25,2	16	11,7	9	7,3	6	4,9	4,1
4	34,1	21,3	15,6	12	9,7	8	6,7	5,4
5	41,3	26,4	19,3	14,9	12	9,9	8,2	6,8
6		31,4	23,3	17,7	14,3	11,8	9,9	8,2
7		35,6	26,1	20,3	16,7	13,6	11,3	9,5
8
9		44,7	32,8	15,7	12,8	17,2	14,4	12,1

Поскольку минимальная длина слова около 4,*(Пр68) а фактическая средняя длина русского слова (которая должна быть близка к оптимуму) около 7, то по таблице 1 можно оценить «понимаемость» одного звука в русском языке величиной Р = 70%.^¹ Это значение можно проверить на речевом материале.

В самом деле. «Понимание» речевого звука означает правильное истолкование его как реализации элемента кодирования знака в памяти языкового механизма (как морфофонемы). Принимая пока в качестве таких элементов внутреннего кодирования знаков фонемы МФШ (парадигмофонемы), можно подсчитать неопределённость интерпретации звукотипа, встречаемого в конкретных фонетических условиях высказывания. Рассмотрим, например, следующие фразы:

«Наука ободрана, в лоскуты обшита, изо всех почти домов с ругательствами сбита» (Антиох Кантемир).
«Под голубыми небесами великолепными коврами, блестя на солнце, снег лежит…» (А. С. Пушкин).
«… Нельзя представить себе такого языка, где конструкция каждого слова … не совпадала бы с конструкцией известного количества других слов …» (Е. Д. Поливанов).

В таблице 3 представлена упрощённая фонетическая транскрипция этих фраз в экающем произношении, и для каждого звука указаны возможные интерпретации его как реализации той или иной парадигмофонемы (по М. В. Панову [ПАНОВ 1]).

В первой фразе из 63 звукотипов 42 получают однозначное фонемное истолкование, а относительно 21 оставшегося звука можно сделать в общей сложности 47 предположений об их интерпретации. То есть при восприятии этой фразы языковой механизм слушающего проверяет 42 + 47 = 89 фонемных гипотез. Процент «понимаемости» фонем может быть определён как величина обратная средней неопределённости одного звука:

Р = (число фонем) / (число гипотез) = 63 / 89 = 71 %

Во второй фразе на 61 фонему приходится 87 гипотез. Иначе говоря, «понимаемость» равна Р = 61 / 87 = 70 %.

В третьей фразе на 113 звуков приходится 165 гипотетических парадигмофонем, что соответствует коэффициенту «понимаемости» Р = 68 %, что также не сильно отличается от теоретического значения.

Хотя окончательные выводы можно будет делать лишь после широкого статистического обследования речевого материала, уже на этих примерах, взятых из разных стилей речи, видно, что теоретические положения относительно принципов оптимизации в языке подтверждаются лингвистическими данными.^²

Рассмотренный пример показал высокую эффективность применения соображений оптимальности к анализу явлений языка. Оптимальное языковое поведение может быть обеспечено, только если сам языковой механизм достаточно близок к оптимальному устройству. Выше мы видели, что оптимизация языка вызывается потребностью сократить время передачи сообщения (т. е. сократить число передаваемых при этом знаков).*(Пр70в) Для искусственных языковых автоматов столь же существенным стимулом оптимизации являлось бы требование максимально сократить объём памяти, необходимой для функционирования языка, для записи его слов и грамматики. Для человеческого мозга эта экономия, по-видимому, не имеет столь существенного значения, ибо объём долговременной памяти у современного человека используется не полностью; во всяком случае, память человека позволяет одновременно пользоваться не одним, а двумя, тремя и большим числом языков.*(Пр70с)

Хотя возможности долговременной памяти позволяют человеку запомнить гораздо больше программ и эталонов звуковых единиц, чем то используется в языках фактически (эта возможность иллюстрируется способностью человека освоить фонетику иностранных языков), но соображения быстродействия заставляют всё-таки пользоваться минимальным набором фонологических единиц, совместимым с необходимостью различать заданную систему знаков. В самом деле, при производстве речи языковые знаки зашифровываются системой артикуляторно-грамматических команд, для чего описание каждой команды должно быть отыскано в общем списке, что занимает тем больше времени, чем длиннее данный список. С другой стороны, при речевосприятии каждый элемент принятого звукового сигнала также следует сравнить со всем списком эталонов, и здесь опять-таки большой список потребует большего времени сравнения. Поэтому с точки зрения оптимальности функционирования звукового языка необходимо, чтобы списки программ звукообразования и эталонов звуковосприятия были минимальны.*(Пр70н)

Объём долговременной памяти, как будто, не налагает особых ограничений на функционирование языка, однако в процессе речеобразования и речевосприятия фонологические единицы обрабатываются в оперативном блоке, обладающем весьма ограниченной непосредственной памятью. Отсюда следует второе требование к фонологическим единицам, состоящее в том, чтобы их структура была по возможности наиболее простой и содержала бы не более чем 10 (согласно гипотезе Миллера) различных команд или проверок значения различных параметров.*(Пр71)

Кроме того, надёжность действия механизма требует, чтобы были допустимы отдельные ошибки и искажения сигнала без нарушения процесса коммуникации. Отсюда следует требование, чтобы различные фонологические элементы были в максимальной степени не похожи друг на друга, с тем чтобы изменение отдельных параметров или команд не приводило к совпадению с другими элементами. Иначе говоря, необходимо чтобы фонологический механизм был в достаточной мере «грубым».

Обратной стороной последнего требования и следствием требования простоты является требование физического подобия реализаций одной фонологической единицы. Это подобие должно распространяться как на внутреннее нейродинамическое представление (тогда будет наиболее простой структура команд речепроизводства), так и на внешнее звуковое представление (тогда будет обеспечена определённая грубость механизма). Такие требования можно выразить как условие компактности расположения реализаций фонологических единиц в пространстве физических признаков. Перечисленные требования минимальности, простоты, грубости и компактности позволяют объяснить процедуры построения фонемных систем, принятые в фонологии, а с другой стороны, поставить задачу построения таких систем фонем как задачу математическую. К решению этих вопросов мы переходим в следующих главах.

3.5. Проблема дифференциальных признаков

И. А. Бодуэн де Куртенэ считал необходимым рассматривать фонему как совокупность более дробных единиц, реализованных в нейродинамической системе. Такими единицами в плане восприятия являются «акусмы» – элементарные представления акустических свойств звука. В плане речепроизводства фонемы реализуются как наборы «кинем» – элементарных нейродинамических команд, управляющих органами речи. Однако в его работах фактически фонемы рассматривались как единицы, неделимые с лингвистической точки зрения. Теория же субфонемных единиц – кинем и акусм – не была развита так, чтобы её можно было приложить к языковому материалу.

Последнее было сделано Н. С. Трубецким [ТРУБЕЦКОЙ 1], который определил понятие фонемы как совокупность свойств (дифференциальных, или различительных признаков), отличающих друг от друга звуки, которые выполняют разные функции в данных условиях речи. Но теория Трубецкого игнорирует вопросы материальной реализации языковых механизмов. Поэтому Бодуэновские субфонемные единицы двух видов, представляющие фонемы в двух различных отделах языкового механизма (порождение и восприятие речи), у Н. С. Трубецкого оказались заменены одним нерасчленённым понятием дифференциального признака. Такое упрощение, однако, может быть оправдано только при условии доказанности глубокого изоморфизма процессов речевого звуковосприятия и звукопроизводства. Как мы увидим ниже, языковые данные говорят об отсутствии такого изоморфизма для многих языков (например – русского).

Концепция дифференциальных признаков Трубецкого нашла своё крайнее развитие в работах Р. Якобсона и его последователей [ЯКОБСОН–ФАНТ–ХАЛЛЕ] как теория универсальной системы дихотомических (бинарных, двоичных) признаков, характеризующих акустические свойства речевых звуков любого языка. Однако чисто акустическая природа дифференциальных признаков довольно иллюзорна, поскольку с одной стороны лишь для некоторых из них (компактность-диффузность, тональность и ряд других) удаётся установить абсолютные корреляты среди физических свойств звука, а с другой стороны те же дифференциальные признаки, используемые как компоненты порождающих грамматик [HALLE], оказываются связанными не с акустическими, а именно с артикуляторными процессами (если порождающие грамматики рассматривать как модель нейродинамического процесса порождения речи). В этой теории основную роль играют не фонемы, а сами ДП (дифференциальные признаки), а фонемы рассматриваются как лишь удобные лаконичные обозначения для пучков ДП [HALLE].

Представление о том, что фонема определяется через ДП, довольно распространена в современной фонологии, несмотря на наличие серьёзных возражений (например, см. [ВОРОНКОВА и СТЕБЛИН-КАМЕНСКИЙ; ЕВДОШЕНКО]). Соответственно с этим и в моделях фонологического блока языкового механизма обычно предусматривается система опознавания в речевом потоке отдельных ДП, симультанные наборы которых идентифицируются как фонемы, последовательность которых во времени в свою очередь опознаются как тот или иной речевой знак (см. напр. [БОНДАРКО и др.]). Аналогично и в канале порождения речи предполагается окончательная реализация речевого замысла в виде потока ДП (см. напр. [HALLE]).

Однако с точки зрения материальной реализации языкового механизма, будь то в нейронной системе человека, будь то и искусственном информационном устройстве, вопрос о наличии и отсутствии того или иного блока должен решаться так, чтобы реализованная система была оптимальна для осуществления заданного языкового поведения.

Рассмотрим канал восприятия речи. Его можно было бы представить как набор индикаторов, каждый из которых настроен на опознавание в речи одного знака, имеющего содержательную интерпретацию. Гипотеза фонем состоит в том, что мы предполагаем наличие предварительного слоя индикаторов – которые реагируют на отдельные сегменты знаков, а смысловые единицы обнаруживаются по показаниям этих предварительных (фонемных) индикаторов. Преимущество двухслойной структуры состоит в том, что позволяет упростить устройство знаковых индикаторов за счёт того, что часть обработки данных (отсеивания избыточной информации) осуществляется сравнительно малочисленным набором фонемных индикаторов, которые могут быть достаточно сложными.

Гипотеза ДП предполагает наличие ещё одного слоя индикаторов, которые выделяют в речи признаки фонем и тем самым облегчают работу фонемных индикаторов. В принципе можно предположить наличие ещё одного и еще одного (и так далее) слоя индикаторов. Спрашивается, какое количество слоёв всё-таки обеспечивает наибольшую эффективность устройства, т. е. позволяет сократить объём занятой памяти и времени распознавания сигналов?

Эту задачу в самом общем виде поставил и решил Г. Я. Волошин (см. библ.). Оказывается, что минимальный объём памяти занимает двухслойная система распознавания, если не наложены ограничения на число параллельно работающих индикаторов (как будто ничто не заставляет подозревать наличие сильных ограничений в этом смысле). Применительно к распознаванию речевых знаков работа такого двухслойного распознавателя может быть описана так. Первый слой состоит из некоторого (сравнительно большого) числа индикаторов, определяющих наличие или отсутствие в речевом сигнале какого-либо одного признака. Число таких индикаторов и соответственно признаков выбирается таким, таким чтобы обеспечить различие всех семантически не эквивалентных сигналов. Показатели индикаторов подаются на один решающий элемент второго слоя, который по комбинации показаний опознаёт один из содержательных знаков, имеющихся в словаре распознающего устройства.

Из сказанного ясно, что мы не имеем оснований различать в речераспознающем канале два различных уровня между акустическим входом языкового механизма и знаковой интерпретацией. Единицы единственного промежуточного уровня (при предложении об оптимальном устройстве механизма), представляемые индикаторами первого слоя, целесообразно называть более исконным и более коротким термином «фонемы», а не «дифференциальные признаки».

Фонемы, определённые указанным способом, в отдельных случаях будут обладать свойствами ДП, а в других случаях будут совпадать с фонемами классической фонологии. Наши фонемы не обязаны подчиняться тезису о сукцессивности, но могут перекрываться по времени друг с другом. С другой стороны, наши фонемы не обязаны подчиняться также тезису о симультанности, принятому для ДП. В указанном плане наше представление о фонемах совпадает с теорией субфонем, предложенной М.В. Пановым [1],и естественно включает в себя, как частные случаи, фонемы классического вида, ДП, прозодемы, интонемы и др. «длительные» фонемы.

Обращаясь теперь к каналу речепроизводства, можно также констатировать излишность двух субзнаковых уровней. Если мы нашли такие подпрограммы речепроизводства, в терминах которых набор речевых знаков представляется самым компактным образом, то введение более мелких подпрограмм для описания основных подпрограмм должно потребовать дополнительных ресурсов памяти для фиксации подпрограмм обоих видов или для перезаписи знаков в терминах более мелких (следовательно, неоптимальных) подпрограмм. *(Пр75)

Практика моделирования канала речепроизводства также подтверждает сделанный вывод. Так, в порождающих грамматиках Н. Хомского – М. Халле представлен только уровень ДП [HALLE]. В работах, посвященных искусственному «синтезу речи по правилам» [ДЕРГАЧ и др.], наоборот, представлен только фонемный уровень. Однако априорное ограничение характера используемых для синтеза единиц не позволяет оптимизировать системы и тем самым приблизить её к моделируемому объекту – языковому механизму человека. В процессе поиска оптимальных единиц синтеза может возникнуть необходимость использования единиц, обобщающих понятия фонемы и ДП. Впрочем, в работе [ДЕРГАЧ и др.] система фонем уже включает в себя нефонемные объекты. А именно, рассматриваются «внесегментные фонемы» мягкости и интонации, которые, изменяя параметры других фонем, сами не имеют длительности, но тем не менее занимают определённое место в фонемной цепи.

Относительно канала производства речи можно сделать тот же самый вывод. Минимальный объём памяти обеспечивается двухступенчатым представлением знаков. Каждый знак обеспечивается набором подпрограмм речевой реализации (набором фонем), а каждая подпрограмма расшифровывается как система конкретных артикуляторных и комбинаторных команд различным отделам речепроизводящего механизма. Эти отдельные команды, конечно, можно ассоциировать с артикуляторными ДП, но в отличие от фонем, существующих в речевом механизме константно, как модели речевых навыков, артикуляторные команды появляются и исчезают с каждым новым элементом звучащей речи. Кроме того, состав артикуляторных ДП (в указанном понимании) следует устанавливать не лингвистическими рассуждениями, а анатомо-физиологическим исследованием иннервации мышц речевых органов. Лингвистически устанавливаемые ДП являются суммарным эффектом многих нейродинамических различий между отдельными фонема речепроизводства.

Таким образом, мы приходим к выводу, что априорное предположение о наличие двух фонологических уровней – фонемного и признакового – не соответствует представлению об оптимальном устройстве речевого механизма. В ниже следующих разделах мы будем предполагать наличие одного фонологического уровня. процедуры выделения единиц этого уровня не предполагают заранее специфических свойств этих единиц. Поэтому в конкретных случаях фонологические единицы могут иметь больше общего с ДП или с фонемами классической теории, в зависимости от конкретных свойств анализируемого языка. Именно такого вида единицы рассматривал И.А. Бодуэн де Куртенэ при первоначальной формулировке фонологической теории [6, стр. 121-123].

1 Аналогичный результат из других соображений получен Е. Н. Исениной (см. библ.)

2 В работе [БЕЛЯЕВ] эта модель была применена также для объяснения явлений лексического уровня.

жүктеу/скачать 148.5 Kb.

Достарыңызбен бөлісу: