В. В. Налимов. Бейесовская модель языка

Игорь Бабанов
В.В. Налимов. Бейесовская модель языка
Деятельность сознания характеризуется прежде всего взаимодействием со смыслами. Поэтому естественно было начать с изучения языка — носителя смыслов. Первая сформулированная мною задача звучала так: «Почему мы, люди, понимаем друг друга, когда пользуемся словами, имеющими неоднозначные смыслы?» В этой постановке задача имела кибернетическое звучание, поскольку с решением ее связано и будущее искусственного интеллекта. Естественно было искать ответ на этот вопрос, обращаясь к вероятностным представлениям, поскольку вероятностному описанию поддается изучение реальности любого явления.
Еще в 1974 году появилось первое издание моей книги Вероятностная модель языка. Расширенный и углубленный вариант этой книги был подготовлен к выходу в 1978 году. Но книгу трудно было издать — ее содержание в плане идейном было крайне одиозным для тех лет.
И все же второй вариант был издан.
…Итак, второе издание книги вышло значительно дополненным. Она получила широкий отклик, но, конечно, не у лингвистов — они молчали, считая ее, видимо, недостойной комментирования.
В.В. Налимов. Канатоходец. Воспоминания. Москва. Издательская группа Прогресс, 1994.
***
Перед нами открывается возможность осмыслить процесс понимания текстов.
Как мы понимаем тексты? Как мы понимаем друг друга, если говорим на языке, слова которого не имеют точечных (атомарных) смыслов? Как, скажем, можем мы понимать смысл английского слова set, значения которого в двухтомном Англорусском словаре разъясняются через 1816 слов? Почему мы любим метафорически насыщенные тексты? Каким образом мы понимаем фразы явно алогичные, подчас формально бессмысленные с позиций привычной нам логики? Как переводим мы иностранные тексты, если для ведущих слов текста часто не находим семантически однозначные слова на другом языке?
Мне представляется, что эти и подобные им вопросы являются ключевыми как для понимания природы нашего сознания, так и для поиска путей развития искусственного интеллекта. Я сформулировал их со всей остротой еще лет двадцать пять тому назад. Первым, правда, теоретически еще недостаточно четко разработанным ответом на них была книга Вероятностная модель языка, второе расширенное издание. Позднее к этой теме я возвращался во всех своих публикациях, относящихся к проблеме сознания.
Ответ, коротко говоря, звучит так: читая или ведя беседу, мы оказываемся вовлеченными в языковую игру, погружая важные для данного текста слова в ту или иную, новую нам ситуацию y, порождающую фильтр понимания p(y/m). Смысл слова, таким образом, сужается – конкретизируется. Но выбор фильтра всегда индивидуален. Бейесовская логика, в отличие от Аристотелевой, всегда свободна – свободна в понимании текста. Мы знаем на своем опыте, как тоталитаризм пытался изжить эту свободу. Именно свобода понимания делает общество гибким.
...Динамическое раскрытие природы смысла может быть достигнуто только через одновременный анализ семантической триады: смысл, текст, язык. Любой элемент этой триады может быть определен через два других. Здесь мы обращаемся к так называемому “циклическому определению”. Скажем:
Смыслы – это то, из чего создаются тексты с помощью языка.
Тексты – это то, что создано из смыслов с помощью языка.
Язык – это средство, с помощью которого из смыслов рождаются тексты.
Триада становится синонимом сознания.
Тексты, в моем понимании, – это структуры, организуемые вероятностным взвешиванием смыслов. Взвешивание – это придание элементарным смыслам вероятностной меры.
Вероятностное взвешивание – это анти-Аристотелева логика. Она позволяет оперировать размытыми смыслами, раскрывающимися на глубинных уровнях сознания. Это – логика творческого процесса. Аристотелева логика вторична. Она редуцирует смысловой континуум к дискретам – словам, за которыми скрыто множество смыслов. Желая серьезно понять дискретно написанные тексты, мы обращаемся к скрытой размытости. Понимание становится личностным. Более того, оно всегда ситуационно.
Из интервью с В.В. Налимовым (Впервые в сокращенном варианте текст был опубликован в журнале Общественные науки и современность, 1995, № 3, с.122–132)
***
Цель этой книги – выяснить, что же представляет собой язык. Пытаясь сформулировать требования, определяющие те знаковые системы, которые нам хочется рассматривать как язык, мы анализируем функции языка, описываем иерархические структуры языка и его размерность, изучаем различные подходы к классификации языков. Классификация – это один из способов логического анализа сложных систем. Расположение явлений по какой-то определенной схеме, выбранной исследователем для решения стоящих перед ним познавательных задач, – это взгляд на систему в некотором специальном ракурсе, позволяющий отчетливо увидеть то, что ранее оставалось затушеванным. Так будем поступать и мы. В частности, строя семантическую шкалу языков, мы пытаемся посмотреть на все многообразие языковых систем глазами тех, кто придает особое значение вероятностной структуре языка. Чтобы выполнить эту задачу, мы рассматриваем широкую гамму языков: абстрактные языки математики, обыденный язык людей и языки науки, язык древней индийской философии, язык межмолекулярных взаимодействий и, наконец, язык абстрактной живописи
...Оставаясь на позициях кибернетики, мы рассматриваем язык как некоторый организм, полагая, что возникнув под влиянием определенных (может быть, еще далеко не понятых нами, тем более в деталях) причин, он продолжает самостоятельно развиваться, проходя свой, специфичный путь эволюции и оказывая подчас решающее влияние на иерархически выше стоящие системы, скажем на мышление человека.
...Главная проблема семантики формулируется так: как связан знак с тем, что оно обозначает, как знаковые системы используются в интеллектуальной деятельности, как, почему и в какой степени одни люди понимают то, что говорят другие, почему в процессе развития культуры появляются новые и все более сложные знаковые системы, чем различаются в семантическом отношении знаковые системы, созданные в разные культурные эпохи, чем они отличаются от единственно известной нам но социально созданной знаковой системы — биологического кода.
...Бейесовская модель языка
Попробуем теперь построить модель языка, содержащую в явной форме вероятностную структуру смыслового содержания знака. Здесь нам прежде всего надо сказать несколько слов о теореме Бейеса[*7]и необейесовском подходе к обоснованию правил вывода в современной математической статистике. Основная идея здесь заключается в том, что, принимая какое-либо решение после того или иного эксперимента, мы всегда используем как вновь полученные знания, так и предыдущие знания об изучаемом явлении. До постановки опыта у исследователя всегда есть какие-то знания, которые могут быть выражены на вероятностном языке, – мы можем это назвать априорной вероятностью, или, иначе, субъективной, или персональной, вероятностью[*8]. Теорема Бейеса позволяет формализовать процесс принятия решения, моделируя такую процедуру, в которой используется как априорная информация, так и информация, полученная из опыта, ответ выдается в вероятностных терминах в виде апостериорной вероятности.
Поясним смысл этого приема в обычных статистических терминах. Допустим, что производится измерение величины ; для некоторого объекта Н. Имеется пространство Y всех возможных результатов измерений у. На этом пространстве задана вероятность р(у/;). В простейшем случае это просто функция нормального распределения для ошибок наблюдений при измерении объекта Н. Далее будем считать, что нам известна априорная вероятность р(;), т. е. априори – до проведения опыта – нам что-то известно о распределении всех возможных значений ;. Тогда теорему Бейеса можно записать следующим образом:
р(;/у)= k р(у/;) р(;),
где k – константа, получаемая, как обычно, из условий нормировки. Вводя в рассмотрение априорную информацию, мы как бы задаем вход в систему, а затем, пользуясь теоремой Бейеса, образуем разумным образом (используя аксиому об умножении вероятностей) выход из системы, который записывается в виде апостериорной вероятности р(;/y). Вся трудность этого подхода заключается в понимании того, чт; значит априорная вероятность р(;), об этом много написано (см., например, [Good, 1962], [Wright von, 1962]). Во всяком случае ясно, что человек как в своей научной, так и в повседневной деятельности постоянно оценивает вероятности различных событий. Эти оценки всегда субъективны в том смысле, что они определяются интеллектуальной настроенностью данного субъекта и степенью его информированности, но они в каком-то смысле и объективны, или, может быть, лучше сказать – всеобщи, поскольку предполагается, что приходится иметь дело с разумными наблюдателями, настроенными в какой-то степени одинаково. Важно здесь другое: если субъективная вероятность какого-либо события как-то оценена, то с нею можно поступать так же, как с вероятностью, введенной в математике, полагая, что она обладает теми же свойствами и подчиняется тем же постулатам.
...Вернемся теперь к семантическому анализу знаковых систем. Основное наше утверждение может быть сформулировано следующим образом: как в обыденном языке, так и во многих других языках с каждым знаком вероятностным образом связано множество смысловых значений. Можно говорить об априорной функции распределения смысловых значений знака. Это распределение может быть построено, скажем, так: приемник имеет в своем сознании некоторое представление о возможных смысловых значениях знака, одни из них имеют б;льшую вероятность появления, другие – меньшую и т.д. Все это может быть представлено функцией распределения, построенной так, что по оси абсцисс отложены ранги смысловых значений, установленные по вероятности их появления, по оси ординат отложены сами вероятности. Шкала абсцисс может мыслиться и как непрерывная – смысловыми единицами могут быть нечетко разграниченные участки этой шкалы, так же, как, скажем, нечетко разграничены цвета на волновой шкале для спектра белого света. Если мы посмотрим на словари – толковые или двуязычные, то увидим, что каждому слову, находящемуся на «входе» словаря, дается несколько, иногда даже много, разъяснительных текстов. Эти разъяснительные тексты обычно упорядочиваются по силе их связи со словом на входе. Таким образом, представление о функции распределения смыслового содержания слова в неявном виде оказывается заложенным в структуре наших словарей. Там смысловое содержание знака представлено в виде семантического поля, элементы которого упорядочены по линейной шкале. Мы хотим это упорядочивание усилить, приписав участкам смысловой шкалы вероятности, с которыми они ассоциируются со знаком. Эти вероятности возникают в сознании приемника-субъекта, и потому соответствующие им функции распределения могут быть названы априорными, или, как еще иногда говорят, субъективными, или персональными[*10].
В.В. Налимов. Вероятностная модель языка. Издание второе, расширенное. М.: Наука, 1979, 303 с.