Глава 7. Новые возможности

Геннадий Москвин
"Искусственный интеллект отличается от естественного тем, что, в отличие от человека, процесс мышления у думающей машины является естественным состоянием" (M.Geny).


    Спустя более чем два с половиной десятилетия сомнений и даже почти полного забвения, интерес к искусственным нейронным сетям (ИНС) за последние несколько лет снова быстро вырос. Различные специалисты из таких далеких областей, как техническое конструирование, философия, физиология и психология, заинтригованные возможностями ИНС, ищут новые возможности развития с помощью приложений ИНС внутри своих дисциплин.

     Это возрождение интереса было вызвано как теоретическими и прикладными достижениями, так и ожиданием появления нового чудо - алгоритма обучения. Но чудо пока так и не произошло. Поэтому пока пришлось воспользоваться тем, в сущности, хламом, что оказался под рукой. Но, как это ни странно, даже используя несовершенные алгоритмы, неожиданно открылись новые возможности использования вычислений в сферах, до этого относившихся лишь к области человеческого интеллекта.

      Открылись новые возможности создания машин, способность которых учиться и запоминать удивительным образом напоминает мышление человека. Это позволило вновь заговорить о новым наполнении содержания все еще загадочного термина «искусственный интеллект».

     Какие же свойства позволили пересмотреть отношение к примитивным обучающим алгоритмам? Как известно, искусственные нейронные сети индуцированы биологией, так как они состоят из элементов, функциональные возможности которых аналогичны большинству элементарных функций биологического нейрона. Затем искусственные нейроны само организуются таким образом, что напоминает нам синтез структуры человеческого мозга.

     Невзирая на весьма условное сходство, ИНС все же иногда демонстрируют довольно убедительное подобие тем свойствам, которые присущи мозгу человека. Например, ИНС могут обучаться на основе использования имеющегося опыта, могут обобщать и переносить предыдущие результаты на новые ситуации и извлекать существенные свойства из несущественной поступающей информации, содержащей неполные или излишние данные.

     Несмотря на некоторое  сходство алгоритмов обучения, трудно утверждать, что в скором будущем ИНС смогут адекватно дублировать функции человеческого мозга. Все же, реальный "интеллект", демонстрируемый даже самыми сложными ИНС, находится даже ниже уровня примитивного дождевого червя, и поэтому энтузиазм чрезмерных оптимистов должен быть умерен в соответствии с современными реалиями.

      Однако нельзя  пренебрегать сходством в работе ИНС с функционированием человеческого мозга. Даже ограниченные возможности ИНС позволяют утверждать, что прогресс процесса уподобления ИНС человеческому интеллекту, возможно, совсем уж не за горами. ИНС оказались способны изменять свое поведение в зависимости от воздействий внешней среды.

       Этот фактор в большей степени, чем любой другой, повлиял за тот интерес, который они вызвали. После подачи входных сигналов ИНС самонастраиваются с помощью функции отклика, тем самым обеспечивая адекватную ответную реакцию. Было разработано множество обучающих алгоритмов ИНС, причем каждый из них оказался как с сильными, так и слабыми сторонами.

    Сохранились преимущества и недостатки старого доброго метода грубой подгонки, проб и ошибок. Поэтому проблема несовершенства ИНС все еще существуют относительно того, чему сеть может обучиться и каким именно образом обучение должно проводиться. Отклик сети после обучения может быть до некоторой степени нечувствителен к небольшим изменениям входных сигналов. Эта внутренне присущая способность видеть нужный образ сквозь шум и искажения жизненно важна для распознавания образов в реальном мире.

     Эта способность позволяет снизить требования к точности предъявления образа, предъявляемые обычным компьютером, и может открыть путь к системам, которые могут успешно взаимодействовать с тем несовершенным реальным миром, в котором мы живем. Важно отметить, что ИНС делает обобщения автоматически благодаря своей нейроноподобной структуре, выполненной с помощью специально написанных компьютерных программ, а не с помощью использования натурального "человеческого интеллекта". 
 
24. УМ КАК СПОСОБНОСТЬ АБСТРАГИРОВАНИЯ

"Усложняя паутину, пауки совершенствуют мух" (M.Geny)

     Некоторые из предложенных искусственных нейронных сетей оказались способны извлекать полезную сущность из входных сигналов. Например, сеть Хопфилда может быть обучена на последовательности представления искаженных версий какой - либо буквы. После соответствующего обучения предъявление искаженного примера буквы приведет к тому, что сеть сама генерирует букву "совершенной" формы. В некотором смысле она обучается порождать то, что на самом деле никогда не видела.

       Эта способность извлекать идеальное из несовершенных входов ставит интересные философские вопросы. Она напоминает концепции идеалов, выдвинутую Кампанеллой в "Городе Солнца" или Платоном в его «Республике». Во всяком случае, способность ИНС извлекать  идеализированные прототипы у людей является весьма ценным качеством. Но надо при этом понимать, что ИНС не являются панацеей от всех проблем.

       Они, очевидно, не годятся для выполнения таких задач, как начисление социально справедливой заработной платы. Похоже, однако, что им будет отдаваться предпочтение в большом классе задач распознавания образов, с которыми плохо или вообще не справляются обычные компьютеры. Людей всегда интересовало их собственное мышление. Этот опрос мозга о себе самом является, возможно, главной отличительной чертой человека от животного.

       Имеется множество размышлений о природе мышления, простирающихся от духовных до анатомических. Обсуждение этого вопроса, протекавшее в горячих спорах философов и теологов с физиологами и анатомами, принесло мало пользы, так как сам предмет весьма труден для изучения. Те, кто опирался на самоанализ и размышление, пришли к выводам, не отвечающим уровню строгости физических наук.

       Экспериментаторы в области науки о мозге человека утверждают, что мозг труден для наблюдения и ставит в тупик своей организацией. И это естественно и понятно - ведь настощий интеллект в принципе непредсказуем. Иначе какой же это "интеллект"?

       Короче говоря, мощные методы научного исследования, изменившие наш взгляд на физическую реальность, оказались бессильными в понимании самого человека. Нейробиологи и нейроанатомы достигли значительного прогресса. Усердно изучая структуру и функции нервной системы человека, они многое поняли в "электропроводке" мозга, но мало узнали о его функционировании.

      В процессе накопления ими знаний выяснилось, что мозг имеет ошеломляющую сложность. Сотни миллиардов нейронов, каждый из которых соединен с сотнями или тысячами других, образуют систему, далеко превосходящую наши самые смелые мечты о суперкомпьютерах. Тем не менее мозг постепенно раскрывает свои секреты в процессе одного из самых честолюбивых исследований в истории человечества.

      Лучшее понимание работы элементарного нейрона и структуры его функциональных связей позволило ученым создать математические модели для проверки выдвинутых гипотез и теоретических положений в области ИНС. Эксперименты теперь могут проводиться на компьютерах без участия человека или животных, что решает многие практические и даже морально-этические проблемы.

      После завершения первых же работ выяснилось, что эти модели не только повторяют некоторые функции мозга, но и способны выполнять функции, имеющие свою собственную "умственную" ценность. Поэтому возникли две взаимно обогащающие друг-друга цели нейронного моделирования: первая – понять функционирование нервной системы человека на уровне физиологии и психологии и вторая – создать вычислительные системы ИНС, выполняющие функции, сходные с функциями мозга человека.

      Параллельно с прогрессом в программировании, нейроанатомии и нейрофизиологии психологами были созданы модели человеческого обучения. Одной из таких моделей, оказавшейся наиболее плодотворной, была модель Д. Хэбба, который в 1949 г. предложил закон обучения, явившийся стартовой точкой для алгоритмов обучения искусственных нейронных сетей. Дополненный сегодня множеством других методов, он мог бы продемонстрировать ученым того времени, как сеть нейронов может обучаться и самообучаться.

       Еще в 40-е и 50-е годы исследователи, объединив биологические и физиологические научные подходы, создали первые ИНС. Выполненные первоначально как электронные сети, они были позднее перенесены в более гибкую среду компьютерного моделирования, сохранившуюся и в настоящее время. Первые успехи вызвали взрыв активности и оптимизма.

       Минский, Розенблатт, Уидроу и другие разработали сети, состоящие из одного слоя искусственных нейронов. Часто называемые "перцептронами", они были использованы для такого широкого класса задач, как предсказание погоды, анализ электрокардиограмм и искусственное зрение. В течение некоторого времени казалось, что ключ к интеллекту найден и воспроизведение человеческого мозга является лишь вопросом конструирования достаточно большой сети.

       Но эта иллюзия скоро рассеялась. Сети не могли решать задачи, внешне весьма сходные с теми, которые они успешно решали. С этих неудач начался период нового интенсивного анализа. Минскому удалось доказать ряд теорем, относящихся к функционированию ИНС. Результаты его исследования (вместе с Пайпертом) были обобщены в книге, в которой они доказали, что используемые в то время однослойные сети теоретически неспособны решить многие простые задачи, в том числе реализовать функцию "исключающее ИЛИ".

       Минский не был оптимистом относительно возможного прогресса в области ИНС. Но, все же, перцептрон на деле показал себя заслуживающим изучения, несмотря на жесткие ограничения, причем, возможно, даже именно благодаря ограничениям. У ИНС много привлекательных свойств: линейность, занимательная теорема об обучении, простота модели параллельных вычислений. Правда, нет никаких оснований полагать, что эти достоинства сохранятся при переходе к многослойным системам.

      Тем не менее, считается важной задачей для исследования подкрепление или опровержение интуитивного убеждения, что такой переход бесплоден. Возможно, будет открыта какая-то мощная теорема о сходимости или будет найдена глубокая причина неудач обучения многослойных машин. Блеск и строгость аргументации Минского, а также его разрекламированный прессой научный престиж, породили чрезмерное доверие к его книге – ее выводы выглядели просто неуязвимы.

      В результате разочарованные исследователи поверили авторитету Минскому на слово и оставили распаханное поле исследований ради более обещающих областей, а правительства перераспределили свои субсидии, и искусственные нейронные сети были благополучно забыты почти на два с половиной десятилетия.

     Кстати, ту же ситуацию мы теперь наблюдаем с псевдонаучными инсинуациями и домыслами о "черных дырах" от Кембриджского авантюриста и шарлатана г-на Хокинга (Stephen William Hawking, Великобритания), считающегося одним из наиболее влиятельных и известных широкой общественности физиков-теоретиков нашего времени. В то же время (но в обратном порядке!)сразу несколько ученых, в том числе Кохонен, Гроссберг, Андерсон и автор этих строк проводили самостоятельные исследования, не поверив "на слово" Минскому.

      Наряду с плохим финансированием и недооценкой, исследователи испытывали затруднения с проведением экспериментов и публикациями. Поэтому исследования, опубликованные в семидесятые и в начале восьмидесятых годов, разбросаны в массе различных около научных журналов и публикаций, поэтому многие из работ в этой области мало известны, а подозрительно практически одни и те же алгоритмы стали получать разные названия.

      "Лица Чернова" удивительно стали похожи на физиономию Хопфильда, а получивший распространение BPM - метод обратного распространения ("back propagation method") не менее десяти лет позднее оригинала один к одному "слизан" с международно запатентованного метода обратного преобразования вашего покорного слуги (на основе новых методов и обучающих алгоритмов созданы и получены первые в мировой истории международные патенты 24 стран на интеллектуальные датчики), слово "преобразование" заменили на "распространение", а "коэффициенты коррекции" обучающего алгоритма превратились в "весовые коэффициенты" BPM. И никаких других усовершенствований метода, кроме тавтологических ухищрений, предложено не было. Становятся более понятны процессы, происходившие, например, в эпоху создания радио. Приоритетное авторство Попова до сих пор оспаривается поклонниками Маркони.

      Так или иначе, но в отношении ИНС постепенно появился теоретический фундамент, на основе которого сегодня конструируются наиболее мощные многослойные сети. Разумеется, что оценка Минского оказалась излишне пессимистичной, многие из поставленных в его книге задач сейчас легко решаются нейронными сетями с помощью простых стандартных процедур. За последние несколько лет теория стала применяться в прикладных областях и появились новые корпорации, занимающиеся коммерческим использованием этой технологии.

25. НЕНАСТОЯЩЕЕ БУДУЩЕЕ

"Оптимизм - это торжество иллюзий над разумом" (M.Geny)

      В современных продвинутых технологиях уже имеется много впечатляющих демонстраций возможностей искусственных нейронных сетей: сеть научили превращать текст в фонетическое представление, которое затем с помощью уже иных методов превращалось в речь, другая сеть может распознавать рукописные буквы, сконструирована система сжатия изображений, основанная на нейронной сети и т.д. Все они используют вышеупомянутую сеть обратного распространения – до сих наиболее успешный из современных алгоритмов, несмотря на то, что автор этих строк на международном симпозиуме предложил его еще на заре эпохи микропроцессоров - в далеком 1977 году.

       Обратное преобразование или распространение, предложенное в различных работах, является систематическим методом для обучения многослойных сетей, и тем самым преодолевает ограничения, указанные Минским. Как было справедливо указано автором этих строк, метод обратного распространения не свободен от проблем. Прежде всего, нет никакой гарантии, что сеть может быть обучена за конечное время. Большинство усилий, потраченных на обучение ИНС, пропадает напрасно после огромных затрат на использование машинного времени.

       Потом попытка обучения упорно повторяется еще и еще раз за разом – безо всякой уверенности, что новый результат окажется лучше прежнего. Нет также уверенности, что сеть обучится наилучшим, наиболее оптимальным из возможных способов. Алгоритм обучения может легко попасть в "ловушку" так называемого "локального минимума" и в результате будет получено не лучшее, а худшее решение.
Именно этот парадокс до сих пор приводит к катастрофам на железнодорожном транспорте.

       Разработано много других сетевых алгоритмов обучения, имеющих свои специфические преимущества. Некоторые из них до сих пор обсуждаются в специальной литературе. Следует еще раз подчеркнуть, что никакая из сегодняшних ИНС не является универсальным средством решения всех проблем, все они страдают от ограничений в своих возможностях обучаться и "вспоминать" результаты обучения.

       Мы имеем дело с алгоритмами, продемонстрировавшими как свою работоспособность и уникальные потенциальные возможности, так и  ограниченность, и множество открытых вопросов. Такая ситуация настраивает на умеренный оптимизм. Авторы склонны публиковать свои успехи, но не неудачи, создавая тем самым впечатление, которое может оказаться нереалистичным.

      Существует, следовательно, опасность, что ИНС начали продавать раньше, чем пришло их время, обещая те функциональные возможности, которых пока невозможно достигнуть. Если дело так пойдет и дальше, то область в целом может пострадать от потери кредита доверия и неизбежно вернется к застойному периоду семидесятых годов.

       Для улучшения существующих ИНС требуется много основательной работы. Должны быть развиты новые технологии, улучшены существующие методы и расширены теоретические основы, прежде чем данная область сможет полностью реализовать свои потенциальные возможности.

       ИНС сегодня предложены для решения задач, простирающихся от управления сражением и боем до присмотра за непослушным ребенком. Потенциальными приложениями являются те, где человеческий интеллект малоэффективен или таковой вообще отсутствует, а обычные вычисления трудоемки или неадекватны. Этот класс приложений во всяком случае не ниже класса, обслуживаемого обычными вычислениями, и можно предположить, что ИНС так или иначе, несмотря на свою уязвимость, все же займут свое место наряду с обычными вычислениями в качестве дополнения такого же объема и важности. В последние годы над ИНС  доминировали логические и символьно-операционные дисциплины.

     Например, широко пропагандировались экспертные системы, у которых имеется много заметных успехов, так же, как и неудач. Кое-кто кое-где говорит, что ИНС и вовсе заменят собой современный искусственный интеллект, но многое свидетельствует о том, что они будут существовать, объединяясь в системах, где каждый подход используется для решения только тех прикладных задач, с которыми они лучше справляются. Эта точка зрения подкрепляется тем, как люди функционируют в реальном мире.

     Решение задачи распознавания образов отвечает за активность, требующую быстрой реакции. Так как действия совершаются быстро и бессознательно, то этот способ функционирования важен для выживания, например, во враждебном окружении. Вообразите только, что было бы, если бы наши предки вынуждены были обдумывать свою реакцию на уже прыгнувшего на них хищника?

      Когда наша система распознавания образов не в состоянии дать адекватную интерпретацию, вопрос передается в высшие отделы мозга. Они могут запросить добавочную информацию и займут больше времени, но качество полученных в результате решений может быть выше. Можно представить себе искусственную систему, подражающую такому разделению труда. ИНС реагировала бы в большинстве случаев подходящим образом на внешнюю среду.

      Так как такие сети способны указывать доверительный уровень каждого решения, то сеть "знает, что она ничего не знает" и передает данный случай для разрешения "вышестоящей" экспертной системе. Решения, принимаемые на более высоком уровне, были бы конкретными и логичными, но они могут нуждаться в сборе дополнительных фактов для получения окончательного умозаключения.

      Разумеется, что комбинация двух систем была бы более мощной, чем каждая из систем в отдельности, следуя при этом высокоэффективной модели, выдаваемой биологической эволюцией. Урок, который можно извлечь из этой истории, выражается законом Артура Кларка - известным писателем и ученым. В нем утверждается, что, если крупный уважаемый ученый говорит, что нечто может быть выполнено, то он почти всегда прав.

      Если же ученый говорит, что это не может быть выполнено, то он почти всегда неправ. История науки является летописью ошибок, заблуждений и частичных истин. То, что сегодня не подвергается сомнениям, завтра или послезавтра может быть отвергнуто. Некритическое восприятие фактов может парализовать научный поиск.

       Какой бы привлекательной не была научная работа Минского, но именно она на десятилетия задержала развитие ИНС. Нет сомнений, однако, в том, что развитие ИНС пострадало также вследствие необоснованного оптимизма и отсутствия достаточной теоретической базы. Но не исключено, что шок, вызванный книгой Минского, обеспечил не только новое направление заблуждения, но новый потенциал развития, необходимый для дозревания или окончательного догнивания этой научной области.
 
      Все применяемые на практике алгоритмы обучения ИНС, да и не только нейронных сетей, базируются на оценочной функции, с помощью которой оценивается качество работы всей ИНС в целом. Имеется определенный алгоритм, который в зависимости от полученного значения этой оценки регулирует переменные параметры системы. Эти алгоритмы характеризуются сравнительной простотой, однако не позволяют за приемлемо короткое время получить развитую систему управления или приемлемую модель для использования ее в сложных биологических объектах.

      Именно в скорости самонастройки биосистемы человек всегда опережал любую искусственно созданную автоматическую систему. Но в последнее время появилась новые возможности для создания таких алгоритмов автоматических систем, которые по скорости обучения могут приблизиться к скорости самонастройки биологических объектов. Mир, в котором мы живем и творим, является комплексом причинно-следственных связей. Как это следует понимать?

      Представим себе, что за окном в буйном цветении весна, вы вместо стихов пишете научную статью про искусственные нейронные сети, а гдe-тo рядом "с белых яблонь падает белый дым", которого вы не видите. Если такое событие повлияет на текст, который вы пишете, то можно смело утверждать, что наш мир настолько насыщен причинно-следственными связями, что любое событие окажет большое или малое влияние на события, произошедшие после него. Помните у Гете?:

"Нельзя цветка так не задеть,
Чтобы Луну не потревожить!"
 
       Именно такая биосистема называется сильно связанной. Но весь наш практический опыт доказывает как раз обратное. К примеру, кто-то  поссорился с любимой тещей. Но на подавляющее большинство холостяков это не окажет никакого влияния. Дело в том, что реальные системы оперируют ступенчатыми функциями (У.Эшби, 1962), которые при небольших отклонениях  возмущающих воздействий не дают им распространяться дальше к другим системам и подсистемам.

        Более того, именно благодаря взаимосвязанности элементов реального мира мы можем выделить в нем  общие структуры систем и более детально выделить их подсистемы. В противном случае реальный мир представлял бы собой одну настолько сложную для познания систему, что даже не дипломированный гений не смог бы разобраться в ней, не говоря уж об обычной амебе или инфузории туфельке.

        Биосистемам управления приходиться адаптироваться к окружающей среде, принимая симметричную форму зеркального отражения характеристик ее структуры, приходиться постоянно совершенствовать и дополнять новыми параметрами и коэффициентами свою функцию отклика, как реакцию на вызовы сложной динамической биосистемы. Поэтому в нашем мозгу существуют такие независимые подсистемы, которые не влияют друг на друга в обученном состоянии.

        То есть, когда "хард-диск" нашего мозга переполнен знаниями, его лучше не трогать. Можно привести пример: психически и физически здоровой человек с нормальной координацией движений способен продолжать двигаться в прямом направлении независимо от поворота головы. Весьма полезное свойство, если учесть, что голова не всегда поворачивается в сторону здравого смысла.