Обработка информации у человека Ч.1. Уровни и

advertisement
3С
УДК 681.3: 519.9
В.В. Сторож
Донецкий государственный институт искусственного интеллекта
Обработка информации у человека
Ч.1. Уровни и базисные элементы
В статье проведен анализ информационных аспектов работы головного мозга, данные о
составе, структуре и организации работы мозга; показано, что человек представляет и обрабатывает информацию с помощью многоуровневой системы базисных элементов. Эти элементы на нижних уровнях обработки информации представляют собой инварианты пространственно-временных
преобразований, имеющих простой физический смысл. Создание такого рода базисных элементов
опирается на принципы симметрии, инвариантности, минимума энтропии. Полученные результаты
позволили более четко обозначить различия между искусственными нейросетями и головным мозгом и наметить пути совершенствования нейросетей.
Введение
Человек пытается понять принципы работы своего собственного мозга.
Это важно как с чисто мировоззренческих позиций: кто мы есть и зачем, – так и
для моделирования человеческой психики, создания новых поколений компьютерной техники, усиления мощи человека.
C позиции информационного подхода представляется, что основные проблемы на пути понимания человеческой психики можно сформулировать следующим образом.
1. Окружающий человека мир событий многоаспектен и многомерен. Но человек
сжимает информацию о мире до уровня физического пространства и пространства представления (или пространств представлений). Каким образом он это
делает? Ответ нужно дать как на уровне общей схемы обработки информации,
так и на уровне нейрофизиологии, а затем показать, как нейрофизиология
обеспечивает работу абстрактной общей схемы. Иначе мы неизбежно придем к
столь модной сейчас концепции о несводимости психики к физиологии.
2. Часто пытаются свести принципы обработки информации к распознаванию образов. Однако мозг предназначен в первую очередь не для распознавания, а для
моделирования. В ходе эволюции выжили в первую очередь те, кто умел лучше и быстрее моделировать происходящие в окружающей среде процессы. А
для моделирования более важными являются вопросы представления информации, ее соответствия оригиналу, скорость предсказания и выбор наилучшего
решения. В этом перечне задача распознавания образов, безусловно, важна, но
она занимает подчиненное место. Таким образом, следующая важная проблема – это принципы адекватности мира и мышления. Без решения этой проблемы невозможно решить в общей постановке и задачу распознавания образов.
96
«Искусственный интеллект» 4’2001
Обработка информации у человека. Ч.1. Уровни и базисные элементы
3С
3. Человек работает не непосредственно с входной информацией, а осуществляет
ее сложную и многоэтапную переработку, в том числе путем выделения некоторых базисных элементов [1]. В задаче распознавания образов эти базисные
элементы соответствуют признакам [2, с. 63-64]. Возникает вопрос: какие
принципы используются при выделении таких признаков (базисных элементов) и как это реализуется на нейрофизиологическом уровне?
4. Известно, что информация в человеческом мозгу передается с помощью импульсов, при этом частота следования импульсов находится в диапазоне примерно 10-103 импульсов в секунду, т.е. средняя скорость работы мозга составляет примерно 102 Гц [1, с. 10]. В то же время минимальная частота оценки новой ситуации составляет всего несколько десятых долей секунды, за это время
мозг успевает реализовать не более нескольких десятков тактов своей работы.
Но при этом обрабатывается колоссальное количество информации. Это может
быть реализовано только в том случае, если мозг работает параллельно. Причем речь идет не просто о некоторых параллельных процессах, а о том, что основная часть элементов мозга работает параллельно над решением одного и
того же круга задач. Каким образом мозг может это реализовать?
Поскольку указанные вопросы относятся к различным аспектам единого
процесса обработки информации, то они, безусловно, тесно взаимосвязаны. Таким
образом, с одной стороны, необходимы поиски комплекса представлений, дающих
ответ с единых позиций на все поставленные вопросы, а с другой – полученные
для отдельных вопросов решения могут быть использованы и для объяснения остальных проблем.
Настоящая статья посвящена поиску ответов (хотя бы в некоторой мере)
на поставленные выше вопросы. При этом ставилась задача в первую очередь не
выдвижения новых понятий, а согласования уже существующих подходов между
собой и с данными нейрофизиологии.
Нейрофизиологические данные
Анализ любых аспектов работы мозга, в том числе и информационных,
невозможен без знания некоторых физиологических основ его работы, в связи с
чем приведем минимально необходимые для дальнейшего анализа в рамках данной статьи данные о составе, структуре и организации работы мозга.
Мозг состоит из трех типов клеток [1, с. 10-20]: рецепторов, нейронов и
вспомогательных (например, глиальных). Рецепторы – это клетки для восприятия
внешней информации: зрительной, слуховой и т.д. Нейроны – это клетки для переработки информации, они имеют сложное строение; связь между нейронами определяет структуру мозга. Нейрон состоит из центральной части, иначе называемой телом нейрона, входных отростков – синапсов и одного выходного, разветвляющегося на множество окончаний, – аксона. Центральная часть нейрона содержит в себе ядро, в котором при определенных состояниях синапсов (входов) возникают нервные импульсы, передающиеся далее другим нейронам путем распространения электрического импульса через аксон и его разветвления. Импульсы
передаются не непосредственно с аксона на синапсы, а через промежуточную среду, посредством так называемой постсинаптической связи. При этом между окон-
«Штучний інтелект» 4’2001
97
Сторож В.В.
3С
чаниями одного нейрона и синапсами другого существует небольшой зазор. Когда
электрический импульс достигает окончания нейрона, он приводит к высвобождению небольшого количества специализированных белковых молекул – нейромедиаторов. Эти молекулы распространяются через зазор и приводят к возникновению электрического импульса во входном синапсе (или синапсах) другого нейрона. Важно отметить, что число синапсов и выходных окончаний нейронов находится, как правило, в диапазоне от нескольких сот до нескольких тысяч, а характерные размеры области, с которой снимается информация отдельным нейроном,
составляет около одного миллиметра, хотя часть связей может иметь и значительно большую длину, т.е. нейрон может иметь связи как со своим непосредственным
окружением, так и с удаленными группами нейронов и другими отделами мозга.
Как видно из этого описания, нейрон – это значительно более сложная система,
чем отдельный элемент микросхемы (с чем так часто принято сравнивать нейрон),
позволяющий хранить и перерабатывать всего один бит информации. Скорее,
нейрон можно сравнить не с элементом микросхемы, а со сложной микросхемой,
обрабатывающей информацию.
Очень интересны и сведения о структуре связей между нейронами и об
организации их работы. В настоящее время достаточно хорошо изучено зрение у
человека и животных, а также несколько входных уровней мозга, занимающихся
обработкой зрительной информации. Далее этот вопрос освещен по [1, с.40-132].
Экспериментально показано, что связи между нейронами (через синапсы и аксоны) осуществляются не хаотически, а в высокой степени упорядоченно, причем
эта упорядоченность относится в первую очередь к обработке информации, включая и выделение базисных единиц для анализа информации. Поскольку эти данные играют ключевую роль в дальнейших рассуждениях, рассмотрим их более детально на примере обработки зрительной информации.
На первом этапе идет обработка информации непосредственно в глазу, в
нескольких слоях нервных клеток, примыкающих к сетчатке. При этом каждый
отдельный нейрон связан синапсами не с отдельным рецептором, а с большим их
количеством (несколькими сотнями или тысячами), примерно так же, как связаны
между собой нейроны в последующих слоях. Поскольку каждый нейрон связан со
множеством рецепторов, расположенных на сетчатке в довольно широкой пространственной области (диаметром примерно миллиметр) и поэтому фиксирующих световое излучение в достаточно широком угловом диапазоне, то и каждый
нейрон фиксирует световую информацию не в узкой точке, соответствующей одному нейрону, а в достаточно широкой области, называемой рецептивным полем
нейрона. Общее количество нейронов в этих слоях не сильно отличается от общего числа рецепторов (у человека 125 миллионов рецепторов – палочек и колбочек),
поэтому одни и те же рецепторы одновременно связаны с большим количеством
нейронов, расположенных поблизости, в результате чего рецептивные поля отдельных нейронов значительно перекрываются. Помимо этого, нейроны связаны
между собой большим количеством обратных связей, позволяющих нейронам взаимное торможение, т.е. предотвращение возбуждения электрических импульсов.
На этом уровне происходит первое преобразование входной информации.
Это осуществляется следующим образом: если все нейроны в области рецептивного поля освещены одинаково, то они взаимно тормозят друг друга, в результате чего их импульсация (количество импульсов) практически та же самая, что и в темно-
98
«Искусственный интеллект» 4’2001
Обработка информации у человека. Ч.1. Уровни и базисные элементы
3С
те или при других уровнях освещенности. В результате на следующие уровни посылается информация не об абсолютной освещенности, а лишь дифференциальные
характеристики входного сигнала. При этом структура посылаемой на следующий
уровень информации довольно проста: нейрон сигнализирует лишь в том случае,
если в его рецептивном поле есть перепады освещенности, и частота импульсов тем
выше, чем ближе этот перепад к центру рецептивного поля и чем больше (до определенного предела) размеры пятна, на границах которого имеется перепад освещенности. Как видно из изложенного, на этом этапе зрительная информация кодируется
всего двумя-тремя признаками: интенсивностью перепада, радиальной симметрией,
и, возможно, третьей переменной, связанной с размерами пятна.
Из теории сжатия информации хорошо известно, что вычет фона или кодирование его меньшим количеством информации – один из самых простых и эффективных способов сжатия информации. Поэтому в данном случае мы имеем дело одновременно с кодированием (точнее сказать, перекодированием) информации в новое пространство признаков или базисных элементов и ее сжатием.
Сжатая информация от нейронов сетчатки поступает (после некоторой
промежуточной обработки) в первичную зрительную кору (стриарную кору),
представляющую собой слой нейронов толщиной примерно два миллиметра и
площадью до нескольких десятков квадратных сантиметров. Обработка информации здесь характеризуется несколькими основными принципами:
1) происходит дальнейшее перекодирование представления информации. Эксперимент показывает, что на этом уровне появились специализированные нейроны,
избирательно реагирующие на такие параметры, как ориентация линии, направление движения, длина линии и ее кривизна, а также зависимость от глаза, на который подается стимул. Количество таких новых базисных элементов, в которых
представляется зрительная информация, составляет порядка десяти [1, с. 100]. Таким образом, мы видим, что повышение уровня обработки информации от уровня
сетчатки до уровня зрительной коры сопровождается увеличением числа первичных элементов, в которых представляется информация;
2) первичная зрительная кора состоит из отдельных модулей размером примерно
2х2х2 мм, содержащих в себе все перечисленные виды нейронов и осуществляющих параллельную обработку информации с областей сетчатки, примерно
соответствующих размерам рецептивных полей нейронов сетчатки. При этом
нейроны специализируются не только на типе обработки, но и на количественных характеристиках. Например, нейроны, реагирующие на направление линии, разделены на те, которые реагируют лишь на определенное положение
линий, и на соседние нейроны, которые реагируют только на линии, находящиеся под определенным углом к первым и т.д. Характерное число количественных градаций составляет от 10 до 100 [1, с. 107-108]. Соответственно и точность определения характеристик не может быть высокой;
3) у различных живых существ наборы базисных элементов в первичной зрительной коре могут несколько отличаться, однако у одного и того же вида они одинаковы, т.е. структура обработки зрительной информации определяется генетически, или, иначе говоря, по отношению к отдельному человеку является
врожденной. Как мы увидим дальше, это чрезвычайно важный вывод, позволяющий нам в новом свете увидеть природу проблем, выдвинутых Платоном и
Кантом.
«Штучний інтелект» 4’2001
99
Сторож В.В.
3С
После зрительной коры зрительная информация поступает в более высокие отделы коры, где происходит «сборка» мозаичной картины в целостные образы. Для этого и более высоких этапов не существует таких детализированных
экспериментальных данных, как для первых двух этапов, так что пока мы можем
лишь гадать, как это происходит.
Остается добавить, что обработка информации, поступающей от других
органов чувств, по-видимому, происходит по той же схеме, что и для зрительной
информации. Т.е. первичная информация перекодируется в некоторые базисные
для данного типа информации элементы, и наборы таких элементов обрабатываются в отдельных модулях. В частности, такая картина экспериментально обнаружена в соматосенсорной коре, обрабатывающей информацию рецепторов осязания
и проприоцепции (мышечного чувства) [1, с. 122].
Инварианты и базисные элементы
Пожалуй, самый интригующий вопрос познания заключается в том, каким
образом мы получаем соответствие наших представлений и внешнего мира, и что
значит вообще это соответствие как на уровне нейрофизиологии, так и с информационной точки зрения. Вопрос представляется еще более запутанным, если вспомнить о многоуровневой обработке информации, что неизбежно порождает новый
вопрос: если у нас уже на входных уровнях имеется соответствие (иначе его не
будет и на высших уровнях), то зачем нужны эти высшие уровни и какие принципы они используют?
Как следует из экспериментальных данных, информация в мозгу передается в виде последовательности электрических импульсов, причем амплитуда этих
импульсов примерно одинакова для всех нейронов, а меняются лишь частотные
характеристики. Картина осложняется тем, что нейроны связаны между собой
сложным образом и их взаимодействие имеет многомерную пространственновременную структуру. В то же время эта многомерность не может рассматриваться классическим образом как минимум по двум причинам:
– отдельные нейроны могут посредством связей (синапсов и аксонов) входить в
образования с различной размерностью, т.е. размерность пространства не определена и можно говорить, скорее, о топологии связей отдельных нейронов,
чем о размерности пространства;
– отдельный нейрон испускает импульсы в ответ не на единичное раздражение, а
на действие целой группы синапсов, в том числе относящихся к различным
функциональным группам нейронов, что можно трактовать как сжатие размерностей пространства или как их перемешивание.
Эти вопросы еще ждут своих исследователей, здесь же отметим, что во всей
этой сложности, близкой, на первый взгляд, к хаосу, существует один мощный организующий принцип – принцип инвариантности, значение которого для вопросов познания трудно переоценить, в связи с чем рассмотрим его более подробно.
Вообще под инвариантностью принято понимать сохранение чего-либо (закона, величины и т.п.) при некоторых преобразованиях [3, с. 137]. Понятие инвариантности развивалось относительно независимо в физико-математических науках и
в психологии. В математике понятие инварианта существует уже несколько столе-
100
«Искусственный интеллект» 4’2001
Обработка информации у человека. Ч.1. Уровни и базисные элементы
3С
тий, в физике же оно получило широкое распространение после работ немецкого
математика
Эми
Нетер,
опубликованных
в
первые
десятилетия
20-го века [4, с. 165]. В этих работах было показано, что каждый инвариант связан с
определенным типом симметрии и, наоборот, каждый тип симметрии приводит к
появлению некоторого инварианта. В физике инварианты являются законами сохранения некоторой величины. Например, такой тип симметрии, как однородность
пространства, приводит к независимости от точки отсчета и соответствует закону
сохранения количества движения; симметрии во времени соответствует закон сохранения энергии. В четырехмерном пространстве-времени насчитывается всего
десять фундаментальных законов сохранения [5, с. 333-334]. В дальнейшем была
показана тесная связь инвариантов и симметрии с теорией групп, в результате чего
инвариант стали представлять как некоторое групповое преобразование.
Как показано в разделе о нейрофизиологии зрения, мозг на первых этапах
преобразования зрительной информации выделяет величины, которые можно сопоставить с физическими инвариантами. Так, например, нейроны первичной зрительной коры, реагирующие на линию, движущуюся в определенном направлении
и с определенной скоростью, можно сопоставить с физическим инвариантом, соответствующим закону сохранения скорости. Такого же рода физические инварианты можно сопоставить и с остальными базисными элементами представления
информации в нейронах сетчатки и зрительной коры. Интересно отметить, что
мозг в стриарной коре отображает трехмерное пространство плюс время, т.е. четырехмерное пространство и число базовых элементов примерно равно десяти, т.е.
равно теоретическому числу инвариантов для четырехмерного пространства. Отсюда следует ряд важных выводов:
1. Для представления информации в мозгу используются наборы базисных элементов, представляющих собой инварианты некоторых преобразований. Эти
преобразования имеют глубокую внутреннюю связь с принципами симметрии,
групповыми преобразованиями, а также с физическими законами окружающего нас мира.
2. Принципы, понятия и элементы, которые мы используем для описания природы и собственного мышления – одни и те же, т.е. мышление существует точно
таким же образом, как и окружающий мир (имеет такой же онтологический
статус). Во всяком случае, как существует психика, как существует природа и
насколько адекватно мы их описываем – одинаково непонятно.
3. Любая симметрия накладывает на элементы множества определенные связи и
таким образом сокращает число степеней свободы и число возможных состояний системы. Поскольку энтропия пропорциональна логарифму числа возможных состояний, то использование инвариантов приводит, с одной стороны, к
уменьшению энтропии системы, а с другой – к упрощению описания системы.
По-видимому, можно строго доказать, что используемые мозгом базисные
элементы (языки, признаки и т.п.) максимально возможным образом упрощают
описание (максимально снижают энтропию представления) либо такое описание находится в некотором локальном минимуме сложности (и энтропии).
Понятие инварианта в той или иной трактовке широко используется и в
психологии. Вначале оно использовалось в гештальт-психологии для подчеркивания того, что образ представляет собой целостное образование, сравнительно неизменное в некотором диапазоне преобразований [6, гл. 4]. В настоящее время это
«Штучний інтелект» 4’2001
101
Сторож В.В.
3С
понятие используется в психологии примерно в том же смысле, что и в физике.
Так, в работе [7], посвященной рассмотрению роли инвариантов в психологии, инвариант определяется как группа преобразований, используемая для описания
психических исследований. При этом инварианты употребляются как опознавательные признаки и как характеристики психологических шкал [7, с. 26]. В этой
же работе вводится понятие базиса описания, представляющего собой множество
знаковых объектов, характеризующихся полнотой и упорядоченностью и предназначенных для описания одного и того же круга явлений [7, с. 34]. В то же время в
психологической литературе не приводится каких-либо алгоритмов (процедур, методик) сравнения различных инвариантов или создания более эффективных. В результате, несмотря на прозрачность и объяснительную силу данного понятия, не
очень понятно, как с ним работать в психологии и лингвистике.
Этапы и уровни обработки информации
На основании приведенных выше экспериментальных данных и соображений, целостную картину обработки информации человеком можно представить
следующим образом (рис. 1).
На первом этапе информация воспринимается различными органами чувств
(рецепторами), сжимается путем удаления фона, кодируется несколькими простейшими базовыми элементами и передается на следующий уровень обработки.
На втором уровне происходит усложнение представления информации,
число базовых элементов возрастает примерно до десяти. Сами базисные элементы представляют собой некоторые инварианты достаточно простых и прозрачных
физических преобразований. (На этих уровнях типы инвариантов заданы генетически, т.е., независимо от нашего личного опыта структура восприятия мира на
этих уровнях задана нам еще до рождения и мы можем, на этих уровнях, воспринимать мир только так, а не иначе.
На следующем уровне, который пока не исследован экспериментально в
достаточной степени, происходит «сборка» целостных в рамках данного органа
чувств образов. Сколько базисных элементов используется на этих уровнях и каким образом они работают – мы пока не знаем. Можно только, исходя из логики
изменения предыдущих уровней, предположить, что число базисных элементов с
усложнением обработки информации возрастает, эти элементы в значительной
мере заданы генетически и являются инвариантами некоторых более сложных,
чем на предыдущих уровнях, преобразований.
Описание следующих двух уровней носит гипотетический характер и относится прежде всего к принципам обработки информации, а не к физиологии.
Оно основано на предположении, что принципы обработки информации на этих
уровнях носят промежуточный характер между низшими уровнями и уровнями
интеллекта и сознания. В какой-то мере эти уровни можно сопоставить с бессознательным в классической психологии.
Итак, следующий уровень – это уровень сведения образов, созданных на
базе восприятия различными органами чувств, в единую целостную картину.
102
«Искусственный интеллект» 4’2001
Обработка информации у человека. Ч.1. Уровни и базисные элементы
3С
Рис. 1. Наглядное представление процесса обработки информации
у живых существ:
а) в зависимости от этапа обработки информации;
б) количество базисных элементов в зависимости
от этапа обработки информации и этапа эволюции;
с) этап эволюции
У различных живых существ он, по-видимому, организован различным
образом. Так, у насекомых принципы образования образов должны быть заданы
генетически, а выходы нейронов этого уровня напрямую либо с минимальным количеством переходных элементов соединены с исполнительными органами.
Уровень эмоций. Он появляется у более высокоорганизованных живых
существ, чем насекомые. Этот уровень может быть разделен еще на несколько в
зависимости от сложности мозга, степени генетической предопределенности эмо-
«Штучний інтелект» 4’2001
103
Сторож В.В.
3С
ций и т.д. Детальная классификация этого уровня не входит в нашу задачу. Отметим лишь, что у высокоразвитых животных и человека инварианты здесь уже не
заданы жестко генетическим путем, а приобретаются в процессе жизни.
Уровень предсознания. Характеризуется наличием простейшего языка. Звуковые сигналы, а также жесты, позы и т.п. могут являться заместителями ситуаций.
Каждое слово этого протоязыка соответствует инварианту некоторой ситуации. Как показывают наблюдения за млекопитающими и приматами, число
слов в таком протоязыке колеблется в пределе примерно от 10 2 до 103. Инварианты высших уровней в значительной мере формируются в результате приобретенного опыта.
На уровне сознания в качестве инвариантов мышления выступают понятия. У первобытного человека число таких понятий составляет порядка 104, у современного человека – 105-106. Языковые инварианты образуются исключительно
в результате приобретенного опыта и овладения языком.
Отметим, что число базисных элементов у живых существ увеличивается
по мере возрастания сложности представления информации. Качественно это
можно объяснить тем, что происходит добавление новых параметров, каждый из
которых может быть представлен как новая размерность. Таким образом, увеличение количества базисных элементов вызвано увеличением размерности пространства представления. Почему природа делает это? Учитывая, что на уровне стриарной коры число базисных элементов примерно равно числу инвариантов данной
размерности, можно обобщить этот результат и высказать предположение, что
число базисных элементов должно быть равно числу инвариантов данного многомерного пространства (и представлять собой эти инварианты), в котором мы представляем искомую информацию. В таком случае эти базисные элементы представляют собой нечто вроде ортогонального базиса по отношению к представлению
информации. В этом ортогональном базисе любая информация, которая требует
для представления пространства данной размерности, может быть записана наиболее компактным образом.
Человек в процессе мышления работает одновременно со всеми уровнями
представления информации. Так, например, образ бала содержит одновременно и
пространственную картину (низшие уровни представления информации), и музыку (сочетание нескольких типов входной информации), и эмоции, а также имеет
понятийную структуру (кто, как одет и т.д.). Т.е. воспринимаемые человеком образы состоят фактически из набора подобразов, образуемых с помощью инвариантов различных уровней.
Образование такой целостной картины на основе представлений различных уровней возможно только в случае, если существуют эффективные процедуры перевода информации на языки (представления) различных уровней. В этом
отношении мозг существенно отличается от современных искусственных нейросетей, работающих всего с одним уровнем представления информации, в результате
чего там вопросы перевода даже не могут возникнуть.
Инварианты низших уровней могут быть также сделаны объектом понятийного анализа и внутреннего самоанализа. При этом возникает вопрос: к какому
же миру принадлежат обнаруженные инварианты – миру психики или внешнему
миру? Представляется, что понятие об идеях у Платона возникло именно в результате самоанализа и выявления простейших инвариантов (соответствующих по
104
«Искусственный интеллект» 4’2001
Обработка информации у человека. Ч.1. Уровни и базисные элементы
3С
предложенной здесь классификации второму уровню). Отсюда же и корни априоризма Канта, утверждавшего, что пространства как такового нет, а мы структурируем мир в пространство своим собственным мышлением.
Так что же мы видим – внешний мир или свои собственные представления о
нем? Проведенный в предыдущих разделах анализ показывает, что на самом деле
верны оба ответа. Мы на самом деле работаем лишь со своими собственными представлениями о мире и себе. Но эти представления в нашем мозгу существуют в виде
инвариантов, соответствующих наиболее общим закономерностям мира. Внешнее и
внутреннее с позиций представления информации есть одно и то же. При этом необходимо отметить, что, строго говоря, логически возможны и несколько отличающиеся наборы первичных простейших инвариантов, задаваемых на генетическом уровне.
Очевидно, что в случае использования другого набора исходных инвариантов мы
представляли бы себе окружающий мир несколько иначе.
Возникает еще один вопрос. Хорошо, мы используем инварианты низших
уровней для представления целостной картины мира (например, для создания образа пространства), мы можем сопоставить с этими простейшими инвариантами
понятия нашего языка (пространство, симметрия, законы сохранения и т.д.). А могут ли эти простейшие инварианты каким-либо образом влиять на образование инвариантов более высоких уровней? Для соседних уровней ответ очевиден: не
только могут, но и должны, поскольку базисные элементы вышестоящего уровня
состоят из некоторой комбинации элементов нижестоящих уровней. Для существенно различающихся уровней ответ менее очевиден, но, по-видимому, тоже положителен. Так, в принятой сейчас большинством лингвистов концепции генеративной (порождающей) грамматики утверждается, что наиболее общие грамматические структуры у человека (деление на глаголы – движение, и существительные
– объекты или сохраняющиеся величины) являются врожденными [8]. Таким образом, простейшие пространственно-временные инварианты, относящиеся к начальным уровням обработки информации, оказывают активное влияние и на работу инвариантов самых высоких уровней.
Мозг и контекст
В предыдущем разделе мы рассматривали оптимизацию представления
информации с помощью использования в качестве базисных элементов инвариантов некоторых преобразований. Однако это не единственный способ повышения
эффективности использования информации. Имеется и ряд других способов. Для
их обозначения используются термины: сжатие, контекст, внешние критерии, коллектив решающих правил и ряд других. Все эти способы в нашем понимании объединяет один общий принцип: информация не является замкнутой и независимой,
интерпретация как этой информации, так и полученных на ее основании выводов
тем или иным образом зависит от любой другой информации. Понятие контекста
детально рассмотрено нами в работе [9], там же предложена формула для подсчета количества информации с учетом контекста.
Не повторяя полученных в [9] результатов, сделаем лишь несколько замечаний. Природа использует контекстные принципы на самых различных уровнях обработки информации. В случае простых языков представления одним из наиболее эф-
«Штучний інтелект» 4’2001
105
Сторож В.В.
3С
фективных способов представления информации является голография, в связи с чем
К. Прибрамом была выдвинута гипотеза о голографических принципах обработки
информации у человека [10]. Сейчас считается, что реальный процесс обработки информации более сложен, и, по-видимому, более точным с позиций принципов обработки информации у человека является предложенный в работах [11], [12] термин
квазиголография. В данном случае учитывается, что волновые процессы в мозгу аппроксимируются дискретными элементами (синапсами, импульсами).
На более высоких уровнях обработки информации (эмоции и язык) речь
идет уже о взаимодействии не простых элементов, а достаточно сложных образований, но принцип тот же: внешняя информация изменяет и расширяет содержание данной информации.
Нейрофизиологической основой контекстного представления информации
является наличие множества входов и выходов у нейронов. При такой организации
нейроны одной группы могут влиять на нейроны многих других групп. Если мы сопоставим эти группы нейронов с единицами или комплексами информации, в том
числе и в виде понятий языка, то получаем, что контекст физически реализуется путем изменения электрических потенциалов синапсов и аксонов. Очевидно, что если
мы хотим использовать принципы контекстной обработки информации в компьютерах, мы должны использовать для этого какие-либо физические механизмы.
Принципы параллельной
обработки информации
Своей эффективностью мозг во многом обязан колоссальной степени параллельности работы. Так, если в обычном процессоре обрабатывается параллельно от двух до десяти команд, в многопроцессорной системе – до нескольких десятков тысяч простейших команд, то у человека эта цифра значительно выше. Для
оценки степени этой параллельности используем приведенные во введении цифры: скорость распознавания ситуации и принятия решения в простых случаях находится в диапазоне примерно 0,1-1,0 секунды, скорость испускания импульсов
порядка 102 импульсов/сек. В таком случае число тактов до принятия решения находится в диапазоне от 10 до 100. Предположим для простоты, что в течение каждого такта некоторой частью нейронов мозга обрабатывается одна более простая
подзадача либо осуществляется этап однотипной обработки информации. И пусть
в конечном итоге сработают все нейроны. В таком случае мы получаем, что количество параллельно работающих над одной задачей нейронов в мозгу у человека
составляет от 1010 до 1011 (количество нейронов разделить на число тактов). Как
видим, в отношении организации параллельной работы современные компьютеры
уступают человеку минимум на 7-8 порядков. Если же рассмотренные этапы осуществляются не последовательно, а параллельно, то у человека работают одновременно практически все нейроны. За счет чего же достигается такой высокий
уровень параллельности работы нейронов мозга?
В значительной мере ответ на этот вопрос дают рассмотренные нами выше данные нейрофизиологии.
106
«Искусственный интеллект» 4’2001
Обработка информации у человека. Ч.1. Уровни и базисные элементы
3С
Во-первых, вся исходная информация разбивается на точки, точнее, подобласти, и обработка информации ведется параллельно по каждой из выделенных
подобластей.
Во-вторых, в рамках каждой подобласти в силу специализации нейронов
идет параллельная обработка информации о значениях базисных элементов представления информации в данной подобласти. Очевидно, для того, чтобы реализовать этот принцип, мозг должен обладать значительным уровнем избыточности
(число элементов мозга должно превышать число бит обрабатываемой информации). Например, если мозг фиксирует линию, движущуюся в определенном направлении и с определенной скоростью, то информацию несут лишь нейроны,
фиксирующие данное направление и данную скорость. При степени градации ориентации и скорости в диапазоне от 10 до 100 мы имеем степень избыточности нейронной структуры от 102 до 104. По-видимому, остальные нейроны тоже каким-то
образом перерабатывают информацию (вспомним о квазиголографическом принципе обработки информации), да и усложнение картины приводит к работе большей части нейронов. Тем не менее определенная степень избыточности здесь сохраняется, и, по-видимому, именно она позволяет на этом этапе производить параллельную обработку информации.
В-третьих, путем разбиения процесса обработки информации на более
простые подэтапы. При этом обработка информации на различных подэтапах может идти параллельно.
И, в-четвертых, возможна параллельная работа различных разделов мозга,
например, зрительной коры, речевых отделов, лобных долей, гипоталамуса и т.д.
Высокая скорость реакции мозга по отношению к частоте импульсов позволяет сделать еще один важный вывод: нейроны в мозгу реагируют не на сложные
частотные характеристики возбуждающих импульсов (как показывает скорость ответа) – для этого просто нет времени, а фактически на первый или несколько первых
импульсов возбуждения. Это свидетельствует о том, что при рассмотрении работы
мозга достаточно ограничиться очень простым описанием частотных характеристик
отдельных нейронов. Сложная работа мозга в таком случае может быть реализована
лишь за счет сложной структуры связей нейронов. Этот же вывод можно сформулировать следующим образом: познавательный потенциал мозга обеспечивается в
большей мере структурой связей, чем структурой процессов.
Мозг и нейросети
Принято считать, что нейросети, хотя бы и весьма приближенно, моделируют работу человеческого мозга. Насколько полным является это приближение?
Рассмотрим этот вопрос с учетом литературных данных и полученных в работе
результатов.
Безусловно, мозг и нейросети объединяет возможность работы с неполными и неточными данными, а также возможность обучения. В то же время мозг
намного более сложная структура, чем классическая нейросеть. Различие в сложности можно описать следующими параметрами:
– число элементов. Нейросеть обычно содержит от нескольких десятков до нескольких сотен обрабатывающих элементов – это уровень сложности отдель-
«Штучний інтелект» 4’2001
107
Сторож В.В.
3С
ного нейрона головного мозга. Учитывая, что этих нейронов у человека примерно 1012, получаем, что мозг примерно в такое же количество раз превышает
нейросеть по числу элементов;
– сложность организации. Нейросеть, как правило, представляет собой одноуровневую в смысле принципов обработки информации структуру. Мозг же
состоит из большого количества уровней, на каждом из которых информация
обрабатывается различным образом. Помимо этого, каждый уровень может состоять из ряда блоков, обрабатывающих информацию различным образом;
– наличие базисных элементов (языков) для обработки информации на каждом
уровне. Строго говоря, те математические понятия, которые используются в нейросетях, тоже могут рассматриваться как базис для представления информации.
Проблема, однако, в том, что с усложнением информации необходимо усложнение базиса (языка) для более адекватного и экономного ее представления;
– возможность интерпретации внутренними средствами. Речь идет о том, что работа мозга чаще всего может быть проанализирована, и результаты представления информации на одном уровне могут быть переведены в представления
на других уровнях. Для нейросети же, имеющей всего один язык представления, вопрос о переводе информации в другие представления вообще не имеет
смысла (во всяком случае, средствами самой нейросети);
– свойства базисных элементов. Базисные элементы для представления информации у человека прошли длительный период естественного отбора и поэтому
являются весьма эффективными для решения определенного круга задач. В
нейросетях же уровень оптимальности представления информации намного
ниже, чем у человека (если только мы сами не будем конструировать эти базисные элементы при создании нейросети). В то же время нейросети в этом отношении имеют и преимущество перед человеком, поскольку структура их базисных элементов не задана генетически, и мы можем ее создавать с учетом
специфики конкретных задач, получая в итоге лучшие результаты при меньших затратах.
Проведенное сравнение показывает, что современные нейросети по своим
возможностям ни в какой мере не могут заменить человека при решении сложных
задач, требующих обработки большого количества разнотипной информации. Но
при этом они могут успешно применяться для решения специализированных задач
(что в реальности и наблюдается).
В то же время проведенный анализ позволяет наметить и ряд эффективных мер по совершенствованию нейросетей и расширению сферы их действия. К
этим мерам можно отнести следующие:
– разработка теории оптимальных языков представления информации о предметных областях различной сложности. Конструирование базисных элементов
представления информации при создании нейросетей с учетом сложности
предметной области, для моделирования которой предназначена разрабатываемая нейросеть;
– разработка теории перевода информации на различные языки представления, что
позволит как более гибкое использование нейросетей, так и расширит возможности интерпретации путей получения оптимального решения нейросетями;
– использование на базе двух предыдущих пунктов комплексов нейросетей с
различными языками представления информации, что позволит эффективное
108
«Искусственный интеллект» 4’2001
Обработка информации у человека. Ч.1. Уровни и базисные элементы
3С
представление и обработку разнотипной информации. Нейросети такого типа
по своим возможностям будут больше соответствовать человеческому мозгу и
иметь более широкую область применения.
Мозг и распознавание образов
Если исходить лишь из информационной точки зрения, то обработку информации у человека можно представить примерно следующим образом. На вход
(рецепторы) подается некоторая внешняя информация, которая фиксируется рецепторами в виде данных, относящихся к различным точкам. Нужная человеку
информация на этом уровне находится не в значениях величин возбуждения рецепторов, а в отношениях этих величин, поэтому на дальнейших этапах обработки
информации человек анализирует некоторое многообразие отношений, которое
также может быть представлено в виде пространства. Проблема, однако, заключается в том, что размерность этого пространства может быть самой различной, в
том числе при наличии множества разнородных связей пространство может быть
вообще неопределенномерным, попросту говоря, информация не может быть
представлена в виде пространства определенной размерности. Перебор множества
связей в наборе пространств различной размерности – это комбинаторная вычислительная задача, которая, очевидно, в принципе не может быть решена за время
существования Вселенной. При таком подходе мы не можем поставить вопрос о
распознавании образов, поскольку для распознавания мы должны их представить,
а этого мы как раз в данном случае сделать не можем, несмотря на существование
простого и понятного алгоритма.
Единственный выход в такой ситуации – наложение некоторых заданных
связей на отношения между исходными точечными данными. Фактически при
этом речь идет о выделении признаков, по которым распознаются образы или об
использовании некоторых базисных элементов (языка представления) в рамках
терминологии данной статьи. Наложение такого рода однотипных классов связей
позволяет очень резко снизить число вариантов связей, и свести задачу к разрешимой за приемлемое время.
В таком случае возникает вопрос: каким же образом выбирать эти базисные
элементы? Если они не будут отображать значимые для решения наших задач связи,
то мы, соответственно, не сможем и представить искомый образ, не говоря уже о его
распознавании [13], [2, с. 212]. Предложено множество подходов к выбору исходного
пространства признаков. В частности, в работах В.И. Васильева [13], [14] предложен
так называемый метод предельных упрощений, позволяющий конструировать пространство, в котором искомые образы выражаются наиболее просто. Однако этот и
другие подобные методы требуют высокого уровня формализации представления, а
также накладывают достаточно серьезные ограничения на математические соотношения между исходными данными. Поэтому в работе [2, с. 8-9], написанной известными специалистами в области искусственного интеллекта, делается вывод, что, несмотря на ряд достижений, проблема распознавания образов средствами искусственного интеллекта в общем виде не решена до сих пор.
В то же время мозг легко решает эти неразрешимые для современной вычислительной техники задачи. Каким образом он это делает? С учетом получен-
«Штучний інтелект» 4’2001
109
Сторож В.В.
3С
ных в предыдущих разделах результатов основные принципы, которые позволяют
мозгу эффективное распознавание образов, на наш взгляд, следующие:
1) человек уже изначально воспринимает информацию в виде некоторых базисных элементов, причем эти элементы организованы так, что отображают информацию с минимальными затратами;
2) для представления информации различной сложности человек использует многоуровневую систему оптимально организованных базисных элементов, причем существуют эффективные процедуры перевода, согласования и интерпретации информации в термины различных уровней. Это необходимо потому,
что зрительные, слуховые и вообще перцептивные образы – это только часть, к
тому же простейшая, семейства образов. Есть еще мысленные или интеллектуальные образы, они гораздо интереснее и сложнее. В этом смысле распознаваемые перцептивно образы всегда должны быть соотнесены с некоторым интеллектуальным обобщенным образом, т.е. нельзя понять природу распознавания перцептивных образов, не зная, как интеллект работает с образами вообще
и, в частности, с образами других классов. Мысленные образы отличаются от
перцептивных двумя основными чертами:
– во-первых, они неоднородны и включают в себя как перцептивные данные,
так и данные других типов: оценочные, ценностные (определяют некоторый срез действительности), ассоциативные (структура связи с другими образами) и т.д.;
– во-вторых, мысленные образы могут включать или не включать в себя перцептивные образы, быть сложными и состоять из набора образов любых
типов.
Поэтому, в связи с тем, что сложные мысленные образы состоят из набора
более простых образов различной природы и различных уровней, должны существовать процедуры их представления в некотором целостном виде, т.е. механизмы соотнесения элементов различной природы;
3) в каждый данный момент мозг не распознает все возможные образы, а ищет среди
них те, которые наиболее соответствуют требованиям текущих задач. Это реализуется как на нейрофизиологическом уровне (с помощью смещения потенциалов,
частот и т.д.), так и с помощью эвристических принципов, которые называются
контекстом, внешними критериями, требованиями задачи и т.д.
Выводы
Человек представляет и обрабатывает информацию с помощью многоуровневой системы базисных элементов. Эти элементы на нижних уровнях обработки информации представляют собой инварианты пространственно-временных
преобразований, имеющих простой физический смысл. Создание такого рода базисных элементов опирается на принципы симметрии, инвариантности, локального или глобального минимума энтропии, а также на максимальное соответствие
физических структур и представляющих их психических образований.
Каждый набор базисных элементов представляет собой, по сути, язык для
представления информации определенного уровня сложности. Более сложные объекты мира требуют для своего адекватного представления и более сложных языков, при
110
«Искусственный интеллект» 4’2001
Обработка информации у человека. Ч.1. Уровни и базисные элементы
3С
этом более сложные языки имеют как более сложную структуру базовых элементов,
так и большее их количество. В мозгу существуют эффективные процедуры перевода
и интерпретации информации между различными представлениями.
Инвариантная структура базисных элементов позволяет параллельную обработку информации на данном уровне с дальнейшей быстрой стыковкой отдельных точек на вышестоящих уровнях.
Человеческий мозг и на высших уровнях во многом использует принципы
первичной обработки информации, т.е. принципы выделения пространственновременных инвариантов.
Мозг представляет собой целостную единицу по обработке информации.
Целостность обусловлена нейрофизиологически за счет множественной и многоуровневой связи между нейронами, и выражается в существовании различных видов контекста (внешних критериев) и языка.
Литература
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
Хьюбел Д. Глаз, мозг, зрение. – М.: Мир, 1990. – 239 с.
Васильев В.И., Шевченко А.И. Формирование и опознавание образов. – Донецк: ДонГИИИ,
2000. – 360 с.
Физическая энциклопедия. – М.: Наука, 1983. – С. 137.
Разумовский О.С. Современный детерминизм и экстремальные принципы в физике. – М.: Наука, 1975. – 248 с.
Полак Л.С. Вариационные принципы механики. Их развитие и применение в физике. – М.:
Наука, 1960.
Веккер Л.М. Психика и реальность. Единая теория психических процессов. – М.: Смысл, 1998.
Ганзен В.А. Системные описания в психологии. – Л.: Изд-во Ленингр. ун-та, 1984. – 176 с.
Chomsky N. The Logical Structure of Linguistic Theory. – N.Y.-L.: Plenum Press, 1975.
Сторож В.В. Работа мозга. Нейролингвистический подход // Искусственный интеллект. –
2001. – № 3. – С. 429-438.
Прибрам К. Языки мозга. – М.: Прогресс, 1975. – 598 с.
Гаряев П.П. Волновой генетический код. – М.: Издатцентр, 1997.
Прангишвили И.В., Гаряев П.П., Тертышный Г.Г. Генетические структуры как источник и
приемник голографической информации / ИПУ РАН, 2000 //
http://rusnauka.narod.ru/lib/phisic/garayaev/golog2d.htm
Васильев В.И. Теория редукции в задачах экстраполяции // Проблемы управления и информатики. – 1996. – № 1-2. – С. 239-251.
Васильев В.И. Индукция и редукция в проблемах искусственного интеллекта // Искусственный
интеллект. – 1998. – № 1. – С. 14-26.
In the paper there is an analysis of informational aspects of the work of cerebrum, the data of
structure and work organization of the brain. It is shown that man represents and processes the information
by means of multi-leveled system of base elements. These elements on the low levels of information
processing represent invariant of spatial and temporal transformations that have a common physical sense.
The creation of such a kind of basis elements serves for principles of symmetry, invariant, minimum of
entropy. The received results let us define the difference between artificial neural networks and cerebrum
and perfect the neural networks.
Материал поступил в редакцию 22.12.01.
«Штучний інтелект» 4’2001
111
Download