Об интеллекте, работе мозга и первобытных

advertisement
Об интеллекте, работе мозга и первобытных «вундеркиндах»
Владимир И. Андреев
Россия, Санкт-Петербург
Август 26, 2010
В последнее время вновь резко возрос интерес к «интеллектуальной» деятельности
инопланетян на Земле. И это уже не просто знаменитые «круги на полях» или «светящиеся
колеса» на воде морей и океанов. Ныне уже усматривается результат их деятельности даже
на истории предков нашей цивилизации.
Так в очередном номере «Тайны ХХ века» (№ 34 за 2010 г.) в статье «Первобытные
вундеркинды» представлен материал по результатам анализа археологических данных,
известных уже почти 100 лет, но недавно получивших новую интерпретацию. Речь идет о
так называемых «Боскопах», ископаемых останках одного из первобытных предков
современного человека.
По данным исследователей останков этих «предков» установлено, что их череп
слишком велик - примерно в 1,5 раза больше современного человеческого. На основании
этого некоторые исследователи и высказали предположение о том, что его умственные
способности также должны были быть значительно выше, чем у их «современников» кроманьонцев – прямых предков современного человека. По таким оценкам специалистов
уровень их интеллекта (IQ) должен оцениваться величиной порядка 149. У современного же
человека он ~ 100.
А далее, на основании таких выводов развивается целая цепочка фантазий и гипотез о
том, что этих «интеллектуальных предшественников» человека инопланетяне сознательно
уничтожили, боясь быстрого развития этой популяции и их конкуренции в будущем при
покорении нашей планеты. Они, якобы, предпочли, чтобы реальными хозяевами Земли стали
мы – более тупые и легче управляемые в будущем умными инопланетянами и т.п.
Можно было бы и не обращать внимания на такие выводы «ученых», тем более что вся
информация о «боскопах» и их последующее исчезновение, с заменой на кроманьонцев «с
меньшим черепом и соответственно, с меньшим головным мозгом», есть не более чем
фантазия. Но, автора настоящей статьи, много лет занимавшегося исследованием работы
мозга (в плане сравнения способностей мозга и ЭВМ при решении задачи распознавания
речи) такое примитивное мнение затронуло. Возникло желание высказать некие свои
соображения относительно логических способностей и размеров мозга по результатам своих
научных исследований.
Прежде всего, в научной литературе нет никаких доказательств, что интеллектуальные
способности «напрямую» зависят от величины головного мозга. Во-вторых, ничего не
известно об организации работы мозга ни у боскопов, ни у кроманьонцев, а потому и судить
об их интеллектуальных способностях только на основе размеров головного мозга нельзя.
Если же рассмотреть общую схему эволюционных процессов в природе (в том числе и
процессов развития в науке, технике, технологии), то можно четко увидеть некую общую
закономерность, заключающуюся в том, что, создав первый «образец», некой новой идеи,
далее природа «сама» начинает его совершенствовать. И, прежде всего, в целях экономии
энергии и возможно места, начинает его уменьшать в размерах…
Много лет, занимаясь наукой в области ЭВМ, автор очень наглядно помнит эти этапы.
Первыми были «ламповые» ЭВМ, огромные «мастодонты», занимая площадь в сотни
квадратных метров, потребляя киловатты электроэнергии, и имея возможность производить
лишь тысячи операций в секунду. А теперь сопоставим их с современными компьютерами,
имеющими вычислительные возможности в миллиарды операций в секунду, обрабатывая
гигабайты информации и умещаясь на пластинке в несколько квадратных сантиметров.
Вполне логично предположить, что и живая природа эволюционировала по такой же
схеме. Породив первых «разумных существ» с большой головой и объемным мозгом, далее
она произвела некий эволюционный эксперимент. Создав со временем «разумных существ»
с меньшим объемом мозга, природа тем самым дала возможности эволюции сравнить
результаты их интеллектуальной деятельности. Не обнаружив существенной разницы в
поведении и адаптации разных существ к изменяющимся условиям, эволюция сама выбрала
для будущего существ с более мелкими головами. Более малая по объему и весу голова
позволила им легче и быстрее действовать. Тогда у природы и встал вопрос, а зачем тогда
«большеголовые»? И они исчезли с исторической арены…
Ну, это так к слову и юмору о философской стороне вопроса. А теперь по существу.
Исследования способностей головного мозга человека при работе в рамках программы
«Автоматическое распознавание слуховых образов» (АРСО), существовавшей в СССР, дали
автору убедительный материал и основания для своих будущих выводов и научных статей в
Интернете. Занимаясь этой проблемой, автор имел возможность многолетнего общения с
коллегами на регулярных «школах-семинарах» АРСО. И эти общения показали, что
большинство исследователей, занимаясь проблемой АРСО, в определенном смысле пыталось
моделировать интеллектуальную деятельность мозга человека, не имея еще представления о
существе процессов в головном мозге при решении задачи – «идентификация образов». При
наличии разнообразных подходов к решению этой проблемы, большинство из разработчиков
все же, так или иначе, фактически пытались решить задачу «в лоб», ориентировалось на
возможности математических методов и мощность ЭВМ.
Когда автор настоящей работы занялся этим вопросом в рамках инициативной НИР он
имел возможность использовать относительно маломощную ЭВМ и такие же примитивные
технические средства преобразования речевого сигнала в код. А из общения с коллегами по
общей тематике ему стало ясно, что надо искать иной подход к решению этой проблемы.
Анализируя результаты других исследователей, имеющих более мощные аппаратные и
программные средства ЭВМ, но достаточно скромные успехи в решении основной задачи,
автор пришел к выводу, что, не зная и не учитывая принцип работы головного мозга
человека, решить эту проблему невозможно. Но в большинстве работ серьезных научных
коллективов (ИК АН УССР, СОАН СССР, ИТК АН БССР и др.) используемые методы и
технологии решения задачи АРСО (алгоритмы и программы работы компьютеров при
решении задачи «идентификации») не имели ничего общего со схемой и алгоритмами
работы мозга человека при решении задачи «идентификации».
В 1970-е годы было увлечение компьютеризацией и большинство исследователей,
владевших в той или иной степени математическими методами, стремились решать все
задачи «строго математически», используя мощность «могучих» по тем временам ЭВМ. Но
практика показала, что такой подход и попытка решить задачи «в лоб», используя лишь
мощные средства вычислительной техники, не понимая и не используя идеи и принципы
работы живого человеческого мозга, не давали и не могли дать желаемых результатов.
Как иллюстрация этого вывода рассмотрим пример, наиболее ярко характеризующий
парадоксы в эффективности этих двух подходов. Так на одной из конференций АРСО
руководители научной темы по АРСО из Института кибернетики АН УССР докладывали
результат моделирования задачи распознавания 50 слов на ЭВМ БЭСМ-6. Решая задачу
выбора одного из заданных слов, ЭВМ, имея быстродействие 1 миллион операций в секунду,
получала результат, примерно через 40 сек. Тогда это было одним из лучших достижений
среди многих научных коллективов СССР, занимавшихся этой проблемой.
А мозг человека, для сравнения, на решение задачи выбора из нескольких тысяч слов
стандартного словаря «интеллектуала» требовал всего несколько секунд или даже доли
секунды. При этом мозг человека выполняет всего около тысячи операций в секунду –
максимальная скорость передачи импульсов в сети нейронов.
О чем говорят результаты этого сравнения? Они означают, что мы имеем две
принципиально различные схемы (алгоритмы) обработки сигналов, при решении задачи
идентификации образов (акустических сигналов, изображений, или смысла). Поэтому
многолетние исследования крупнейших научных коллективов так и не дали результатов в
решении главной задачи – «научить ЭВМ понимать речь человека». Все ограничилось
решением частных задач, да и эти решения пока находятся на уровне макетов.
Эксперименты автора настоящей работы на частной задаче показали, что нужен не
только новый подход к решению этой задачи, но и новая его постановка. Как уже было
показано выше, первоначально задача была сформулирована не совсем корректно, а именно
как «Распознавание…». Но смысловой анализ такой постановки задачи показал, что она
содержит несколько иной смысл и даже носит иное название. По существу задача имеет
более широкий смысл, а именно - «идентификацию» содержания сигналов. А по аналогии с
криминалистикой, такая задача решается в виде нескольких этапов, включая следующие:
Узнавание – детерминированное принятие решения на основе полного совпадения
описания искомого объекта (сигнала) с описанием известным в «базе данных».
Опознавание – вероятностно-статистический выбор наиболее вероятного объекта из
подмножества «неузнанных», но «подозреваемых».
Распознавание – как чисто вероятностный поиск искомого объекта путем анализ всего
множества вариантов на основе различных методов и средств принятия решения.
Такой подход к решению задачи «идентификации» речевых сигналов и позволил
автору сформулировать некий концептуальный подход и алгоритм в виде трехуровневой
модели системы идентификации [1].
Полная реализация такой модели требовала огромной работы и большого коллектива
разработчиков, поэтому автором, был исследован, смоделирован и экспериментально
проверен только один первый уровень общей модели – этап «Узнавание». Этот уровень
предполагал создание системы, способной запоминать, хранить и выдавать информацию из
памяти ЭВМ без перебора всех данных, то есть построить ассоциативную систему памяти
данных. И такая система сравнительно легко была реализована путем организации описания
представления всех объектов в двоичном виде.
Как выше уже было показано, что мозгом человека задача идентификации решается
значительно эффективнее, чем ЭВМ. И возникло естественное предположение, что в мозгу
реализован иной алгоритм решения таких задач. Дальнейшее и показало, что есть основания
предполагать процесс идентификации сигналов человеческим мозгом как многоступенчатую
схему принятия решения по описанной выше схеме ассоциативного выбора информации из
памяти. Иначе говоря, на первом уровне этой схемы идентификации работает процедура
простого узнавания путем сравнения входных сигналов со всем множеством ранее накопленных в памяти сигналов.
Таким образом общая схема работы мозга при идентификации входных сигналов
просматривается следующей. На первом этапе «Узнавание», путем сравнения на «полное»
совпадение входного сигнала (в некоторой системе описания) со всей информацией в памяти
системы о сигналах, подлежащих «распознаванию». На втором этапе, при неоднозначном
решении на первом этапе, идет «Опознавание» - процедура выявления искомого класса из
подмножества, сокращенного на первом этапе, используя некие статистические параметры,
накопленные в процессе обучения. И, наконец, третий этап «Распознавание», когда в
памяти системы вообще нет данного варианта описания, то есть, система еще не обучена или
«недообучена». На этом этапе, видимо, включаются уже все «классические» вероятностностатистические методы, включая процедуру «обнаружение сигнала на фоне шума».
Автором и была исследована модель первого этапа идентификации, реализованная в
виде технического блока преобразования речевого сигнала в код и комплекса программ ЭВМ
[2]. Технический блок обеспечивал предварительную «компрессию» аналогового сигнала,
преобразование его в дискретный код и сопряжение с ЭВМ.
Программный комплекс системы включал две основные программы: «Формирование
дифференциальных признаков описания» и «Обучение-узнавание». Первая программа
преобразовывала дискретное представление речевых сигналов в систему двоичных
признаков, размерности «m». Программа «Обучение-узнавание», реализованная в виде
логического дешифратора, обеспечивала «ассоциативное» запоминание и поиск описания
сигналов в памяти ЭВМ, без перебора всего материала обучения, представленного в
двоичной метрике описания.
При размерности описания каждого «среза» сигнала, равной «m» двоичных разрядов, в
m
памяти компьютера формировались матрицы «обучения», размерности N х Q, где: N = 2 длина матрицы обучения; Q - ширина матрицы обучения (равная числу классов сигнала).
Принцип работы программы «Обучение-распознавание» заключался в следующем:
Входной сигнал в «m» - мерной метрике описания принимался как относительный адрес
строки матрицы обучения. Исполнительный адрес получался в результате арифметического
сложения базового адреса АБ (физический адрес начала матрицы обучения) и входного m –
мерного кода описания Аисп = АБ + m.
На этапе обучения системы в полученной строке матрицы обучения, в разряд,
соответствующий i-му номеру класса ( i  Q ) сигналов, записывается «1», означающая, что
данный фрагмент сигнала i-го класса имеет такой вариант представления в метрике
признаков описания. Поскольку каждый реальный сигнал имеет описание, состоящее из К
фрагментов (временны´х) параметров, представленных m - мерными кодами, то общее поле
обучения содержит К матриц размерности N  Q, которые по мере обучения системы
заполняются «единицами».
На этапе «узнавания» схема работает аналогично. По входному сигналу формируется
Аисп = АБ + m. Из памяти извлекается строка длиной Q разрядов и проверяется, какие из
разрядов «не нулевые». Номера «ненулевых» разрядов обозначают классы, в которых
встречается данный фрагмент входного сигнала.
Решение об «узнавании» всего сигнала принимается после проверки на совпадение
всех «К» признаков описания по следующему алгоритму: выбираются строки из всех «К»
матриц обучения - Х(Q)i и полученные частные результаты логически перемножаются Х(Q)1
 Х(Q)2  ...  Х(Q)i  Х(Q)k = X(Q)fin.
При этом в результате возможны три варианта ситуаций: X(Q)fin = 0 - означающий, что
сигнал не принадлежит ни одному из заданных классов, то есть что система еще не обучена.
При X(Q)fin  0 и что «1» имеется, только в одном из разрядов строки означает, что
сигнал принадлежит одному конкретному классу – то есть система его «узнала».
При X(Q)fin  0, но, «1» имеются в нескольких разрядах означает, что класс сигнала на
данном этапе однозначно не определен и требуется перейти на следующий уровень
идентификации - опознавание.
В результате испытания модели «Обучения-Узнавания» и анализа полученных
результатов, были получены следующие выводы:
Во-первых, процесс накопления информации в памяти ЭВМ идет по закону, близкому
к экспоненте и система довольно быстро «насыщается». Объем информации, запоминаемый
системой, значительно меньше, чем поступающий в нее в процессе обучения [2].
Во-вторых, на материале 27 дикторов (мужчин и женщин) было экспериментально
установлено, что вероятность «неузнавания» системой сигналов очередного нового диктора
убывает по мере обучения системы, изменяясь по закону гиперболы 1/N, где N – количество
участвовавших в обучении системы. Следовательно, принципиально, ее можно научить
«узнавать» сигналы с любой, наперед заданной, достоверностью.
В-третьих, описанный выше алгоритм «Обучения-Узнавания» обладает следующими
свойствами:
- процесс «узнавания» на ЭВМ происходит практически мгновенно, не требуя высокого
быстродействия, так как решение принимается после нескольких обращений к памяти и
операции логического перемножения промежуточных результатов (простейшая функция,
легко выполняемая аппаратно или в нейронной сети);
- алгоритм программы требует большой емкости памяти для организации и хранения
материала обучения - полей (матриц обучения).
Но, как показывает анализ, именно такими свойствами и обладает мозг человека. Он
имеет достаточно низкое быстродействие (в нейронной сети мозга скорость передачи
сигналов не превышает тысячи «импульсов» в секунду).
В то же время, информационная емкость мозга очень велика. Все это в совокупности и
позволяет допустить, что в мозгу человека, видимо, реализована именно такая схема
идентификации, которая обеспечивает мозгу способность осуществлять идентификацию
смыслового содержания слов и фраз из словаря в несколько десятков тысяч слов практически мгновенно. Таким образом, если быть последовательными, следует признать, что в
мозгу человека наиболее вероятна реализация именно алгоритма узнавания.
Но, возникает вопрос, как может мозг, при наличии в коре мозга всего 1010 нейронов,
хранить всю поступающую информацию, если только один зрительный канал человека в
течение 80 лет жизни принимает около 1016 - 1017 бит информации? Остальные органы чувств
добавляют еще лишь незначительную часть от объема информации зрительного канала, но и
одного потока зрительного канала вполне достаточно, чтобы переполнить емкость мозга.
Каким образом мозг успешно справляется с этой задачей и как это можно согласовать с
реальным количеством нейронов в 10 миллиардов единиц?
Чтобы доказать, реальность схемы идентификации мозгом входных сигналов, путем
детерминированного узнавания, покажем, что возможна такая схема организации памяти,
при которой информационная емкость системы (в частности, мозга) на несколько порядков
превышает число отдельных элементов памяти (нейронов в коре головного мозга). И она во
много раз превышает объем информации, поступающей в мозг на протяжении всей жизни.
Известно, что нейроны - элементы нервной системы и мозга, имеют один выход (аксон)
и множество входов. В коре головного мозга они образуют сети, состоящие из многих
совокупностей, так называемых «ансамблей». Нейроны в таких ансамблях могут иметь до
сотен входов (синапсов), через которые они устанавливают связи друг с другом и с другими
ансамблями.
Полагаем, что процесс обучения и накопления информации в мозгу заключается в том,
что в нейронных сетях в процессе развития организма, при многократном повторении
входных сигналов (обучении), образуются и закрепляются новые синаптические связи и
нейрон, видимо, таким образом накапливает информацию. Следовательно, нейрон головного
мозга это вовсе не аналог одного элемента памяти компьютера, как считалось ранее.
Нейроны коры головного мозга это целые сети, которые способны при большом числе
синапсов (входов нейрона) запоминать, накапливать и хранить в одном нейроне тысячи бит
информации. Покажем возможность реализации такой нейронной сети мозга, на примере
аналогичной сети - схемы организации памяти на магнитных (ферритовых) сердечниках в
старых ЭВМ на рисунке, где представлены варианты организации памяти.
Схема организации оперативной памяти на магнитных сердечниках типа ОЗУ.
Характеристика памяти системы: n – число запоминающих элементов, m – число входов,
In – емкость памяти схемы из n элементов. Для данной схемы I n  n = 4 бита
Схема постоянной памяти на магнитных сердечниках типа ПЗУ
Характеристика памяти системы: n – число запоминающих элементов, m – число входов,
m = 2 n , p – размерность слова памяти = n, I n  количество слов памяти из n элементов
I n  m  p  n  2n
Схема организация «оперативной» памяти (ОЗУ) «матричного типа», позволяет, как
записывать, так и считывать и стирать любую информацию. Схема реализации «постоянной»
памяти ЭВМ (ПЗУ), позволяет только считывать информацию, «записанную» в нее ранее
при создании или при переписи.
Как явствует из алгоритмов работы, вторая схема более «примитивна», так как может
выполнять лишь одну функцию - хранить информацию и выдавать ее по запросу. Но, она
более экономична с точки зрения затрат энергии и расхода элементов памяти. В ОЗУ объем
информации равен количеству элементов памяти - n, а количество информации, которое
n
может храниться в системе (ПЗУ) на тех же n элементах, равно n  2 .
Как показывают исследования функциональных возможностей мозга, он обладает,
именно такими или аналогичными свойствами. У мозга низкие энергозатраты и информация
в мозгу хранится постоянно (оперативно не стирается). Следовательно, есть основания
утверждать, что организации ПЗУ ЭВМ по своим функциональным возможностям подобна
организации нейронной сети мозга и наоборот, работа мозга подобна работе схемы ПЗУ.
На основании этого допущения произведем оценку информационной емкости памяти
мозга по той же методике, что и оценка памяти ПЗУ.
Полагая, что запоминание и хранение информации в коре мозга осуществляется
ансамблями по n нейронов, аналогично неким локальным схемам типа ПЗУ из n элементов,
можно оценить общую емкость памяти мозга следующим образом: пусть каждый ансамбль
из n нейронов может хранить информацию I an  n  2 , бит. Число ансамблей Nan в общем
поле памяти из Nn нейронов будет
N an  N n / n (1).
n
Тогда суммарная емкость данных, которые могут быть запомнены в поле памяти N n ,
определится как
I 
N an
 I an
1
(2)
Предположим, для простоты, что все ансамбли имеют одинаковую размерность, тогда
мы получим возможную емкость памяти в следующем виде
I   I an  N an  n  2 n   N n / n = I   N n  2 n
(3)
Приняв, что общее число нейронов в коре мозга 10 , допустим, что для запоминания
информации используется только 1 % нейронов, то есть Nn = 108. Будем считать, что
остальные 99 % нейронов мозга осуществляют «дешифрацию» входных сигналов, участвуя
в логической обработке, и организуя связи ансамблей нейронов памяти с аналитической
областью мозга. Тогда, при Nn = 108 и размерности ансамбля n = 20, емкость памяти составит
I = 108  220  108  106  1014 бит.
Однако в реальной структуре мозга известны ансамбли из 100 и более нейронов.
Поэтому, с учетом такой возможности ансамблей мозга, реальная емкость мозга может
достигать величины 1020 - 1030 бит, что в миллионы раз больше, чем это требуется для
хранения информации, получаемой человеком в течение жизни всеми органами чувств.
Следовательно, имеющиеся данные о количестве нейронов в коре мозга человека, как
некой средней величине, еще ничего не говорят об интеллектуальной способности данного
индивида. Эти качества его мозга определяются развитостью его структуры, то есть числом
и сложностью его нейронных ансамблей. А они, в свою очередь, определяются числом
новых синаптических связей, возникших в его коре в процессе жизни.
А отсюда можно сделать и еще один вывод, что в процессе жизнедеятельности
емкость мозга не уменьшается, а может быть, даже возрастает (при условии нормальной и
здоровой жизни всего организма). Поэтому, пока человек работает мозгом (думает), его мозг
все время развивается, пока человек живет.
И теперь ответ на главный вопрос, поставленный в начале статьи. Сила мозга не в
величине, а в сложности организации его внутренней структуры – его ансамблей.
И теперь несколько фантастических мыслей о возможностях мозга и его аномальных
свойствах в особых парадоксальных случаях.
Каждый человек рождается с неким «базовым» набором своих ансамблей нейронов.
Со временем, часть из них развиваясь дополняется и расширяется за счет его прижизненной
личной информации. При этом значительная часть базовой (дородовой) информации
закрывается новой прижизненной информацией.
Тем не менее, описанная схема хранения информации вполне может обеспечить
информацию не только полученную при жизни через все органы чувств, но и некую часть
«дородовой» (наследственной) информации, порождая новых талантливых «наследников».
А иногда и приобретенную из внешней среды (Биополя) информацию, которая потом
проявляется у некоторых людей в виде «памяти» о событиях, в которых данный человек
принципиально не мог присутствовать.
Можно отметить и некоторые практические выводы:
Рассмотренную схему идентификации сигналов в мозгу человека можно использовать
при построении технической системы идентификации сигналов. В отличие от компьютера,
мозг человека работает по другому алгоритму. Он ничего не вычисляет, а только запоминает
новую информацию и извлекает из памяти то, что ему было уже когда-то предъявлено ранее.
Мозг - не арифмометр, а огромный дешифратор, приводящий входные сигналы от разных
органов к однообразной структуре, в комплексе с ассоциативной памятью записи, хранения и
поиска информации.
Для успешной реализации технических систем идентификации образов любого типа,
они должны строиться по аналогии с мозгом и на первом этапе должен использоваться
алгоритм «узнавания» по описанной схеме.
Используя трехуровневую схему идентификации, включая уровень вероятностностатистического «распознавания», можно построить систему, способную к самообучению
(самосовершенствованию). Сигнал, «неузнанный» технической системой на первом уровне,
после его «распознавания» на третьем уровне, может быть запомнен в поле памяти «обучения». Повысив свой уровень «обученности», в дальнейшем система идентификации будет
10
реже обращаться к высшему уровню принятия решения, на основе длительной и сложной
процедуры.
Используемые источники:
1. Андреев В.И. Концептуальная модель автоматической классификации речевых сигналов.
Тезисы XI Всесоюзной школы-семинара АРСО-11. Ереван 1983. с.385.
2. Андреев В.И. Некоторые свойства автоматической распознающей системы, построенной
по принципу узнавания речевых сигналов. Тезисы докладов и сообщений 12-го Всесоюзного
семинара “Автоматическое распознавание слуховых образов”. Киев-Одесса 1982. Ч.1, с.6-8.
Download