c текстом доклада можно ознакомиться здесь

advertisement
КОНЦЕПЦИЯ ПОСТРОЕНИЯ
НА БАЗЕ
НЕЙРОСЕМАНТИЧЕСКОГО ПОДХОДА
(ПРИГЛАШЕНИЕ К СОТРУДНИЧЕСТВУ)
Бодякин В.И.
Институт проблем управления РАН
им. В.А. Трапезникова, Москва
E-mail: body@ipu.ru ,
http://www.informograd.narod.ru ,
служ.тел.:334-92-39
План обсуждения
Постановка задачи. Проблемы 2030 года
Нейросемантика
- Предметная область  Информационный
канал  Информационная система
- Форма представления информации
- Автосруктуризация
- Нейросемантические структуры (НСС)
- Сигнал – Информация – Знание
- Адаптивные регуляторы на базе НСС
- Текстовая энтропия
Решение. Проекты: - Искусственный разум
- Информоград
- Восхождение разума
2
Постановка задачи
Проблемы 2030 года
•
•
•
•
•
•
Тенденции уменьшения ресурсоемкости
информационной техники и прогноз
Глобальные эволюционные этапы лидирующей
формы высокоорганизованной материи
Модель "текстовая жизнь"
Естественная эволюция, - это ряд аттракторов
Темпы и масштабы эволюции
Эволюция технической цивилизации
3
Тенденции уменьшения
ресурсоемкости (f(гp*см3*сек*чел))
информационной техники (на 10 000 оп./с)
Ресурс
f(m*v*t)
1020
MARK-1
ЭНИАК
М-4
1018
(гр.* см3* 1016
сек* чел. 1014
~ (рубли)) 12
10
10
В пересчете на 10 000 оп./с
М-220
ЕС-ЭВМ, ЕС-1060
10
РС-286
108
РС Р-4
106
104
102
1
-2
Техноло- 10
гический 10-4
предел -6
10
Эволюционные этапы вычислительной техники
19401950г.
1960
1970
1980
1990
2000г.
2010
2020
2030г.
4
Глобальные эволюционные этапы
лидирующей формы
высокоорганизованной материи
Рождение Вселенной
10
10
Этап физической эволюции материи
Возникновение жизни на Земле
9
10
Первые позвоночные
Этап биоэволюции
8
10
107
6
10
Первые человекообразные
Длительность
этапов
в годах
10 : 1
Первые люди
Огненные прототехнологии
5
10
Этап социальноиндустриальной эволюции
Собирательство, охота
4
10
Земледелие, скотоводство
103
Прогноз
Индустриальная фаза
102
1970 г.
Информационная фаза
10
Этап духовной эволюции
2027 г.
2030 г.
Ноосфера
1
Фазовый переход
0.1
1
2
3
4
5
6
7
8
9
10
11
12
Эволюционные этапы № лидирующей формы высокоорганизованной материи
5
Зарождение и механизмы направленности эволюции
простейших информационных систем (ИС).
("текстовая жизнь").
bcc z cccc z
ааааа
ааааа
ааааа
a
bb z
ccb z
bcdd z
…
cddb z
cccc z
cccdd z
bddeed z
bcdee z
…
cccdd z
cdddddd z
…
zzz…z
…
…
…
zzzzzzzzzzzzzzzz…z
А = {a,b,c,d,…,w,x,y - аналоги химических элементов и
z - как аналог пространства}.
( a>b>c>d>… >w>x>y>z ≈ 0 )
ДНК человека, число вариантов = А L ; A=4, L= 10 9 P= 4 -1000 000 000
"Быть иль не быть, вот в чем вопрос?" A=256, L= 36, P=10-80 случайн.
A=256, L=4 («слоги»=103 ) 2564 =1010 (-7)
«слоги»4 = «слова»=105;
103*4=1012 (-7)
-46 !!!
«слова»4 = «лексемы»=107; 105*4=1020 (-13)
случайн.
«лексемы»4=«фразы» =109; 107*4=1028 (-19) !!!!!!!!! P=10-34 иерарх.6
Энерго-сырьевой потенциал эволюции
простейших информационных систем (ИС).
("первые аттракторы").
П а м я т ь
В
AL
в
2
L
Управление
и обработка
о
д
Самокопирование ИС
.
.
.
L
.
.
c
b
a
b
b
3 c a
b
c
. ..
.
ca cb cc
ba bb bc
aa ab ac
a
b
c
1
...
ИС
В
ы
в
о
д
Воздейст
вие
Энергия
Вещество
1-й аттрактор ИС –
«Рецепторный»
L=1 A; L=2 A2 ; L=3
A3 ; …
7
Процесс естественной эволюции ИС
представляет ряд аттракторов
с экспоненциальными характеристиками





Первый из которых "рецепторный" – линейные затраты (x) на расширение
диапазона рецепторов ИС дают приращение эволюционного ресурса как Ax,
где А – алфавит рецепторов, х – длины образов.
Второй эволюционный аттрактор ИС – "ассоциативный", заключается в
переводе линейной формы памяти ИС в иерархически-сетевую.
Третий аттрактор ИС – "интеллектуальный". Он позволяет сводить
воспринимаемые семантические переменные текстов к константам их
грамматических структур [4]. Конечное множество грамматических структур
покрывает большую часть информационного потока любой среды.
Четвертый эволюционный аттрактор ИС – "знание" когда все типы
грамматических конструкций ИС по переработке текста сводятся к 4
конструкциям над грамматическими конструкциями ИС ("Homo-sapiens").
Пятый эволюционный аттрактор ИС – "социальный", законы А.А.Богданова
о сверхаддитивности сложения усилий субъектов.
Шестой аттрактор – "Восхождение разума", интеграция всех ИС независимо
от их начальной природы (биологические, искусственные, …), приводит к
бесконечному росту эффективности Разума в "понимании " среды. .
8
Темпы и масштабы эволюции
Рождение
Вселенной
Э
Возникновение
жизни на земле
в
о
Десятки
миллиардов лет
л
ю
Первые
позвоночные
ц
Миллиарды
лет
и
Первые
человекообразные
я
Сотни миллионов
лет
ф
Первые люди
Цивилизация
о
р
Десятки
миллионов лет
м
t
Миллионы
лет
Сотни тысяч
лет
10 : 1
Эпоха прототехнологий
Э
в
Охота,
скотоводство
о
Сотни тысяч лет
л
ю
Аграрная фаза
ц
Десятки тысяч
лет
и
я
Тысячи лет
Индустриальная
фаза
с
Информационная
фаза
т
р
Сотни лет
у
к
Десятки лет
Ноосфера
т
у
Фазовый
переход
р
Годы
t
Месяцы
информационнный этап
1: 1000
Энерго-вещественный этап
Солнечная
система,
Вселенная
тысячи
километров
милиметры
простейшие
метры
высшее
растения
километры
высшее
животные
Разум,
человек
Н а п р а в л е н н о с т ь
Р о с т
Сверхразум,
Ноосфера
с ф е р ы
э в о л ю ц и и
в л и я н и я
9
Эволюция технической цивилизации
Материальная
ресурсоемкость
R=f(m,v,t)
(продукта, изделия,
услуги)
Знание,
Интеллектуально
информационный
ресурс
t
Первый палеокризис
1967 США-СССР
0
2000
2030
годы
Экстенсивный
Интенсивный Неустойчивость,
Этапы развития
фазовый переход
И
Р
М
И
Информоград
Одноклеточный
социум
Н о о с ф е р а –
форма существования социального организма
(Информоград - первый этап)
10
Нейросемантика
- Предметная область – Информационный
канал – Информационная система
- Форма представления информации
- Автосруктуризация
- Нейросемантические структуры
(НСС)
- Сигнал – Информация – Знание
- Адаптивные регуляторы на базе НСС
- Текстовая энтропия
11
Комплекс:
"Предметная область (ПО) 
Информационный канал (ИК) 
Информационная система (ИС)"
ПО
F
ИС
ak
aj
ИК


… dhdgdgsg ... shlhllb.. + -
ai
t
L
m
t
"Генетич .
программа"
0
12
Предметная область (ПО)
Любую физическую ПО можно рассматривать как некоторую
дискретную пространственно-временную область с
взаимодействующими объектами-процессами (ai, aj,).
При попадании нескольких объектов, в одну и ту же ячейку
(область взаимодействия), происходит процесс
их взаимодействия.
ПО
F
aj

ak
ai
m
Энергетика физического процесса
 это некоторый инвариант, характеризующий
потенциальную глубину причинно-следственного
распространения данного физического процесса


Предположим, что скорости
распространения разнообразных
физических процессов различны.
Мы будем рассматривать только такие ПО,
в которых существуют
малоэнергетические сопутствующие
процессы с большими скоростями
распространения, относительно
основного физического процесса.
14
Процесс взаимодействия объектов осуществляется
в течение нескольких тактов времени t2-t1.
Результат взаимодействия объектов выражается в
изменении величины одного или нескольких параметров
W, характеризующих их взаимодействие.
Любой W(t) может быть преобразован в текстовую
форму.
W
A
Wn
Z
t
t1

...
*
*
* *
tn  b
a


t2
а)
*
б)
*
*
в)
ln 
<kzkkzkb>
текстовая форма
г)
многомерный физический процесс <-> текстовая форма
15
Будем предполагать,
что в любой ПО выполняются:
- принцип причинности (инвариантность процессов
во времени и в пространстве),
т.е. если si  sj, то процесс si всегда вызывает sj;
- принцип локальной однородности (сведение
континуума значений параметра к ограниченному числу
качественно-различных образов, т.е. (<zzjbaabj>= si) ~
(<zzjbab>= si);
Например, вся температурная шкала разбивается на четыре
образа: si= «твердое», sj= «жидкое», sk= «газ», sl= «плазма».
- принцип субъектности,
т.е. каждый процесс ПО (si) имеет оценку полезности для ИС.
16
При взаимодействии объектов (например, {ai*aj}), в соответствии с F(ПО),
порождается ЭСЕ - элементарная семантическая единица
(s{ai*aj} = <cade…b>),
которая однозначно порождается процессом взаимодействия этих объектов.
Все множество взаимодействий в данной ПО, представляет собой
семантическое пространство, как совокупность ЭСЕ.
В качестве примеров ЭСЕ различных
ПО можно привести:
взаимодействие элементарных частиц –
<ababcw>;
<Привет Петров, как дела? Нормально!>
– взаимодействие объектов
макроуровневых ПО;
образование двойной звезды из двух
астрообъектов – <zzjbaabj>
(на гигауровне).
"d"
...
"тройки"
a1
a2
…
"пары"
cade…b
aj
…
an
a1 a2 …
ai
… an
ЭСЕ, порождаемые в ПО, суперпозиционно "сливаются" в
непрерывный информационный поток. W
17
Информационный канал (ИК).
В ИК происходит процесс формирования информационного ресурса
и его транспортировка к ИС.
Частота взаимодействия объектов в ПО
определяет плотность информационного потока в ИК.
ИК
информационная компонента (сигнал)
ПО
. . . dab d lklj
deas
tn
kjy uuus
физическая компонента процесса
а)
ИС
. . . abcd dab d ded deas lklj kjy uuus
t
ИР
ПО
. . . bcdabcddabdzxcwzxdljjkehdlkjhhbhdlkjjjh
tn
б)
ПО
в)
ИС
abcd
abcd
zx
Е
abcd dab cw
. . .bcdsdbcddabded sdadffabcdwzwjh
ИС
tn
18
В рамках рассматриваемого комплекса:
ПО -- ИК -- ИС,
задача ИС заключается в:
1. Воспринимать текстовую форму
2. Хранить информацию
3. Преобразовывать (качественно) информацию
4. Оценивать информацию
5. Выдавать информацию (текстовую форму)
6. Иметь положительный эволюционный потенциал
ПО
F
ИС
ak
aj
ИК


… dhdgdgsg ... shlhllb.. + -
ai
t
m
0
L
t
"Генетич .
программа"
19
АВТОСТРУКТУРИЗАЦИЯ
НЕПРЕРЫВНОГО
ТЕКСТОВОГО ПОТОКА
ПО
ИК
.
. . . bcdddabdzxcwzxdljkehkjhhbhdlkjjh
ИС
ПОЧЕМУ ВСЕ ОРГАНИЗМЫ "ЕДИНОДУШНЫ"
В КЛАСТЕРИЗАЦИИ ОКРУЖАЮЩЕГО НАС МИРА
НА ОТДЕЛЬНЫЕ ОБРАЗЫ ?
Предметная область
..1010010…
010101010101001001001110110101
010101010101010101010100101010
101010101010101010000010101010
101001010101010101010101001010 …0100101…
100101010101010101010100101010
101010101001010100101010101010
101010010101010100100110101010
101010101010101010101010101010
101010101010100110010101010101
010101010101010101010100101010
101010101010101010010101010101
010100110101010101010101001010
…0100101…
Традиционный способ
структуризации в системах ИИ
Предметная область
Пользователь
Программист
систем ИИ
ПО
ak
aj
Информационный 01001 – apll
001111  …
канал

ai
010101010... 01010101..
t
…
Программа
ИИ
00111001 - .
101010 22
Задача: в непрерывном потоке ТФ
необходимо выделить образы,
соответствующие процессам любой ПО
ПО
МАКРИСРИСМАКДУБЛЕН

t01
t02
t03
АКР
ИСМ
КД
УБЛ
ЕНД
…
R1
РИС
ДУБ
МАК
ЛЕН
ИС
Rm
Метод: построение в ИС множества различных
словарей и выбор минимального (Ri)
Результат: Минимальный словарь ИС
ПО)
(гомоморфен процессам
Инструментарий: нейросемантические
структуры
Демонстрационный пример
(четыре равновероятных процесса формируют непрерывный поток ТФ)
aj ПО
ЛЕН
МАК
ДУБ
ai
РИС
ИС
Текстовой поток
____
СМАКРИСРИСМАКДУБЛЕН
ak
Закрашенный
поток
"Генетич.
программа"
Необходимо построить словарь в N образов, полностью покрывающий
ТФ. Примем что:
Энергетические затраты на обработку одного образа в ИС равна 1Е-.
Время обработки символа и образа  один такт Т,
Энергетические затраты на хранение одного образа в памяти 1/24 Е-.
Энергетика каждого прогнозируемого ИС символа равна 1Е+,
Усредненный на 12 тактов энергетический баланс ИС =
-N(обработка) -1/2N(хранение) + (12-N)(прогнозирование) = (12 - 5/2N)*E
Результаты эксперимента
Первая структуризация словаря ИС
Форма словаря: (наибольший размер образа один символ):

<М><А><К><Р><И><С><Л><Е><Н><Д><У><Б>,

R(ИС)=12R*(0,5Е-/R) = 6E-,

прогнозирование (Т) = 0Т (т.к. у образа только один символ),

затраты энергии на распознавание = 12E
контролирование потенциальной энергии ТФ = 0E+.
Итог: для односимвольного словаря усредненный энергетический баланс
= 18E- .
Усредненный энергетический баланс ИС назовем
эволюционным потенциалом ИС
Эволюционный
потенциал ИС
численно
характеризует
жизнеспособность
ИС
потенциал
Эволюционный
ЭП = Э * И
Информационная
компонента  И
(в битах)
Информационноуправляющая
система
Материальная компонента
(энергия – Э, в джоулях)
Вторая структуризация словаря ИС
(наибольший размер образа два символа):





а) Минимальная форма словаря: <МА><К><РИ><С><ЛЕ><Н><ДУ><Б>:
R(ИС)=8R =4Е-, прогнозирование = 0,5Т (на образ),
затраты энергии на распознавание = 8E-,
контролирование потенциальной энергии ТФ = 4E+.
Итог а) 4Е- + (0,5Т * 8(образов на ТФ=12) = 4E+) + 8E- = 8E- .

б) Максимальная форма (без полного пересечения):
<МА><КЛ><КР><КД><КМ> <ЛЕ>…<БД>:
R(ИС)= 20R=10Е-, прогнозирование = 0,2Т (на образ),
затраты энергии на распознавание = 20E-,
контролирование потенциальной энергии ТФ = 4E+.
Итог б) 10Е- + (0,2Т * 20(образов на ТФ=12) = 4E+) + 20E- = 26E- .

Итоговый лучший эволюционный потенциал = 8E- .




26
Третья структуризация словаря
(наибольший размер образа в три символа).





а) Минимальная форма словаря: <МАК><РИС><ЛЕН><ДУБ>:
R(ИС)=4R =2Е-, прогнозирование = 2Т (на образ),
затраты энергии на распознавание = 4E-,
контролирование потенциальной энергии ТФ = 8E+.
Итог а) 2Е- + (2Т * 4(образов на ТФ=12) = 8E+) + 4E- = 2E+.

б) Максимальная форма (без дублирования, т.е. без полного пересечения):
<АКР><ИСР><ИСМ><АКД> <УБЛ><ЕНД> … <АКМ>:
R(ИС)= 36R=18Е-,
прогнозирование (Т) =+4E ,
затраты энергии на распознавание = 36E-,
контролирование потенциальной энергии ТФ = 0E+.
Итог б) = 50E- .

Лучший итоговый эволюционный потенциал = 2E+ , 50E-  2E+(!!).





27
Четвертая структуризация словаря (наибольший
размер образа в четыре символа)





а) Минимальная форма словаря: <МАК><РИС><ЛЕН><ДУБ>:
R(ИС)=4R =2Е-, прогнозирование = 2Т (на образ),
затраты энергии на распознавание = 4E-,
контролирование потенциальной энергии ТФ = 8E+.
Итог а) 2Е- + (2Т * 4(образов на ТФ=12) = 8E+) + 4E- = 2E+.

б) Максимальная форма (без дублирования):
<АКРИ><ИСРИ><ИСМА> <АКДУ><УБЛЕ><ЕНДУ> … <АКМА>:
R(ИС)= 48R=24Е-, прогнозирование (Т) = 0Т (на образ),
затраты энергии на распознавание = 48E-,
контролирование потенциальной энергии ТФ = 0,5E+.
Итог б) = 78E- .

Лучший итоговый эволюционный потенциал = 2E+ , 78E-  2E+




28
Пятая и другие структуризации словаря
Лучший итоговый эволюционный потенциал =
2E+ , 204E-  2E+
Шестая структуризация словаря, седьмая … и т.д.  2E+ !!!
Худший - E

Теоретический анализ результатов эксперимента
показывает, что эволюционный потенциал ИС
обратно пропорционален размеру словаря,
Размеры минимальных и максимальных словарей ИС
соотносятся минимум как:
o(N) и o(N3) !!! O(n); ???
где: N – максимальное число процессов в ПО
Автоструктуризация
информации в ИС
МАКРИСРИСМАКДУБЛЕН…
ПО
МАК
РИС
ЛЕН
ДУБ
£

t01
t02
t03
N
Минимальный
словарь ИС
-----> ! ! !
Образы ИС =
процессам ПО
ИС
АКР
ИСР
ИСМ
АКД
УБЛ
ЕНД
…
АКМ
РИС
ДУБ
МАК
ЛЕН
min
N2(L-1)=32
СN
[L/£]
L=3
N=4
2+ [L/£]
=N
max
o(N3) >> o(N) !!!
max
min
O(n); ???
30
Автоструктуризация
сложных иерархических процессов
ПО
…ДА КОЛЯ ЛОВИТ РЫБУ СА…
Подл. Сказ. Обст.
{…}{…}{…}
иерархические
процессы
Подл. Сказ. Обст.
ИС
{…}{…}{…}
иерархическая
структура
словарей образов
При минимизации словаря на
нейросемантических структурах,
его топология гомоморфна
структуре исходных процессов ПО
Теорема: минимальная форма словаря ИС может
достигаться только при ее гомоморфности исходной
структуре процессов ПО
Доказательство: Если представить формирование текстовой
формы двумя независимыми и непересекающимися
процессами А и Б, то становится очевидным,
проц. А
проц. Б
010010 УКЛОН ЭРМИТАЖ 101010010
образ А
образ Б
что минимальным словарем образов закрашивающим эти два
процесса могут быть только образы совпадающие по текстовой
форме с генерирующих их процессами.
На вопрос: "Почему все организмы 'единодушны' в кластеризации окружающего нас мира на отдельные образы ?"
Вытекает ответ: "Т.к. минимальный словарь, дает эволюционные преимущества, то все ИС данной ПО выбирают
его, а соответственно, и его образы".
Из минимизации отображения в ИС
гомоморфность
структуры образов в НСС
структуре процессов ПО
НСС
ПО
F
~
 ################## 
…######## 
Теорема:
максимальное значение компрессии достижимо
только при гомоморфном отображении
структуры процессов ПО в структуре образов НСС
Нейросемантическая форма
представления информации
НСС
Номера
слоев
Предметная область
6
N-элементы
5
Связи
4
3
2
1
Алгоритм
НСС
11011010001101101001-
0
"0" "1"
Семантика, тексты ПО,
содержание процессов
1
2
3
4
5
6
Номера элементов в слоях
Автоматическое выделение образов-процессов из
предметной области в нейроподобные элементы НСС
при минимизации ресурсных затрат (памяти)
N-элемент (образ НСС)  процесс предметной области
Автоструктуризация на
нейросемантических структурах
RИС = f(число N-элементов, число связей)в битах
1/P (компрессия) = ---------------------------------------------------------  0
при t   TФИС = объем текстовой информации в ИС в битах
или RИС / TФИС  0 и RИС  const, при t  M
при t  
Примеры:
а) <RISMAKDUBLENLENDUBMAKMAKLENRISRISLENMAKRISDUBRIS>
правильно выделяются все процессы: <MAK><RIS><MAK><DUB>;
б)<ДОМЗЕБРЫСКИТНАДОМДОМВНАДОМВСКИТВНАСКИТВВЗЕБРЫНАВНА>,
правильно выделяются все процессы:<ЗЕБРЫ><СКИТ><ДОМ><НА>
<В>.
сдвиг алфавита А в кодах ASCII в примере б)
<ЕПНИЖВСЬТЛЙУОБЕПНЕПНГОБЕПНГТЛЙУГОБТЛЙУГЖВСЬОБГОБ> на +1
<?IGB@<KVLECMH;?IG?IG=H;?IG=LECM =H;LECM==B<KVH;=H;{> на -133.
35
Структуру памяти ИС, в которой выполняется
свойство гомоморфного отображения ЭСЕ ПО и
их структуры в образы ИС и обратно:
N-элемент (образ ИС)  ЭСЕ (ПО)
будем называть –
нейросемантической структурой (НСС)
НСС – это готовая структура данных (процессов и объектов)
произвольной ПО для любой ИС.
Понятно, что ее автоматическое формирование открывает широкие
горизонты для инженерии ИС.
36
НСС – это пример 1-го формального преобразования
количественной текстовой формы представления
информации в качественно новую форму –
структуру образов ИС
1—
Автоструктуризация
0
"с учителем"
– "школа"
"без учителя"
 "игра"
log (tn)
(в битах)
Критерии достаточности: а) все пространство состояний;
б) если человек может правильно структурировать данный текстовой
материал в непривычной, но взаимнооднозначной нотации,
в) наличие характерных особенностей динамического процесса при
минимизации ресурса RИС
37
Расширив свойства формального нейрона введением в
него относительности времени активации входов,
получим нейроподобный N-элемент.
U(t)
Выход
Параметры ИС
Набор функционалов
сходства Fi
t
U(t) / U max
U(t)
x1
t0
x2
dt2
x3
dt3
*
*
*
*
...
Входы
Umax
*
Входящие N-элементы
xk
dtk
...
Пространство
образов Х
U(t)= P1*X1(t0) + P2*X2+T2*(t2- t0) + … + Pk*Xk+Tk*(tk- t0)
Fi (P,T)
1
1
1
…
U(t+1)= U(t)/a
0
1
1
k
0
1
k
0
1
k
0
1
k
38
Объединив N-элементы в потенциальный
многодольный иерархический граф, удалось получить
структуру аналогичную естественно-языковым.
k
слоя
№
слоя
5
2
5
1
...
...
. . .
...
.
...
...
...
...
1
2
...
...
...
...
...
...
...
...
...
... Номер N-элемента
39
Структурное описание НСС можно представить в виде
многодольного графа:
k
Номера
входов слоев
01100101011011011010001101101001 
2
6
2
5
2
4
2
3
2
2
2
1
1
0
Алгоритм А1
Текстовая форма
N-элементы
Связи
"0" "1"
1
2
3
4
5
Номера элементов в слоях
6
Форма НСС
Алгоритм обратного преобразования НСС в текстовую форму
осуществляется уже за меньшее число операций и идет "сверху-вниз".
40
Первый слой (доля графа) N-элементов – терминальный, фактически отображает
алфавит А ЭСЕ, второй слой – "псевдослоги" и строится на пространственновременных ссылках на предыдущий (терминальный) слой - информационное
содержание N-элемента, слой "псевдослов" – ссылается на "псевдослоги" и т.д., до
самого верхнего N-элемента, отображающего в себе через связи всю ПО.
Номер
слоя
k - в х одов
"В с я П О"
n
7
"Р а з д е л ы"
n-1 7
...
...
"Ф р а з ы"
4
5
"С л о в а"
3
5
"С л о г и"
2
3
"А л ф а в и т"
1
1
Номер
межслойной
среды связи

ИС
\\\\\\
n-1

\\\\\\\\\\\\\\\\\\\\\\
n-2
...

\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\
3

 - N-э л е м е н т ы
\\\\\\\\\\\\\\\\\\\\\\\
2
\\ - с в я з и

\\\\\\\\
1


ПО
 abcklltfdbababafgkdkediejjdjchhc
Текстовой
поток
41
Следует также отметить, что все технические характеристики
ассоциативной памяти на базе НСС:
- время доступа,
- коэффициент компрессии-сжатия,
- надежность хранения информации и др.)
имеют тенденцию к улучшению, как в среднем, так и в
абсолютных значениях, по мере роста объема вводимой
информации из ПО.
Коэффициент
сжатия
Р раз
1
Время Надеждоступа ность ИС
T сек. Q %
q
элемента
Q
T
P
1
0
log (tn)
(в битах)
Величина компрессии отражает
потенциальную интеллектуальность ИС.
Псевдофрактальные файлы.
Сжатие
Зависимость степени сжатия от размера файла, как Log 2(X) байт
800
700
600
500
400
300
200
100
0
NSS
RAR
ZIP
10
11
12
13
14
15
16
17
18
19
20
43
Адаптивные регуляторы
на базе НСС
Примеры объектов управления
Fn
1
2
` Xn
Xn
3
4
5
6
7
Fn
Xn
-3 -2
-1
0
1
2 3
б) "Обратный маятник"
а) "Наклонная плоскость"
а2
-2
-1
0
1
2
3
с) "Неизвестный объект"
X0
X0
а1
-3
Fn
аа3 1
а4
а5
а6
а7
Xn
Xn+1 = 1+ Xn + Fn + Zn
аQ
`
-3
-2
-1
0
1
2
3
Q
Xn
Xn+1 = 2*Xn + Fn + Zn
Xn+1 = f(Xn) + Fn + Zn
44
Таблица пространства состояний
f(Xn) и Fn
Форма задания объекта
N= 7 - число состояний объекта.
(1 2)(2 3)(3 4)(4 5)(5 6)(6 7)(7 8)
-пары (Xn Xn+1) отражают f(Xn)
перехода состояний объекта
Область нормальных состояний
объекта S – первый элемент
пары (Xn Xn+1) = {1,2,3,4,5,6,7}.
F= -1, -2, -3, -4, -5, -6, -7,
- возможные управляющие
воздействия регулятора
Xn+1 = f(Xn) + Fn + Zn
45
Адаптивный регулятор №1 на базе НСС.
е)
д)
4-3 2-7 


4-3
г)
в)
1
2-7
2
7-4 4-1 4-1 4-6 
7-4
3

4-1
4
4-6
5
5-2 …
…
5-2
6
7
1
2
X
б)
4
5
max F0
-F
4-3 2-7  7-4 4-1 4-1 4-6  5 2 …
t0
tn
F
S
а)
3
Q
Xn+1 = f (Xn) + Fn + Zn
X0
t

6
7
Запоминая пары <X><Y> и их оценку <E> для любого
априорно неизвестного объекта управления (f(Xn)),
регулятор №1, фактически полным перебором, проходит
все возможное пространство его состояний (N*M ).
60
50
Настроенный
регулятор
40
30
Обуче ние
20
10
0
1
6
11 16 21 26 31 36 41 46 51 56 61 66 71 76 81 86 91 96 101
47
Адаптивный регулятор №2
е)
д)
4-3 2-7 


7-4
4-3
4-1
2-7
4-1
7-4
4-6

5-2 …
4-1
4-6
…
5-2
…
г)
в)
1
2
3
4
5

6
7
x>
x=
=4
4-3 2-7  7-4 4-1 4-1 4-6  5 2
F
3
t
Q
Xn+1 = f (Xn) + Fn + Zn
X0
2
…
tn
S
1
4
max F0
-F
t0
а)
…
=+1
R(X,F)
X
б)
x<

5
6
7
Скорость обучения регулятора №2 почти не зависит от размерностей N и M
(N – число состояний объекта, M – число состояний возможного управления, в
эксперименте для простоты принималось N = M = 7, 15, 17,19, 21),
Т.е., пример регулятора №2 демонстрирует возможность практического
преодоления "проклятия размерности".
150
регулятор №2
100
регулятор №1
50
0
1
250
6 11 16 21 26 31 36 41 46 51 56 61 66 71 76 81 86 91 96 101 106 111 116 121
регулятор №2
200
регулятор №1
150
100
50
0
1
12
23
34
45
56
67
78
89 100 111 122 133 144 155 166 177 188 199 210 221
49
Формирование понятия абстрактного числа в ИС
(задача неразрешимая для классического ИИ, и легко решаемая
биологическими ИС, как высшими животными, так и человеком).
Одно из физических свойств N-элемента состоит в экспоненциальном
падении величины U(t+1) = ( U(t) + 1* ) / . после его активации
(напр., при =2)
U(t) 2
1
0
TL
Это пример сведения семантических характеристик ПО
к физическим параметрам элементной базы ИС,
т.е. сводимым к: См.-Бит-Сек – Система СБС
50
Адаптивный регулятор №3
<больше> <меньше>
Fn
Xn
U(t) =1.0
U(t) =1.5
1
2
3
4
5
6
7
|; ||; |||; ||||; |||||; … |||||||;
U(t) 2
U(t) =1.75
N-эл. "1"
N-эл. "2"
N-эл. "3"
t
t
U(t)
…
U(t) =1.96
N-эл. "7"
Upor, Fi
U(t) =1.5
1
0
TL
<3; 4><число><+t><больше>
<1; 4><число><+2t><больше>
…
<3; 2><число>< -t><меньше>
<4; 1><число><-3t><меньше>
51
На базе нейросемантического регулятора №3 формально
показано, как на основе вышеописанных физических
свойств N-элементов возможно естественное
самоформирование R-отношений, представленных в
регуляторе №2. Тем самым, подведено теоретическое
основание для инженерного построения ИР, т.е.:
теоретически решить проблему построения ИИ.
Как и вычислительная техника начала развиваться с теоретических
моделей "машин Тьюринга и Поста", так и анализ работы
нейросемантического регулятора будет способствовать формированию
широкого фронта научных работ по разработке ИР.
Таким образом, на НСС-регуляторах можно продемонстрировать:
- №1 – "адаптационность", как возможность адаптироваться в любой ПО;
- №2 – "интеллектуальность", как возможность существенного
сокращения перебора;
- №3 – "креативность", как целенаправленное порождение нового знания.
Пространство №1 >> №2 >> №3 : полного перебора >>
пространство отношений >> энтропийное пространство
Функционирование примитивных ИС
В ИС отображается только объективная информация.
При этом, на каждое конкретное раздражение (Хi)
– конкретная реакция (Уj),
с "эмоциональной" оценкой ее полезности для ИС.
Fi(P,T)
ПО
Max(U(t)) + --
ИС
Оценка
(Е+)
Вход (Хi)
(Yj) Выход
53
Память "сложных" ИС строится как иерархическая структура из
НСС. На фактографическую НСС1, настраивается НСС2
("ортогональная"), которая функционально воспринимает НСС1,
также как НСС1 воспринимает ПО.
НСС 2
НСС 3
. . .
НСС 1

ПО
По нашим оценкам, структуры из 4-5-ти иерархических НСС вполне
достаточно, чтобы моделировать основные психические функции человека
54
ЗНАНИЕ
(например, "логические высказывания")
в текстовой форме обязательно содержат
ритмические п о в т о р е н и я !
|ВСЕ| |ВОЛК|И|
|СЕР|Ы||А||ЕСТЬ| |ВОЛК|,||ЗНАЧИТ|,|А||ЕСТЬ|
СЕР|ЫЙ|<E+>
|ВСЕ||ПЕТУХ|И||КРАСИВ|Ы||В||ЕСТЬ||ПЕТУХ|,||ЗНАЧИТ|,|В||ЕСТЬ|КРАСИВ|ЫЙ|<E+>
НСС1
в НСС2 автоматически строится структура:
|ВСЕ| |X1 |И| | X2 |Ы|, |X3| |ЕСТЬ| |X1 |, | |ЗНАЧИТ|, |X3| |ЕСТЬ| X2 |Ы|Й|<E+>
 t1
 t3
 t2
<ВСЕ ПЛЮКИ КАНЫ, ОН ЕСТЬ ПЛЮК, ЗНАЧИТ, ОН ЕСТЬ >t2+Ы|Й<КАНЫЙ>
<ВСЕ ЛЮДИ СМЕРТНЫ, СОКРАТ ЕСТЬ ЛЮД, ЗНАЧИТ, СОКРАТ ЕСТЬ >,
ИС в своей грамматике выдаст: <СМЕРТНЫЙ>.
Таким образом, все типы логических высказываний
произвольной ПО покрываются одним механизмом НСС
55
Информационный ресурс:
"сигнал – информация – знание"
При TФ = const (t),
"линейный – сигнал",
RИС = f (SИС(t))
RИС= K*t +b1
RИС
(бит)
Память
ИС
Сигнал - простая суперпозиция ЭСЕ ПО;
"логарифмический – информация”
RИС= log(t) +b2
t
TИС (бит)
RИС
Информация – знаковая последовательность на языке
системы, соответствующая целому числу причинносвязанных процессов ПО, т.е. ЭСЕ
Данные – форматированная под ПО информация
"const - знание".
t
TИС
RИС
RИС= const +b3
Знание – совокупность ЭСЕ, отражающих одновременно
процессы ПО и процессы в самой ИС
t
TИС
56
Отображение информационного
ресурса тремя классами ИС
Автомат
БШ
ПО
ПС
Сигнал
Сигнал
Сигнал
Сигнал
Информация
Информация
Сигнал
Информация
Знание
bsejgr…
abcabc...
"Телесериал"
Реальный
"животн." "ИС-человек"
Mather…
57
Текстовая энтропия
 = p(s), при p(s)  1
ТЭ(s) 
 = 1 - (p(s) - 1) / (m-1),
p(s) - частота на интервале
L*AL,
1
ТЭ
при p(s) > 1
0
0  p(s)  m;
1 p(s)
m
 p(s)L / m = 1
m
(условие нормировки)
1
s - некоторое слово длиной в L символов;
m - размер потенциального S-словаря в m=AL S-слов
информационное пространство в L*m = L*AL символов
m
ТЭL =  ТЭ(s)L / m
1
L
m=A
2
.
.
.
L
…kksxkdkdfjfjgh…
.
.
.
Т=L*AL
Например, p(dkd)L=3
bb
c
b
a
3 c a
b
c
. ..
ca cb cc
ba bb bc
aa ab ac
a
b
А
c
1
...
58
Текстовая энтропия
1—
ТЭL
0
Периодический
сигнал
1
5
Идеальный
случайный сигнал
Реальный текст
10
15
Псевдо случайный
20
L
Относительная текстовая энтропия
Случайный сигнал
1—
OТЭ
Реальный текст
0
1
5
10
15
20
L
Таким образом, числовые значения ТЭ и ОТЭ являются эффективными параметрами-индикаторами, которые характеризуют
возможность семантического анализа конкретной ПО
(например, при поиске сигналов от внеземных цивилизаций). 59
Решение
Проекты:
- Искусственный разум
ИР
ИРМИ
- Информоград
- Восхождение разума
60
Проект -
Искусственный разум
Прототипы компьютерного интерфейса: “ человек-ИP “
с а м о р е ф л е к с и я
Параллельные
каналы
Л
П "Моти- Л
вация
 оценка"
Е=+0,3
"Глаз"
"Ухо"
Последовательные
каналы
П
"Рука"
"Речь"
"эмоции"
<машина>
обработка информации
Входная
информация
- "рецепторы"
Оценка
Выходная
соответствия
информация
адекватности - "эффекторы"
выхода на вход
ПО
61
По нашим оценкам





через 12 месяцев возможно получить программную
реализацию описанного ИP.
за 18 и 24 месяца, на базе многопроцессорных ЭВМ (2561024 RISC процессоров), сформировать многопроцессорный
кластер и чисто аппаратную реализации ИP, реализуя
естественную параллельность процессов в НСС.
ИP - это на 6-9 порядков ускорение решения любых
"интеллектуальных" задач с одновременным повышением их
сложности (числа компонент) на 5-6 порядков.
Для цивилизации, появление ИP, это как реальный шанс ее
будущего, особенно в сегодняшнее неуправляемое время
"технологий глобального (воз)действия" (биотехнологий,
информационных, ядерных, финансовых), которые, в руках
террористов, превращаются в орудие ада.
Без ИP человечеству в 21 веке практически не выжить и в
подтверждение этого тезиса можно привести множество
доводов
Человек и искусственный разум
* 10 6-10 =
ИР
ИРМИ
...
Объем памяти 1012-1016 образов (1024 текста, графики, …)
Режим работы on-line: 50 пользователей - станция Sun;
1000 пользователей – многопроцессорная супер ЭВМ;
100 000 пользователей – аппаратная реализация ИРМИ.
Язык диалога - естественный для каждого пользователяисследователя.
Когнитивные функции ИРМИ не уступают человеческим
Проблемы решаемые только с помощью ИР
- on-line структуризация и формирование глобальных БЗ;
- "Госплан" Планеты;
- Глобальный Университет (обучение);
- Промышленная разработка информационного ресурса;
- Безопасность Планеты;
…
Человек и Машина (ИР)



Страхи что ИР поработит человечество – типичный пример широко
распространившегося шаманизма от киноиндустрии. Для человека более
опасен другой человек, т.к. у них одна ниша потребления. Генетически же
ИР нацелен на космос – именно там широкое поле для его деятельности.
Неограниченное количество любых материальных ресурсов вселенной не
дает даже теоретических основ для конфликта между ИР с земным
человеком.
С точки же зрения сотрудничества, ИР для человека представляется
идеальным партнером, т.к. у них одна область производства легко
тиражируемого результата. Где в итоге, каждый получает весь конечный
продукт – новое знание (пример ИРМИ). Так что, никаких естественных
оснований для конфликта между человеком и ИР нет. Сотрудничество
же человека с ИР станет мощным стимулом для заключительного
экспоненциального этапа научно-технического прогресса нашей
цивилизации.
Работы над созданием ИР должны проводиться только в рамках нового
гуманистического мировоззрения и специализированной международной
академической инфраструктуры. Это необходимо, чтобы такой фактор, как
ИР не стал "информационной дубиной" в руках какой-либо эгоистической
группировки. В качестве такой начальной социально-экономической
структуры по разработке ИP предлагается проект "Информоград".
Российский центр поддержки
инноваций (проект "Информоград")
ИРМИ в рамках Российского центра поддержки инноваций
(проект "Информоград") каждому исследователю даст в свое
распоряжение колоссальные материальные и
интеллектуальные возможности, о которых до этого не могли
мечтать и целые государства.
В процессе взаимодействия при решении задачи, ИРМИ
помогает человеку получить новое решение, человек при этом
обучает ИР, представляя ему уже известные знания.
Новое же знание, полученное в
ходе сотрудничества ИРМИ и
человека, становится их общим
знанием, взаимообогащая их
обоих, как бы более
интеллектуально ИР не
превосходил человека.
65
$1500-3000
2006-2007 г
$300-500
2006-2007 г
"Информоград"
Российский информационно-аналитический
центр поддержки инновационных работ
$1500-3000
Молодой российский выпускник за границей :
-Материальный достаток и хорошие бытовые условия
-Новейшее оборудование
-Иная культурная среда
-Работа на вторых ролях (мах post-doctor = м.н.с.)
-Малая перспектива роста
-2004 г число возвращающихся высококлассных
специалистов (МФТИ, МГУ, МГТУ, МИФИ) сравнялось с
числом отъезжающих за рубеж
67
ТНК
Аутсорсинг
$500-1000
"Чем больше работаешь – тем больше остаешься должен" !
Российский рынок информационной безопасности в прошлом году
составил $170 млн. и по предварительным прогнозам, в 2005 году
вырастет до $230 млн., мировой рынок составит ~ $200 млрд.
В этой области работает ~ 1 000 программистов из России. Они
получают ~ $1000, сумма = $12 млн./год
$230 млн. - $12 млн. = $220 млн. ??! (выплаты из России)
В $200 млрд. (общ. объем $1 трлн.) ~ 10% труда россиян,
а получают 0,5% или 1/200 от прибыли, принесенной ТНК
Пример: 10 чел. за 12 мес. для ТНК делают ПО ИИС (цена ПО $1000)
Получают по $1200/мес. Семьи по 5 человек. Прож. минимум $200.
Доход семьи (страны) = $2400/год.
Семья разработчика ПО не может купить свой ПО (2400 << 5*1000 ) !!!
Нет более ценного товара,
чем ИНФОРМАЦИЯ (знание)



Инновационная экономика - стратегическое
направление развития России в XXI веке
Создание единого информационного пространства
(информационной инфраструктуры) технологии
разработки знаний
Как не богата Росси я природными ресурсами,
но основное её "богатство в мозгах, а не в недрах"
Смена социально-экономической философии
Не догонять, а упреждать !!!
Не ЭВМ, а Искусственный разум !!!
69
"И н ф о р м о г р а д" это:
- Повышение производительности труда в 1000 раз
= 10 (этап постановки) *10 (НИР) *10 (НИОКР)
- Экспериментально-опытное производство (ЧПУ,…)
= готовые изделия (патент, самолет, …)
- Новые социально-экономические отношения
= Ноосфера (социальный организм)
- 2012 год Россия мировой лидер социальноэкономического развития (русский космизм)
$300 000 - 500 000
Проект - Восхождение разума
71
Характеристики
эволюционного процесса
высокоорганизованной материи
Цель – пролонгация лидирующего вида до горизонта
прогнозирования будущего ( n(t), t∞).
– экспансия свободы вида ( n(t)=f(at), t∞, Q).
Мера – эволюционный потенциал (Э(Е) – НЭ(Е)),
доступный ресурс ( n(t) max(E) Q),
компрессия ( Pmax Q).
Механизмы – законы экспоненциальности (f(at),
и сверхаддитивности f(s1,…,sn)>>f(s1)+,,,+f(sn)
и алгоритмы НСС (C++, …)
72
Фазы эволюции
высокоорганизованной материи
Пространственная
1-я фаза
Пространственновременная
2-я фаза
Временная
3-я фаза
Довещественная
Вещественная
Надвещественная
Б
Мы
Антропный
принцип (Разума)
В
О
С
Флуктуация,
Большой взрыв
Х
О
Ж
Д е г р а
Д
д
2006г.
Е
а
Разум
Н
ц
И
Е
и я
Эволюция форм материи и ее пространственно-временных фаз
73
СПАСИБО ЗА ВНИМАНИЕ
По всем вопросам Проекта
(национального)
ИСКУССТВЕННЫЙ РАЗУМ
обращаться к Бодякину Владимиру
E-mail: body@ipu.ru
www.informograd.narod.ru/
тел. (095)334-92-39
в ИПУ тел 1-346
74
Свойство доминирования "внутренних"
информационных процессов (от НСС5 > НСС1)
над "внешними" информационными процессами
идущими от НСС1, назовем сознанием ИС.
Особенностью нейросемантической ИС является
то, что в N-элементе происходит слияние
общепринятых понятий данных и алгоритма,
как неделимого пространственнофункционального элемента – образа.
"Метаалгоритмом" поведения ИС является
асимптотическая минимизация отображения
(при t), всех значимых для неё текстовых потоков.
Формальная схема иерархического построения памяти
ИС приводит к расширению языка, что позволяет
"обойти" запрет теоремы Гёделя о неполноте
формальных систем.
Так, если язык фактографической ИС (НСС1)
представляет только <X><Y><E>
(<стимул><реакция><оценка>), то иерархическая схема в
НСС2 позволяет дополнительно описывать
различные отношения R(<X><Y>)
физических характеристик активируемых N-элементов
и объединять все это с оценкой <E>.
<X><Y><E> 
< (<X><Y>) >< R(<X><Y>) >< E>
 <…
Алгоритм (А1) преобразования текстовой формы
в иерархическую структуру словарей (НСС)
L = {01100101011011011010001101101001}.
Исходный текст
1-й шаг k1=2
l0 01100101011011011010001101101001
Последовательность индексов (ссылок)
l1 1 2 1 1 1 2 3 1 2 2 4 3 1 2 2 1
+
Номера цепочек
в словаре
1 2 3 4
"01"10"11"00“
L1
77
2-й шаг k2=2
l1 1211123122431221
l2
12134516
Номера цепочек в словарях
1 2 3
4 5 6
+
12 11 31 22 43 21
"01"10“ 11"00"
L2
L1
78
3-й шаг k3=2
l2
12134516
Номера цепочек в словарях
1
l3
1234
2
3
4
5
6
12 13 45 16
L3
12 11 31 22 43 21
+ "01"10“ 11“ 00"
L2
L1
79
4-й шаг k4=2
l3
1234
l4
12
Номера цепочек в словарях
1
+
2
3
4
5
6
12 34
L4
12 13 45 16
L3
12 11 31 22 43 21 L2
"01"10"11"00" L1
80
5-й шаг k5=2
и исходная последовательность символов полностью
переходит в НСС.
Номера
Ссылки
словарей
6
1
на предыдущие
(слоев)
5
12
словари
4
12 34
и "алфавит"
3
12 13 45 16
2
12 11 31 22 43 21
1
"01"10“ 11“ 00"
1 2 3 4 5 6
Номера элементов в словаре
81
Номера
словарей
(слоев)
Включение
в НСС
алфавита А
6
5
4
3
2
1
0
6
5
4
3
2
1
А
1
Ссылки
12
на предыдущие
12 34
словари
12 13 45 16
и "алфавит"
12 11 31 22 43 21
12 21 22 11
"0" "1"
1 2 3 4 5 6
Номера элементов в словаре
82
Структурное описание НСС можно представить в виде
многодольного графа:
Номера
слоев
6
N-элементы
5
Связи
4
3
2
1
0
"0" "1"
1
2
3
4
5
6
Номера элементов в слоях
Алгоритм обратного преобразования НСС в текстовую форму
осуществляется уже за меньшее число операций и идет "сверху-вниз".
83
Download