Intelligent Systems for life and social sciences В.К. ФИНН

advertisement
ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ ДЛЯ НАУК О ЖИЗНИ И СОЦИАЛЬНОМ
ПОВЕДЕНИИ
Intelligent Systems for life and social sciences
В.К. ФИНН
Всероссийский институт научной и технической информации
(ВИНИТИ РАН)
V.K. Finn
All Russian Institute for Scientific and Technical Information (VINITI)
of the Russian Academy of Sciences
В начале 80-х годов в ВИНИТИ были начаты исследования по созданию логических
средств систем искусственного интеллекта. Главным результатом этих исследований
стало создание ДСМ-метода автоматического порождения гипотез (ДСМ-АПГ) в базах
данных с неполной информацией.
ДСМ-метод АПГ состоит из:
(1) аксиоматизируемых условий применимости;
(2) правдоподобных рассуждений типа ДСМ, формализуемых посредством
бесконечнозначных логик предикатов, истинностными значениями которых
являются степени правдоподобия порожденных гипотез;
(3) представления знаний (в базах знаний) в виде квазиаксиоматических теорий;
(4) дедуктивной имитации правдоподобных рассуждений;
(5) алгоритмов порождения сходства фактов, используемых для реализации
индукции в базе фактов (БФ);
(6) интеллектуальных систем типа ДСМ.
Интеллектуальные системы (ИС) суть компьютерные системы такие, что они
способны решать в автоматическом или интерактивном режиме трудные (часто плохо
формализуемые) задачи, решение которых человеком в реальное время невозможно.
ИС имеют следующую архитектуру:
ИС = Решатель (задач) + Информационная среда + Интеллектуальный интерфейс,
где
Решатель = Рассуждатель + Вычислитель + Синтезатор,
Информационная среда = база фактов (БФ) + база знаний (БЗ),
Интеллектуальный интерфейс = диалог + демонстрация результатов ИС (в т.ч.
графика) + научение работе с системой.
ИС осуществляют анализ данных в БФ посредством Решателя и использует
полученные результаты (гипотезы) для прогнозирования изучаемых эффектов.
Рассуждатель реализует автоматизированные рассуждения (в т. ч. индукцию,
аналогии, абдукцию и дедукцию), Вычислитель реализует различные вычислительные
методы (статистические, квантовохимические расчеты, нейронные сети и т.д.).
Синтезатор объединяет и координирует работу Рассуждателя и Вычислителя,
формируя в интерактивном режиме стратегию решения класса задач, соответствующих
проблеме, для решения которой предназначена ИС.
Таким образом, ИС есть человеко-машинная система поддержки научных
исследований, проблем управления и медицины посредством имитации и усиления
интеллектуальной деятельности человека.
ИС типа ДСМ (ИС-ДСМ), реализующие ДСМ-метод АПГ, обладают следующими
особенностями.
(1) Условиями применимости ИС-ДСМ является наличие в БФ не только позитивных
((+)-примеров) и негативных примеров ((–)-примеров), но и наличие в БФ (±)зависимостей причинно-следственного типа. Кроме того, факты ((±)-примеры) из БФ
имеют представление, достаточное для установления сходства (являющегося источником
образования гипотез). Таким образом, в ИС-ДСМ осуществляется принцип: сходство
фактов влечет наличие (отсутствие) изучаемых эффектов и их повторяемость.
Следовательно, ИС-ДСМ посредством ДСМ-метода АПГ реализуют формализованный
качественный анализ данных для структуризованных фактов из БФ и прогнозирование
изучаемых эффектов посредством гипотез об их (±)-причинах.
(2) Рассуждатель ИС-ДСМ осуществляет правдоподобные рассуждения, которые
образованы синтезом трех познавательных процедур – индукции, аналогии и абдукции.
Посредством индукции (установление сходства фактов в БФ) порождаются гипотезы о
(±)-причинах изучаемых эффектов. Посредством выводов по аналогии, использующих
гипотезы о (±)-причинах (результаты индукции), осуществляется предсказание – перенос
(±)-причин на факты с неопределенной оценкой. Чередование правил вывода «индукция –
аналогия» продолжается до стабилизации (новые гипотезы не возникают).
После стабилизации Рассуждателя (этап применения индукции и аналогии)
применяется абдукция – объяснение начального состояния БФ посредством гипотез о (±)причинах. В случае объясняемости БФ все порожденные гипотезы принимаются. Если же
имеются необъясненные факты из БФ, то БФ расширяется и Рассуждатель применяется к
новой БФ. Процесс ДСМ-рассуждений продолжается до достижения порога
объясняемости БФ, заданного пользователем. Степень объясняемости БФ d+ есть
отношение числа объясненных (+)-фактов к числу всех (+)-фактов из БФ (аналогично
определяется d– для (–)-фактов).
ИС-ДСМ адекватны задачам наук о жизни и социальном поведении, ибо Решатель
ИС-ДСМ обладает «экологической чистотой» в том смысле, что новое знание извлекается
из БФ посредством установления сходства ((±)-причин) и предсказания эффектов без
каких-либо процедур усреднения и неинтерпретируемых в терминах фактов
преобразования данных.
Высокая точность предсказаний посредством ДСМ-метода АПГ объясняется тем, что
правила индукции и аналогии используют автоматически порождаемые фальсификаторы
гипотез (контраргументы).
Эффективность применения ИС-ДСМ подтверждена его многочисленными
применениями к задачам фармакологии и биохимии, медицинской диагностике и анализу
социологических данных.
ИС-ДСМ для фармакологии и биохимии применялись для предсказания
биологической активности химических соединений (в т.ч. токсичности и
канцерогенности), а также предсказания биотрансформаций химических соединений и
построения путей их метаболизма. ИС-ДСМ для решения этих задач являются средством
компьютерной поддержки фармакологических исследований и конструирования лекарств.
ИС-ДСМ для диагностики по клиническим и лабораторным данным применялись
для диагностики наличия вируса папилломы человека, для диагностики красной волчанки
(системное нефрологическое заболевание) и для диагностики нескольких глазных
заболеваний.
Посредством ИС-ДСМ для анализа социологических данных впервые был
реализован формализованный качественный анализ этих данных, тогда как стандартным
средством анализа данных в социологии является применение статистических методов, не
учитывающих индивидуальные особенности поведения. ДСМ-метод, реализованный в
ИС-ДСМ и использующий синтез индукции, аналогии и абдукции, создает возможности
решения задач и установления детерминант поведения с учетом индивидуальных
особенностей субъектов поведения. Кроме того, ИС-ДСМ способны анализировать
степень рациональности мнений респондентов. Посредством ИС-ДСМ решаются задачи
прогнозирования действий, готовности к действиям (установок) и прогнозирования
мнений (в том числе, электорального поведения).
ИС-ДСМ применялись также к задачам технической диагностики и автоматической
классификации текстов посредством машинного обучения на (+)- и (–)-примерах. ИСДСМ разрабатывались не только в Секторе интеллектуальных информационных систем
ВИНИТИ РАН. На основании опубликованных работ по ДСМ-методу АПГ (в т.ч., в НТИ,
сер.2) были созданы ИС в США и Франции, использующие ДСМ-метод АПГ.
ДСМ-метод также был использован в теоретических исследованиях немецких
математиков, разрабатывающих алгебраическую теорию анализа формальных понятий.
В заключение укажем на возможные новые применения ДСМ-метода АПГ и ИСДСМ. Последние могут использоваться как средство компьютерной поддержки
интеллектуального управления, использующего опыт в БФ и процедуры машинного
обучения. ИС-ДСМ могут быть применены в правовой сфере как средство типологии
преступлений и средство анализа данных в криминалистике. Они также могут быть
полезны для создания интеллектуальных роботов, использующих БФ (предыдущий опыт)
и машинное обучение посредством ДСМ-метода АПГ. Наконец, ИС-ДСМ могут найти
применение в работах по интеллектуализации информационного поиска – например, для
отнесения вновь поступившего текста к набору известных тем.
Таким образом, ИС-ДСМ являются современным средством интеллектуальных
компьютерных технологий (человеко-машинных партнерских систем), имеющим широкие
возможности автоматизированной поддержки наук о жизни, наук о социальном
поведении, управления и экологии.
The JSM-Method of Automatic Generation of Hypotheses (JSM- MAGH) (developed in VINITI) is
the tool for Intelligent Data Analysis, which formalizes special class of plausible reasoning. The proposed
technique is a synthesis of cognitive procedures – empirical induction (formal generalization of John S.
Mill’s Methods of Causal Reasoning), causal analogy and Charles S. Peirce’s abduction (acceptance or
rejection of hypotheses by an explanation of initial data). This synthesis (called JSM-reasoning) is
formalized by specially created many-valued logic The JSM-reasoning realizes natural heuristics (which
is the tool of formalized qualitative Intelligent Data Analysis) and proves to be an adequate instrument for
formalization of reasoning in life and social sciences.
In general, basic process of the developed technique has three stages. The first one is a stage at
which hypotheses on causal relations (determinants of behaviour) are generated –empirical induction is
realized here. The second is a stage at which predictions about previously unknown properties of objects
(individual’s behaviour) are inferred from causal relations – it means inference by analogy. This two-part
process is iterated until stabilization is achieved (the stabilization is guaranteed by the specific features of
the process). At the last stage, a test is performed to check on the explanatory adequacy of the sets of
generated hypotheses – we have special kind of abductive inference here. In accordance with the results
of this test, hypotheses are either accepted or rejected.
Being realized as an intelligent computer system (IS), the JSM-method is applicable to open subject
domains with large amount of empirical material and ill-formalized knowledge. The method can yield
useful automatically formed generalization of facts from Data Base with incomplete information as well
as prediction of objects’ properties.
JSM-method has been effectively applied to the problems of pharmacology and biochemistry,
clinical and laboratorial diagnostics and qualitative analysis of sociological data. The described formal
tools can be the instruments for intelligent control, for data analysis in criminology and for intelligent
information retrieval (texts categorization, classification, for instance).
Некоторые публикации.
1.
Anshakov O.M., Finn V.K., Skvortsov D.P. On Logical Means of the JSM-method
of automatic hypotheses generation // 10-th IEEE International Symposium on
Intelligent Control, Proceedings of the 1995 ISIC Workshop, Monterey, California,
USA, 1995, pp.86 – 88.
2.
3.
4.
5.
6.
Zabezhailo M.I. et al. Reasoning Models for Decision Making: Application of
JSM-Method for Intelligent Control Systems // Ibid., pp.99 – 108.
Finn V.K., Mikheyenkova M.A. Application of JSM-Theory of Plausible
Reasoning to Social Data Analysis and Social Actions Prediction // International
Conference on Intelligent Systems and Semiotics, Gaithersburg, MD, September
22-25, 1997, Proceedings, pр.92 – 95.
Панкратова Е.С. и др. Применение ДСМ-метода для прогнозирования
высокопатогенных типов вирусов папилломы человека // НТИ, сер. 2, № 6,
2002, с. 22 – 26.
Finn V.K. et al. Toxicology Analysis by Means of JSM-method // Bioinformatics,
vol. 19, № 10, 2003.
Финн В.К., Михеенкова М.А., Бурковская Ж.И. О логических принципах
анализа электорального поведения // НТИ, сер. 2, № 8, 2004, с. 18 – 22.
Download