Коротенков Ю.Г. Количество информации в аспекте ее

advertisement
Ю.Г. Коротенков
КОЛИЧЕСТВО ИНФОРМАЦИИ В АСПЕКТЕ ЕЕ ЗНАЧИМОСТИ
И ОБУЧЕНИЯ ИНФОРМАТИКЕ
(г. Москва, Институт содержания и методов обучения РАО)
Выражение количества информации. Количество информации – это оценка информации с количественным выражением ее результатов. То есть результат оценки
должен находиться в некотором абстрактном числовом множестве, фиксированном для
каждого конкретного типа (каждой формы) оценки. Следовательно, можно ввести следующие обозначения.
Пусть М – информация (информационный объект или множество информационных объектов), К – количественная оценка информации, применимая к М. Тогда можно
ввести абстрактное число K(M)= | M | = | M |K.
Оценка количества считается определенной в некоторой информационной области, если она определена для каждого компонента информации этой области. Очевидно
также, что она должна быть однозначной – с единственным результатом.
Пусть С – информационная область, СМ – множество множеств информации этой
области: множество объектов, совокупностей объектов и т.д., то есть любая конкретная
информация этой области является элементом множества СМ. Пусть также в области С
определена оценка количества информации К. Тогда должно существовать такое множество абстрактных чисел I, что определено отношение K: CM → I, где K(M) = | M |
для каждого М ∈ СМ.
Множество I может быть бесконечным и конечным независимо от мощности
множества СМ. Так, например, это множество может содержать только элементы
(«числа»): «много», «очень много», «мало», «очень мало». Может она, напротив, содержать все множество натуральных чисел.
Очевидно, что «количество» (тип оценки количества) не может быть определено
однозначно, поскольку не однозначно понятие количества. Поэтому представляется
правильным говорить не об оценке количества информации, а о количественной оценке, т.е. оценке, имеющей количественное выражение (в абстрактном числовом множестве).
Количественная оценка предполагает наличие определенной упорядоченности
множества I, что обусловлено требованием сравнимости оценок. В принципе, любое
множество может быть вполне упорядочено, но здесь имеется в виду известное и значимое для данной оценки упорядочение. На конечном множестве упорядочение можно
назначить произвольным образом, на бесконечном множестве необходим закон, по которому будет осуществляться сравнение его элементов.
Количественная оценка, выражаемая в различных формах, может быть локальной
– в ограниченной области и с субъективным выражением (субъективно определенным
и осуществляемым). Может она, напротив, быть глобальной – массовой, стандартной в
некоторой достаточно большой информационной области. Естественно, что и требования, предъявляемые к каждой из таких оценок, различны. В личной среде достаточно
субъективного понимаемой системы оценок: множества «чисел» I, отображения информации (множеств элементов информации) в это множество, отношений «=», «больше», «меньше» и пр.
Оценка с массовой применимостью требует однозначного ее истолкования. Необходимо наличие стандартов оценки – моделей или алгоритмов, обеспечивающих результативность и однозначность оценки, а также ее воспроизводимость. Именно такие
требования предъявляются к количественной оценке информации в системах исследования и автоматизированной обработки.
Таким образом, количество информации – это условная величина, значение которой существенно для оценки информации в силу ее сравнимости с другими значениями этой величины применительно к информации определенной среды.
Каждому информационному объекту соответствует одно и только одно значение
величины, определенной в качестве количества информации. Оценка количества информации предусматривает наличие соответствующего абстрактного множества с определенным на нем упорядочением, обеспечивающим сравнимость его элементов.
Учитывая бесконечность информации (информация постоянно растет, развивается, изменяется), произвол и договоренности в количественной оценке массовой информации не могут иметь места. Необходимы системы формальных правил, применимых
к любой информации определенной информационной среды и единых для всех людей,
использующих какую-либо форму количественной оценки. Но формальные правила
приложимы только к формально выраженной информации – к одной из ее форм: знаниям или данным - и иметь фиксированное объективное представление. То есть стандарт количественной оценки информации, действующий в определенной области информационной среды, должен соответствовать следующим требованиям:
• система оценки основана на определенном (конечном) множестве формальных
правил, применимых к любой информации этой области;
• информация данной области является формально выраженной в виде упорядоченной совокупности своих элементов.
Замечание 1. Содержание информации является переменным множеством, состав
и мощность которого зависят от характера конкретной информационной сферы, от
субъективных факторов при истолковании семантики и прагматики. Это явление социальное, имеющее интеллектуальную и духовную ценность и значимость в информационной сфере, возможно, не сразу уловимый и постепенно познаваемый фактор. Поэтому количественная оценка содержания возможна только на персональном уровне или в
достаточно ограниченной сфере. Может, конечно, иметь место общепринятая оценка,
основанная на личной оценке авторитетных экспертов, но всегда могут быть и оценки
типа «Эта вещь будет посильнее Фауста Гете». То есть в общем случае формальная
количественная оценка к содержанию информации не применима.
Знания являются формально выраженной информацией в виде системы. Но эта
система является открытой и поэтому расширяемой и изменяемой. Поэтому речь можно вести только об одном из состояний знаний, зафиксированном в материализованном
представлении.
Оценка в соответствии с конечным набором формальных правил означает ее алгоритмичность: есть цель и дискретный путь к этой цели.
Очевидно, что алгоритмическая количественная оценка формализованного представления информации применима к элементам этого представления и к отношениям
этих элементов (ко всем или к отношениям определенного типа).
Самой простой оценкой по форме является оценка по объему - количеству знаков,
точек или пикселей, звуков или нот; количеству отношений. Однако объем (большой
или малый) слабо отражает значимость информации в области [автоматизированной]
обработки: это может оказаться «нулевая» статистика или текст, представленный одним знаком.
Наиболее известная система количественной оценки информации – это вероятностная оценка по методу Шеннона-Хартли. Ее ценность в том, что она применима к
любому объективному представлению информации и является универсальной в среде
формализации и автоматизированной обработке информации. Здесь можно говорить о
двух ступенях универсализации количественной оценки по Шеннону-Хартли.
1. Оценка количества информации, представленной определенным образом с помощью знаковой системы в среде естественного (разговорного) или искусственного
языка, в системе компьютерной графики и т.д. Такая оценка применима везде, где информация образована фиксированным конечным множеством элементов с вероятностным выбором каждого из них.
2. Универсализация оценки первого пункта исходит из того, что любая вероятностная неопределенность в представлении устраняется в результате соответствующего
количество операций выбора с вероятностью 1/2. Поскольку бит выражает альтернативу выбора, то количественная оценка битового представления информации является
универсальной.
Но и оценка по Шеннону-Хартли также формальна, как и оценка объема. Неупорядоченный, бессмысленный набор символов алфавита может содержать такое же количество информации, что и осмысленный текст. Это оценка физического состояния
объекта и не более. На самом же деле оценка по Шеннону-Хартли имеет смысл только
для синтаксически правильной информации как компонента определенной языковой
области. То есть количественная оценка по Шеннону-Хартли предполагает предварительную оценку синтаксиса (грамматики) информации в соответствии с правилами
действующей языковой области, которая также может осуществляться формальными
методами и автоматизированными средствами. Возможно, напротив, автоматизированная оценка по Шеннону-Хартли может производиться для предварительного анализа физического состояния информации перед ее синтаксическим анализе.
Замечание 2. Понятие количества информации по Шеннону-Хартли связано,
прежде всего, с исследованием термодинамических систем. Это системы, состоящие
из множества одинаковых (неразличимых) элементов, индивидуальные свойства которых не влияют на поведение системы. Энтропия в теории систем определяется как
«логарифм статистического веса, которым может быть реализовано данное состояние
системы» [3]. Иначе говоря, это «логарифм полного числа возможных состояний физической системы, приходящихся на данный интеграл значений энергии» [3]. Поэтому
количество информации в данном случае понимают как меру ее способности описать
множество состояний системы. Информация выступает как физический объект, образуемый простыми элементами, которые в определенной мере позволяют устранить неопределенность в описании состояний системы. То есть информация здесь – это лишь
техническое средство описания системы. Для информации социально-культурной среды ценность такой оценки относительна и применима лишь в совокупности с другим
типом оценки. Хотя, как отмечается в [3], и для термодинамических систем вероятностная оценка К. Шеннона не вполне соответствует требованиям оценки их состояний:
по сути это лишь оценка формализованного представления информации. Требуются
более сложные методы оценки или комбинации различных типов количественной
оценки, например, типов оценки по Шеннону-Хартли и по Колмогорову.
Количество информации в тексте по Шеннону-Хартли ничего не говорит о его
свойствах и особенностях. Однако использование этой оценки при формальном анализе
отношений в синтаксически правильном тексте (распределения символов, слов, словосочетаний), анализе частот их появления в тексте или в определенных позициях, как
это делает, например, В.А. Бубнов [1,2], позволяет получить некоторые качественные
характеристики (выраженные количественно). Дело в том, что энтропия по своей сущности локальна и показывает меру устранения конкретной неопределенности информационного представления. Суммирование энтропии вне их логической (семантической)
взаимосвязи непродуктивно. Однако статистический анализ массивов энтропии может
дать ряд информативно-содержательных показателей, выражение корреляционной или
функциональной зависимости между ними.
Другим известным типом количественной оценки является оценка по Колмогорову. Поскольку она предназначена, прежде всего, для оценки знаний искусственного
интеллекта, то ее можно назвать кибернетической. По определению А. Колмогорова
количество информации определяется мерой сложности алгоритма, переводящего систему из одного состояния в другое, т.е. мерой значимости для преобразования (развития) содержащей ее системы. Более общо количественной оценкой данного типа можно
назвать меру существенности информации для содержащей ее системы или локальной
среды, соответствующей этой информации.
Количественная оценка по Колмогорову связана со средой оцениваемой информации, процессами, характерными для нее, системой исследования этой среды, т.е. не
является универсальной. Оцениваемая информация также является тематически выраженной. Следовательно, данная оценка имеет смысл только для информации, имеющей
отношение к определенной среде, системе или системам определенного типа.
Существенность информации для содержащей ее системы или ее внешней среды
определяется их определяющими (закономерными) свойствами, а также некоторым
множеством существенных (информативных) признаков. Следовательно, для оценки
информации по Колмогорову необходима реляционная модель, заданная множеством
признаков информации и областями их возможных значений. Очевидно, при этом, что
количественная оценка предполагает возможность количественного выражения значений каждого из признаков и/или их совокупности.
Количественная оценка по Колмогорову применима не только к знаниям, но и к
данным, содержащимся в базе данных, концептуальная структура которой соответствует модели оценки:
• знания оцениваются в аспекте возможности для их расширения, для развития
содержащей их системы (естественного или искусственного интеллекта);
• данные оцениваются в аспекте их существенности для описания знаний или системы, к которым они относятся.
Замечание 3. Объективизация любой оценки информации (по содержанию или по
форме) предполагает необходимость создания множества моделей этой оценки: модели
признаков оценки, модели показателей, методической модели – в целях стандартизации
и массовости применения по отношению к информации и экспертам. Однако между
обычной и количественной оценкой имеются значительные различия:
1. Оценка по форме и/или по содержанию может проводиться как по качественным, так и по количественным признакам. Общий характер результата оценки имеет
характер качественной характеристики – соответствует / не соответствует, обладает / не
обладает и т.д. В количественной оценке должен быть механизм отображения ее результатов абстрактное множество чисел.
2. Модель методики оценки должна обеспечивать ее воспроизводимость. Однако в
оценке по содержанию достаточно наличия единой логической схемы, тогда как в количественной оценке требуется функциональное выражение. В первом случае при воспроизведении необходимо соответствие результатов, во втором – совпадение.
3. Модели оценки (экспертизы) образуют общую модель оценки, в которой могут
участвовать знания естественного и искусственного интеллекта - постоянные и переменные знания. Поэтому в общем случае оценка субъективна и не обязана быть однозначной. Формальность и функциональность количественной оценки полностью освобождает ее от субъективности в применении.
В отличие от оценки по Шеннону-Хартли оценка по Колмогорову рассматривает
не количественное выражение распределения элементов формального представления
(символов идентификации), а отношения в этом представлении в аспекте определяющих отношений содержащей ее системы или среды. и в аспекте взаимоотношений оцениваемой информации со своей средой.
Достаточно хорошее описание методов количественной оценки по ШеннонуХартли и Колмогорову в их индивидуальной спецификации и сравнимости дана в [3].
Здесь дается интересная характеристика этих методов: «Если шенноновскую меру
можно считать мерой классической физики, то мера, предлагаемая информационной
теорией систем, с этой точки зрения является скорее квантовой» (в основу меры
«предлагаемой информационной теорией систем» авторами полагается мера «конструктивного подхода, развиваемого А.Н. Колмогоровым»).
Наиболее интересной является количественная оценка по Колмогорову применительно к знаниям естественного или искусственного интеллекта, составляющим базу
(объем) знаний внутри соответствующей интеллектуальной системы. Оцениваемые
знания находятся вне этой базе и при их экспертизе составляют дополнительные знания
(по отношению к постоянным). Изменение состояния интеллектуальной системы выражается в ее обучении и самообучении. То есть изменение состояния системы под
воздействием оцениваемых знаний выражается в мере, в которой эти знания могут
стать частью ее базы знаний. Следовательно, оценка знаний состоит в определении меры их соответствия со знаниями содержащей их интеллектуальной системы, соответствия их закономерностей, семантической метрики, систем связи и.д.
Замечание 4. Постоянные знания интеллектуальной системы являются ее составляющей, уже получившей высокую оценку.
Особенность оценки знаний заключается также в том, что в их отношениях и
структуре сохраняется семантика (содержание) информации, без отражения которой в
результате оценки она будет неполной и односторонней. Естественно, в каждом конкретном случае эта проблема требует собственного решения.
Замечание 5. Различие знаний естественного и искусственного интеллекта состоит в том, что знания естественного интеллекта могут составлять и содержание, и форму
информации (как неразделимое сочетание) тогда как знания искусственного интеллекта
являются только формой, за которой стоит содержание (формализованное или неформализованное). Знания искусственного интеллекта соответствуют абстрактным знаниям – представлению знаний человека (человечества) в объективной форме. Представление обязано сохранять основные отношения содержания знаний, по которым его
можно восстановить. Однако никакое представление знаний не способно сохранить все
их содержание, тем более, что оно является переменной величиной. Как заметил по
этому поводу Ю Шрейдер: “знание моделируется … в упрощенной форме … как «намек», позволяющий воссоздать архитектуру моделируемого знания”.
Обобщая сказанное, можно сказать, что количественная оценка – это прагматическая интерпретация отношений информации со средой и/или содержащими ее информационными системами. То есть это оценка прагматики информации, осуществляемая формальными методами и получающая абстрактно-числовое выражение в терминах содержащей ее системы. Предметом оценки является формальное выражение (форма) информации. Субъективные прагматические отношения выражаются в выборе (определении, осуществлении) конкретных форм количественной оценки.
При этом, каждая форма оценки выражает только объективные отношения – множество объективных отношений, определенных этой формой, правилами, алгоритмом
или моделью.
Количество информации как предмет обучения. Количество информации является одной из важнейших тем теоретического курса информатики в средней и высшей
школе. Определение количества информации – одна из составляющих частей общей
оценки информации, требующая в не меньшей, а возможно и в большей, степени, чем
другие типы и формы этой оценки, объективности и универсальности. Поэтому ее рассмотрение должно вестись в единстве цели оценки, содержания и формы, а также требований к этой оценке.
I. Количество информации – условная величина, вычисляемая определенным
способом в системе исследования информации. Особенность ее в том, что она обеспечивает сравнимость результатов применительно к различной информации, интерпретируемую соответствующим образом. В этом состоит и ее существенность Способы
определения количества могут быть различными Выбор способа и формы определения
этой величины не однозначен: он зависит от условий и решаемых задач. Поэтому определение количества информации – это количественная оценка в соответствии с одной
из ее форм. В каждой из форм оценки заключено свое содержание – способ, смысл,
значение, методика.
Замечание 6. У каждого типа оценки (не только количественной) имеются собственные семантика и прагматика. Важно донести их до учащихся на дифференцированном уровне.
II. Принципиальным является объяснение назначения и цели количественной
оценки. По сути дела необходимы ответы на вопросы:
1. Для чего нужна эта оценка?
2. Чем отличается количественная оценка от других типов оценки?
3. Что нового может дать количественная оценка?
Здесь следует обратить внимание, что количество информации по сути выражает (формальным образом) прагматику объектно-объектных отношений – роль, значимость в
общей или локальной информационной среде (области, системе), ее влияние на объекты среды или на среду в целом.
Замечание 7. Любая оценка по содержанию также оценивает прагматику информации, но во-первых, во взаимосвязи с ее семантикой и прагматикой субъектнообъектных отношений, с качественными характеристиками, а во-вторых, производится
на уровне определения качественных показателей. Здесь же оценка не только полностью формальна, но и результат ее выражается абстрактно-числовым показателем. И
наконец, количественная оценка, определенная некоторым образом, позволяет «формализовать» оценку информации, доверяя ее [автоматизированному] исполнителю соответствующего алгоритма. Она не заменяет (и не может заменить) другие типы оценки
информации (по форме и содержанию), а дополняет их.
III. Принципиальным является и то обстоятельство, что оцениваемая информация рассматривается в данном случае в качестве объекта обработки – предмета хранения, представления, преобразования, средства описания и/или получения другой информации. Именно поэтому необходимы знания о ценности этой информации в качестве объекта [автоматизированной] обработки, алгоритмичность получения и числовое
выражение показателя оценки, используемого в соответствующей системе обработки.
То есть количественная оценка информации является частью некоторой информационной системы и определяется в соответствии с ее целями. Из этого факта следуют два
важных положения, раскрывающие требования к этой оценке:
1. Каждая форма оценки количества информации должна обладать свойствами
однозначности, объективности, достоверности, стандартности и массовости применения. То есть она должна быть алгоритмичной и универсальной в определенной информационной среде.
2. Любой тип (форма) количественной оценки не может претендовать на абсолютную универсальность: у каждой среды обработки информации имеются свои цели и
средства.
То есть количественная оценка информации предусматривает многозначность ее
определения и однозначность выражения каждого из определений. При этом, следует
обратить внимание на следующее:
3. Глобальность информационных сфер, образованных процессами представления, обозначения, хранения предполагает наличие необходимости в универсальных
формах количественной оценки в этих сферах.
Таким образом, необходимо рассмотрение количественных форм оценки в аспекте
общей оценки информации, ее проблем и требований (объективности, унификации, моделируемости и др.); дифференциация различных форм оценки информации по форме
и/или содержанию; необходимо объяснение роли и специфики оценки количества информации. Как и оценка по содержанию и/или по форме, количественная оценка информации существует во множестве различных форм, отличающимися друг от друга
принципами и методами, формами признаков и показателей оценки, областями применения.
IV. Области применения форм количественной оценки различны: от уровня прикладных информационных систем до уровня всей среды. Однако в любом случае к ним
предъявляются единые требования: однозначность в понимании и использовании и
применимость к любой информации соответствующей системы среды (всеми субъектами).
V. Следующим важным положением является то, что количественная оценка информация – это оценка ее формы (формального представления):
Во-первых, частью системы обработки информации (информационной, автоматизированной системы) может быть только форма – объективное выражение информации);
Во-вторых, количественная оценка неприменима к содержанию: (в сочетании семантики, прагматики и синтаксиса) его невозможно выразить в соответствии с требованиями оценки. К содержанию применима только качественная оценка.
Замечание 8. Вообще говоря, оценка информации – это оценка сочетания ее формы и содержания. Причем, информация рассматривается в современном понимании как
глобальный фактор мира – одна из его базовых составляющих. Но понятие количества
информации появилось в середине ХХ века, когда информатика фактически отождествляла информацию с данными – с их формальным представлением. Это была оценка
информации, представленной на машинных носителях в целях ее значимости для автоматизированных систем. Поэтому и проблема дифференциации формы и содержания
как предметов оценки не возникала. Расширение понятия информации автоматически
ведет и к расширению понятия количества информации. Однако цели оценки остаются
прежними, поэтому и предмет оценки должен сохраниться, тем более, что расширение
(количественная оценка содержания) не имеет смысла. Тем не менее, это приходится
объяснять и даже доказывать учащимся, для того, чтобы у них могло сложиться дифференцированное представление об оценке информации.
VI. Форма количественной оценки многообразна. Она зависит от среды или системы, содержащей оцениваемую информацию, информационных процессов, в аспекте
которых она определяется, от конкретной цели оценки. Однако общим для всех форм
является однозначность абстрактно-числового выражения ее результатов (показателей
оценки). То есть для каждой формы количественной оценки должно быть определено
отображение (однозначное соответствие) К: А → | F |К, или по-другому, определена
функция К(А) = | A |К для любого информационного объекта (любой информации) из
области применения этой формы оценки.
Степень формализации понятия оценки в курсе информатики зависит от уровня
математической подготовки учащихся, профиля обучения и т.д. Но функциональность
выражения результатов количественной оценки они должны понимать (они хорошо
знакомы с понятием функции).
Функциональность предполагает наличие определенного конечного набора формальных правил оценки и их алгоритмической реализации. Это обеспечивает стандартность формы количественной оценки и массовость ее применения, как на уровне
оцениваемых объектов, так и на уровне субъектов (экспертов). Это тоже принципиальная характеристика количественной оценки, являющаяся достаточно очевидной для
учащихся в случае понимания ими ее функциональности.
VII. Каждая из форм количественной оценки информации имеет свою цель, свое
формально-функциональное выражение и обладает собственным содержанием. Часто в
обучении информатике ограничиваются одной формой – оценкой по Шеннону-Хартли, самой известной в теории информации. Но она имеет довольно узкие цели и область применения. Поэтому обязательно надо рассматривать в курсе информатики и
оценку по Колмогорову, более содержательную и более значимую в области обработки
информации. Целесообразно также провести сравнительный анализ этих двух типов
количественной оценки, показав их преимущества и недостатки.
Количество информации определено К. Шенноном как выражение количественного изменения неопределенности в результате сообщения. Нелишне вспомнить, что
это определение середины ХХ века, когда в качестве информации рассматривались
данные, форма информации в виде формализованных представлений (сообщений). При
этом, К. Шеннон замечает: “семантические аспекты ... не имеют отношения к технической стороне вопроса”. Для него информация - физическая (техническая) величина,
форма, содержание которой не имеет значения для теории информации, а, следовательно, не имеет отношения к энтропии и неопределенности.
При изменении понятия информации изменяется и понятие неопределенности как
противопоставления информации. Не понимая этой “подмены” понятий, учащиеся могут воспринять неопределенность как некую черную дыру, как что-то страшное и непонятное: неопределенность как противопоставление познанию и как мировой хаос. Но
буквально из определения следует, что неопределенность противопоставляется формализованному сообщению (множеству сообщений), представленному на материальном
носителе. Она, так же, как и сообщение, является компонентом информационной среды
и устраняется в результате сообщений (в большей или меньшей мере). Сообщение, в
свою очередь, понимается как конечное упорядоченное множество знаков. Следовательно, мера неопределенности в результате сообщения выражается через меры неопределенности при идентификации знаков этого сообщения. То есть неопределенность
по К. Шеннону - это неопределенность знакового представления информации.
Таким образом, неопределенность - это неопределенная (неизвестная, новая) информация, определяемая сообщением, и потому имеющая дискретное представление и
объективное выражение. То есть, неопределенность представляется в виде некоторого
(счетного) множества информационных объектов, определяемых множеством сообщений в процессах их представления
Замечание 9. Недаром в [3] отмечено: «информация это почти то же, что энтропия, взятая с обратным знаком». Действительно, с точки зрения К Шеннона первая –
средство устранения неопределенности, вторая – мера неопределенности.
Следовательно, по Шеннону информация (читай, материализованное сообщение)
– это неопределенность с обратным знаком. Отсюда следует, что каждая конкретная
неопределенность устраняется выбором конечного числа символов, идентифицирующих соответствующее сообщение. Поскольку же символы являются элементами конечной системы обозначения в определенной языковой области, то выбор каждого из них
имеет определенную численно выраженную вероятность.
При рассмотрении оценки по Шеннону-Хартли существенны следующие два аспекта:
Во-первых, нельзя останавливаться только на оценке битового представления: это
лишь частный случай (хотя и важный). У учащихся не должно сложиться впечатление,
что бит - единственный победитель неопределенности. Целесообразно начать с общего
случая – с оценки вероятностного представления посредством произвольной системы
кодирования (обозначения) с конечным числом кодов. Затем можно дать оценку битового представления в качестве универсальной формы вероятностной оценки, выражающей все другие формы оценки этого типа. Однако количественные показатели в
различных представлениях не всегда взаимовыражаемы.
Во-вторых, необходимо рассмотреть область применения оценки по ШеннонуХартли: количественная оценка текста (произведения) мало информативна. В данном
случае это всего лишь характеристика физического (материализованного) объекта как
предмета преобразования. Количественная мера этой оценки характеризует лишь потенциальную значимость информации для процессов и функций преобразования. Это
своего рода оценка массы информации как объекта обработки, передачи, хранения, показатель величины механической работы, производимой при этом. Синтаксис информации при этом никак не учитывается, поэтому и значение оцениваемой таким образом
информации может быть только относительным. То есть здесь оценивается прагматика информации как физического объекта, представленного некоторым множеством
элементов кодирования в определенной языковой области.
Однако при оценке действительного распределения (употребления) равновероятностных образующих элементов (знаков, слов, морфем) в текстах поэта или писателя
количественная оценка может переходить в качественные характеристики его творчества (см. [1,2]). Это тоже оценка формы. Но в данном случае форма (синтаксически
правильная) выражает вполне конкретное содержание. Поэтому это уже изучение содержания через оценку формы (стиля, языка).
Замечание 10. Фактическая вероятность присутствия знаков (как функция частоты) в сообщении может не совпадать с их исходной равновероятностью. Например, с
сообщении, представленным одним знаком из N возможных, вероятность выбора этого
знака равна 1. Следовательно, количество информации в этом сообщении равно 0:
log21 = 0. То есть значимость (масса) его нулевая.
VIII. Оценка по Колмогорову качественно иная. Она рассматривает информацию (информационный объект) не просто как физическую величину, а как компонент
системы или ее среды во взаимосвязи с этой системой и другими ее компонентами по
существенным для них признакам. Следовательно, по формам этой оценки могут оцениваться не только данные, но и знания, которые, как известно, сохраняют в своих отношениях семантику информации. Поэтому данная количественная оценка имеет гораздо более широкое применение, чем оценка по Шеннону-Хартли и в системе ее обработки информации, и в системах искусственного интеллекта.
Как часть информационной системы или часть среды, влияющая на ее состояние,
оцениваемая по Колмогорову, информация в определенной мере отражает содержание
этой системы – семантику, прагматику, синтаксис. То есть количественная оценка по
Колмогорову является оценкой прагматики информации как части содержащей ее
системы или системной среды с отражением ее взаимосвязи с этой системой и влияния на нее в аспекте ее развития.
С точки зрения оценки по Колмогорову оцениваемая информация рассматривается как физический материализованный объект, представленный образующими
элементами и отношениями, в аспекте отношений и информационных процессов, су-
щественных для системы, во взаимосвязи с которой осуществляется это рассмотрение.
Оценка по Колмогорову по своей природе локальна, и каждая ее форма имеет ограниченную область применения. Цели исследования каждой информационной системы несут в себе характер определенной субъективности. Поэтому и соответствующая
форма количественной оценки имеет субъективное выражение и, возможно, требует
определенной объективизации. Это можно трактовать как недостаток этой оценки. В то
же время, поскольку информация в данном случае рассматривается в аспекте субъектно-объектных отношений, то здесь оценивается не только ее физическая, но и социальная значимость. То есть оцениваемая информация предстает в качестве материализованного социально-информационного объекта, компонента информационной сферы
общества, системы информатизации. В этом состоит одно из достоинств данного способа оценки.
В оценке по Колмогорову количество информации в сообщении, представленным
одним знаком, не всегда нулевая. В системе из двух влюбленных письмо, где «в каждой строчке только точки», несет достаточно много информации, способной изменить
эту систему.
Замечание 11. Еще больше информации в письме, где «в каждой строчке только
точки после буквы Л», хотя по Шеннону-Хартли ее количество равно 0: вероятность
выбора точки, как и буквы «Л», равна 1, вернее, вероятность выбора сочетания «Л.»
равна 1.
IX. Основным лейтмотивом данного повествования является стремление показать, что количество информации – не только абстрактная величина (своего рода черный ящик для учащихся), но величина, имеющая практическую значимость, средство
исследования информации при решении социально значимых задач.
1. Бубнов В.А., Карпушкин Н.А. Частотный анализ слов по начальной букве // Педагогическая информатика, 1998. № 4.
2. Бубнов В.А., Ануфриев С.В., Казакова И.С. Анализ поэтических текстов на уроках
литературы с помощью информационных технологий // Информационные технологии в
предметной области. – М.: МГПУ, 2002.
3. Шилейко А.В., Кочнев В.Ф., Химушин Ф.Ф. Введение в информационную теорию
систем. – М.: Радио и связь, 1985.
Download