Восприятие информации и измерение

advertisement
Восприятие информации и языки
В этом параграфе обсудим вопрос: как и в какой форме человек
воспринимает информацию?
Человек воспринимает информацию из окружающего мира с помощью
своих органов чувств; их пять: зрение, слух, вкус, обоняние, осязание.
Более 90% информации поступает к нам через зрение и слух. Но и запахи,
вкусовые и осязательные ощущения тоже несут информацию. Например,
почувствовав запах гари, вы узнали, что на кухне сгорел обед, о котором
забыли. На вкус вы легко узнаете знакомую пищу, на ощупь — знакомые
предметы даже в темноте.
Информация, воспринимаемая человеком в речевой или письменной
форме, называется символьной, или знаковой, информацией.
Письменный текст состоит из букв, цифр, скобок, точек, запятых и
других знаков. Устная речь тоже складывается из знаков. Только эти
знаки не письменные, а звуковые. Лингвисты их называют фонемами. Из
фонем складываются слова, из слов — фразы. Между письменными
знаками и звуками есть прямая связь. Ведь сначала появилась речь, а уже
потом — письменность. Письменность для того и нужна, чтобы
представить на бумаге человеческую речь. Отдельные буквы или
сочетания букв обозначают звуки речи, а знаки препинания — паузы,
интонацию.
Очень
интересна
история
письменности! Письменность,
которой пользуемся мы и
большинство
европейских
стран, называется звуковой. То,
что
было
сказано
выше,
относится
к
звуковой
письменности. А вот китайская
письменность
называется
идеографической. В ней один
значок (его часто называют
иероглифом) обозначает слово
или значительную часть слова.
А японское письмо называется
слоговым. Там один значок
обозначает слог. Самая же
древняя форма письменности,
которая идет от первобытных
людей, называется пиктографической. Одна пиктограмма — это рисунок,
который обозначает понятие или даже целое сообщение.
Пиктографическая символика часто используется и сегодня. Например,
всем вам знакомые дорожные знаки — это пиктограммы.
Человеческая речь и письменность тесно связаны с понятием «язык».
Конечно, имеется в виду не орган речи, а способ общения между людьми.
Разговорные языки имеют национальный характер. Есть русский,
английский, китайский, французский и другие языки. Лингвисты их
называют естественными языками. Естественные языки имеют устную и
письменную формы.
Кроме разговорных (естественных) языков существуют формальные
языки. Как правило, это языки какой-нибудь профессии или области
знаний. Например, математическую символику можно назвать
формальным языком математики; нотную грамоту — формальным
языком музыки.
ЯЗЫК — это знаковый способ представления информации.
Общение на языках — это процесс передачи информации в
знаковой форме.
Можно привести примеры разных способов знакового обмена
информацией, заменяющих речь. Например, глухонемые люди речь
заменяют жестикуляцией. Жесты дирижера передают информацию
музыкантам. Судья на спортивной площадке пользуется определенным
языком жестов, понятным игрокам.
Однако запахи, вкусовые и осязательные ощущения не сводятся к какимто знакам, не могут быть переданы с помощью знаков. Безусловно, они
несут информацию, поскольку мы их запоминаем, узнаем. Такую
информацию будем называть образной информацией. К образной
относится также информация, воспринимаемая через зрение и слух, но не
сводящаяся к языкам: шум ветра, пение птиц, картины природы,
живопись.
Коротко о главном
С помощью всех своих органов чувств человек воспринимает
символьную и образную информацию.
Символьная (знаковая) информация представляется по правилам какоголибо языка. Языки бывают естественными и формальными.
Образная информация — это сохраненные в памяти ощущения человека
от контакта с источником (вкусы, запахи, осязательные ощущения,
зрительные и звуковые образы).
Информационные процессы
Любой человек постоянно занят какой-то работой с информацией: читает
книги, подсчитывает стоимость покупки, пересказывает другому
человеку какие-то сведения, заучивает правила, решает задачи и многое
другое. Профессии многих людей связаны исключительно с
информационной деятельностью: это учителя, студенты, журналисты,
ученые, переводчики, писатели, библиотекари, работники архивов и
многие другие.
Можно ли найти что-то общее в столь разнообразных видах работы с
информацией?
Оказывается,
можно!
Любая
информационная
деятельность человека сводится к выполнению трех основных видов
информационных процессов: процесса хранения информации, процесса
передачи информации и процесса обработки информации.
Хранение информации. Люди хранят информацию либо в собственной
памяти (иногда говорят — «в уме»), либо на каких-то внешних
носителях, чаще всего — на бумаге.
Те сведения, которые мы помним, всегда нам доступны. Например, если
вы запомнили таблицу умножения, то вам никуда не нужно заглядывать
для того, чтобы ответить на вопрос: сколько будет пятью пять? Каждый
человек помнит свой домашний адрес, номер телефона, а также адреса и
телефоны близких людей. Если же понадобится адрес или телефон,
который вы не помните, то поможет записная книжка или телефонный
справочник.
Память человека можно условно назвать оперативной. Здесь слово
«оперативный» является синонимом слову «быстрый». Сохраненные в
памяти знания воспроизводятся человеком мгновенно. Свою память мы
еще можем назвать внутренней памятью. Тогда информацию,
сохраненную на внешних носителях (в записных книжках, справочниках,
энциклопедиях, магнитных записях), можно назвать нашей внешней
памятью. Чтобы воспользоваться такой информацией, ее сначала нужно
поместить во внутреннюю
память. Например, прочитать номер телефона в записной книжке, а потом
использовать эту информацию по назначению (набрать номер на
аппарате).
Наша внутренняя память не всегда надежна. Человек нередко что-то
забывает. Информация на внешних носителях хранится дольше,
надежнее. Именно с помощью внешних носителей люди передают свои
знания из поколения в поколение.
Передача информации. Очень часто любому человеку приходится
участвовать в процессе передачи информации. Передача может
происходить при непосредственном разговоре между людьми, через
переписку, с помощью технических средств связи: телефона, радио,
телевидения. Такие средства связи называются каналами передачи
информации.
В процессе передачи информация может искажаться или теряться, если
информационные каналы плохого качества. Многие знают, как трудно
общаться при плохой телефонной связи.
Передача информации — всегда двусторонний процесс: есть источник и
есть приемник информации. Источник передает (отправляет)
информацию, а приемник ее получает (воспринимает). Читая книгу или
слушая учителя, вы являетесь приемником информации, рассказывая
товарищу последние новости или отвечая на уроке — источником
информации. Каждому человеку постоянно приходится переходить от
роли источника к роли приемника информации и обратно.
Обработка информации — третий вид информационных процессов. Вот
хорошо вам знакомый пример — решение математической задачи.
Например, даны значения сторон прямоугольника. Нужно определить его
площадь. Чтобы решить такую задачу, кроме исходных данных ученик
должен знать математическое правило, с помощью которого можно найти
решение. В данном случае это правило звучит так: площадь
прямоугольника равна произведению длин двух смежных его сторон.
Применяя это правило, получаем искомую величину.
В данном примере процесс обработки заключается в том, что новая
информация получается путем вычислений, произведенных над исходной
информацией.
Вычисление — лишь один из вариантов обработки информации. Если
путем обработки исходной информации получается другая, то это совсем
не обязательно должны быть математические расчеты. Вспомните
истории Шерлока Холмса, героя книг Конан Дойля. Имея в качестве
исходной информации часто очень запутанные показания свидетелей и
косвенные улики, Холмс с помощью логических рассуждений прояснял
всю картину событий и разоблачал преступника.
Человеческая логика — это система правил, с помощью которой из
одной информации можно вывести другую.
Процесс обработки информации не всегда связан с получением каких-то
новых сведений. Например, учитель русского языка проверяет
написанные вами сочинения на тему «Как я провел лето». Он исправляет
ошибки и выставляет оценки. Исправление ошибок — это вариант
обработки текста сочинения без изменения его содержания. Ведь не
станет же учитель дописывать в ваши сочинения какие-то новые факты!
Исправив ошибки, он внес изменения не в содержание сочинений, а в их
форму.
Перевод текста с одного языка на другой — это тоже пример процесса
обработки информации, изменяющего форму, но не содержание текста.
К информационным процессам обработки относится кодирование
информации. Процесс кодирования — это преобразование формы
представления информации в новую форму, удобную для ее хранения,
передачи и обработки.
Особенно широко понятие «кодирование» стало употребляться с
развитием технических средств хранения, передачи и обработки
информации (телеграф, радио, компьютеры).
Например, в начале XX века телеграфные сообщения кодировались и
передавались с помощью азбуки Морзе. Иногда кодирование
производится в целях засекречивания содержания текста. В таком случае
его называют шифровкой.
Еще одной разновидностью процесса обработки информации является ее
сортировка (иногда говорят — упорядочение). Например, вы решили
записать адреса и телефоны всех своих одноклассников на отдельные
карточки. В каком порядке нужно сложить эти карточки, чтобы затем
было удобно искать среди них нужные сведения? Наверняка вы
разложите их в алфавитном порядке по фамилиям. В информатике
организация информации по какому-то правилу, связывающему ее в
единое целое, называется структурированием.
И наконец, еще одна разновидность процесса обработки — поиск
информации. Нам с вами очень часто приходится этим заниматься: в
словаре искать перевод иностранного слова, в телефонном справочнике
— номер телефона, в железнодорожном расписании — время
отправления поезда, в учебнике математики — нужную формулу, на
схеме метро — маршрут движения, в библиотечном каталоге — сведения
о нужной книге. Можно привести еще много примеров. Все это —
процессы поиска информации на внешних носителях: книгах, схемах,
таблицах, картотеках.
Коротко о главном
Разнообразная
информационная
деятельность
человека
складывается из осуществления трех основных видов информационных
процессов: хранения, передачи и обработки информации.
Человек хранит информацию в собственной памяти (внутренняя,
оперативная информация) и на внешних носителях: бумаге, магнитной
ленте и пр. (внешняя информация)
Процесс передачи информации осуществляется от источника к
приемнику по информационным каналам связи.
Процесс обработки информации связан с получением новой или
изменением формы или структуры данной информации; осуществлением
поиска информации на внешних носителях.
Количество информации
А теперь обсудим вопрос о том, как можно измерить информацию.
Существует множество подходов к измерению информации. Здесь мы
рассмотрим только один подход, который называется алфавитным.
Вам хорошо известно, что для измерения таких величин, как, например,
расстояние, масса, время, существуют эталонные единицы. Для
расстояния — это метр, для массы — килограмм, для времени — секунда.
Измерение происходит путем сопоставления измеряемой величины с
эталонной единицей. Сколько раз эталонная единица укладывается в
измеряемой величине, таков и результат измерения. Следовательно, и для
измерения информации должна быть введена своя эталонная единица.
Алфавитный подход позволяет измерять информацию, заключенную в
тексте на некотором языке (естественном или формальном). Обычно под
алфавитом понимают только буквы, но поскольку в тексте могут
встречаться знаки препинания, цифры, скобки, то мы их тоже включим в
алфавит. В алфавит также следует включить и пробел, т. е. пропуск
между словами.
Полное число символов в алфавите принято называть мощностью
алфавита. Будем обозначать эту величину буквой N. Например, мощность
алфавита из русских букв и отмеченных дополнительных символов равна
54: 33 буквы + 10 цифр + 11 знаков препинания, скобки, пробел.
При алфавитном подходе считается, что каждый символ текста имеет
определенный «информационный вес». Информационный вес символа
зависит от мощности алфавита. А каким может быть наименьшее число
символов в алфавите? Такой алфавит используется в компьютере. Он
содержит всего 2 символа, которые обозначаются цифрами «0» и «1». Его
называют двоичным алфавитом.
Информационный вес символа двоичного алфавита
принят за единицу информации и называется 1 бит
Полное количество информации, заключенное в тексте, записанном с
помощью двоичного алфавита, равно числу нулей и единичек в этом
тексте. Например, следующий двоичный текст:
1101001011000101110010101101000111010010
содержит 40 бит информации. Пока вам не понятно, что он обозначает.
Несколько позже вы сможете разобраться в этом вопросе.
С увеличением мощности алфавита увеличивается информационный вес
символов этого алфавита. Так один символ из четырехсимвольного
алфавита (N = 4) «весит» 2 бита. Объяснение этому можно дать
следующее: все символы такого алфавита можно закодировать
всевозможными комбинациями из двух двоичных цифр так, как это
показано в следующей таблице:
Номер символа
1
2
3
4
Двоичный код
00
01
10
11
Если мощность алфавита равна 8, то один символ будет заключать в себе
3 бита информации. Используя двоичные цифры, можно составить 8
различных трехразрядных комбинаций:
Номер символа
1
2
3
4
5
6
7
8
Двоичный код
000 001 010 011 100 101 110 111
Четыре бита несет один символ из 16-символьного алфавита и т. д.
Найдем зависимость между информационным весом символа (i) и
мощностью алфавита (N). Нами были получены следующие значения:
N
2
4
8
16
i
1 бит
2 бита
3 бита
4 бита
Заметим, что 2 = 2, 2x2 = 4, 2x2x2 = 8, 2x2x2x2 = 16.
То есть .N равно двойке, i раз умноженной самой на себя. В математике
такое действие называется возведением в степень и записывается так:
21 = 2 — два в первой степени равно двум;
22 = 4 — два во второй степени равно четырём;
23 = 8 — два в третьей степени равно восьми;
24 = 16 — два в четвертой степени равно шестнадцати.
В общем виде это записывается следующим образом: 2i = N — два в
степени i равно N.
Информационный вес каждого символа (i) и мощность
алфавита (N) связаны формулой: 2i = N.
Удобнее всего измерять информацию, когда размер алфавита N равен
целой степени двойки1. Например, если N = 32, то один символ «весит» 5
бит, поскольку 25 = = 2x2x2x2x2 = 32.
Ограничения на максимальный размер алфавита теоретически не
существует. Однако есть алфавит, который можно назвать достаточным.
Это алфавит мощностью 256 символов. В алфавит такого размера можно
поместить все практически необходимые символы: строчные и
прописные латинские и русские буквы, цифры, знаки арифметических
операций, всевозможные скобки, знаки препинания и пр.
Поскольку 256 = 2 х 2 х 2 х 2 х 2 х 2 х 2 х 2= 28, то один символ этого
алфавита «весит» 8 бит. Причем 8 бит информации — это настолько
характерная величина, что ей даже присвоили свое название — байт.
1 байт = 8 бит.
Сегодня очень многие люди для подготовки писем и различных
документов используют компьютерные текстовые редакторы. С этими
средствами вы подробно познакомитесь несколько позже. Компьютерные
редакторы работают с алфавитом, в котором содержится 256 символов.
Легко подсчитать объем информации в тексте, если известно, что 1
символ несет 1 байт информации. Надо просто сосчитать число символов
в тексте. Полученное значение и будет информационным объемом текста,
выраженным в байтах.
Например, небольшая книжка, сделанная с помощью компьютерного
текстового редактора, содержит 150 страниц. На каждой странице — 40
строк, в каждой строке — 60 символов (включая пробелы между
словами). Значит, страница содержит 40x60=2400 байт информации. Для
вычисления информационного объема всей книги нужно полученную
величину умножить на число страниц:
2400x150 = 360 000 байт.
Уже на таком примере видно, что байт — «мелкая» единица. А
представьте, если нужно, например, измерить информационный объем
целой библиотеки? В байтах это окажется громадным числом!
Для измерения больших информационных объемов используются более
крупные единицы:
1 килобайт
= 1Кб = 210 байт = 1024 байта
1 мегабайт
= 1Мб = 210 Кб
= 1024 Кб
10
1 гигабайт
= 1Гб = 2 Мб
= 1024 Мб
Следовательно, информационный объем вышеупомянутой книги равен
приблизительно тремстам шестидесяти килобайтам. А если посчитать
точнее, то получится:
360000/1024 = 351,5625 Кб
351,5625/1024 = 0,34332275 Мб.
Коротко о главном
Алфавитный подход — один из способов измерения информации.
Алфавит — это вся совокупность символов, используемых в некотором
языке для представления информации. Мощность алфавита — это число
символов в нем.
1 бит — информационный вес символа из двухсимвольного алфавита (N
= 2).
Количество информации i, которое несет один символ в тексте, и
мощность алфавита N связаны формулой: 2i= N.
Информационный объем всего текста равен сумме информационных
весов всех символов, составляющих текст.
1 байт — информационный вес символа из алфавита мощностью 28 = 256
символов. 1 байт = 8 бит.
Байт, килобайт, мегабайт, гигабайт — единицы измерения информации.
Каждая следующая больше предыдущей в 1024 (210) раза.
Download