Двоичное кодирование текстовой информации

advertisement
Двоичное кодирование текстовой
информации
• Компьютеры не с самого рождения могли
обрабатывать символьную информацию.
Лишь с конца 60-х годов они стали
использоваться для обработки текстов и в
настоящее время большинство
пользователей ПК занимаются вводом,
редактированием и форматированием
текстовой информации.
• Традиционно для кодирования одного символа
используется 1 байт информации.
• При вводе в компьютер текстовой информации
происходит ее двоичное кодирование, изображение
символа преобразуется в его двоичный код.
Пользователь нажимает на клавиатуре клавишу с
символом, и в компьютер поступает определенная
последовательность из восьми электрических
импульсов (двоичный код символа). Код символа
хранится в оперативной памяти компьютера, где
занимает один байт.
• В процессе вывода символа на экран компьютера
производится обратный процесс - декодирование, то
есть преобразование кода символа в его
изображение.
• Важно, что присвоение символу конкретного кода это вопрос соглашения, которое фиксируется в
кодовой таблице.
Стандартная часть таблицы кодов
ASCII
• Первые 32 кода отданы
производителям аппаратных
средств и называются они
управляющие, т.к. эти коды
управляют выводом данных.
Им не соответствуют
никакие символы.
• Коды с 32 по 127
соответствуют символам
английского алфавита,
знакам препинания,
цифрам, арифметическим
действиям и некоторым
вспомогательным символам.
Коды национального (русского)
алфавита
• Коды расширенной части
таблицы ASCII отданы под
символы национальных
алфавитов, символы
псевдографики и научные
символы.
Альтернативные системы
кодирования кириллицы
1. Система кодирования КОИ-7 (код обмена
информацией, семизначный), действовавшая в
СССР. Была вскоре вытеснена американским:
кодом ASCII во вторую, расширенную часть
системы кодирования с кодами от 128 по 255.
2. Кодировка Windows-1251. Была введена извне
компанией Мiсrosоft. Так как программный
продукт этой компании - операционная система
Windows глубоко закрепилась и широко
распространилась, то кодировка Windows-1251
получила широкое применение на компьютерах,
работающих под управлением именно этой
операционной системы.
3. Кодировка КОИ-8 широко распространена на
территории России и в российском секторе
Интернета.
4. Кодировка ISO (lntemational Standard Organization –
Международный институт стандартизации) содержит символы русского алфавита, но на
практике используется редко.
5. Кодировка ГОСТ - альтернативная. Действует на
компьютерах в операционных системах MS-DOS.
6. Система UNICODE. Для представления каждого
символа в этом стандарте используются два байта:
один байт для кодирования символа, другой для
кодирования признака. Двухбайтовое описание
кодов символов позволяет закодировать очень
большое число символов из различных
письменностей. Так, в документах Unicode могут
соседствовать русские, латинские, греческие буквы,
китайские иероглифы и математические символы.
Закрепление изученного
•
•
•
•
•
•
•
•
•
•
•
•
№1. Закодируйте с помощью таблицы ASCII слова: А) Excel; Б) Access; В) Windows;
Г) ИНФОРМАЦИЯ.
№2. Буква «i» в таблице кодов имеет код 105. Не пользуясь таблицей, расшифруйте следующую
последовательность кодов: 102, 105, 108, 101.
№3. Десятичный код буквы «е» в таблице ASCII равен 101. Не пользуясь таблицей, составьте
последовательность кодов, соответствующих слову help.
№4. Десятичный код буквы «i» в таблице ASCII равен 105. Не пользуясь таблицей, составьте
последовательность кодов, соответствующих слову link.
№5. Декодируйте следующие тексты, заданные десятичным кодом:
А) 192 235 227 238 240 232 242 236; Б) 193 235 238 234 45 241 245 229 236 224;
В) 115 l1l 102
116 119 97 114 101.
№6. Во сколько раз увеличится информационный объем страницы текста при его
преобразовании из кодировки Windows 1251 (таблица кодировки содержит 256 символов) в
кодировку Unicode (таблица кодировки содержит 65536 символов)?
№7. Каков информационный объем текста, содержащего слово ПРОГРАММИРОВАНИЕ: А) в 16битной кодировке; Б) в 8-битной кодировке.
№8. Текст занимает ¼ Кбайта. Какое количество символов он содержит?
№9. Текст занимает полных 6 страниц. На каждой странице размещается 30 строк по 80
символов. Определить объем оперативной памяти, который займет этот текст.
№10. Свободный объем оперативной памяти компьютера 320 Кбайт. Сколько страниц книги
поместится в ней, если на странице: А) 32 строки по 32 символа;
) 64 строки по 64 символа; В)
16 строк по 32 символа.
№11. Текст занимает 20 секторов на двусторонней дискете объемом 360 Кбайт. Дискета разбита
на 40 дорожек по 9 секторов. Сколько символов содержит текст?
Домашнее задание
• §2.10. Двоичное кодирование текстовой
информации
• Стр.111 практические задания
• №2.29, 2.30, 2.31
Download