Кодирование и обработка текстовой информации. Информатика 10 класс

advertisement
Информатика ФГОСС
Кодирование и обработка текстовой информации.
Кодирование и
обработка текстовой
информации.
Информатика 10 класс
Учитель информатики
МБОУ СОШ № 8
Токар И.Н.
Информатика ФГОСС
Кодирование и обработка текстовой информации.
Проверка домашней работы:
§
РТ № ____
Информатика ФГОСС
Кодирование и обработка текстовой информации.
Домашнее задание:
§ § ______
РТ: № ___, ___,
___
Информатика ФГОСС
Кодирование и обработка текстовой информации.
Для кодирования прописных и строчных букв русского
и латинского алфавитов, цифр и ряда специальных
знаков – достаточно использовать 256 различных
символов.
Кодирование заключается в том, что каждому символу
ставится в соответствие уникальный десятичный код от 0 до
255 или соответствующий ему двоичный код от 00000000до
11111111. Таким образом, человек различает символы по их
начертанию, а компьютер – по их коду.
Код – это система условных знаков для представления
информации.
Кодирование – это перевод информации в удобную для
передачи, обработки или хранения форму с помощью
некоторого кода.
Информатика ФГОСС
Кодирование и обработка текстовой информации.
Любой код – это своего рода соглашение между людьми, которые
договариваются , что таким-то образом они будут обозначать тото и то-то. Данное соглашение фиксируется в кодовой таблице. В
качестве международного стандарта принята кодовая таблица
ASCII (American Standard Code for Information Interchange).
Первые 33 кода (с 0 по 33) этой таблице соответствует не
символам, а операциям (ввод пробела, перевод строки и т.д.)
Коды с 33 по 127 являются интернациональными и соответствуют
символам латинского алфавита, цифрам, знакам арифметических
операций
и
знакам
препинания.
Коды с 128 по 255 являются национальными, т.е. в разных
национальных кодировках одному и тому же коду соответствуют
различные символы. Существует 5 кодировочных таблиц для
русских букв (Windows, MS-DOS, Mac, ISO, КОИ – 8). Поэтому
тексты созданные в одной кодировке не будут правильно
отображаться в другой.
Информатика ФГОСС
Кодирование и обработка текстовой информации.
Задание №1 ЕГЭ 2015 г.
Для кодирования некоторой последовательности,
состоящей из букв А, Б, В, Г и Д, используется
неравномерный двоичный код, позволяющий
однозначно декодировать полученную двоичную
последовательность. Вот этот код: А – 0; Б – 100;
В – 1010; Г – 111; Д – 110.Требуется сократить для
одной из букв длину кодового слова так, чтобы
код по-прежнему можно было декодировать
однозначно. Коды остальных букв меняться не
должны. Каким из указанных способов это можно
сделать?
1) для буквы В – 101
2) это невозможно
3) для буквы В – 010
4) для буквы Б – 10
Информатика ФГОСС
Кодирование и обработка текстовой информации.
Давайте проанализируем текст задачи. Итак, нам известно,
что используется неравномерный двоичный код. Что это
такое? На самом деле все очень просто:
1. Равномерное кодирование — каждый символ
кодируется кодами равной длины.
2. Неравномерное кодирование — разные
символы могут кодироваться кодами разной
длины.
Информатика ФГОСС
Кодирование и обработка текстовой информации.
Например, если у нас есть три символа А, Б, В и
закодированы они так:
А — 010
Б — 011
В — 111
, то это равномерное кодирование, так как длина
кода одинаковая. Если же эти же символы мы
закодируем вот так:
А — 01
Б — 110
В — 1011
, то получим неравномерное кодирование.
Информатика ФГОСС
Кодирование и обработка текстовой информации.
Кроме этого, нам необходимо знать и понимать условие
Фано
Никакое кодовое слово не может быть началом
другого кодового слова
Также существует обратное условие Фано
Никакое кодовое слово не является окончанием
другого кодового слова
Чтобы однозначно декодировать сообщение,
достаточно того, чтобы условие Фано (или
обратное условие) выполнялось.
Информатика ФГОСС
Кодирование и обработка текстовой информации.
Теперь, получив необходимые знания, можем
перейти к решению задачи.
Рассмотрим первый вариант ответа. Если мы для буквы
«В» сократим код до 101, то условие Фано нарушено не
будет. Действительно, с кода 101 не начинается ни один
из четырех оставшихся кодов для «А», «Б», «Г» и «Д» и
все коды различны.
Второй вариант отпадает, так как мы только что
убедились, что это возможно.
Третий вариант не подходит, так как в этом случае код
буквы «В» — 010 будет начинаться с 0, а 0 — это код
буквы А. Получается, что это нарушает условие Фано.
Вариант 4 тоже не подходит. В этом случае код буквы «Б»
— 10 будет являться началом для кода буквы «В», а это
нарушение условия Фано.
Правильный ответ: 1.
Информатика ФГОСС
Кодирование и обработка текстовой информации.
А1 Задачи для самостоятельного решения (с
ответами)
Для
кодирования
некоторой
последовательности, состоящей из букв А, Б, В,
Г и Д, используется неравномерный двоичный
код, позволяющий однозначно декодировать
полученную двоичную последовательность.
Вот этот код: А–10, Б–001, В–0001, Г–110, Д–111.
Можно ли сократить для одной из букв длину
кодового слова так, чтобы код по-прежнему
можно было декодировать однозначно? Коды
остальных букв меняться не должны.
Выберите правильный вариант ответа.
1) это невозможно2) для буквы В – 0003) для
буквы Б – 004) для буквы Г – 11
Правильный ответ: 2
Информатика ФГОСС
Кодирование и обработка текстовой информации.
A1.2 А1 Задачи для самостоятельного решения
(с ответами)
Для кодирования некоторой последовательности,
состоящей из букв А, Б, В, Г и Д, используется
неравномерный двоичный код, позволяющий однозначно
декодировать полученную двоичную
последовательность. Вот этот код: А–011, Б–000, В–11, Г–
001, Д–10. Можно ли сократить для одной из букв длину
кодового слова так, чтобы код по-прежнему можно было
декодировать однозначно? Коды остальных букв
меняться не должны.
Выберите правильный вариант ответа.
1) это невозможно2) для буквы А – 013) для буквы Б –
004) для буквы Г – 00
Правильный ответ: 2
Информатика ФГОСС
Кодирование и обработка текстовой информации.
A1.3 Задачи для самостоятельного решения (с ответами)
Для кодирования некоторой последовательности,
состоящей из букв А, Б, В, Г и Д, решили использовать
неравномерный двоичный код, позволяющий
однозначно декодировать двоичную
последовательность, появляющуюся на приёмной
стороне канала связи. Для букв А, Б, В и Г использовали
такие кодовые слова: А–111, Б–110, В–100, Г–101.
Укажите, каким кодовым словом может быть
закодирована буква Д.
Код должен удовлетворять свойству однозначного
декодирования. Если можно использовать более одного
кодового слова, укажите кратчайшее из них.
1) 02) 013) 004) 000
Правильный ответ: 1
Информатика ФГОСС
Кодирование и обработка текстовой информации.
A1.4 Задачи для самостоятельного решения (с
ответами)
Для кодирования некоторой последовательности,
состоящей из букв А, Б, В, Г и Д, используется
неравномерный троичный код, позволяющий однозначно
декодировать полученную троичную
последовательность. Вот этот код: А–0, Б–11, В–20, Г–21,
Д–22. Можно ли сократить для одной из букв длину
кодового слова так, чтобы код по-прежнему можно было
декодировать однозначно? Коды остальных букв
меняться не должны.
Выберите правильный вариант ответа.
1) это невозможно2) для буквы Б – 13) для буквы В –
24) для буквы Д – 2
Правильный ответ: 2
Информатика ФГОСС
Кодирование и обработка текстовой информации.
A1.5 Задачи для самостоятельного решения (с ответами)
Для кодирования некоторой последовательности,
состоящей из букв А, Б, В, Г и Д, решили использовать
неравномерный троичный код, позволяющий однозначно
декодировать троичную последовательность,
появляющуюся на приёмной стороне канала связи. Для
букв А, Б, В и Г использовали такие кодовые слова: А–11,
Б–12, В–21, Г–22. Укажите, каким кодовым словом может
быть закодирована буква Д.
Код должен удовлетворять свойству однозначного
декодирования. Если можно использовать более одного
кодового слова, укажите кратчайшее из них.
1) 02) 013) 024) 10
Правильный ответ: 1
Информатика ФГОСС
Кодирование и обработка текстовой информации.
Информатика ФГОСС
Кодирование и обработка текстовой информации.
Упражнение в рабочей тетради:
§
РТ. с. ___ № ___
Информатика ФГОСС
Кодирование и обработка текстовой информации.
Практическая работа:
§№
___
с. ____
Download