Текстовая информация и компьютер

advertisement
Текстовая информация
и компьютер
Виды информации
текстовая
графическая
числовая
звуковая
При ручной записи или даже при
использовании пишущей машинки часто
неприятной
проблемой
становится
необходимость исправлять ошибки или
вносить какие - то изменения в текст.
У лукоморья дуб зеленый,
а
Злотая цепь на дубе том.
И днем и ночью кот ученый
и
Все ходет по цепи кругом
Имея
компьютер,
можно
создавать
тексты, не
тратя на
это бумаги.
СПОСОБЫ ОБРАБОТКИ И ХРАНЕНИЯ ТЕКСТОВ
Ручная
запись текста
на бумаге
Печать
на пишущей
машинке

Тексты
на
бумаге
Печать
на принтере
Бумажная технология
Файлы
Компьютерная технология
Недостатки бумажной технологии
Достоинства компьютерной технологии
• проблемы
редактирования
бумажных
документов
(зачеркивание,
стирание,
заклеивание, переписывание заново)
• компактное хранение в файлах на носителях
• книги, документы на бумажном носителе
занимают очень много места
• одноразовое
бумаги
использование,
перерасход
• трудности копирования бумажных текстовых
документов
• трудности передачи текстовой бумажной
информации на большие расстояния
• возможность
носителя
многократного
использования
• простота копирования и размножения
• простота
изменений
редактирования
–
внесения
• быстрая передача по сетевым каналам
СВОЙСТВА КОМПЬЮТЕРНЫХ ДОКУМЕНТОВ
Возможность
внесения
любых
изменений
непосредственно в файле, не расходуя при
этом бумагу
Компактность хранения текстовой информации
Возможность
многократного
внешних носителей
Легкость
носители
использования
копирования файлов на любые
с помощью компьютера
Оперативная связь – передача текстовой информации через
компьютерные сети
Легкость удаления (стирания) ненужных текстовых файлов
Возможность просмотра компьютерных текстов на экране дисплея

Тексты
в компьютерной памяти
Урок 1
ТЕКСТОВАЯ ИНФОРМАЦИЯ И КОМПЬЮТЕР
Представление текста
в памяти компьютера
Представление
символов
Таблица
кодировки
Код ASCII
256 символов
1 символ – 1 байт
стандартная часть
коды 0 – 127
альтернативная
часть
коды 128 - 255
Структура
документов
Структурные
единицы
•
•
•
•
•
слово
строка
абзац
страница
раздел
Программы создания
и редактирования текста
Текстовые
редакторы
Текстовые
процессоры
ОСНОВНЫЕ РЕЖИМЫ
• ввод текста
• редактирование
• поиск и замена
• работа с файлами
• правописание
• печать документа
• помощь
ДОПОЛНИТЕЛЬНЫЕ
ФУНКЦИИ
• стили, шаблоны
• списки
• таблицы
• графика
• формулы
Интеллектуальные системы
работы с текстом
Гипертекст
Программы
переводчики
Программы распознавания
печатного текста
Кодирование текстов
А теперь заглянем в память компьютера и
разберемся, как же представлена в нем
текстовая информация.
1ва4
символы

символы
vbmlf



Цифры: 1 2 3 4 5 6 7 8 9
буквы
Знаки препинания
С точки зрения компьютера
текст – это любая
последовательность
символов из компьютерного
алфавита.
Самое главное, чтобы все
используемые символы входили
бы в компьютерный алфавит.
Тексты в компьютерной
памяти
Мощность компьютерного алфавита
256 символов.
Сколько информации несет один символ данного
алфавита?
2i = N
2i = 256
2i = 28
i=8
(бит)
двоичный код каждого
символа в компьютерном
тесте занимает 1 байт
памяти.
ТЕКСТЫ В КОМПЬЮТЕРНОЙ ПАМЯТИ

• Каждый символ текста представлен в памяти компьютера двоичным кодом (1 байт)
• Слово – последовательность символов, отделенная разделительным знаком или пробелом
• Строка – это последовательность слов, отделенная от другой строки
управляющими кодами “перевод строки” (ASCII=13) и “возврат каретки” (ASCII=10)
• Текстовый файл содержит последовательность кодов символов, разделенную
по строкам. В конце расположен управляющий код “конец файла” (ASCII=26)
Строка
слово
символ
Код ASCII
слово
символ ….. символ
пробел
символ
Код ASCII
Код ASCII
Код ASCII
Строка
Код ASCII
Управляющие
коды (13 + 10)
символ ….. символ
Код ASCII
Строка
.....
Специальные управляющие
коды для разделения текста
на строки (13 + 10)
Код ASCII
Строка
.....
Последовательность кодов ASCII cтрок – текстовый файл
.....
Специальный
управляющий код
26 (конец файла)
Какой именно восьмиразрядный двоичный
код поставить в соответствие каждому
символу?
Таблица, в которой всем символам
компьютерного алфавита поставлены в
соответствие порядковые номера,
называется таблицей
кодировки.
ASCII
КОИ-8
международный стандарт кодировки.
(американский стандартный код для информационного
обмена)
код обмена информацией
КОДИРОВАНИЕ ТЕКСТА. ТАБЛИЦА КОДИРОВКИ
Структура кодовой таблицы
Кодировка в ОС Windows – код ANSI
№
Символ
Двоичный код
0
NUL
00000000
1
3OH
00000001
…
…..
……………
31
US
00011111
…
…..
……………
82
R
01010010
83
S
01010011
84
T
01010100
…
…..
……………
127

01111111
…
…..
……………
195
Г
11000011
Кодовая страница CP-1251
196
Д
11000100
128 (10000000) . . . 255 (11111111)
197
Е
11000101
…
…..
……………
254
ю
11111110
Содержит русские
буквы, упорядоченные в
алфавитной последовательности (это правило
соблюдается не во всех кодовых страницах)
255
я
11111111
American National Standard Institute
(американский институт стандартизации)
Стандартная часть кода ANSI/ASCII
0 (00000000) . . . 127 (01111111)
Символы с кодами 0 . . . 31 выполняют
управляющие функции. При выводе
текста они не отображаются графическими знаками.

Кодирование.
file
file
f - 01100110
i - 01101001
l - 01101100
e - 01100101
01100110 01101001 01101100 01100101
Кодирование.
01100100 01101001 01110011 01101011
d
01100100
01101001
01110011
01101011
i
s
k
Кодовая таблица Windows (ANSI, CP-1251)
Саша набирает текст на
компьютере. Куда первоначально
заносится набираемый текст?
Текст заносится в
оперативную память.
А для длительного хранения текста
должна быть использована
внешняя память
магнитные диски
Текст на магнитном диске сохраняется
в файле
Гипертекст
Самое поразительное отличие компьютерного
текста от бумажного вы почувствуете, если
встретитесь с текстом, информация в котором
организована по принципу гипертекста.
Смысловые связи между
различными фрагментами текста
– гиперсвязи, гиперссылки
гиперсвязь
При наведении курсора на
гиперссылку курсор изменяет свой
вид.
Работа с текстовой информацией
Способы обработки и хранения текстов
Гипертекст
Гипертекст – это способ организации текстовой информации,
внутри которой установлены смысловые связи (гиперсвязи)
между ее различными фрагментами
Текст
на бумажном носителе
Компьютерный гипертекст
Страница 1
гиперссылки
Страница 2
Страница…
гиперсвязи
Домашнее задание
• 1. C помощью кодировочной таблицы ASCII
раскодируйте заданный текст:
• 98 117 99 107 32 105 115 32 109 121
32 102 114 105 101 110 100 46
• 2. C помощью кодировочной таблицы ASCII
закодируйте заданный текст:
• I was born in 1995.
• 3. Сколько символов содержится в тексте,
использующем таблицу ASCII, если
известно, что он занимает 24 576 бит
памяти?
Download