7. Общая характеристика информационных процессов

advertisement
Контрольные вопросы
По теоретическому материалу 1 семестра
1. Понятие информатики, история развития информатики, место информатики в ряду других
фундаментальных наук. ........................................................................................................................................1
2.
Основные объекты и методы изучения науки информатики. ...................................................................5
3.
Мировоззренческие экономические и правовые аспекты информационных технологий. ....................7
4.
Понятие информации. Формы представления информации. ....................................................................9
5. Измерение и представление информации. Меры информации и их классификация (синтаксическая,
семантическая, прагматическая). .......................................................................................................................11
6.
Носители информации. Виды и свойства информации. ..........................................................................17
7.
Общая характеристика информационных процессов ..............................................................................20
8.
Информационные технологии и ресурсы..................................................................................................30
9.
Информационные системы .........................................................................................................................32
10.
Информатизация общества и автоматизация офиса ............................................................................34
11.
Понятие данных. Носители данных. Операции с данными. ................................................................36
12.
Кодирование данных двоичным кодом. Кодирование целых и действительных чисел. .................38
13.
Кодирование текстовых данных. ............................................................................................................40
14.
Кодирование графических данных. ........................................................................................................44
15.
Системы счисления. Перевод целых и дробных чисел из одной системы счисления в другую. ......48
16.
Основные структуры данных...................................................................................................................54
Тема1. Информация и информационные технологии.
1. Понятие информатики, история развития информатики, место информатики в ряду
других фундаментальных наук.
Информатика как самостоятельная отрасль научного знания и область практической
деятельности появилась во второй половине ХХ в. Ее истоками можно считать:
– теорию информации, тесно связанную с теорией связи в технических системах (телефон,
телеграф, радиосвязь), в частности, математическую теорию связи (Клод Шеннон, 1948 г.);
– кибернетику, исследующую общие законы управления в системах различной природы,
основы которой заложил Ноберт Винер (1948 г.);
– теорию автоматов, основы которой заложил Джон фон Нейман (1946 г.);
– теорию алгоритмов (Н. Вирт, Э. Дейкстра, А.П. Ершов, Д. Кнут и др.).
Информатику традиционно связывают с развитием компьютерной техники. Но компьютер
послужил лишь катализатором тенденций, которые возникли в науке и практике задолго до его
появления. Каковы же эти тенденции? Прежде всего, резкое нарастание объема информации,
1
которая с развитием средств связи становится доступной отдельному человеку. Приходит
осознание того, что человеческие возможности восприятия и переработки информации
ограничены. В то же время научно-технический прогресс, сопровождаемый высокими
скоростями, развитием сложных технических комплексов, ставит человека в условия, когда ему
необходимо научиться быстро и безошибочно перерабатывать информацию, чтобы эффективно
управлять техникой. Решения часто приходится принимать в условиях дефицита времени,
которые, к тому же, они могут быть чреваты большими последствиями. Задачи управления
требуют применения таких средств, которые помогают собрать более полную информацию,
надежно ее хранить, быстро распространять и безошибочно обрабатывать. Таким средством и
стал компьютер. По сути, информатика призвана заниматься решением проблем, связанных с
необходимостью организации информационных процессов (сбор, хранение, передача, обработка,
защита и т.п.) и эффективного использования информационных ресурсов.
Компьютерные средства работы с информацией как основной объект изучения
современной
информатики
представляет
собой
неразрывное
единство
трех
частей
–
технического, программного и алгоритмического обеспечения информационных процессов и
информационных систем. Основной вопрос информатики – каковы информационные процессы и
как они могут быть эффективно автоматизированы?
Информатика широко использует достижения таких дисциплин, как математика,
лингвистика, семиотика (наука о знаковых системах), логика, computer science, робототехника,
инженерия знаний и др. В становлении информатики как науки вклад внесли многие
замечательные ученые, среди них А.Н. Колмогоров, В.А. Котельников, А.А. Ляпунов, А.П.
Ершов, В.С. Леднев, А.А. Харкевич, А.Я. Хинчин и др.
Термин «информатика» возник в начале 60-х годов ХХ века во Франции для выделения
области знаний, связанной с автоматизированной обработкой информации с помощью
электронно-вычислительных машин. Informatique происходит от французских слов information
(информация) и automatique (автоматика) и дословно означает «информационная автоматика».
Широко распространен также англоязычный вариант этого термина–«Сomputer science»,
что означает буквально «компьютерная наука».
Информатика – это основанная на использовании компьютерной техники дисциплина,
изучающая структуру и общие свойства информации, а также закономерности и методы ее
создания, хранения, поиска, преобразования, передачи и применения в различных сферах
человеческой деятельности.
В 1978 году международный научный конгресс официально закрепил за понятием
«информатика» области, связанные с разработкой, созданием, использованием и материальнотехническим обслуживанием систем обработки информации, включая компьютеры и их
2
программное обеспечение, а также организационные, коммерческие, административные и
социально-политические аспекты компьютеризации – массового внедрения компьютерной
техники во все области жизни людей.
Таким образом, информатика базируется на компьютерной технике и немыслима без нее.
Информатика – комплексная научная дисциплина с широчайшим диапазоном применения.
Ее приоритетные направления:
‒
разработка вычислительных систем и программного обеспечения;
‒
теория информации, изучающая процессы, связанные с передачей,
‒
приемом, преобразованием и хранением информации;
‒
математическое моделирование, методы вычислительной и прикладной математики и их
применение к фундаментальным и прикладным исследованиям в различных областях
знаний;
‒
методы искусственного интеллекта, моделирующие методы логического и аналитического
мышления в интеллектуальной деятельности человека (логический вывод, обучение,
понимание речи, визуальное восприятие, игры и др.);
‒
системный анализ, изучающий методологические средства, используемые для подготовки
и обоснования решений по сложным проблемам различного характера;
‒
биоинформатика, изучающая информационные процессы в биологических системах;
‒
социальная информатика, изучающая процессы информатизации общества;
‒
методы машинной графики, анимации, средства мультимедиа;
‒
телекоммуникационные системы и сети, в том числе, глобальные компьютерные сети,
объединяющие все человечество в единое информационное сообщество;
‒
разнообразные приложения, охватывающие производство, науку, образование, медицину,
торговлю, сельское хозяйство и все другие виды хозяйственной и общественной
деятельности.
В информатике можно выделить три неразрывно и существенно связанные части –
технические, программные и алгоритмические средства.
Технические средства, или аппаратура компьютеров, в английском языке обозначаются
словом Hardware, которое буквально переводится как «твердые изделия».
Для обозначения программных средств, под которыми понимается совокупность всех
программ, используемых компьютерами, и область деятельности по их созданию и применению,
используется
слово
Software
(буквально
–
«мягкие
изделия»),
которое
подчеркивает
равнозначность самой машины и программного обеспечения, а также способность программного
обеспечения модифицироваться, приспосабливаться и развиваться.
Программированию задачи всегда предшествует разработка способа ее решения в виде
3
последовательности действий, ведущих от исходных данных к искомому результату, иными
словами, разработка алгоритма решения задачи. Для обозначения части информатики, связанной
с разработкой алгоритмов и изучением методов и приемов их построения, применяют термин
Brainware (англ. brain – интеллект).
Роль информатики в развитии общества чрезвычайно велика. С ней связано начало
революции в области накопления, передачи и обработки информации. Эта революция, следующая
за революциями в овладении веществом и энергией, затрагивает и коренным образом преобразует
не только сферу материального производства, но и интеллектуальную, духовную сферы жизни.
Прогрессивное
информационных
увеличение
сетей,
возможностей
создание
новых
компьютерной
информационных
техники,
технологий
развитие
при-
водят
к
значительным изменениям во всех сферах общества: в производстве, науке, образовании,
медицине и т.д.
Информатику можно рассматривать как науку, как технологию и как индустрию.
Информатика как наука объединяет группу дисциплин, занимающихся изучением
различных аспектов свойств информации в информационных процессах, а также применением
алгоритмических, математических и программных средств для ее обработки с помощью
компьютеров.
Информатика как технология включает в себя систему процедур компьютерного
преобразования информации с целью ее формирования, хранения, обработки, распространения и
использования.
Основными
чертами
современной
(новой) информационной
технологии
являются:
‒
дружественный программный и аппаратный интерфейс;
‒
интерактивный (диалоговый) режим решения задач;
‒
сквозная
информационная
поддержка
всех
этапов
решения
задачи
на
основе
интегрированной базы данных;
‒
возможность коллективного решения задач на основе информационных сетей и систем
телекоммуникаций;
‒
безбумажная технология, при которой основным носителем информации является не
бумажный, а электронный документ.
Информатика как индустрия – это инфраструктурная отрасль народного хозяйства,
обеспечивающая все другие отрасли необходимыми информационными ресурсами. Индустрия
информатики включает в себя предприятия, производящие вычислительную технику и ее
элементы; вычислительные центры различного типа и назначения (индивидуальные, кустовые,
коллективного пользования и др.); предприятия, осуществляющие производство программных
средств
и
проектирование
информационных
систем;
организации,
накапливающие,
4
распространяющие и обслуживающие фонды алгоритмов и программ; станции технического
обслуживания вычислительной техники.
Роль информатики в современных условиях постоянно возрастает. Деятельность как
отдельных людей, так и целых организаций все в большей степени зависит от их
информированности и способности эффективно использовать имеющуюся информацию.
Внедрение компьютеров, современных средств переработки и передачи информации в различные
индустрии послужило началом процесса, называемого информатизацией общества. Современное
материальное производство и
информационном
другие сферы деятельности
обслуживании,
переработке
огромного
все больше нуждаются в
количества
информации.
Информатизация на основе внедрения компьютерных и телекоммуникационных технологий
является реакцией общества на потребность в существенном увеличении производительности
труда в информационном секторе общественного производства, где сосредоточено более
половины трудоспособного населения.
Результатом процесса информатизации является создание информационного общества, где
манипулируют не материальными объектами, а идеями, образами, интеллектом, знаниями. Для
каждой страны ее движение от индустриального этапа развития к информационному этапу
определяется степенью информатизации общества.
Информатика связана с кибернетикой, но не тождественна ей. Кибернетика изучает общие
закономерности процессов управления сложными системами в различных областях человеческой
деятельности независимо от наличия или отсутствия компьютеров. Информатика же изучает
общие свойства только конкретных информационных систем.
Информатика изучает свойства, структуру и функции информационных систем, а также
происходящие в них информационные процессы. Под информационной системой понимают
систему, организующую, хранящую и преобразовывающую информацию. Подавляющее
большинство современных информационных систем являются автоматизированными.
2. Основные объекты и методы изучения науки информатики.
Существует много определений информатики как науки и учебной дисциплины. Такое
многообразие мнений отражает тот факт, что информатика – это бурно развивающаяся наука,
находящаяся в периоде становления. Сегодня быстро изменяются не только аппаратные средства
и программное обеспечение, но и методы работы с информацией, а также понимание роли
информации в эффективном использовании ограниченных материальных ресурсов и технических
возможностей современного производства.
Чтобы определиться с основными объектами изучения в информатике, приведем
несколько определений информатики, которые представляют спектр основных мнений.
В 1978 г. на Международном конгрессе по информатике было предложена следующая
5
формулировка определения понятия "информатика": "Понятие информатики охватывает области,
связанные
с
разработкой,
созданием,
использованием
и
материально-техническим
обслуживанием систем обработки информации, включая машины, оборудование, математическое
обеспечение, организационные аспекты, а также комплекс промышленного, коммерческого,
административного и социального воздействия".
В следующем определении в явном виде подчеркивается двойственный характер
информатики – фундаментальность и технологичность: "Информатика – в настоящее время одна
из фундаментальных областей научного знания, формирующая системно-информационный
подход к анализу окружающего мира, изучающая информационные процессы, методы и средства
получения, преобразования, передачи, хранения и использования информации. Вместе с тем
информатика – это стремительно развивающаяся и постоянно расширяющаяся сфера
практической деятельности человека, связанная с использованием информационных технологий".
Методологическое определение: "Информатика – комплекс научных направлений и
наукоемких технологий, объединенных общим методом исследования – информационным
подходом и общим предметом исследования – информационными процессами".
На наш взгляд, информатика – это наука о закономерностях протекания информационных
процессов в системах различной природы, о методах, средствах и технологиях автоматизации
информационных процессов, о закономерностях создания и функционирования информационных
систем.
В данной формулировке подчеркивается, что объектом изучения информатики как науки
являются
именно
законы,
закономерности,
поскольку цели
любой
науки
не
только
объяснительные, но и прогностические. Основной предмет изучения – информационные
процессы, но не сами по себе, а в их привязке к "носителю" – информационным системам.
Прагматизм информатики обусловлен тем, что предметом ее исследования являются также
методы, средства и технологии, обеспечивающие эффективную организацию информационных
процессов и их автоматизированное выполнение.
С точки зрения вузовского образования, информатику следует рассматривать как
существенный элемент гуманитарной культуры человека, который вносит решающий вклад в
формирование современного научного мировоззрения, дает ключ к пониманию многих явлений
нашей жизни, снабжает умениями, необходимыми для ориентирования в современном
информационном пространстве и успешной деятельности в нем.
Таким образом, основными объектами изучения в информатике являются:
– информационные объекты (тексты, совокупности данных, алгоритмы и т.п.), т.е.
информация, зафиксированная на каком-либо носителе;
– информационные ресурсы общества как совокупность созданных человечеством
6
информационных объектов;
– информационные процессы (поиск, отбор, хранение, передача, обработка, хранение,
кодирование, защита);
– информационные модели (в частности, структуры данных, алгоритмы, программы);
– информационные технологии, как совокупность методов, способов, протоколов
реализации информационных процессов;
– информационные системы, как совокупность информационных ресурсов вместе с
допустимыми
для
них
информационными
процессами,
реализуемыми
с
помощью
информационных технологий;
– компьютер и компьютерные системы как универсальные средства автоматизации
информационных процессов.
В любом научном исследовании важно не только то, что исследуется, но и то, как
исследуется, т.е. важно иметь представление об основных методах исследования, а также о
специфике применения общенаучных методов в данной области знания. Общими для всех наук
методами исследования являются наблюдение, теоретический анализ, эксперимент, в том числе
вычислительный, моделирование и др. В каждой конкретной науке эти методы приобретают свою
специфику.
Основными методами исследования в информатике являются:
–
системно-информационный анализ как конкретизация системного подхода;
–
информационное
моделирование
как
конкретизация
общенаучного
метода
моделирования;
–
компьютерный эксперимент как разновидность свойственного всем наукам
вычислительного эксперимента.
Быстрое увеличение объема существующей и циркулирующей в обществе информации
ставит современного человека перед проблемой умения работать с ней: находить, отбирать
нужное,
хранить,
упаковывать
и
быстро
извлекать
из
хранилища,
обрабатывать
и
преобразовывать. Причем, информация все чаще может быть представлена не только в текстовом,
наиболее привычном виде, но и как видео- и аудиоматериалы, схемы и анимационная графика и
т.п. Владение методами, приемами и средствами ра- боты с информацией становится одним из
основных профессионально важных качеств специалиста любого профиля.
3. Мировоззренческие экономические и правовые аспекты информационных технологий.
Информационная культура - это есть обладание знаниями и умениями в области
информационных и коммуникационных технологий, а также знание юридических и этических
норм в этой сфере.
Основной закон нашей страны – Конституция (в ст. 29) гарантирует каждому гражданину
7
России свободу мысли и слова. И каждый из нас имеет право свободно искать, получать,
передавать, производить и распространять информацию любым законным способом.
Современному человеку необходимо:
- овладеть коммуникативной культурой;
- знание и соблюдение юридических и этических норм и правил.
Законы запрещают использование пиратского компьютерного обеспечения и пропаганду
насилия, наркотиков и порнографии в Интернете.
Программы по их юридическому статусу можно разделить на три большие группы:
-
Лицензионные;
-
Условно бесплатные (shareware);
-
Свободно распространяемые программы (freeware).
Лицензионные программы продаются.
К бесплатно распространяемым программам можно отнести: новые недоработанные (бета)
версии
программных
продуктов
(это
позволяет
провести
их
широкое
тестирование);
программные продукты, являющиеся частью принципиально новых технологий (это позволяет
завоевать рынок); дополнения к ранее выпущенным программам, исправляющие найденные
ошибки или расширяющие возможности; устаревшие версии программ; драйверы к новым
устройствам или улучшенные драйверы к уже существующим.
Условно-бесплатные в целях их рекламы их продвижения на рынок, предоставляют
пользователю версию программы с ограниченным сроком действия.
В настоящее время в России “законодательство в сфере информатизации” охватывает по
различным оценкам несколько сотен нормативно правовых актов. Из них можно выделить около
десятка основных. Это, например, Федеральный закон “Об информации, информационных
технологиях и защите информации” (от 27.07.2006 года №149-Ф3); “О средствах массовой
информации” (от 27.12.91 г. № 2124-I); “О правовой охране программ для электронных
вычислительных машин и баз данных” (от 23.09.92 г. № 3523-I); “Об авторском праве и
смежных правах” (от 09.07.93 г. № 5351-I) и др..
Для нарушителей авторских прав закон предусматривает возмещение убытков автору и
выплаты нарушителем штрафа по решению суда в сумме от 5000-кратного до 50 000- кратного
размера минимальной месячной оплаты труда.
Среди правовых проблем, связанных с деятельностью в Интернете, можно назвать
следующие:
защита интеллектуальной собственности;
защита национальной безопасности;
ответственность провайдеров и владельцев сайтов;
8
регулирование электронной коммерции;
защита тайны личной жизни;
защита несовершеннолетних (от оскорбительных форм маркетинга и порнографии);
вопросы информационной безопасности и др.
В 2002 году был принят Закон РФ «Об электронно-цифровой подписи», который стал
законодательной основой электронного документооборота в России. По этому закону
электронная цифровая подпись в электронном документе признается юридически
равнозначной подписи в документе на бумажном носителе.
При
регистрации
электронно-цифровой
подписи
в
специализированных
центрах
корреспондент получает два ключа: секретный и открытый. Секретный ключ хранится на дискете
или смарт-карте и должен быть известен только самому корреспонденту.
Открытый ключ должен быть у всех потенциальных получателей документов и обычно
рассылается по электронной почте.
Законы и нормативные акты.
Об авторском праве и смежных правах. Закон РФ от 19.07.1995 года № 110-ФЗ.
Об информации, информационных технологиях и защите информации. Закон РФ от
27.07.2006 года №149-Ф3.
Доктрина информационной безопасности Российской Федерации. Указ Президента РФ от
09.09.2000 года № Пр-1895.
Об электронной цифровой подписи. Федеральный закон от 10.01.2002 года № 1-ФЗ.
О федеральной целевой программе “Электронная Россия (2002 – 2010 годы)”.
Постановление Правительства РФ от 28.01.2002 года № 65.
ГОСТ
Р6.30-2003.
Унифицированная
система
организационно-распорядительной
документации. Требования к оформлению документов. – М.: Изд-во стандартов, 2003.
4. Понятие информации. Формы представления информации.
Термин «информация» происходит от латинского слова «informatio», что означает
сведения, разъяснения, изложение. Несмотря на широкое распространение этого термина,
понятие информации является одним из самых дискуссионных в науке. В настоящее время наука
пытается найти общие свойства и закономерности, присущие многогранному понятию
информация, но пока это понятие во многом остается интуитивным и получает различные
смысловые наполнения в различных отраслях человеческой деятельности:
‒ в обиходе информацией называют любые данные или сведения, которые кого-либо
интересуют. Например, сообщение о каких-либо событиях, о чьей-либо деятельности и
т.п. «Информировать» в этом смысле означает «сообщить нечто, неизвестное раньше»;
‒ в технике под информацией понимают сообщения, передаваемые в форме знаков или
9
сигналов;
‒ в кибернетике под информацией понимает ту часть знаний, которая используется для
ориентирования,
активного
действия,
управления,
т.е.
в
целях
сохранения,
совершенствования, развития системы.
Информация – это сведения об объектах и явлениях окружающей среды, их параметрах,
свойствах и состояниях, которые уменьшают имеющуюся о них степень неопределенности,
неполноты знаний.
Информатика рассматривает информацию как связанные между собой сведения,
изменяющие наши представления о явлении или объекте окружающего мира. С этой точки
зрения информацию можно рассматривать как совокупность знаний о фактических данных и
зависимостях между ними.
Люди обмениваются информацией в форме сообщений. Сообщение – это форма
представления информации в виде речи, текстов, жестов, взглядов, изображений, цифровых
данных, графиков, таблиц и т.п.
Одно и то же информационное сообщение (статья в газете, объявление, письмо,
телеграмма, справка, рассказ, чертеж, радиопередача и т.п.) может содержать разное количество
информации для разных людей – в зависимости от их предшествующих знаний, от уровня
понимания этого сообщения и интереса к нему.
Так, сообщение, составленное на японском языке, не несет никакой новой информации
человеку, не знающему этого языка, но может быть высокоинформативным для человека,
владеющего японским. Никакой новой информации не содержит и сообщение, изложенное на
знакомом языке, если его содержание непонятно или уже известно.
Информация есть характеристика не сообщения, а соотношения между сообщением и его
потребителем. Без наличия потребителя, хотя бы потенциального, говорить об информации
бессмысленно.
Применительно к компьютерной обработке данных под информацией понимают
некоторую последовательность символических обозначений (букв, цифр, закодированных
графических образов и звуков и т.п.), несущую смысловую нагрузку и представленную в
понятном компьютеру виде. Каждый новый символ в такой последовательности символов
увеличивает информационный объем сообщения.
Предметы,
процессы,
явления
материального
или
нематериального
свойства,
рассматриваемые с точки зрения их информационных свойств, называются информационными
объектами.
В процессе обработки информация может менять структуру и форму. Признаком
структуры являются элементы информации и их взаимосвязь. Формы представления
10
информации могут быть различны. Основными из них являются:
‒
символьная (основана на использовании различных символов);
‒
текстовая (текст – это символы, расположенные в определенном порядке);
‒
графическая (различные виды изображений);
‒
световых или звуковых сигналов;
‒
радиоволн;
‒
электрических и нервных импульсов;
‒
магнитных записей;
‒
жестов и мимики;
‒
запахов и вкусовых ощущений;
‒
хромосом, посредством которых передаются по наследству признаки и свойства
организмов и т.д.
В
повседневной
практике
такие
понятия,
как
информация
и
данные,
часто
рассматриваются как синонимы. На самом деле между ними имеются существенные различия.
Данными называется информация, представленная в удобном для обработки виде.
Данные могут быть представлены в виде текста, графики, аудио-визуального ряда.
Представление данных называется языком информатики, представляющим собой совокупность
символов, соглашений и правил, используемых для общения, отображения, передачи
информации в электронном виде.
5. Измерение и представление информации. Меры информации и их классификация
(синтаксическая, семантическая, прагматическая).
Измерение информации.
Прежде, чем измерять значение какой-либо физической величины, надо ввести единицу
измерения. У информации тоже есть такая единица – бит, но смысл ее различен при измерении
информации в рамках разных подходов к определению понятия "информация".
I ПОДХОД. Неизмеряемость информации в быту (информация как новизна для
получателя).
Вы получили некоторое сообщение, например, прочитали статью в журнале. В этом
сообщении содержится какое-то количество новых для Вас сведений. Как оценить, сколько
информации Вы получили? Другими словами, как измерить информацию? Можно ли сказать,
что чем больше статья, тем больше информации она содержит?
Разные люди, получившие одно и то же сообщение, по-разному оценивают его новизну и
информационную емкость. Это происходит оттого, что знания людей о событиях, явлениях, о
которых идет речь в сообщении, до получения сообщения были различными. Поэтому те, кто
знал об этом мало, сочтут, что получили много информации, те же, кто знал больше, могут
11
сказать, что информации не получили вовсе. Количество информации в сообщении, таким
образом, зависит от того, насколько ново это сообщение для получателя. В таком случае,
количество информации в одном и том же сообщении должно определяться отдельно для
каждого получателя, т.е. иметь субъективный характер. Но субъективные вещи не поддаются
сравнению и анализу, для их измерения трудно выбрать одну общую для всех единицу
измерения. Таким образом, с точки зрения информации как новизны, мы не можем однозначно
и объективно оценить количество информации, содержащейся даже в простом сообщении. Что
же тогда говорить об измерении количества информации, содержащейся в научном открытии,
новом музыкальном стиле, новой теории общественного развития. Поэтому, когда информация
рассматривается как новизна сообщения для получателя, вопрос об измерении количества
информации не ставится.
II ПОДХОД – технический или объемный.
В технике, где информацией считается любая хранящаяся, обрабатываемая или
передаваемая последовательность знаков, сигналов, часто используют простой способ
определения количества информации, который может быть назван объемным. Он основан на
подсчете числа символов в сообщении, т.е. связан только с длиной сообщения и не учитывает
его содержания.
Длина сообщения зависит от числа знаков, употребляемых для записи сообщения.
Например, слово "мир" в русском алфавите записывается тремя знаками, в английском – пятью
(peace), а в ДКОИ-8 (двоичный код обмена информацией длиной 8) – двадцатью четырьмя
битами (111011011110100111110010).
В вычислительной технике применяются две стандартные единицы измерения: бит (англ.
binary digit – двоичная цифра) и байт (byte) и производные от них единицы – килобайт (Кб),
мегабайт (Мб), гигабайт (Гб), тетрабайт (Тб).
1 бит – минимально возможный хранимый и передаваемый сигнал. Условно два его
возможных состояния обозначаются 0 и 1. В действительности эти состояния могут иметь
различную физическую природу: для оперативной памяти это наличие или отсутствие
напряжения в электронной схеме; для компакт-дисков это выступ или впадина на поверхности и
т.д. Исторически сложилось так, что 1 байт равен 8 битам. Именно восемью битами кодировался
один символ в программах для первых ЭВМ.
Обычно приставка "кило" означает тысячу, а приставка "мега" – миллион, но в
вычислительной технике все "привязывается" к принятой двоичной системе кодирования.
В силу этого один килобайт равен не тысяче байт, а 2 10 = 1024 байт.
Аналогично, 1 Мб = 210 Кб = 1024 Кб = 220 байт = 1 048 576 байт. 1 Гб = 210 Мб = 220 Кб =
230 байт = 1 073 741 824 байт.
12
III ПОДХОД – вероятностный. Измерение информации в теории информации, когда
информация определяется как снятая неопределенность.
Получение информации (ее увеличение) одновременно означает увеличение знания, что,
в свою очередь, означает уменьшение незнания или информационной неопределенности.
Говорят, что сообщение, которое уменьшает неопределенность, существовавшую до его
получения, ровно в 2 раза, несет 1 бит информации. По сути, 1 бит информации соответствует
выбору одного из двух равновероятных сообщений.
ПРИМЕРЫ.
Книга лежит на одной из двух полок – верхней или нижней. Сообщение о том, что книга
лежит на верхней полке, уменьшает неопределенность ровно вдвое и несет 1 бит информации.
Сообщение о том, как упала монета после броска – "орлом" или "решкой", несет один бит
информации.
В соревновании участвуют 4 команды. Сообщение о том, что третья команда набрала
большее количество очков, уменьшает первоначальную неопределенность ровно в четыре раза
(дважды по два) и несет два бита информации.
Очень приближенно можно считать, что количество информации в сообщении о каком-то
событии совпадает с количеством вопросов, которые необходимо задать и ответом на которые
могут быть лишь "да" или "нет", чтобы получить ту же информацию. Причем событие, о
котором идет речь, должно иметь равновероятные исходы. Именно поэтому, если число
равновероятных исходов события, о котором идет речь в сообщении, кратно степени числа 2 (4
= 22, 8 = 23, 32 = 25), то сообщение несет целое количество бит информации. Но в реальной
практике могут встречаться самые разные ситуации. Например, сообщение о том, что на
светофоре красный сигнал, несет в себе информации больше, чем бит.
С точки зрения на информацию как на снятую неопределенность количество информации
зависит от вероятности получения данного сообщения. Причем, чем больше вероятность
события, тем меньше количество информации в сообщении о таком событии. Иными словами,
количество информации в сообщении о каком-то событии зависит от вероятности свершения
данного события.
Научный подход к оценке сообщений был предложен еще в 1928 г.
Р. Хартли. Расчетная формула имеет вид:
I = log2 N или 2I = N,
где N – количество равновероятных событий (число возможных выборов); I – количество
информации.
Если N = 2 (выбор из двух возможностей), то I = 1 бит.
Бит выбран в качестве единицы количества информации потому, что принято считать,
13
что двумя двоичными словами исходной длины k или словом длины 2k можно передать в 2 раза
больше информации, чем одним исходным словом. Число возможных равновероятных выборов
при этом увеличивается в 2k раз, тогда как I удваивается.
Иногда формула Хартли записывается иначе. Так как наступление каждого из N
возможных событий имеет одинаковую вероятность
p = 1 / N, то N = 1 / p и формула имеет вид I = log2 (1/p) = – log2 p.
Познакомимся с более общим случаем вычисления количества информации в сообщении
об одном из N, но уже неравновероятных событий. Этот подход был предложен К. Шенноном в
1948 г.
Пусть имеется текст, содержащий тысячу букв. Буква "о" в тексте встречается примерно
90 раз, буква "р" ~ 40 раз, буква "ф" ~ 2 раза, буква "а" ~ 200 раз. Поделив 200 на 1000, мы
получим величину 0.2, которая представляет собой среднюю частоту, с которой в
рассматриваемом тексте встречается буква "а". Вероятность появления буквы "а" в тексте (pa)
можем считать приблизительно равной 0,2. Аналогично, p р = 0,04, pф = 0,002, ро = 0,09. Далее
поступаем согласно К. Шеннону. Берем двоичный логарифм от величины 0,2 и называем то, что
получилось, количеством информации, которую переносит одна единственная буква "а" в
рассматриваемом тексте. Точно такую же операцию проделаем для каждой буквы. Тогда
количество собственной информации, переносимой одной буквой равно
hi = log2 (1/pi) = – log2 pi, где pi – вероятность появления в сообщении i-го символа
алфавита.
Удобнее в качестве меры количества информации пользоваться не значением h i , а
средним значением количества информации, приходящейся на один символ алфавита
H = pi hi = –pi log2 pi
Значение Н достигает максимума при равновероятных событиях, т.е. при равенстве всех
pi
pi = 1 / N.
В этом случае формула Шеннона превращается в формулу Хартли. Интересный факт.
На памятнике немецкому ученому Л. Больцману высечена формула, выведенная в 1877 г.
и связывающая вероятность состояния физической системы и величину энтропии этой системы.
Энтропия (греч. en – в, внутрь; trope – превращение, буквально смысловой перевод: то, что
внутри, неопределенно) – физическая величина, характеризующая тепловое состояние тела или
системы, мера внутренней неупорядоченности системы. Так вот, формула для энтропии
Больцмана совпадает с формулой, предложенной Шенноном для среднего количества
информации, приходящейся на один символ в сообщении. Совпадение это произвело столь
сильное впечатление, что Шеннон назвал количество информации негэнтропией. С тех пор
14
слово "энтропия" стало чуть ли не антонимом слова "информация".
Чем больше энтропия системы, тем больше степень ее неопределенности. Поступающее
сообщение полностью или частично снимает эту неопределенность. Следовательно, количество
информации можно измерять тем, насколько понизилась энтропия системы после поступления
сообщения. Таким образом, за меру количества информации принимается та же энтропия, но с
обратным знаком. Уменьшая неопределенность, мы получаем информацию, в этом весь смысл
научного познания.
Одной из важнейших характеристик информации является ее адекватность.
Адекватность информации – это уровень соответствия образа, создаваемого с помощью
информации, реальному объекту, процессу, явлению. От степени адекватности информации
зависит правильность принятия решения. Адекватность информации может выражаться в
трех формах: синтаксической, семантической и прагматической.
Синтаксическая адекватность отображает формально-структурные характеристики
информации, не затрагивая ее смыслового содержания. На синтаксическом уровне учитываются
тип носителя и способ представления информации, скорость ее передачи и обработки, размеры
кодов представления информации, надежность и точность преобразования этих кодов и т.д.
Информацию, рассматриваемую с таких позиций, обычно называют данными.
Семантическая адекватность определяет степень соответствия образа объекта самому
объекту. Здесь учитывается смысловое содержание информации. На этом уровне анализируются
сведения, отражаемые информацией, рассматриваются смысловые связи. Таким образом,
семантическая адекватность проявляется при наличии единства информации и пользователя.
Эта форма служит для формирования понятий и представлений, выявления смысла, содержания
информации и ее обобщения.
Прагматическая адекватность отражает соответствие информации цели управления,
реализуемой на ее основе. Прагматические свойства информации проявляются при наличии
единства информации, пользователя и цели управления. На этом уровне анализируются
потребительские
свойства
информации,
связанные
с
практическим
использованием
информации, с соответствием ее целевой функции деятельности системы.
Каждой форме адекватности соответствует своя мера количества информации.
Синтаксическая мера информации оперирует с обезличенной информацией, не
выражающей смыслового отношения к объекту. На этом уровне объем данных в сообщении
измеряется количеством символов в этом сообщении. В качестве минимальной единицей
измерения данных информации Клод Шеннон предложил принять один бит (англ. bit – binary
digit – двоичная цифра). Бит в теории информации – количество информации, необходимое для
различения двух равновероятных сообщений (типа: «чет» или «нечет», «орел» или «решка»,
15
«да» или «нет» и т.п.).
В вычислительной технике битом называют наименьшую «порцию» памяти компьютера,
необходимую для хранения одного из двух знаков «0» и «1», используемых для
внутримашинного представления данных и команд.
Бит – слишком мелкая единица измерения. На практике чаще применяется более крупная
единица – байт, равная восьми битам. Именно восемь битов требуется для того, чтобы
закодировать любой из 256 символов алфавита клавиатуры компьютера (256 = 28 ) .
Широко используются также еще более крупные производные единицы информации:
1 Килобайт (Кбайт) = 1024 байт,
1 Мегабайт (Мбайт) = 1024 Кбайт,
1 Гигабайт (Гбайт) = 1024 Мбайт.
В последнее время в связи с увеличением объемов обрабатываемой информации входят в
употребление такие производные единицы, как:
1 Терабайт (Тбайт) = 1024 Гбайт,
1 Петабайт (Пбайт) = 1024 Тбайт.
За единицу информации можно было бы выбрать количество информации, необходимое
для различения, например, десяти равновероятных сообщений. Это будет не двоичная (бит), а
десятичная (дит) единица информации.
Семантическая мера информации используется для измерения смыслового содержания
информации. Наибольшее распространение здесь получила тезаурусная мера, связывающая
семантические свойства информации со способностью пользователя принимать поступившее
сообщение. Тезаурус – это совокупность сведений, которыми располагает пользователь или
система. Максимальное количество семантической информации потребитель получает при
согласовании ее смыслового содержания со своим тезаурусом, когда поступившая информация
понятна пользователю и несет ему ранее не известные сведения. С семантической мерой
количества информации связан коэффициент содержательности, определяемый как отношение
количества семантической информации к общему объему данных.
Прагматическая мера информации определяет ее полезность, ценность для процесса
управления. Обычно ценность информации измеряется в тех же единицах, что и целевая
функция управления системой.
Какое количество информации содержится, к примеру, в тексте романа
«Война и мир», во фресках Рафаэля или в генетическом коде человека? Ответа на эти
вопросы наука не дает и, по всей вероятности, даст не скоро. А возможно ли объективно
измерить количество информации? Важнейшим результатом в теории информации является
следующий вывод:
16
В определенных, весьма широких условиях можно пренебречь качественными
особенностями информации, выразить ее количество числом, а также сравнить количество
информации, содержащейся в различных группах данных.
В настоящее время получили распространение подходы к определению понятия
«количество информации», основанные на том, что информацию, содержащуюся в сообщении,
можно нестрого трактовать в смысле ее новизны или, иначе, уменьшения неопределенности
наших знаний об объекте. Эти подходы используют математические понятия вероятности и
логарифма.
Информация передается в форме сообщений от некоторого источника информации к ее
приемнику посредством канала связи между ними. Источник посылает передаваемое
сообщение, которое кодируется в передаваемый сигнал. Этот сигнал посылается по каналу
связи. В результате в приемнике появляется принимаемый сигнал, который декодируется и
становится принимаемым сообщением. Передача информации по каналам связи часто
сопровождается воздействием помех, вызывающих искажение и потерю информации.
6. Носители информации. Виды и свойства информации.
Информация всегда связана с материальным носителем. Носитель информации – среда
для записи и хранения информации. Носителем информации может быть любой материальный
предмет (бумага, камень, стена, поверхность дискеты), волны различной природы (акустическая
– звук, электромагнитная – свет, радиоволна, гравитационная – давление, притяжение), особые
состояния вещества (концентрация молекул в жидком растворе, температура и давление газа,
расположение молекул в кристалле процессора и др.).
Способ передачи информации – сигнал.
Информационный сигнал – физический процесс, имеющий для человека или
технического
устройства
информационное
значение.
Он
может
быть
непрерывным
(аналоговым) или дискретным.
Аналоговый сигнал – сигнал, непрерывно изменяющийся по амплитуде и во времени.
Сигнал называется дискретным, если он может принимать лишь конечное число
значений в определенный период времени.
В реальной жизни мы чаще всего воспринимаем непрерывные сигналы. Даже речь
человека по сути представляет собой непрерывный сигнал. В этом легко убедиться, если
вспомнить, что речь на незнакомом языке воспринимается слитно, в ней трудно выделить
отдельные слова. Но легче обрабатывать дискретные сигналы. Благодаря сложившейся с детства
привычке, мы выделяем в сигналах, непрерывно поступающих к нам из внешнего мира,
отдельные элементы: лица и облака, слова и музыкальные фразы.
Важно: аналоговые сигналы всегда могут быть представлены в дискретном виде,
17
например, в виде последовательности чисел. Процесс представления какой-либо величины в
виде последовательного ряда ее отдельных (дискретных) значений называют дискретизацией.
Вычислительная техника может работать как с аналоговыми, так и с дискретными
(цифровыми) сигналами. Соответственно, существуют аналоговые вычислительные машины
(АВМ) и цифровые вычислительные машины (ЦВМ), причем последние получили значительно
большее распространение.
Виды информации:
–
по
способу
восприятия:
визуальная,
аудиальная,
тактильная,
вкусовая,
обонятельная;
–
по общественному значению:
–
личная – это знания, опыт, интуиция, умения, эмоции, наследственная память
конкретного человека;
–
специальная,
значимая
для
определенной
группы
людей:
научная,
производственная, техническая, управленческая;
–
общественная, значимая для большинства членов общества: общественно-
политическая,
научно-популярная
(научно
осмысленный
опыт
всего
человечества,
исторические, культурные и национальные традиции и др.), обыденная (которой мы
обмениваемся в процессе повседневного общения), эстетическая (изобразительное искусство,
скульптура, музыка, театр и др.).
– по сфере применения информации (экономическая, географическая, социологическая и
пр.);
– по характеру источников информации (первичная, вторичная, обобщающая и пр.);
Существует выделение видов информации и по другим основаниям, но в информатике
наиболее важным является разделение информации по форме представления, а именно:
–
текстовая,
–
числовая,
–
графическая,
–
звуковая и их всевозможные комбинации.
Для каждого из видов информации существуют особые методы кодирования,
специальные программные средства (текстовые, графические, звуковые редакторы, электронные
таблицы и т.п.) и специальные устройства (клавиатура для ввода текстовой и числовой
информации, сканер для ввода графики и т.п.).
В настоящее время основной в вычислительной технике становится мультимедийная
(многосредовая, комбинированная) форма представления информации. Цветная графика
сочетается со звуком и текстом, числовые расчеты сопровождаются деловой графикой, текст –
18
движущимися видеоизображением и трехмерными образами.
Информация нам нужна для того, чтобы ориентироваться в окружающей обстановке и
принимать правильные решения. Но любая ли информация помогает нам в этом? Знание
свойств информации может помочь человеку оценить в каждом конкретном случае насколько
решения, принятые на основе имеющейся информации, могут быть верными.
1
Информация объективна, если она не зависит от чьего-либо мнения, суждения.
Объективную информацию можно получить с помощью исправных датчиков, измерительных
приборов. Но, отражаясь в сознании конкретного человека, информация перестает быть
объективной, так как преобразовывается (в большей или меньшей степени) в зависимости от
мнения, суждения, опыта, знания, пристрастий конкретного субъекта.
2 Информация достоверна, если она отражает истинное положение дел.
Недостоверной информация может быть по следующим причинам:
– преднамеренное искажение (дезинформация);
– искажение в результате воздействия помех ("испорченный телефон");
– в случае, когда значение реального факта приуменьшается или преувеличивается
(слухи, "рыбацкие истории", реклама, политические дебаты).
3 Информация полна, если ее достаточно для понимания и принятия решения.
Неполная информация может привести к ошибочному выводу или решению. Не зря
русская пословица гласит: "Недоученный хуже неученого".
Избыток информации может быть также вреден при принятии решения, как и ее
недостаток, поскольку для анализа и обработки дополнительной информации требуется время.
А время для человека – один из самых дефицитных и дорогостоящих "ресурсов" его жизни, не
говоря уже об экстремальных ситуациях, когда от быстроты принятия решения может зависеть
очень многое.
4 Информация актуальна (своевременна), если она важна, существенна для настоящего
времени. Только вовремя полученная информация может принести необходимую пользу.
Неактуальной информация может быть по трем причинам, она может быть:
‒
устаревшей (прошлогодняя газета);
‒
преждевременной (прогноз погоды на лето, данный в январе);
‒
незначимой, ненужной (например, сообщение о том, что в Италии снижены цены на
проезд в транспорте на 5 %).
5 Информация может быть полезной или бесполезной (ценность информации).
Но, так как четкой границы между этими понятиями нет, то следует говорить о степени
полезности применительно к нуждам конкретных людей. Полезность информации оценивается
по тем задачам, которые мы можем решить с ее помощью. Оценка полезности информации
19
всегда субъективна. То, что полезно для одного человека, может быть совершенно бесполезно
для другого.
6 Информация понятна, если она выражена на языке, доступном для получателя.
Социальная информация обладает еще и дополнительными свойствами, а именно:
7 Имеет семантический (смысловой) характер. Как правило, содержание, смысл для
человека важнее, чем форма представления информации.
8 Имеет языковую природу. Одно и то же содержание может быть выражено на разных
естественных (разговорных) либо специальных языках.
9 С течением времени количество информации растет, информация накапливается,
происходит ее систематизация, оценка и обобщение. Это свойство назвали ростом и
кумулированием информации (кумуляция – от латинского cumulatio – увеличение, скопление).
10 Свойство старения информации заключается в уменьшении ее ценности с течением
времени. Старит информацию не само время, а появление новой информации, которая уточняет,
дополняет или отвергает полностью или частично более раннюю информацию. Научнотехническая информация стареет быстрее, эстетическая (произведения искусства) – медленнее.
11 Логичность, компактность, удобная форма представления информации облегчает
понимание и усвоение информации.
Пример. Грамотное, доказательное выступление, когда оратор логично переходит от
одного вопроса (факта, предположения) к другому, воспринимается лучше, чем сумбурная речь.
Использование схем нередко лучше проясняет принцип работы технического устройства, чем
многостраничные описания.
12 При восприятии и понимании текстов человеком важным свойством информации
оказывается ее определенность (однозначность).
Пример. "И вскрикнул внезапно ужаленный князь!" Внезапно вскрикнул или внезапно
ужаленный? "Сережа встретил Свету на поляне с цветами". С цветами был Сережа или с
цветами была Света? А, может быть, цветы росли на поляне?
7. Общая характеристика информационных процессов
Информацию можно:
‒ создавать;
‒ передавать;
‒ воспринимать;
‒ использовать;
‒ запоминать;
‒ принимать;
‒ копировать;
20
‒ формализовать;
‒ распространять;
‒ преобразовывать;
‒ комбинировать;
‒ обрабатывать;
‒ делить на части;
‒ упрощать;
‒ собирать;
‒ хранить;
‒ искать;
‒ измерять;
‒ разрушать;
‒ и др.
Все эти процессы, связанные с определенными операциями над информацией,
называются информационными процессами.
Обработка информации – получение одних информационных объектов из других
информационных объектов путем выполнения некоторых алгоритмов. Обработка является
одной из основных операций, выполняемых над информацией, и главным средством увеличения
объема и разнообразия информации.
Средства обработки информации – это всевозможные устройства и системы, созданные
человечеством, и в первую очередь, компьютер – универсальная машина для обработки
информации.
Компьютеры обрабатывают информацию путем выполнения некоторых алгоритмов.
Живые организмы и растения обрабатывают информацию с помощью своих органов и систем.
Информационный процесс (ИП) определяется как совокупность последовательных
действий (операций), производимых над информацией (в виде данных, сведений, фактов, идей,
гипотез, теорий и пр.), для получения какого-либо результата (достижения цели).
Информационные
процессы
могут
быть
целенаправленными
или
стихийными,
организованными или хаотичными, детерминированными или вероятностными, но какую бы мы
не рассматривали систему, в ней всегда присутствуют информационные процессы, и какой бы
информационный процесс мы не рассматривали, он всегда реализуется в рамках какой-либо
системы – биологической, социальной, технической, социотехнической. В зависимости от того,
какого рода информация является предметом информационного процесса и кто является его
субъектом (техническое устройство, человек, коллектив, общество в целом), можно говорить о
глобальных информационных процессах, или макропроцесссах и локальных информационных
21
процессах, или микропроцессах. Так, процесс познания, распространение информации
посредством СМИ, информационные войны, организация архивного хранения информации –
это глобальные ИП, а посимвольное сравнение данных, двоичное кодирование текста, запись
порции информации на носитель – локальные ИП.
Наиболее обобщенными информационными процессами являются три процесса: сбор,
преобразование, использование информации. Каждый из этих процессов распадается, в свою
очередь, на ряд процессов, причем некоторые из них являются общими, т.е. могут входить в
каждый из выделенных "укрупненных" процессов (рисунок 2).
Рисунок 2 Схема взаимосвязи информационных процессов.
Человек всегда стремится автоматизировать выполнение рутинных операций и операций,
требующих постоянного внимания и точности. То же справедливо и по отношению к
информационным процессам.
Универсальными средствами для автоматизированного выполнения информационных
процессов в настоящее время являются: компьютер, вычислительные системы и сети.
СБОР ИНФОРМАЦИИ
Поиск информации – один из важных информационных процессов. От того, как он
организован, во многом зависит своевременность и качество принимаемых решений.
В широком плане является основой познавательной деятельности человека во всех ее
проявлениях: в удовлетворении любопытства, путешествиях, научной работе, чтении и т.п. В
более узком смысле означает систематические процедуры поиска в организованных
хранилищах информации: библиотеках, справочниках, картотеках, электронных каталогах,
базах данных.
Методы поиска информации можно разделить на те, которые осуществляются самим
человеком,
и
осуществляемые
непосредственное
наблюдение,
техническими
общение
со
устройствами.
специалистами,
К
первым
чтение
относятся:
соответствующей
литературы, просмотр телепрограмм, прослушивание радиопередач, аудиокассет, работа в
22
библиотеках, архивах, обращение с запросом к информационным системам, базам и банкам
данных.
Поиск информации, осуществляемый компьютерными программами, всегда идет в
соответствии с некоторым запросом. Им может быть набор ключевых слов при поиске
информации в Интернет, шаблон имени файла при поиске нужного файла на диске, значения
некоторых реквизитов при поиске документов в справочно-правовых системах и т.п. Среди
основных методов поиска можно выделить: посимвольное (побитное) сравнение на совпадение,
сравнение основы слов (без учета суффиксов, окончаний, порядка слов), расширенный поиск с
использованием словаря синонимов, контекстный поиск.
Применение разнообразных методов поиска поможет собрать более полную информацию
и повысит вероятность принятия правильного решения.
В процессе поиска может встретиться самая разная информация. Любую информацию
человек привык оценивать по степени ее полезности, актуальности и достоверности.
Оценивание явно или неявно ведется в соответствии с некоторыми заранее определенными
критериями отбора.
В процессе отбора информации она может проходить процедуры
сравнения,
регистрации, измерения величин и их представления, оценки свойств в соответствии с
заданными критериями и др. После оценки одни из полученных сведений могут быть
отброшены как ненужные, другие, наоборот, оставлены на долгое хранение, т.е. процесс поиска
информации практически всегда сопровождается ее отбором. Вместе это называют процессом
сбора информации.
Сбор информации всегда осуществляется с определенной целью, которая во многом
определяет выбор методов поиска и критериев отбора найденной информации.
КОДИРОВАНИЕ ИНФОРМАЦИИ
Информационный процесс кодирования информации встречается в нашей жизни на
каждом шагу. Любое общение между людьми происходит именно благодаря тому, что они
научились выражать свои образы, чувства и эмоции с помощью специально предназначенных
для этого знаков – звуков, жестов, букв и пр.
Одно и то же сообщение можно закодировать разными способами, т.е. выразить на
разных языках. В процессе развития человеческого общества люди выработали большое число
языков кодирования. К ним относятся:
• разговорные языки (русский, английский, хинди и другие, всего около 5000);
• язык мимики и жестов;
• язык рисунков и чертежей;
• языки науки (язык математики, химии и т.д.);
23
• язык искусства (музыки, живописи, скульптуры);
• специальные языки (эсперанто, морской семафор, азбука Морзе, азбука Брайля для
слепых и т.д.)
В специальных языках особо выделим языки программирования. Программирование –
кодирование информации на языке, "понятном" компьютеру. В вычислительной технике
кодирование используется при хранении, передаче информации, представлении ее на носителе.
Кодирование информации можно рассматривать как один из способов ее обработки
(преобразования).
Дадим определения основных понятий.
Кодированием называется процесс преобразования одного набора знаков в другой
набор знаков.
Кодом называется правило для преобразования одного набора знаков в другой
набор знаков.
Знак – это элемент конечного множества отличных друг от друга элементов, с помощью
которых кодируется сообщение.
Набор знаков, в котором определен порядок их следования, называется алфавитом.
Алфавит, состоящий из двух знаков, называется двоичным алфавитом.
В вычислительной технике в настоящее время широко используется двоичное
кодирование с алфавитом {0,1} (рисунок 3). Наиболее распространенными кодами являются
ASCII (American standart code for information interchange – американский стандартный код для
обмена информацией), ДКОИ-8 (двоичный код обмена информации), Win1251 или СР1251 (code
page), Unicode.
24
Рисунок 3 Пример универсального кодирования с помощью алфавита {0,1}.
Длиной кода называется то количество знаков кодирующего алфавита, которое
используется при кодировании одного знака кодируемого сообщения.
Код может быть постоянной и переменной длины.
В естественных языках используются в основном коды переменой длины (слова русского
языка бывают длиной в 1, 2, 3 и т.д. букв); в технике чаще используются коды постоянной
длины. Так длина кода ASCII 8 бит или 1 байт, длина кода Unicode 16 бит или 2 байта.
Если длина кода равняется n, то алфавитом, состоящим из k знаков, можно закодировать
М = kn различных состояний.
С помощью двоичного алфавита (k = 2) в ASCII (n = 8) таблица кодировки включает 2 8 =
256 символов, в Unicode (n = 16) таблица кодировки включает 216 = 65536 символов.
Чтобы закодировать М различных состояний с постоянной длиной кода, используя
алфавит из k знаков, длина кода должна быть не менее n = [ log k M +1].
ХРАНЕНИЕ ИНФОРМАЦИИ
Хранение информации – процесс такой же древний, как и жизнь человеческой
цивилизации. Он имеет огромное значение для обеспечения поступательного развития
человеческого общества (да и любой системы), многократного использования информации,
передачи накапливаемого знания последующим поколениям.
Уже в древности человек столкнулся с необходимостью хранения информации.
Примерами тому служат зарубки на деревьях, чтобы не заблудиться во время охоты; счет
предметов с помощью камешков, узелков; изображение животных и эпизодов охоты на стенах
пещер. Человеческое общество способно бережно хранить информацию и передавать ее от
поколения к поколению. На протяжении всей истории знания и жизненный опыт отдельных
людей накапливаются. По современным представлениям, чем больше информации накоплено и
используется в обществе, тем выше уровень его развития. Накопление информации является
основой развития общества. Когда объем накапливаемой информации возрастает настолько, что
ее становится просто невозможно хранить в памяти, человек начинает прибегать к помощи
различного рода вспомогательных средств
С
рождением
письменности
возникло
специальное
средство
фиксирования
и
распространения мысли в пространстве и во времени. Родилась документированная информация
– рукописи и рукописные книги, появились своеобразные информационно-накопительные
центры – древние библиотеки и архивы. Постепенно письменный документ стал и орудием
управления (указы, приказы, законы).
Следующим информационным скачком явилось книгопечатание.
С его возникновением наибольший объем информации стал храниться в различных
25
печатных изданиях, и для ее получения человек обращается в места их хранения (библиотеки,
архивы и пр.).
В
настоящее
время
мы
являемся
свидетелями
быстрого
развития
новых
–
автоматизированных – методов хранения информации с помощью электронных средств.
Компьютер и средства телекоммуникации предназначены для компактного хранения
информации с возможностью быстрого доступа к ней.
Информация, предназначенная для хранения и передачи, как правило, представлена в
форме документа. Под документом понимается объект на любом материальном носителе, где
имеется информация, предназначенная для распространения в пространстве и времени (от лат.
dokumentum – свидетельство. Первоначально это слово обозначало письменное подтверждение
правовых отношений и событий). Основное назначение документа заключается в использовании
его в качестве источника ин- формации при решении различных проблем обучения, управления,
науки, техники, производства, социальных отношений.
Одной из процедур хранения информации является ее накопление. Оно может быть
пассивным и активным.
При пассивном накоплении поступающая информация просто "складируется", при этом
принимаются меры для обеспечения ее сохранности и повторного обращения к ней
(считывания).
Например,
запись
звуковой
информации
на
магнитофонную
ленту;
стенографирование выступления; размещение документов в архиве.
При
активном
накоплении
происходит
определенная
обработка
поступающей
информации, имеющая много градаций, но в целом направленная на обогащение знания
получателя информации. Например, систематизация и обобщение документов, поступивших на
хранение, перевод содержания документов в другую форму, перенесение документов на другие
носители совместно с процедурами сжатия данных, обеспечения защитными кодами и т.п.
Важно помнить, что хранение очень больших объемов информации оправдано только
при условии, если поиск нужной информации можно осуществить достаточно быстро, а
сведения получить в доступной форме. Иными словами, информация хранится только для того,
чтобы впоследствии ее можно было легко отыскать, а возможность поиска закладывается при
определении способа хранения информации и доступа к ней. Таким образом, первый вопрос, на
который необходимо ответить при организации любого хранилища информации – как ее потом
там искать.
Информационно-поисковая система (ИПС) – это хранилище информации, снабженное
процедурами ввода, поиска, размещения и выдачи информации. Наличие таких процедур –
главная особенность информационных систем, отличающая их от простых скоплений
информационных материалов.
26
Например, личная библиотека, в которой может ориентироваться только ее владелец,
информационной системой не является. В публичных же библиотеках порядок размещения книг
всегда строго определенный. Благодаря ему поиск и выдача книг, а также размещение новых
поступлений представляет собой стандартные, формализованные процедуры. То же самое
справедливо и для компьютерных ИПС.
Все хранимые в ИПС документы индексируются каким-либо образом. Каждому
документу
(статье,
протоколу,
видеокассете)
присваивается
индивидуальный
код,
составляющий поисковый образ документа. Поиск в хранилищах идет не по самим документам,
а по их поисковым образам, которые могут включать в себя:
• название документа;
• время и место создания;
• фамилии авторов или название организации, создавшей документ;
• тематические разделы, к которым можно отнести документ по его содержанию;
• информацию о местонахождении документа в хранилище и многое другое.
Например, файловая система компьютера – это тоже информационно-поисковая система.
Поисковый образ файла включает в себя полное имя файла (имя дисковода, имена каталогов и
подкаталогов, собственное имя файла, расширение), дату и время создания, размер файла, его
атрибуты.
ПЕРЕДАЧА ИНФОРМАЦИИ
Хранение информации необходимо для распространения ее во времени, а ее
распространение в пространстве происходит в процессе передачи информации. Практически
любая деятельность людей связана с общением, а общение невозможно без передачи
информации.
В процессе передачи информации обязательно участвуют источник и получатель
информации: первый передает информацию, второй ее принимает. Между ними действует канал
передачи информации – канал связи (рисунок 5). Передача информации возможна с помощью
любого языка кодирования информации, понятного как источнику, так и получателю.
Рисунок 5 Процесс передачи информации.
Передача информации – это реальный физический процесс, протекающий в среде,
разделяющей источник и получатель. Передаваемая информация обладает определенным
27
строением, которое чаще всего выглядит как последовательность сигналов, каждый из которых
переносит элементарную порцию информации. В теории связи эта последовательность сигналов
называется сообщением.
В процессе передачи информация может теряться и искажаться: искажение звука в
телефоне, атмосферные помехи в радио, искажение или затемнение изображения в телевидении,
ошибки при передаче по телеграфу. Эти помехи, или, как их называют специалисты, шумы,
изменяют сообщение. Поэтому при организации автоматизированной передачи сообщений
необходимо особо заботиться об обеспечении защиты от помех, о проверке соответствия
полученного сообщения переданному.
В теории информации установлена связь между способом кодирования передаваемых
сообщений, скоростью их передачи по каналам связи и вероятностью искажения передаваемой
информации. Еще в сороковых годах ХХ в. К. Шеннон доказал, что при любых помехах и
шумах можно обеспечить передачу информации без потерь.
ОБРАБОТКА ИНФОРМАЦИИ
Человек выделяет в информации по крайней мере три компонента: смысл (семантика);
оформление (синтаксис); личностная значимость (оценка, прагматика). Иными словами в любом
сообщении можно выделить содержание, форму и наше отношение к сообщению.
Обработка
(преобразование)
информации
—
это
процесс
изменения
формы
представления информации или ее содержания.
Как
правило,
обработка
информации
–
это закономерный,
целенаправленный,
планомерный процесс. Всегда существует цель обработки.
Процессы изменения формы представления информации часто сводятся к процессам ее
кодирования и декодирования и проходят одновременно с процессами сбора и передачи
информации.
Примеры изменения формы информации в результате обработки:
• специальное оборудование на метеостанции преобразует сигналы, полученные от
метеозондов, в графики;
•
данные
анкет,
полученные
в
результате
психологических
исследований,
представляются в виде диаграмм;
• при сканировании рисунок преобразуется в последовательность двоичных цифр.
Процесс изменения содержания информации включает в себя такие процедуры, как
численные расчеты, редактирование, упорядочивание, обобщение, систематизация и т.д.
Примеры изменения содержания информации в результате обработки:
• результатом обработки данных нескольких метеостанций выступает прогноз погоды;
•
анализ
данных
психологических
исследований
позволяет
дать
обобщенную
28
психологическую характеристику группы "испытуемых" и рекомендации по улучшению
психологического климата в этой группе;
•
отсканированный
текст
первоначально
представляется
в
виде
рисунка
(в
соответствующем двоичном представлении). После его обработки программой оптического
распознавания символов он преобразуется в "текстовые" коды.
Обрабатывать можно информацию любого вида и правила обработки могут быть самыми
разнообразными. Общая схема преобразования информации приведена на рисунке 6.
Рисунок 6 Процесс преобразования информации.
Нам не всегда известно, как, по каким правилам входная информация преобразовывается
в выходную. Систему, в которых наблюдателю доступны лишь входные и выходные величины,
а структура и внутренние процессы неизвестны, называют черным ящиком (рисунок 7).
Рисунок 7 Схема преобразования информации по принципу "черного ящика"
Не будет преувеличением сказать, что любой познаваемый объект всегда первоначально
выступает для наблюдателя как "черный ящик".
Но чаще всего без знания правил преобразования невозможно достичь цели, ради
которой информация и обрабатывается. Если эти правила строго формализованы и имеется
алгоритм их реализации, то можно построить устройство для автоматизированной обработки
информации. Таким устройством в вычислительной технике является процессор (рисунок 8).
Рисунок 8 Схема обработки информации.
Обработка информации всегда происходит в некоторой внешней среде (обстановке),
являющейся источником входной информации и потребителем выходной информации.
Непосредственная переработка входной информации в выходную осуществляется процессором.
При этом предполагается, что процессор располагает памятью.
Замечание. Обработка информации в общем случае приводит и к изменению состояния
самого процессора.
29
Процесс обработки информации в рамках данной схемы чаще всего сводится к
следующим процедурам:
• вычисление процессором значений выходных параметров как некоторой функции
входных;
• накопление информации, т.е. изменение состояния памяти под воздействием входной
информации;
• реализация причинной связи между входом и выходом процессора;
• взаимодействие процессора со средой, реакция на изменения обстановки;
• управление поведением всей системы в целом.
Обработка информации – это процесс, происходящий во времени.
В ряде случаев он должен подчиняться заданному темпу поступления входной
информации и допустимому пределу задержки в выработке информации на выходе. В этом
случае говорят об обработке информации в реальном масштабе времени. Примером является
управление работой машин и устройств, в том числе компьютера.
В других случаях
время рассматривается как
дискретная цепочка мгновенно
происходящих событий. При этом важна лишь их последовательность, а не значение
разделяющих события временных промежутков. Такой подход применяется обычно при
обработке информации в моделировании.
Наиболее простой формой обработки информации является последовательная обработка,
производимая одним процессором, в котором в любой момент времени происходит не более
одного события. При наличии в системе нескольких процессоров, работающих одновременно,
говорят о параллельной обработке информации.
Обработка информации является центральной процедурой в управлении любой системой.
Трактовка управления системой как процесса обработки информации является одним из
основных принципов кибернетики.
Вычислительная техника в основном предназначена для автоматизированной обработки
информации различного вида. К ней относятся: обработка запросов к базам данных,
перекодирование информации, численные расчеты по формулам, аранжировка музыкальных
произведений, синтез новых звуков, монтаж анимационных роликов и многое другое.
8. Информационные технологии и ресурсы
Информационные ресурсы – это идеи человечества и указания по их реализации,
накопленные в форме, позволяющей их воспроизводство.
Это книги, статьи, патенты, диссертации, научно-исследовательская и опытноконструкторская документация, технические переводы, данные о передовом производственном
опыте и др.
30
Информационные ресурсы (в отличие от всех других видов ресурсов – трудовых,
энергетических, минеральных и т.д.) тем быстрее растут, чем больше их расходуют.
Информационная технология – это процесс, использующий совокупность средств и
методов сбора, обработки и передачи данных для получения информации нового качества о
состоянии объекта, процесса или явления.
Цель информационной технологии – производство информации для ее анализа
человеком и принятия на его основе решения по выполнению какого-либо действия.
Человечество занималось обработкой информации тысячи лет. Первые информационные
технологии основывались на использовании счетов и письменности. Около пятидесяти лет
назад началось исключительно быстрое развитие этих технологий, что в первую очередь
связано с появлением компьютеров.
Внедрение персонального компьютера в информационную сферу и применение
телекоммуникационных средств связи определили новый этап развития информационной
технологии. Новая информационная технология – это информационная технология с
«дружественным»
интерфейсом
работы
пользователя,
использующая
персональные
компьютеры и телекоммуникационные средства. Новая информационная технология базируется
на следующих основных принципах:
‒
интерактивный (диалоговый) режим работы с компьютером;
‒
интегрированность с другими программными продуктами;
‒
гибкость процесса изменения данных и постановок задач.
В
качестве
инструментария
информационной
технологии
используются
распространенные виды программных продуктов: текстовые процессоры, издательские
системы, электронные таблицы, системы управления базами данных, электронные календари,
информационные системы функционального назначения.
К основным видам информационных технологий относятся следующие.
1. Информационная технология обработки данных предназначена для решения
хорошо структурированных задач, алгоритмы решения которых хорошо известны и для
решения которых имеются все необходимые входные данные. Эта технология применяется на
уровне
исполнительской
деятельности
персонала
невысокой
квалификации
в
целях
автоматизации некоторых рутинных, постоянно повторяющихся операций управленческого
труда.
2. Информационная технология управления предназначена для информационного
обслуживания всех работников предприятий, связанных с принятием управленческих решений.
Здесь информация обычно представляется в виде регулярных или специальных управленческих
отчетов и содержит сведения о прошлом, настоящем и возможном будущем предприятия.
31
3. Информационная технология автоматизированного офиса призвана дополнить
существующую систему связи персонала предприятия. Автоматизация офиса предполагает
организацию и поддержку коммуникационных процессов как внутри фирмы, так и с внешней
средой на базе компьютерных сетей и других современных средств передачи и работы с
информацией.
4. Информационная технология поддержки принятия решений предназначена для
выработки управленческого решения, происходящей в результате итерационного процесса, в
котором участвуют система поддержки принятия решений (вычислительное звено, задающее
входные данные и оценивающее полученный результат).
5. Информационная технология экспертных систем основана на использовании
искусственного интеллекта. Экспертные системы дают возможность менеджерам получать
консультации экспертов по любым проблемам, о которых в этих системах накоплены знания.
В настоящее время термин «информационная технология» употребляется в связи с
использованием компьютеров для обработки информации. Информационные технологии
охватывают всю вычислительную технику и технику связи и, отчасти, – бытовую электронику,
телевидение и радиовещание.
Они находят применение в промышленности, торговле, управлении, банковской системе,
образовании, здравоохранении, медицине и науке, транспорте и связи, сельском хозяйстве,
системе социального обеспечения, служат подспорьем людям различных профессий и
домохозяйкам.
Народы развитых стран осознают, что совершенствование информационных технологий
представляет самую важную, хотя дорогостоящую и трудную задачу. В настоящее время
создание крупномасштабных информационно- технологических систем является экономически
возможным,
и
это
обусловливает
появление
национальных
исследовательских
и
образовательных программ, призванных стимулировать их разработку.
9. Информационные системы
Информационная система – это взаимосвязанная совокупность средств, методов и
персонала, используемых для хранения, обработки и выдачи информации для достижения цели
управления. В современных условиях основным техническим средством обработки информации
является персональный компьютер. Большинство современных информационных систем
преобразуют не информацию, а данные. Поэтому часто их называют системами обработки
данных.
По степени механизации, процедур преобразования информации, системы обработки
данных делятся на системы ручной обработки, механизированные, автоматизированные и
32
системы автоматической обработки данных.
Важнейшими принципами построения эффективных информационных систем является
следующее.
Принцип интеграции, заключающийся в том, что обрабатываемые данные, однажды
введенные в систему, многократно используются для решения большого числа задач.
Принцип системности, заключающийся в обработке данных в различных на всех
уровнях управления.
Принцип комплексности, заключающийся в механизации и автоматизации процедур
преобразования данных на всех этапах функционирования информационной системы.
Информационные системы также классифицируются:
по функциональному назначению:
‒ производственные,
‒ коммерческие,
‒ финансовые,
‒ маркетинговые и др.,
по объектам управления:
‒ информационные системы автоматизированного проектирования,
‒ управления технологическими процессами,
‒ управления предприятием (офисом, фирмой, корпорацией, организацией) и т.п.,
по характеру использования результатной информацией:
‒ информационно-поисковые, предназначенные для сбора, хранения и выдачи
информации по запросу пользователя;
‒ информационно-советующие,
предлагающие
пользователю
определенные
рекомендации для принятия решений (системы поддержки принятия решений);
‒ информационно-управляющие,
результатная
информация
которых
непосредственно участвуют в формировании управляющих воздействий.
Структуру информационных систем составляет совокупность отдельных ее частей,
называемых подсистемами.
Функциональные подсистемы реализуют и поддерживают модели, методы и
алгоритмы получения управляющей информации. Состав функциональных подсистем весьма
разнообразен и зависит от предметной области использования информационной системы,
специфически хозяйственной деятельности объекта управления.
В состав обеспечивающих подсистем обычно входят:
1) информационное обеспечение – методы и средства построения информационной
базы
системы,
включающее
системы
классификации
и
кодирования
информации,
33
унифицированные системы документов, схемы информационных потоков, принципы и методы
создания баз данных;
2) техническое обеспечение – комплекс технических средств, задействованных в
технологическом процессе преобразования информации в системе. В первую очередь это
вычислительные машины, периферий- новое оборудование, аппаратура и каналы передачи
данных;
3) программное обеспечение включает в себя совокупность программ регулярного
применения, необходимых для решения функциональных задач, и программ, позволяющих
наиболее эффективно использовать вычислительную технику, обеспечивая пользователям
наибольшие удобства в работе;
4) математическое обеспечение – совокупность математических методов, моделей и
алгоритмов обработки информации, используемых в системе;
5) лингвистическое обеспечение – совокупность языковых средств, используемых в
системе с целью повышения качества ее разработки и облегчения общения человека с машиной.
Организационные подсистемы по существу относятся также к обеспечивающим
подсистемам, но направлены в первую очередь на обеспечение эффективной работы персонала,
и поэтому они могут быть выделены отдельно. К ним относятся:
1) кадровое обеспечение – состав специалистов, участвующих в создании и работе
системы, штатное расписание и функциональные обязанности;
2) эргономическое обеспечение – совокупность методов и средств, используемых при
разработке и функционировании информационной системы, создающих оптимальные условия
для деятельности персонала, для быстрейшего освоения системы;
3) правовое обеспечение – совокупность правовых норм, регламентирующих создание и
функционирование
информационной
системы,
порядок
получения,
преобразования
и
использования информации;
4) организационное обеспечение – комплекс решений, регламентирующих процессы
создания и функционирования как системы в целом, так и ее персонала.
10. Информатизация общества и автоматизация офиса.
Информатизация общества – организованный социально-экономический и научнотехнический
процесс
создания
оптимальных
условий
для
удовлетворения
информационных потребностей и реализации прав граждан, органов государственной власти,
органов местного самоуправления организаций, общественных объединений на основе
формирования и использования информационных ресурсов.
Цель информатизации – улучшение качества жизни людей за счет увеличения
производительности и облегчения условий их труда.
34
Информатизация – это сложный социальный процесс, связанный со значительными
изменениями в образе жизни населения. Он требует серьезных усилий на многих направлениях,
включая ликвидацию компьютерной неграмотности, формирование культуры использования
новых информационных технологий и др.
В настоящее время существует множество программных продуктов, обеспечивающих
информационные технологии автоматизации офиса. К ним относятся тестовые процессоры,
табличные процессоры, система управления базами данных, электронная почта, электронный
календарь, компьютерные конференции, видеотекст, а также специализированные программы
управленческой деятельности: ведение документов, контроль исполнения приказов и т.д.
Текстовые
процессоры
предназначены
для
создания
и
обработки
текстовых
документов. Подготовленные текстовые документы могут быть распечатаны, а также переданы
по компьютерной сети. Таким образом, в распоряжении менеджера оказывается эффективный
вид письменной коммуникации.
Табличные процессоры позволяют выполнять многочисленные операции над данными,
представленными в табличной форме. Пользователь имеет возможность вводить табличные
данные, обрабатывать их, проводить необходимые вычисления, автоматически формировать
итоги, выводить информацию в печатном виде и в виде импортируемых в другие системы
файлов, качественно оформлять табличные данные, в том числе в виде графиков и диаграмм,
проводить инженерные, финансовые, статистические расчеты, проводить математическое
моделирование и т.д.
Системы управления базами данных предназначены для создания и поддержания в
актуальном состоянии баз данных, содержащих различные сведения о системе управления и
производственной деятельности фирмы.
Электронная почта позволяет пользователю получать, хранить и отправлять сообщения
своим партнерам по сети. Возможности, предоставляемые пользователю электронной почтой,
различны, и зависят от применяемого программного обеспечения.
Электронный календарь предоставляет средства для хранения и управления рабочим
расписанием менеджеров и других работников предприятия. Система позволяет установить
дату, время и место встречи или другого мероприятия, согласовав их с расписанием всех
участвующих в нем менеджеров.
Компьютерные конференции используют компьютерные телекоммуникационные сети
для обмена информацией между участниками группы, решающей определенную задачу.
Видеотекст основан на использовании компьютера для получения отображений
текстовых и графических данных на экране монитора. В настоящее время более широкое
распространение получает обмен между компаниями каталогами и прайс-листами, а также заказ
35
газет, журналов и другой печатной продукции в форме видеотекста.
11. Понятие данных. Носители данных. Операции с данными.
Данными называется информация, представленная в удобном для обработки виде.
Данные могут быть представлены в виде текста, чисел, графики, аудио-визуального ряда.
Данные — диалектическая составная часть информации. Они представляют собой
зарегистрированные сигналы. При этом физический метод регистрации может быть любым:
механическое перемещение физических тел, изменение их формы или параметров качества
поверхности, изменение электрических, магнитных, оптических характеристик, химического
состава и (или) характера химических связей, изменения состояния электронной системы и
многое другое. В соответствии с методом регистрации данные могут храниться и
транспортироваться на носителях различных видов.
Самым распространенным носителем данных, хотя и не самым экономичным, повидимому, является бумага. На бумаге данные регистрируются путем изменения оптических
характеристик ее поверхности. Изменение оптических свойств (изменение коэффициента
отражения поверхности в определенном диапазоне длин волн) используется также в
устройствах, осуществляющих запись лазерным лучом на пластмассовых носителях с
отражающим покрытием (СD-RОМ). В качестве носителей, иcпользующих изменение
магнитных свойств, можно назвать магнитные ленты и диски.
Регистрация данных путем изменения химического состава поверхностных веществ
носителя широко используется в фотографии. На биохимическом уровне происходит
накопление и передача данных в живой природе.
Носители данных интересуют нас не сами по себе, а постольку, поскольку свойства
информации весьма тесно связаны со свойствами ее носителей. Любой носитель можно
характеризовать параметром разрешающей способности (количеством данных, записанных в
принятой для носителя единице измерения) и динамическим диапазоном (логарифмическим
отношением интенсивности амплитуд максимального и минимального регистрируемого
сигналов). От этих свойств носителя нередко зависят такие свойства информации, как полнота,
доступность и достоверность. Например, мы можем рассчитывать на то, что в базе данных,
размещаемой на компакт-диске, проще обеспечить полноту информации, чем в аналогичной по
назначению базе данных, размещенной на гибком магнитном диске, поскольку в первом случае
плотность записи данных на единице длины дорожки намного выше. Для обычного потребителя
доступность информации в книге заметно выше, чем той же информации на компакт-диске,
поскольку не все потребители обладают необходимым оборудованием. И наконец, известно, что
визуальный эффект от просмотра слайда в проекторе намного больше, чем от просмотра
аналогичной иллюстрации, напечатанной на бумаге, поскольку диапазон яркостных сигналов в
36
проходящем свете на два-три порядка больше, чем в отраженном.
Задача преобразования данных с целью смены носителя относится к одной из важнейших
задач информатики. В структуре стоимости вычислительных систем устройства для ввода и
вывода данных, работающие с носителями информации, составляют до половины стоимости
аппаратных средств.
В ходе информационного процесса данные преобразуются из одного вида и другой с
помощью различных методов. Обработка данных включает в себя множество различных
операций. По мере развития научно-технического прогресса и общего усложнения связей в
человеческом обществе трудозатраты на обработку данных неуклонно возрастают. Прежде
всего это связано с постоянным усложнением условий управления производством и обществом.
Второй фактор, также вызывающий общее увеличение объемов обрабатываемых данных, тоже
связан с научно-техническим прогрессом, а именно с быстрыми темпами появления и внедрения
новых носителей данных, средств их хранения и доставки.
И структуре возможных операций с данными можно выделить следующие основные:
‒
сбор данных — накопление информации с целью обеспечения достаточной
полноты для принятия решений;
‒
формализация данных — приведение данных, поступающих из разных источников,
к одинаковой форме, чтобы сделать их сопоставимыми между собой, то есть повысить их
уровень доступности;
‒
фильтрация
данных
—
отсеивание
«лишних»
данных,
в
которых
нет
необходимости для принятия решений; при этом должен уменьшаться уровень «шума», а
достоверность и адекватность данных должны возрастать;
‒
сортировка данных — упорядочение данных по заданному признаку с целью
удобства использования; повышает доступность информации;
‒
архивация данных — организация хранения данных в удобной и легкодоступной
форме; служит для снижения экономических затрат по хранению данных и повышает общую
надежность информационного процесса в целом;
‒
защита данных — комплекс мер, направленных на предотвращение утраты,
воспроизведения и модификации данных;
‒
транспортировка данных — прием и передача (доставка и поставка) данных между
удаленными участниками информационного процесса; при этом источник данных в
информатике принято называть сервером, а потребителя — клиентом;
‒
преобразование данных — перевод данных из одной формы в другую или из одной
структуры в другую. Преобразование данных часто связано с изменением типа носителя:
например книги можно хранить в обычной бумажной форме, но можно использовать для этого
37
и электронную форму, и микрофотопленку. Необходимость в многократном преобразовании
данных возникает также при их транспортировке, особенно если она осуществляется
средствами, не предназначенными для транспортировки данного вида данных. В качестве
примера можно упомянуть, что для транспортировки цифровых потоков данных по каналам
телефонных сетей (которые изначально были ориентированы только на передачу аналоговых
сигналов в узком диапазоне частот) необходимо преобразование цифровых данных в некое
подобие звуковых сигналов, чем и занимаются специальные устройства — телефонные модемы.
Приведенный здесь список типовых операций с данными далеко не полон. Миллионы
людей во всем мире занимаются созданием, обработкой, преобразованием и транспортировкой
данных, и на каждом рабочем месте выполняются свои специфические операции, необходимые
для управления социальными, экономическими, промышленными, научными и культурными
процессами. Полный список возможных операций составить невозможно, да и не нужно. Сейчас
нам важен другой вывод работа с информацией может иметь огромную трудоемкость и ее надо
автоматизировать.
12. Кодирование данных двоичным кодом. Кодирование целых и действительных
чисел.
Для автоматизации работы с данными, относящимися к различным типам, очень важно
унифицировать их форму представления — для этого обычно используется прием кодирования,
то есть выражение данных одного типа через данные другого типа. Естественные
человеческие языки — это не что иное, как системы кодирования понятий для выражения мыслей
посредством речи. К языкам близко примыкают азбуки (системы кодирования компонентов языка
с помощью графических символов). История знает интересные, хотя и безуспешные попытки
создания «универсальных» языков и азбук. По-видимому, безуспешность попыток их внедрения
связана с тем, что национальные и социальные образования естественным образом понимают, что
изменение системы кодирования общественных данных непременно приводит к изменению
общественных методов (то есть норм права и морали), а это может быть связано с социальными
потрясениями.
Та же проблема универсального средства кодирования достаточно успешно реализуется в
отдельных отраслях техники, науки и культуры. В качестве примеров можно принести систему
записи математических выражений, телеграфную азбуку, морскую флажковую азбуку, систему
Брайля для слепых и многое другое.
Своя система существует и в вычислительной технике — она называется двоичным
кодированием и основана на представлении данных последовательностью всего двух знаков: 0 и
1. Эти знаки называются двоичными цифрами, по английски — binary digit или, сокращенно, bit
(бит).
38
.._. ___ __ .__. .._
— .
...
Код Морзе
Код морской сигнальный
Рисунок 10. Примеры различных систем кодирования.
Одним битом могут быть выражены два понятия: 0 или 1 (да или нет, черное или белое,
истина или ложь и т. п.). Если количество битов увеличить до двух, то уже молено выразить
четыре различных понятия:
00 01 10 11
Тремя битами можно закодировать восемь различных значений: 000 001 010 011 100
101 110 111
Увеличивая на единицу количество разрядов в системе двоичного кодирования, мы
увеличиваем в два раза количество значений, которое может быть выражено м данной системе, то
есть общая формула имеет вид:
N=2m, где:
N — количество независимых кодируемых значений;
m — разрядность двоичного кодирования, принятая в данной системе.
Целые числа кодируются двоичным кодом достаточно просто — достаточно взять целое
число и делить его пополам до тех пор, пока в остатке не образуется ноль или единица.
Совокупность остатков от каждого деления, записанная справа налево вместе с последним
остатком, и образует двоичный аналог десятичного числа.
19:2 = 9+1
9:2 = 4+1
4:2 = 2 + 0
2:2 = 1
Таким образом, 1910= 10112.
Для кодирования целых чисел от 0 до 255 достаточно иметь 8 разрядов двоичного кода (8
бит). Шестнадцать бит позволяют закодировать целые числа от 0 до 65535, а 24 бита — уже более
16,5 миллионов разных значений.
Для кодирования действительных чисел используют 80-разрядное кодирование. При этом
число предварительно преобразуется в нормализованную форму:
3,1415926 = 0,31415926 • 101
300 000 = 0,3 • 106
123 456 789 = 0,123456789 • 1010
39
Первая часть числа называется мантиссой, а вторая — характеристикой. Большую часть из
80 бит отводят для хранения мантиссы (вместе со знаком) и некоторое фиксированное количество
разрядов отводят для хранения характеристики (тоже со знаком).
13. Кодирование текстовых данных.
Под текстом понимается последовательность знаков, входящих в некоторое
множество (алфавит) и обладающих в этом множестве определенным смыслом, т.е. каждый
знак рассматривается в таком контексте как символ.
Если первоначально компьютеры были предназначены для проведения всевозможных
расчетов ("вычислительные машины"), т.е. выполнения операций над числами, то в настоящее
время значительная доля компьютерных ресурсов тратится именно на ввод, хранение, передачу и
обработку текстов.
Какие же операции можно производить над текстом, ли он уже находится в памяти
компьютера? Прежде всего, поиск заданной последовательности символов и замена на другую
последовательность символов, упорядочивание символов (заметим, что добавление, замена,
удаление, копирование и тому подобные операции относятся в равной мере к обработке данных
всех типов). И поиск, и упорядочивание сводятся к выполнению операции сравнения символов.
При сравнении символов наиболее важными аспектами являются уникальность кода для каждого
символа и длина этого кода, а сам выбор принципа кодирования в настоящее время практически
не имеет значения. Поэтому можно использовать различные таблицы кодировки, лишь бы при
кодировании и декодировании символов использовалась одна и та же таблица.
В вычислительных машинах для представления информации используются цепочки
байтов. Поэтому для перевода информации из машинного представления в человеческий
необходимы таблицы кодировки символов – таблицы соответствия между символами
определенного языка и кодами символов. Их еще называют таблицами кодировки, кодовыми
страницами или применяют английский термин character set (который иногда сокращают до
charset).
Если каждому символу алфавита сопоставить определенное целое число (например,
порядковый номер), то с помощью двоичного кода можно кодировать и текстовую информацию.
Восьми двоичных разрядов достаточно для кодирования 256 различных символов. Этого хватит,
чтобы выразить различными комбинациями восьми битов все символы английского и русского
языков, как строчные, так и прописные, а также знаки препинания, символы основных
арифметических действий и некоторые общепринятые специальные символы, например символ
«§».
Технически это выглядит очень просто, однако всегда существовали достаточно веские
организационные сложности. В первые годы развития вычислительной техники они были
40
связаны с отсутствием необходимых стандартов, а в настоящее время вызваны, наоборот,
изобилием одновременно действующих и противоречивых стандартов. Для того чтобы весь мир
одинаково кодировал текстовые данные, нужны единые таблицы кодирования, а это пока
невозможно из-за противоречий между символами национальных алфавитов, а также
противоречий корпоративного характера.
Для английского языка, захватившего де-факто нишу международного средства общения,
противоречия уже сняты. Институт стандартизации США (ANSI— American National Standard
Institute) ввел в действие систему кодирования ANCII (American Standard Code for Information
Interchange — стандартный код информационного обмена США). В системе ANCII закреплены
две таблицы кодирования — базовая и расширенная. Базовая таблица закрепляет значения кодов
от 0 до 127, а расширенная относится к символам с номерами от 128 до 255.
Первые 32 кода базовой таблицы, начиная с нулевого, отданы производителям аппаратных
средств (в первую очередь производителям компьютеров и печатающих устройств). В этой
области размещаются так называемые управляющие коды, которым не соответствуют никакие
символы языков, и, соответственно, эти коды не выводятся ни на экран, ни на устройства печати,
но ими можно управлять тем, как производится вывод прочих данных.
Начиная с кода 32 по код 127 размещены коды символов английского алфавита, знаков
препинания, цифр, арифметических действий и некоторых вспомогательных символов. Базовая
таблица кодировки ANCII Приведена в таблице 1.
Таблица 1. Базовая таблица кодировки ANCII
32
48 0
64 @
80 Р
33
!
49
1
65
А
81 О
пробел
34
50 2
66 В
82 Я
35 #
51 3
67 С
83 5
36 $
52 4
68
84 т
37 %
53 5
69 Е
85 II
38 &
54 6
70 Р
86 V
39
55 7
71 е
87 \Л/
40 (
56 8
72 н
88 X
41 )
57 9
73 I
89 V
42
58
74 ^
90 2
43 +
59 ;
75 к
91 [
44
60 <
70 I
92 \
4!)
61
77 м
93 1
40
62 >
/I N
94
4/ /
63
/I
9!
I
Аналогичные системы
кодирования
I
)
96
97 а
98 Ь
99 с
100 а1
101 е
102 т
103 д
104 п
105
106 \
107 к
108 1
109 П1
1 10 П
111 О
текстовых
112 Р
113
114 г
115 3
116 1
117 и
118 V
119 \л
120 X/
121 У
122 2
123 {
124 |
12!) }
1?0
\71
данных были разработаны и в других
стропах. Так, например, в СССР в этой области действовала система кодирования КОИ-7 (код
обмена информацией, семизначный). Однако поддержка производителей оборудования и
программ вывела американский код ANCII на уровень международного стандарта, и
национальным системам кодирования пришлось «отступить» во вторую, расширенную часть
системы кодирования, определяющую значения кодов со 128 по 255. Отсутствие единого
41
стандарта в этой области привело к множественности одновременно действующих кодировок.
Только в России можно указать три действующих стандарта кодировки и еще два устаревших.
Так, например, кодировка символов русского языка, известная как кодировка Windows1251, была введена «извне» — компанией Microsoft, но, учитывая широкое распространение
операционных систем и других продуктов этой компании в России, она глубоко закрепилась и
нашла широкое распространение (таблица 2). Эта кодировка используется на большинстве
локальных компьютеров, работающих на платформе Windows.
Таблица 2. Кодировка Windows-1251
14 Г) 16
17
19 А 20 Р 22 а 24 Р
14
16
У
17
+
19
20 С 4
22 б 24
4
0
6
2 Б 8
0 с
14
16
У
17
I
19
В
21
Т
22
в
24
5
1
7
9 У 22
5 г 24
1 т
14
16
17 I 3
19 Г 21
У
6
2 п 18
8
4
0
6
2 Ф
14
16
г
19
Д
21
ф
22
д
24
7
3
9
1
14
16 гI
18 Ц 5
19
21
X 7
22
е 3
24 X
8
4
0
6 Е
2
8
4
I
15
16
18
11
19
Ж
21
ц
23
ж
24
9
5
1
7
3 ч 23
9 3 24
5 ц
15
—
16
§
18
19
3
21
ч
0
6 Ё 18
2
8 И 4
0
6
15
16
ё
20
21
ш
23
и
24
ш
1
7
3
9 Й 5
1
7
15
ТМ
16
©
18
№
20
21
щ
23
й
24
2
8 щ
15
1Ъ 8
17
е 4
18
е 0
20
К 6
21
ъ 2
23
к 25
3
9
5
1
7
3
9 ъ
15
>
17
«
18
»
20
Л
21
ы
23
л
25
ы
4
0
6
2
8
4
0
15
Нэ
17
18
]
20
М
22
ь
23
м
25
ь
5
1
7
3
9
5
1
15
К
17
18
5
20
Н
22
э
23
н
25
э
6
2
8
4
0
6
2
15
Г)
17
®
19
5
20
О
22
ю
23
о
25
ю
7
1 я 7
15 М 3
17 I 9
19 У 5
20 п 22
23 п 3
25 я
8
4
0
6
2
8
4
распространенная
9
5
1кодировка
7 носит3 название
9 КОИ-85 (код обмена информацией,
1 Ъ
1
2 Г
1
2
8 Г
1
13
п
9
3
1
0
'Л2
У
Т
1
3
13!
М
1
3
)1 %0
3
1
/ь
3
1
<
в
3
1
Нэ
/
3
1
к
0
4
1
ъ
9
4
и
1
0
4
1
Другая
4
2
3
восьмизначный)
— ее происхождение относится ко временам действия Совета экономической
Взаимопомощи государств Восточной Европы (таблица 3). Сегодня кодировка КОИ-8 имеет
широкое распространение в компьютерных сетях на территории России и в российском секторе
Интернета.
Международный стандарт, в котором предусмотрена кодировка символов русского
алфавита, носит название кодировки ISO (International Standard Organization — Международный
институт стандартизации). На практике данная кодировка используется редко (таблица 4).
На компьютерах, работающих и операционных системах MS-DOS, могут действовать еще
две кодировки (кодировка ГОСТ и кодировка ГОСТ-альтернативная). Первая из них считалась
устаревшей даже в первые годы появления персональной вычислительной техники, но вторая
используется и по сей день (см. таблицу 5).
Таблица 3. Кодировка КОИ-8
'
:
!
3
■
3
)
0
3
'
1
3
?
)
3
3
з
4
3
:
3
6
>
/
I
I
I
I
I
I
I
•г
X-
144
145
1
!!!
146 1
147 г
148 ■
149 •
150
151
л[
152
»
153
<
>
16
16
0
16
1
16
2
16
3
16
4
16
5
16
6
16
7
16
8
9
—
Ё
г
ё
г
г
1
-,
-|
1
-
17
17
6
17
7
17
8
18
9
18
0
18
1
18
2
18
3
18
4
5
Н
I
н
Ё
н
т
т
т
±
19
19
2
19
3
19
4
19
5
19
6
19
7
19
8
20
9
20
0
1
ю
а
б
ц
д
е
Ф
г
X
и
20
20
8
21
9
21
0
21
1
21
2
21
3
21
4
21
5
21
6
7
п
я
Р
с
т
У
ж
в
ь
ы
22
22
4
22
5
22
6
22
7
22
8
23
9
23
0
23
1
23
2
3
Ю
А
Б
Ц
Д
Е
Ф
Г
X
и
24
24
0
24
1
24
2
24
3
24
4
24
5
24
6
24
7
24
8
9
I
Я
I
1
С
'
1
У
Ж
и
1
ы
,
42
3\
З
т
8
4а
У4 ■
0
Л',
ИI 1
'
З
154
155 ^
156 *
157 2
158
159 *
■
17
17
0
17
1
17
2
17
3
17
4
5
I- 18 л
1
X
18
6
18 .
7
18
8
[
^
19
■
9
|
1
19
.
0 ё
}
1 •
20 й 21 3 23 й 25
20 к 8
21 ш 23 к 25
2
20 л 22 э 4
23 л 0
25
3
9
5 м 1
20
м
22
щ
23
25
4 н 22
0 ч 23
6 н 25
2
20
5
1
7
3
О
ъ
20
22
23 О 4
25
6
2
8
7 Таблица
3 4. Кодировка
9
5
ISO
;
I
|
0
I
Щ
Ч
I
Ь
17 А 19 Р 20 а 22 Р 24 №
17
24
6 Б 19
2 С 20
8 б 22
4 с
0 ё
т 24
17
В
19
т
21
в
22
Г
7
3
5
У 9
У 1
17
Г
19
21
г
22
24
<
8
4 ф 21
0 Д 22
6 Ф 24
2 )
18
Д
19
9
5
1
7 X 3
18 Е 6
19 X 2
21 е 22
24
0
8
4
Ц
I
18
Ж
19
ц
21
ж
23
24
1
7 ч 21
3 3 9
5
В150 не
I
18
3
19
23
ч
24
2 И 20
8 ш 21
4 и 23
0 ш 24
6 I
18
определены
3
9
5
1
18 Й 0
20 щ 21 й 2
23 щ 7
24 1
4
18 К 20 ъ 6
21 к 23 ъ 8
25 п
5
1
7 л 23
3 ы 9
Ь
18
Л
20
ы
21
25
6
2 ь 22
8 м 23
4 ь 25
0 1
.
18
М
20
1
7
3 э 22
9 н 23
5 э 25
1 К
18
н
20
§
8
4
0
6
2
о 23 ю 25 У
19
о
20
ю
22
9
5 я 1
7 я 3
19
22
25
0 п 20
6
2 п 23
8
4 1
кодировка
1Таблица75 ГОСТ-альтернативая
3
9
5 ,
1
12 А 14 Р 16 а 17
19
20 X 22 р 24
ш
12
Б
14
С
16
б
17
19
Г
20
8
0
4
0
6
2
8 т 22
4 с 24
13
в
14
Т
16
в
17
1
19
т
21
т
22 т 1
24
9
5
1
7
3
9
5
13
г
14
У
16
г
17
1
19
\
21
|_
22
У
24
0
6
2
8
4
0
6
2
13
Ф
Д
д
14
16
18
Н
19
21
22
Ф
24
1
3
13 Е 7
14 X 3
16 е 9
18 н 5
19 +- 1
21 Г 7
22 X 24
2
8 Ц 16
4 ж 18
0 ■ 6
2 Г 8
4
13
ж
15
19
21
23
ц
24
3
9
5 3 18
1 1 19
7 1 21
3 + 23
9 ч 24
5
13
3
15
Ч
16
4
1 20
8 1 4
0 ш (3
13
и 0
15 ш 6
16 и 2
18 1
+ 23
5
9 Г
- 21
5
1 и; 24
7
13 и 1
15 Щ 7
16 й 3
18 н 20
21 ^ 23
24
0
2
8
4
0
6
2
8
:>!>
13
к
15
ъ
17
к
18
1
20
21
г
23
ь
/
3
9
51Н 1 1
3
0
т 7
13
л
15
ы
17
л
20
21
■
23
ы
:"
() >■
И
4
0
6
2
8
4
МО
м
15
ь
17
м
ШН
Л
20
122
?3
1.
:"
!)
9
5
М1 II 5
15 э 1
17 II /
III! 1 3
20
22
■:: ;) 1
2
4 + ??
0 Г1 6
;
и |'К 1 20
и: о 6
!Г>
га
1/
К) •.■
7
3
)1' ] 20
5
1 ■1 ::\
и
я
мз
II
15
я
1
:ч!)
1
>
8
4
6
?
\\
■и
В 9связи с /5
изобилием
Н систем
7 кодирования текстовых данных, действующих в России,
16
16
0
16
1
16
2
16
3
16
4
16
5
16
6
16
7
16
8
17
9
17
0
17
1
17
2
17
3
17
4
5
Ё
Ъ
Г
е
3
I
т
3
Лэ
нь
т.
к
У
м
возникает задача межсистемного преобразования данных — это одна из распространенных задач
информатики.
Универсальная система кодирования текстовых данных
Если проанализировать организационные трудности, связанные с созданием единой
системы кодирования текстовых данных, то можно прийти к выводу, что они вызваны
ограниченным набором кодов (256). В то же время очевидно, что если, например, кодировать
символы не восьмиразрядными двоичными числами, а числами с большим количеством разрядов,
то и диапазон возможных значений кодов станет намного больше. Такая система, основанная на
16-разрядном кодировании символов, получила название универсальной — UNICODE.
Шестнадцать разрядов позволяют обеспечить уникальные коды для 65536 различных символов
— этого поля достаточно для размещения в одной таблице символов большинства языков
планеты.
43
Несмотря на тривиальную очевидность такого подхода, простой механический переход на
данную
систему
долгое
время
сдерживался
из-за
недостаточных
ресурсов
средств
вычислительной техники (в системе кодирования UNICODE все текстовые документы
автоматически становятся вдвое длиннее). Во второй половине 90-х годов технические средства
достигли необходимого
уровня обеспеченности
ресурсами, и сегодня мы наблюдаем
постепенный перевод документов и программных средств на универсальную систему
кодирования. Для индивидуальных пользователей это еще больше добавило забот по
согласованию документов, выполненных в разных системах кодирования, с программными
средствами, но это надо понимать как трудности переходного периода.
14. Кодирование графических данных.
Человек воспринимает информацию с помощью всех органов чувств и самыми
различными способами, но все же основными формами информации, с которыми нам наиболее
привычно "работать", являются вербальный и образный, причем последнему часто отдается
предпочтение. Сегодня трудно представить себе экран монитора без графического оформления:
пиктограммы стали неотъемлемыми компонентами пользовательского интерфейса многих
программных средств, с помощью программ- аниматоров создать мультипликационный фильм
может сейчас не только коллектив профессиональных художников, но и любой человек,
которому интересно этим заниматься.
Правда, так было не всегда. Самые первые компьютеры могли работать только с числами –
производить вычисления. Затем с увеличением быстродействия процессоров, появлением
дисплеев и внешней памяти на магнитных носителях появилась возможность обрабатывать
текстовую информацию. Но уже тогда хотелось создавать таблицы и графики, рисовать на
компьютере. Но на алфавитно-цифровых дисплеях графика была возможна только как
"псевдографика" (вообще, для компьютера "псевдо" – широко распространенное явление:
графика – точечная, пространство – виртуальное, интеллект – искусственный и т.д.).
Графические дисплеи появились в начале восьмидесятых годов. К этому времени
достигнутое быстродействие процессоров, объемы памяти, обширные библиотеки алгоритмов
уже позволяли создавать, выводить на экран, преобразовывать даже очень сложные графическое
образы в реальном времени, т.е. без заметных для человека "задержек" на их обработку
компьютерными устройствами.
Компьютерная
графика
сейчас
распространяется
все
шире.
Даже
программы,
предназначенные для создания и работы с текстами – текстовые процессоры – имеют, как
правило, встроенные возможности по созданию рисунков, чертежей, схем и встраиванию их в
текст.
44
Пожалуй, именно для представления в двоичном коде информации графического вида
разработано наибольшее число различных способов. Косвенным свидетельством этого можно
считать наличие большого числа форматов графических файлов: *.bmp, *.jpg, *.tif, *.pcx, *.aca,
*.cdr и т.д. Отчасти это связано с тем, что для хранения рисунков в двоичном коде требуется
много места в памяти ком- пьютера, и программисты всегда пытались изобрести "экономный"
способ кодирования графических изображений.
Важным этапом кодирования графического изображения является разбиение его на
дискретные элементы (дискретизация).
Основными способами представления графики для ее хранения и обработки с помощью
компьютера являются растровые и векторные изображения.
Векторное изображение представляет собой графический объект, состоящий из
элементарных геометрических фигур (чаще всего отрезков, дуг, прямоугольников, эллипсов).
Положение этих примитивов определяется координатами характерных точек и величиной
радиуса. Для каждой линии указывается ее тип (сплошная, пунктирная, штрих-пунктирная),
толщина и цвет. Информация о векторном изображении кодируется как обычная числовая и
обрабатывается специальными программами.
Графический примитив – геометрическая фигура, являющаяся элементом графического
изображения, создаваемого с помощью графического редактора.
Графическим примитивом могут быть прямоугольники, эллипсы, прямые линии, стрелки
различной конфигурации и т.п.
Матричный принцип кодирования графических изображений заключается в том, что
изображение разбивается на заданное количество строк и столбцов. Затем цвет каждого элемента
(клетки, точки) полученной сетки кодируется по выбранному правилу.
Правила могут быть самыми разнообразными, рассмотрим наиболее простое из них.
Если рисунок черно-белый, то достаточно ставить в соответствие клеточке, у которой
"закрашено" больше половины площади, единицу, иначе – ноль. Если рисунок цветной, то для
каждой точки нужно сохранять код ее цвета.
Точки-клетки, на которые разбивается изображение, называются пикселями.
Pixel (picture element – элемент рисунка) – минимальная единица изображения, цвет и
яркость ко- торой можно задать независимо от остального изображения.
В соответствии с матричным принципом строятся изображения, выводимые на принтер,
ото- бражаемые на экране дисплея, получаемые с помощью сканера.
Качество изображения будет тем выше, чем "плотнее" расположены пиксели, т.е. чем
больше разрешающая способность устройства, и чем точнее закодирован цвет каждого из них.
Разрешение устройств обычно измеряют в "точках на дюйм" (dpi).
45
О графическом изображении, когда каждый пиксель кодируется n битами, говорят как о
графике глубиной в n разрядов.
Глубина цвета – длина кода, используемого при кодировании цвета одного пикселя. При
глубине кода, равной 1, можно передать 21 = 2 цвета (например, черный и белый). При глубине
кода, равной 4, можно передать 24 = 16 цветов.
При глубине кода, равной 8 (1 байт), можно передать 28 = 256 цветов.
При глубине кода, равной 16 (2 байта), можно передать 2 16 = 65536 цветов (режим High
Color).
При глубине кода, равной 24 (3 байта), можно передать 224 = = 16777216 оттенков цвета
(режим True Color).
Каким образом кодируется цвет пикселя или графического примитива?
Если Вы посмотрите на экран дисплея через сильную лупу или увеличительное стекло, то
увидите либо множество разноцветных прямоугольников, либо множество разноцветных
кружочков (в зависимости от марки и модели техники). Каждый экранный пиксель состоит из
трех таких элементов, один из которых красного (Red), другой зеленого (Green), третий синего
(Blue) цвета (RGB-модель цветообразования).
Известно, что, если на изображении имеются близко расположенные цветные детали, то с
большого расстояния мы не различаем цвета отдельных деталей – происходит смешение
световых потоков, передающих цвета этих деталей. Известно также, что любой желаемый цвет
может быть получен в результате сложения (смешения) красного, зеленого и синего световых
потоков. Яркость (интенсивность) каждого цвета может быть различна.
Рассмотрим самый простой случай – каждый из трех составляющих пикселя может либо
гореть (1), либо не гореть (0). Тогда мы получаем следующий набор цветов:
Красный
Зеленый
Синий
Цвет
0
0
0
Черный
0
1
0
Зеленый
0
0
1
Синий
1
0
0
Красный
0
1
1
Бирюзовый
1
1
0
Желтый
1
0
1
Малиновый
1
1
1
Белый
При печати на принтере используется несколько иная цветовая модель: если монитор
испускал свет и оттенок получался в результате "сложения" цветов, то краски – поглощают свет,
цвета "вычитаются". Попробуйте покрасить бумагу смесью из красной, зеленой и синей краски –
вряд ли вы когда-нибудь получите белый цвет. Поэтому для цветной печати используют в
качестве основных иные цвета – голубую (Суаn), пурпурную (Magenta) и желтую (Yellow)
46
краски. Теоретически наложение этих трех цветов должно давать черный цвет. На практике из-за
неидеальности красителей чаще получается серый или коричневый цвет. Поэтому в качестве
четвертого основного цвета к ним обычно добавляют черную (blacK) краску. Отсюда пошло
название этого способа цветообразования – CMYK- модель. Для хранения информации о доле
каждой краски и в этом случае чаще всего используется 1 байт.
Для кодирования цветных графических изображений применяется принцип декомпозиции
произвольного цвета на основные составляющие. В качестве таких составляющих используют
три основные цвета: красный (Red, R), зеленый (Green, G) и синий (Blue, В). На практике
считается (хотя теоретически это не совсем так), что любой цвет, видимый человеческим глазом,
можно получить путем механического смешения этих трех основных цветов. Такая система
кодирования называется системой RGB по первым буквам названий основных цветов.
Если для кодирования яркости каждой из основных составляющих использовать по 256
значений (восемь двоичных разрядов), как это принято для полутоновых черно-белых
изображений, то на кодирование цвета одной точки надо затратить 24 разряда. При этом система
кодирования обеспечивает однозначное определение 16,5 млн различных цветов, что на самом
деле близко к чувствительности человеческого глаза. Режим представления цветной графики с
использованием 24 двоичных разрядов называется полноцветным (Тrue Со1оr).
Каждому из основных цветов можно поставить в соответствие дополнительным цвет, то
есть цвет, дополняющий основной цвет до белого. Нетрудно заметить, что для любого из
основных цветов дополнительным будет цвет, образованный суммой пары остальных основных
цветов. Соответственно, дополнительными цветами являются: голубой (Cyan, С), пурпурный
(Маgenta, М) и желтый (Yellow, У). Принцип декомпозиции произвольного цвета на
составляющие компоненты можно применить не только для основных цветов, но и для
дополнительных, то есть любой цвет можно представить в виде суммы голубой, пурпурной и
желтой составляющей. Такой метод кодирования цвета принят в полиграфии, но в полиграфии
используется (еще и четвертая краска — черная (В1аск, К). Поэтому данная система кодирования
обозначается четырьмя буквами СМYК (черный цвет обозначается буквой К, потому, что буква В
уже занята синим цветом), и для представления цветной графики и этой системе надо иметь 32
двоичных разряда. Такой режим тоже называется полно-цветным (Тгие Со1ог).
Если уменьшить количество двоичных разрядов, используемых для кодирования цвета
каждой точки, то можно сократить объем данных, но при этом диапазон кодируемых цветов
заметно сокращается. Кодирование цветной графики 16-разрядными двоичными числами
называется режимом Нigh Со1оr.
При кодировании информации о цвете с помощью восьми бит данных можно передать
только 256 цветовых оттенков. Такой метод кодирования цвета называется индексным. Смысл
47
названия в том, что, поскольку 256 значений совершенно недостаточно, чтобы передать весь
диапазон цветов, доступный человеческому глазу, код каждой точки растра выражает не цвет сам
по себе, а только его номер (индекс) в некоей справочной таблице, называемой палитрой.
Разумеется, эта палитра должна прикладываться к графическим данным – без нее нельзя
воспользоваться методами воспроизведения информации на экране или бумаге (то есть,
воспользоваться, конечно, можно, но из-за неполноты данных полученная информация не будет
адекватной: листва на деревьях может оказаться красной, а небо — зеленым).
15. Системы счисления. Перевод целых и дробных чисел из одной системы счисления в
другую.
Сходство в кодировании числовой и текстовой информации состоит в следующем: чтобы
можно было сравнивать данные этого типа, у разных чисел (как и у разных символов) должен
быть различный код. Основное отличие числовых данных от символьных заключается в том, что
над числами кроме операции сравнения производятся разнообразные математические операции:
сложение, умножение, извлечение корня, вычисление логарифма и пр. Правила выполнения этих
операций в математике подробно разработаны для чисел, представленных в позиционной системе
счисления. Многовековая история развития математики показывает, что именно позиционный
принцип позволяет использовать эти правила как универсальные алгоритмы, справедливые для
системы счисления с любым основанием: 2, 3, 8, 10, 16, 60 и пр.
Система счисления – совокупность приемов обозначения чисел, способ записи чисел.
Система счисления называется позиционной, если значение ("вес") цифры в числе зависит
не только от значения самой цифры, но и от ее позиции в записи числа.
Так, в числе 575,5 последняя цифра "5" передает ("весит") половинку единицы,
предпоследняя цифра "5" передает пять единичек, а первая цифра "5" передает уже пятьсот
единиц. Это число можно записать так:
575 = 5*102 + 7*101 + 5*100 + 5*10–1.
Основание системы счисления – это:
–
число различных цифр, используемых для записи чисел;
–
количество
единиц
младшего
разряда,
соответствующих
одной
единице
следующего старшего разряда.
Наиболее привычная для нас система счисления – десятичная. Для записи чисел в ней
используется
10 разных цифр; единице любого разряда соответствует 10 единиц предыдущего разряда.
В двоичной системе счисления для записи чисел используется всего две цифры – 0 и 1, а
единице любого разряда соответствует две единицы предыдущего разряда.
48
В шестнадцатеричной системе счисления используется 16 цифр: первые десять привычные
арабские цифры, а для обозначения оставшихся шести цифр используются первые шесть
прописных букв латинского алфавита (A, B, C, D, E, F).
В шестидесятеричной системе счисления, так хорошо знакомой нам по нашим часам при
"исчислении" секунд и минут, в настоящее время для записи чисел используется десять цифр,
привычных нам по десятичной системе, но вес единицы каждого разряда составляет 60 единиц
разряда предыдущего.
Заметим, что обычно основание системы счисления указывается как нижний индекс,
например, 123,510
1101,1012
120,78 9А07,С816.
В позиционных системах счисления каждое число может быть записано в цифровой и
многочленной форме.
Пусть запись числа в цифровой форме состоит из цифр аn аn–1 аn–2 ... а2 а1 a0 , а–1 а–2...
Если это число представлено в позиционной системе счисления с основанием р, то
многочленная форма представления числа имеет следующий вид:
аnрn + аn–1 pn–1 + аn–2pn–2 +...+ а2p2 + а1p1 + а0p0 + а–1p-1 + а–2p–2 + ... .
Перевести число из p-ричной в десятичную систему счисления можно, записав его в
многочленной форме и вычислив значение полученного многочлена.
ПРИМЕРЫ
123,510 = 1* 102 + 2* 101 + 3* 100 + 5* 10-1.
1101,1012 = 1* 23 + 1*22 + 0* 21 + 1* 20 + 1* 2-1 + 0* 2-2 + 1* 2-3.
120,78 = 1* 82 + 2* 81 + 0* 80 + 7* 8-1.
9А07,С816 = 9* 163 + 10* 162 + 0* 161 + 7* 160 + 12* 16-1 + 8 * 16-2.
Произведя соответствующие вычисления, Вы получите:
1101,1012 = 8+4+0+1+0,5+0,25+0,125 = 13,87510.
120,78 = 64+16+0+0,875 = 80,87510.
9А07,C816 = 36864+2560+0+7+0,75+0,03125 = 39431,7812510.
Осуществить
перевод
из десятичной
системы
счисления
в любую другую
позиционную систему можно также, используя позиционный принцип. Полезным в этом
случае будет такое понятие, как базис системы счисления, т.е. последовательность так
называемых ключевых чисел, каждое из которых задает значение цифры по ее месту в
записи числа.
ПРИМЕРЫ
Базис десятичной системы счисления: ..., 10 n, ..., 1000, 100, 10, 1, 0.1, 0.01, ... . Базис
двоичной системы счисления: ..., 2n, ..., 16, 8, 4, 2, 1, 1/2, 1/4, ... .
Базис троичной системы счисления: ..., 3n, ..., 81, 27, 9, 3, 1, 1/3, 1/9, ... .
49
Базис шестнадцатеричной системы счисления: ..., 16 n, ..., 256, 16, 1, 1/16, 1/256, ... .
Перевести число из десятичной в p-ричную систему счисления – значит "разложить" это
число по соответствующему базису, а именно, определить, какие элементы базиса (начиная с
максимально возможного) и сколько раз входят в "переводимое количество".
ПРИМЕР
Перевод числа 2610 в двоичную систему счисления:
максимальный элемент базиса, меньший 26 – это 16 – входит 1 раз (остаток 26 – 16 = 10
единиц);
элемент 8 входит в остаток 1 раз (остаток 10 – 8 = 2 единицы); элемент 4 входит в остаток
0 раз (остаток 2 – 0 = 2 единицы); элемент 2 входит в остаток 1 раз (остаток 2 – 2 = 0 единиц);
элемент 1 входит в остаток 0 раз.
Таким образом, 2610 = 110102 . Схематично это можно представить так:
Перевод числа 2610 в шестнадцатеричную систему счисления:
максимальный элемент базиса, меньший 26 – это 16 – входит 1 раз (остаток 26 – 16 = 10
единиц);
элемент 1 входит в остаток 10 раз (обозначается цифрой А) (остаток 10 – 10 = 0 единиц);
Таким образом, 2610 = 1А16 (рис. 17).
Рассмотренные способы перевода чисел из одной системы счисления в другую хорошо
отражают принцип позиционности, но далеко не самые удачные для представления их в виде
строго формализованного алгоритма. Известно несколько способов перевода чисел. Некоторые из
них более удобны для "ручного" перевода, другие специально разработаны для их
автоматического исполнения. Далее приведены основные алгоритмы перевода целых и дробных
чисел для различных систем счисления.
Алгоритмы для перевода целых чисел
50
Постановка задачи. Дано число Аq (в системе счисления с основанием q). Заменить его
равным числом Хр (в системе счисления с основанием р).
Алгоритм I. Для того, чтобы целое число Аq заменить равным ему целым числом Хр,
необходимо число Аq разделить нацело по правилам q-арифметики на основание р. Остаток
деления запомнить, а частное вновь нацело разделить на р. И так далее, пока частное не станет
равно 0.
Цифрами искомого числа Хр являются остатки от деления, выписанные так, что последний
остаток является цифрой старшего разряда числа Хр.
Алгоритм I пригоден для любых р и q, однако рекомендуется для перевода чисел из
десятичной системы счисления в произвольную систему счисления.
Пример
Алгоритм II. Для того чтобы данное целое число Аq заменить равным ему числом Xр,
достаточно цифру старшего разряда числа Аq умножить по правилу р-арифметики на основание
q. К полученному произведению прибавить цифру следующего разряда числа Аq Полученную
сумму вновь умножить на q по правилам р-арифметики, вновь к полученному произведению
прибавить цифру следующего (более младшего) разряда. И так до тех пор, пока не будет
прибавлена младшая цифра числа Аq.
Алгоритм II пригоден для любых р и q, однако рекомендуется при переводе из
произвольной системы счисления в десятичную.
Пример
101102 --> X10
(((1*2+0)*2+1)*2+1)*2+0= 2210
2078 --> X10
(2*8+0)*8+7 =13510
2F516 --> X10
(2*16+15)*16+5== 75710
Алгоритмы для перевода правильных дробей
51
Постановка задачи. Дано число 0, Аq (в системе счисления с основанием q). Заменить его
равным числом 0, Хр (в системе счисления с основанием р).
Алгоритм III. Для того, чтобы исходную правильную дробь 0, Aq заменить равной ей
правильной дробью 0, Хр, нужно 0, Aq умножить на "новое" основание р по правилам qарифметики, целую часть полученного произведения считать цифрой старшего разряда искомой
дроби. Дробную часть полученного произведения вновь умножить на р, целую часть полученного
результата считать следующей цифрой искомой дроби. Эти операции продолжать до тех пор,
пока дробная часть не окажется равной нулю, либо не будет достигнута требуемая точность.
Алгоритм рекомендуется при переводе из десятичной системы счисления в
произвольную.
Пример
Дробь 0,37510 заменить равной ей двоичной дробью.
Решение
0,375 * 2 = 0,750
0,75 * 2 = 1,50
0,5 * 2 = 1,0 (дробная часть равна 0)
0,37510=0,0112
Алгоритм IV. Для того чтобы исходную правильную дробь 0, Aq заменить равной ей
правильной дробью 0, Хр, необходимо цифру младшего разряда дроби 0, Аq разделить на
основание q по правилам р- арифметики, к полученному частному прибавить цифру следующего
(более старшего) разряда и далее поступать так же, как и с первой взятой цифрой.
Эти операции продолжать до тех пор, пока не будет прибавлена цифра старшего разряда
искомой дроби. После этого полученную сумму разделить еще раз на р и к результату приписать
запятую и нуль целых.
Алгоритм рекомендуется при переводе из произвольной системы счисления в
десятичную.
Пример
Дробь 0,11012 заменить равной ей десятичной правильной дробью.
Решение
1 : 2 + 0 = 0,510
0,5 : 2 + 1 = 1,2510
1,25 : 2 + 1 = 1,62510
1,625 : 2 + 0 = 0,812510
0,11012 = 0,812510.
Алгоритмы перевода чисел в системы счисления с кратными основаниями
Постановка задачи. Перевести число Аq из системы счисления с основанием q в систему счисления с
n
основанием q , где n – натуральное число.
52
n
Алгоритм V. Для записи двоичного числа в системе счисления с основанием q = 2 достаточно данное
двоичное число разбить на группы вправо и влево от десятичной точки по n цифр в каждой группе. Затем
каждую такую группу следует рассмотреть как n-разрядное двоичное число и записать его как цифру в системе с
n
основанием q = 2 .
В крайних группах, если двоичных цифр оказалось меньше n, можно добавлять незначащие нули.
Пример
Число 10110000100011002 заменить равным ему числом восьмеричной системы счисления, т.е. системы с
3
4
основанием q = 2 , и шестнадцатеричной системы счисления, т.е. системы счисления с основанием q = 2 .
Решение
Для перевода в восьмеричную систему счисления разбиваем двоичное число на группы по три цифры в
каждой:
001
011
000
010
001
100
– двоичное число
1
3
0
2
1
4
– восьмеричное число
Внизу под каждой из групп выписаны цифры, соответствующие трехразрядным двоичным числам:
12 = 18; 0112 = 38; 0002 = 08; 0102 = 28; 0012 = 18; 1002 = 48.
Для перевода в шестнадцатеричную систему счисления разбиваем двоичное число на группы по четыре
цифры в каждой:
0010
1100
0010
0011
0010 – двоичное число
2
С
2
3
2
– шестнадцатеричное число
Внизу под каждой из групп выписаны цифры, соответствующие четырехразрядным двоичным числам:
102 = 216 ; 11002 = С16 ; 00102 = 216 ; 00112 = 316 ; 00102 = 216.
n
Постановка задачи. Перевести число Аq из системы счисления с основанием q в систему счисления с
основанием q, где n – натуральное число.
n
Алгоритм VI. Для замены числа, записанного в системе с основанием р = 2 , равным ему числом в двоичной
системе счисления достаточно каждую цифру данного числа заменить n-разрядным двоичным числом.
Пример
Число 2607,348 заменить равным ему двоичным числом. В соответствии с алгоритмом запишем:
2
010
6
110
0
000
7
111
3
011
4 – восьмеричное число
100 – двоичное число
В результате получим 2607,248 = 10110000111,01112.
Из сказанного следует, что замена двоичного числа на равное ему восьмеричное и наоборот может
осуществляться механически, без всяких вычислений.
Нетрудно представить себе пишущую машинку, у которой на клавишах восьмеричные цифры: 0, 1,
2, 3, 4, 5, 6, 7 – и на молоточках, которые бьют по бумаге, соответствующие им трехразрядные двоичные числа:
000, 001, 010, 011, 100, 101, 110, 111. Такая машинка позволит всякое восьмеричное число, отстукиваемое на
клавиатуре, отпечатать на бумаге в виде равного ему двоичного числа. Замените клавиши на молоточки – и будет
изготовлена двоично-восьмеричная кодирующая машинка.
Пример
Число 6В07,D416 заменить равным ему двоичным числом.
В соответствии алгоритмом запишем:
6
B
0
7
,D
4
– шестнадцатеричное число;
0110 1011 0000 0111 ,1101 0100 – двоичное число.
В результате получим 6B07,D416 = 110101100000111,1101012 .
Элементы машинной арифметики
Все арифметические операции над двоичными числами в компьютере можно свести к
двум операциям: сложению и сдвигу кодов. Это позволяет технически реализовать четыре
арифметических действия в одном арифметико-логическом устройстве, используя одни и те же
схемы выполнения операций.
53
16. Основные структуры данных.
Работа
с
большими
наборами
данных
автоматизируется
проще,
когда
данные
упорядочены, то есть образуют заданную структуру. Существует три основных типа структур
данных: линейная, иерархическая и табличная. Их можно рассмотреть на примере обычной
книги.
Если разобрать книгу на отдельные листы и перемешать их, книга потеряет свое
назначение. Однако по-прежнему будет представлять набор данных, но подобрать адекватный
метод для получения из нее информации весьма непросто. (Еще хуже дело будет обстоять, если
из книги вырезать каждую букву отдельно, — в этом случае вряд ли вообще найдется адекватный
метод для ее прочтения.)
Если же собрать все листы книги в правильной последовательности, мы получи
простейшую структуру данных — линейную. Такую книгу уже можно читать, хотя для поиска
нужных данных ее придется прочитать подряд, начиная с самого начала, что не всегда удобно.
Для быстрого поиска данных существует иерархическая структура. Так, например, книги
разбивают на части, разделы, главы, параграфы и т. п. Элементы структуры более низкого уровня
входят в элементы структуры более высокого уровня: разделы состоят из глав, главы из
параграфов и т. д.
Для больших массивов поиск данных в иерархической структуре намного проще, чем в
линейной, однако и здесь необходима навигация, связанная с необходимостью просмотра. На
практике задачу упрощают тем, что в большинстве книг есть вспомогательная перекрестная
таблица, связывающая элементы иерархической структуры с элементами линейной структуры, то
есть связывающая разделы, главы и параграфы с номерами страниц. В книгах с простой
иерархической структурой рассчитанных на последовательное чтение, эту таблицу принято
называть оглавлением, а и книгах со сложной структурой, допускающей выборочное чтение, ее
называют содержанием.
Линейные структуры (списки данных, векторы данных)
54
Линейные структуры — это хорошо знакомые нам списки. Список — это простейшая
структура данных, отличающаяся тем, что каждый элемент данных однозначно определяется
своим номером в массиве. Проставляя номера на отдельных страницах, рассыпанной книги, мы
создаем структуру списка. Обычный журнал посещаемости занятий, например, имеет структуру
списка, поскольку все студенты группы зарегистрированы в нем под своими уникальными
номерами. Мы называем номера уникальными потому, что в одной группе не могут быть
зарегистрированы два студента с одним и тем же номером.
При создании любой структуры данных надо решить два вопроса: как разделять элементы
данных между собой и как разыскивать нужные элементы. В журнале посещаемости, например,
это решается так: каждый новый элемент списка заносится с новой строки, то есть разделителем
является конец строки. Тогда нужный элемент можно разыскать по номеру строки.
N п/п Фамилия, Имя, Отчество
1
Аистов Александр Алексеевич
2
Бобров Борис Борисович
3
Воробьева Валентина Владиславовна
27 Сорокин Сергей Семеновичч
Разделителем может быть и какой-нибудь специальный символ. Нам хорошо известны
разделители между словами — это пробелы. В русском и во многих европейских языках
общепринятым разделителем предложений является точка. В рассмотренном нами классном
журнале в качестве разделителя можно использовать любой символ, который не встречается в
самих данных, например символ «*». Тогда список выглядел бы так:
Аистов Александр Алексеевич * Бобров Борис Борисович * Воробьева Валентина
Владиславовна *... * Сорокин Сергей Семенович
В этом случае для розыска элемента с номером n надо просмотреть список начиная с
самого начала и пересчитать встретившиеся разделители. Когда будет отсчитано n-1
разделителей, начнется нужный элемент. Он закончится, когда будет встречен следующий
разделитель.
Еще проще можно действовать, если все элементы списка имеют равную длину. В этом
случае разделители в списке вообще не нужны. Для розыска элемента с номером n надо
просмотреть список с самого начала и отсчитать а(n-1) символ, где a — длина одного элемента.
Со следующего символа начнется нужный элемент. Его длина тоже равна а, поэтому его конец
определить нетрудно. Такие упрощенные списки, состоящие из элементов равной длины,
называют векторами данных. Работать с ними особенно удобно.
Таким образом, линейные структуры данных (списки) — это упорядоченные структуры, в
которых адрес элемента однозначно определяется его номером.
Табличные структуры (таблицы данных, матрицы данных)
С таблицами данных мы тоже хорошо знакомы, достаточно вспомнить всем известную
таблицу умножения. Табличные структуры отличаются от списочных тем, что элементы данных
55
определяются адресом ячейки, который состоит не из одного параметра, как в списках, а из
нескольких. Для таблицы умножения, например, адрес-ячейки определяется номерами строки и
столбца. Нужная ячейка находится на их пересечении, а элемент выбирается из ячейки.
При хранении табличных данных количество разделителей должно быть больше, чем для
данных, имеющих структуру списка. Например, когда таблицы печатают в книгах, строки и
столбцы разделяют графическими элементами — линиями вертикальной и горизонтальной
разметки (рис. 1.4).
Если нужно сохранить таблицу в виде длинной символьной строки, используют один
символ-разделитель между элементами, принадлежащими одной строке, и другой разделитель
для отделения строк, например так:
Меркурий*0,39*0,056*0#Венера*0,67*0,88*0#Земля*1,0*1,0*1#Марс*1,51*0,1*2#...
Для розыска элемента, имеющего адрес ячейки (m, n), надо просмотреть набор данных с
самого начала и пересчитать внешние разделители. Когда будет отсчитан m-1 разделитель, надо
пересчитывать внутренние разделители. После того как будет найден n-1 разделитель, начнется
нужный элемент. Он закончится, когда будет встречен любой очередной разделитель.
Относительная Количест
во
масса
спутнико
в
Меркурий
0,39
0,056
0
Венера
0,67
0,88
0
Земля
1,0
1,0
1
Марс
1,51
0,1
2
Юпитер
5,2
318
16
Рис. 11 В двумерных таблицах, которые печатают в книгах, применяется два
типа разделителей — вертикальные и горизонтальные.
Еще проще можно действовать, если все элементы таблицы имеют равную длину. Такие
Планета
Расстояние до
Солнца, а.е.
таблицы называют матрицами. В данном случае разделители не нужны, поскольку все элементы
имеют равную длину и количество их известно. Для розыска элемента с адресом (m, n) в матрице,
имеющей M строк и N столбцов, надо просмотреть ее с самого начала и отсчитать а [N(m - 1) + (n
- 1)] символ, где а — длина одного элемента. Со следующего символа начнется нужный элемент.
Его длина тоже равна а, поэтому его конец определить нетрудно.
Таким образом, табличные структуры данных (матрицы) — это упорядоченные
структуры, в которых адрес элемента определяется номером строки и номером столбца, на
пересечении которых находится ячейка, содержащая искомый элемент.
Многомерные таблицы. Выше мы рассмотрели пример таблицы, имеющей два измерения
(строка и столбец), но в жизни нередко приходится иметь дело с таблицами, у которых
количество измерений больше. Вот пример таблицы, с помощью которой может быть
организован учет учащихся.
Номер факультета: 3
56
Номер курса (на факультете):
2
Номер специальности (на курсе): 2
Номер группы в потоке одной специальности: 1
Номер учащегося в группе:
19
Размерность такой таблицы равна пяти, и для однозначного отыскания данных об
учащемся в подобной структуре надо знать все пять параметров (координат).
Иерархические структуры данных
Нерегулярные данные, которые трудно представить в виде списка или таблицы, часто
представляют в виде иерархических структур. С подобными структурами мы очень хорошо
знакомы по обыденной жизни. Иерархическую структуру имеет система почтовых адресов.
Подобные структуры также широко применяют в научных систематизациях и всевозможных
классификациях (рис. 1.5).
В иерархической структуре адрес каждого элемента определяется путем доступа
(маршрутом), ведущим от вершины структуры к данному элементу. Вот, например, как выглядит
путь доступа к команде, запускающей программу Калькулятор (стандартная программа
компьютеров, работающих в операционной системе Windows:
Пуск ► Программы ► Стандартные ► Калькулятор.
Рис. 12 Пример иерархической структуры данных.
57
Download