Информационные системы в экономике - ivesep

advertisement
ФИЛИАЛ НОУ ВПО «САНКТ-ПЕТЕРБУРГСКИЙ
ИНСТИТУТ ВНЕШНЕЭКОНОМИЧЕСКИХ СВЯЗЕЙ, ЭКОНОМИКИ
И ПРАВА» В Г. КАЛИНИНГРАДЕ
УЧЕБНО-МЕТОДИЧЕСКИЙ КОМПЛЕКС
Наименование дисциплины
Информационные системы в экономике
Направление подготовки
080100 Экономика
Квалификации (степени) выпускника
бакалавр
Калининград
2012
Информационные системы в экономике: УМК для заочной формы обучения
в филиале в г. Калининграде / авт.-сост. доцент Носова О.А. – ИВЭСЭП,
2012.
Утвержден Научно-методическим Советом,
протокол № 1 от 05.09.2012
Рассмотрен на заседании кафедры бухгалтерского учета и аудита
филиала ИВЭСЭП в г. Калининграде,
протокол №1 от 03.09.2012 г.
Утвержден на заседании Совета филиала ИВЭСЭП в г. Калининграде
протокол № 1 от 04.09.2012 г.
Информационные системы в экономике /Авт.-сост.:Л.Н. Бережной, Н.О. Васильева,
А.Ю.Вальков, А.Н. Протопопов – СПб.: СПбИВЭСЭП, 2011. (адаптирована
для заочной формы обучения в филиале в г. Калининграде доцентом
Носовой О.А.)
Рецензент:
кандидат физ.-мат. наук, доцент кафедры высшей математики СанктПетербургского торгово-экономического института Д.Н. Москвин
Утвержден на заседании кафедры математических и
естественнонаучных дисциплин, протокол № 5 от 19.01.2011 г.
Утвержден и рекомендован к печати Научно-методическим Советом,
протокол № 5 от 20.01.2011 г.
Утверждена на заседании кафедры бухгалтерского учета и аудита
филиала ИВЭСЭП в г. Калининграде,
протокол №1 от 03.09.2012 г.
Лист изменений
в рабочую программу
Дата внесенных
изменений
Содержание изменений
Подпись автора
1. Цели и задачи дисциплины
Цель изучения дисциплины «Информационные системы в экономике» - получение
студентами знаний и формирование умений и навыков, обеспечивающих эффективное
решение прикладных задач в сфере экономической деятельности с использованием
информационных технологий и систем.
Задачи изучения дисциплины:
- получить глубокие знания, необходимые для решения актуальных практических задач с
использованием методов и средств прикладной информатики;
- научиться применять на практике современные прикладные информационные системы;
- выработать навыки практического использования в работе современного
инструментария прикладной информатики: методов, технологий и программнотехнических средств, обеспечивающих решение актуальных прикладных информационнокоммуникационных задач.
2. Место дисциплины в структуре ООП
Данная учебная дисциплина относится к вариативной части (дисциплина по
выбору) блока дисциплин математического и естественнонаучного цикла (В.2) ООП
бакалавриата и направлена на формирование студентом в процессе обучения знаний и
компетенций, а также навыков самостоятельной работы в рамках выбранного
образовательного направления 080100.62 Экономика.
В методическом плане дисциплина опирается на знаниях, полученных при
изучении дисциплин «Информатика» и «Математика» в рамках школьной программы
среднего (полного) образования.
Полученные в процессе обучения знания и освоенные компетенции могут быть
базовыми для изучения дисциплины «Анализ хозяйственной деятельности предприятия» и
др.
3. Требования к результатам освоения дисциплины
Процесс изучения дисциплины направлен на формирование следующих
профессиональных компетенций (согласно ФГОС):
владеет культурой мышления, способен к обобщению, анализу, восприятию
информации, постановке цели и выбору путей ее достижения (ОК-1);
владеет основными методами, способами и средствами получения, хранения,
переработки информации, имеет навыки работы с компьютером как средством управления
информацией, способен работать с информацией в глобальных компьютерных сетях (ОК13);
способен использовать для решения аналитических и исследовательских задач
современные технические средства и информационные технологии (ПК-10).
В результате изучения дисциплины студент должен:
знать:
 основные понятия информационных технологий;
 классы ИС и их назначение, основные подсистемы ИС, модели и процессы
жизненного цикла ИС, стадии создания ИС, методы и средства проектирования
ИС;
 основы архитектуры и процессов функционирования вычислительных и
телекоммуникационных систем;
 информационно-коммуникационные
технологии,
применяемые
в
профессиональной области;
 основное электронное оборудование реализации информационных технологий;
 современное состояние и тенденции развития информационных технологий
уметь:
 проводить анализ предметной области, выявлять информационные потребности и
разрабатывать требования к ИС;
 проводить сравнительный анализ и выбор ИКТ для решения прикладных задач;
 использовать международные и отечественные стандарты разработки программных
комплексов и ИС для решения прикладных задач;
 выбирать и оценивать архитектуру вычислительных и телекоммуникационных
систем применительно к поставленной прикладной задаче практически применять
электронное оборудование и информационно-коммуникационные технологии
владеть:
 основными методами, способами и средствами получения, хранения, переработки
информации, навыками работы с компьютером как средством управления
информацией;
 методами практического применения современных электронных средств
информационного обеспечения коммуникационных технологий;
 современными информационными и информационно-коммуникационными
технологиями
 и инструментальными средствами для решения общенаучных и профессиональных
задач в своей профессиональной деятельности
4. Объем дисциплины и виды учебной работы
Всего часов Семестр
Вид учебной работы
3
Аудиторные занятия (всего)
4
10
10
Лекции
4
4
Практические занятия (ПЗ)
6
6
Самостоятельная работа (всего)
53
53
В том числе:
Контрольная работа
+
Подготовка к сдаче и сдача экзамена
Общая трудоемкость
часы
зачетные единицы
9
9
72
72
2
2
5. Содержание дисциплины
5.1. Содержание разделов дисциплины
Тема 1. Информационные процессы в информационных системах
Информационная технология и информационная система. Модели информационных
процессов передачи, обработки, накопления данных. Обобщенная схема технологического
процесса обработки информации. Сбор и регистрация информации. Передача
информации. Обработка информации. Хранение и накопление информации. Системный
подход к решению функциональных задач и к организации информационных процессов.
Тема 2. Информационные технологии распределенных систем
Технологии распределенных вычислений. Распределенные базы данных.
Технология "Клиент-сервер" и модели ее реализации: файловый сервер, удаленный доступ
к данным; сервер базы данных; сервер приложений. Технологии объектного связывания
данных. Технологии реплицирования данных.
Тема 3. Сетевые информационные технологии и системы
Преимущества и недостатки распределенных сетевых систем. Типы сетевых
систем. Понятие сетевой технологии. Типовые топологии сетей. Понятие открытой
системы. Концепция архитектуры открытых систем. Классификация сетей. Локальные и
глобальные сети. Стек протоколов TCP/IP. Интернет и интранет. Основные службы и
сервисы Интернет. Язык HTML. Программное обеспечение для работы в Интернет.
Обеспечение безопасности информации при использовании Интернет.
Тема 4. Использование информационных технологий и систем в экономической
деятельности
Информационные
процессы
в
организационно-экономической
сфере.
Информационные технологии и системы создания бюджета. Информационные
технологии и системы стратегического планирования. Информационные технологии и
системы прогнозирования деятельности предприятия. Информационные технологии и
системы автоматизации управления в масштабах всего предприятия.
5.2. Разделы дисциплин и виды занятий
№
Наименование раздела дисциплины
п/п
1.
2.
3.
4.
Информационные процессы в
информационных системах
Информационные
технологии
распределенных систем
Сетевые информационные технологии и
системы
Использование
информационных
технологий и систем в экономической
деятельности
Подготовка к сдаче и сдача зачета
Итого
Лекции Практические СРС Всего
занятия
0,5
2
0,5
2
0,5
2
0,5
2
11
13,5
14
16,5
14
16,5
14
16,5
9
2
8
6. Примерная тематика контрольных работ
1. Информационные системы и их классификация.
2. Принципы и стандарты проектирования, внедрения и эксплуатации ИС.
3. Базы данных.
4. Распределенные и интегрированные БД.
5. Системы управления базами данных.
6. Интеллектуальные информационные технологии и системы.
7. Современные экспертные системы.
8. Семейство программ 1С:Предприятие.
9. Информационно-поисковые системы.
10. Интернет-технологии, используемые в сфере бизнеса.
11. Поисковые системы Интернет.
12. Использование Интернет в корпоративных информационных системах.
13. Информационные системы в экономике.
14. Проблемы безопасности ИС
53
72
7. Учебно-методическое и информационное обеспечение дисциплины:
а) Основная литература
1.
Аверченков В. И., Лозбинев Ф. Ю., Тищенко А. А. Информационные
системы в производстве и экономике: учебное пособие. М.: ФЛИНТА, 2011.- 274 с.
2.
Каймин В. А. Информатика: Учебник / В.А. Каймин; Министерство
образования
РФ.
6-e
изд.
М.:
ИНФРА-М,
2010.
285
с.
http://znanium.com/bookread.php?book=224852.
3.
Федотова Е. Л. Информатика: Курс лекций. Учебное пособие / Е.Л.
Федотова, А.А. Федотов. - М.: ИД ФОРУМ: ИНФРА-М, 2011. - 480 с.//
http://znanium.com/bookread.php?book=204273
б) Дополнительная литература
4.
Гвоздева В. А. Информатика, автоматизированные информационные
технологии и системы: Учебник / В.А. Гвоздева. - М.: ИД ФОРУМ: ИНФРА-М, 2011. - 544
с.: http://znanium.com/bookread.php?book=207105.
5.
Информатика: Учебное пособие / Под ред. Б.Е. Одинцова, А.Н. Романова. 2-e изд., перераб. и доп. - М.: Вузовский учебник: НИЦ Инфра-М, 2012. - 410 с.//
http://znanium.com/bookread.php?book=263735
6.
Журнал «Прикладная информатика» http://znanium.com/.
7.
Исаев Г. Н. Информационные технологии: учебное пособие. М.: Омега-Л,
2012. – 464 с. http://www.knigafund.ru/books/106847.
8.
Сергеева И. И. Информатика: Учебник / И.И. Сергеева, А.А. Музалевская,
Н.В. Тарасова. - 2-e изд., перераб. и доп. - М.: ИД ФОРУМ: ИНФРА-М, 2011. - 384 с.//
http://znanium.com/bookread.php?book=305668.
9.
Уткин в. Б., Балдин К. В. Информационные системы в экономике. М.:
Дашков и К., 2012. -394 с. http://www.knigafund.ru/books/106847.
Программное обеспечение:
1. Microsoft Word
2. Электронные таблицы: Microsoft Excel
3. Power Point
Базы данных, информационно-справочные и поисковые системы:
1. Library - Электронный каталог, созданный библиотекой филиала СПб ИВЭСЭП в г.
Калининграде
2. «Консультант Плюс» http://www.consultant.ru
3. ЭБС «КнигаФонд» (Электронная библиотека) ООО «Центр цифровой дистрибуции»
8. Материально-техническое обеспечение дисциплины:
Стандартно оборудованная аудитория.
Проектор с экраном.
Вопросы для промежуточного контроля
1. Сведения об окружающем мире, которые уменьшают имеющуюся степень
неопределенности, неполноты знаний, отчужденные от их создателя и ставшие
сообщения
1) знания
2) информация
3) факты
4) данные
5) сигналы
2. Процесс насыщения производства и всех сфер жизни и деятельности человека
информацией:
1) информационное общество
2) информатизация
3) компьютеризация
4) автоматизация
5) глобализация
3. Совокупность документов, оформленных по единым правилам, называется:
1) документооборот
2) документация
3) информационные ресурсы
4) информация
5) данные
4. Технические показатели качества информационного обеспечения относятся к:
1) объективным показателям
2) субъективным показателям
3) могут относиться как к объективным, так и к субъективным показателям
4) логическим показателям
5) экономическим
5. Субъективный показатель, характеризующий меру достаточности оцениваемой информации для решения предметных задач:
1) полнота информации
2) толерантность
3) релевантность
4) достоверность
5) объем информации
6. Система средств и способов сбора, передачи, накопления, обработки, хранения,
представления и использования информации:
1) информационный процесс
2) информационная технология
3) информационная система
4) информационная деятельность
5) жизненный цикл
7. Под информационной технологией понимаются операции, производимые с
информацией:
1) только с использованием компьютерной техники
2) только на бумажной основе
3) и автоматизированные, и традиционные бумажные операции
4) только автоматизированные операции
5) только операции, осуществляемые с помощью прикладных программ
8. АИС, обеспечивающая информационную поддержку целенаправленной коллективной
деятельности предприятия, − это:
1) АИС управления технологическими процессами
2) финансовая АИС
3) глобальная АИС
4) локальная АИС
5) корпоративная АИС
9. Вид аналога собственноручной подписи, являющийся средством защиты информации:
1) пароль
2) авторизация
3) персонализация
4) шифр
5) электронная цифровая подпись
10. Наиболее устойчивая к неисправностям отдельных узлов, и легко наращиваемая и
конфигурируемая топология сети:
1) шинная
2) радиальная
3) петлевая
4) кольцевая
5) глобальная
11. Система, в которой протекают информационные процессы, составляющие полный
жизненный цикл информации:
1) информационная система
2) компьютерная сеть
3) организационная система
4) социальная система
5) компьютерная система
12. Организация, осуществляющая физическое проектирование на основе существующей
концепции ИС:
1) системный интегратор
2) разработчик ИС
3) консалтинговая фирма
4) аудиторская фирма
5) компьютерная фирма
13. Целью автоматизации финансовой деятельности является:
1) повышение квалификации персонала
2) устранение рутинных операций и автоматизированная подготовка финансовых
документов
3) снижение затрат
4) автоматизация технологии выпуска продукции
5) приобретение нового оборудования
14. Карты, классифицирующиеся по выполняемым ими финансовым операциям:
1) карты с контактным считыванием
2) бесконтактные карты
3) с памятью
4) карты с магнитной полосой
5) кредитные
15. Адрес компьютера в сети, представляющий собой 32-разрядное двоичное число:
1) доменный
2) IР-адрес
3) логин
4) www
5) URL
16. Электронная почта обеспечивает передачу данных в режиме:
1) on-line
2) как в режиме on-line, так и в режиме off-line
3) off-line
4) по желанию отправителя
5) зависит от настроек почтовой программы
17. Рекламный графический блок, помещаемый на Web-странице и имеющий гиперссылку на сервер рекламодателя:
1) тезаурус
2) домен
3) баннер
4) кластер
5) сайт
18. Терминал, предназначенный для оплаты покупки с помощью карты:
1) обменный пункт
2) РОS-терминал
3) банкомат
4) кассовый аппарат
5) сканер
19. Адресом электронного почтового ящика может являться:
1) www.nngu.ru
2) fttp://lab.un.nn.ru
3) e:\work\new\stat.doc
4) http://www.host.ru/index.html
5) nauka@list.ru
20. Цель информационного обеспечения определяется:
1) субъектом информационного обеспечения
2) задачами организации
3) руководителем организации
4) информационными потребностями
5) указами правительства
Вопросы к зачету
1. Понятие информационной технологии.
2. Основные этапы развития информационных технологий.
3. Современные информационные технологии.
4. Эволюция информационных технологий; их роль в развитии экономики и общества.
5. Современное состояние и тенденции развития информационных технологий.
6. Классификация информационных технологий.
7. Понятие распределенной функциональной информационной технологии.
8. Централизованная и распределенная обработка данных.
9. Информационные системы (ИС): назначение, общая характеристика,
10. Структура и классификация ИС
11. Жизненный цикл ИС.
12. Информационные технологии и системы современного офиса.
13. Информационные технологии и системы поддержки принятия управленческих
решений.
14. Компьютерные сети: основные понятия, технологии, топологии.
15. Сети ЭВМ и сетевые ресурсы.
16. Глобальная сеть Интернет.
17. Интернет и интранет: общая характеристика технологий, их сходство и основные
отличия.
18. Службы, сервисы и информационные ресурсы Интернета.
19. Методы защиты электронных документов и их отдельных фрагментов.
20. Обеспечение безопасности информации при работе в Интернет.
21. Семейство экономических программ 1С.
22. 1С:Бухгалтерия: назначение, основные возможности, принципы применения.
23. 1С:Торговля и склад: назначение, основные возможности, принципы применения.
24. 1С:Зарплата и кадры: назначение, основные возможности, принципы применения.
25. 1С:Предприятие: назначение, основные возможности, принципы применения.
Глоссарий
A3D — стандарт генерации таких эффектов, как густой туман или подводные звуки,
позволяет моделировать конфигурацию помещения, в котором раздаются и
распространяются звуки.
Anchors — ссылки. Гипертекстовые ссылки, внедренные в Web-документ. Позволяют
пользователю переходить от одного фраг-; мента информации к другому независимо
от места ее хранения в Internet.
ANSI (American National Standards Institute) — американский национальный институт
стандартов — неправительственная организация, устанавливающая стандарты.
Развивает и издает стандарты для «добровольного» использования в Соединенных
Штатах. Набор стандартов принимается национальными организациями через
поставщиков данной страны.
API (Application Program Interface) — интерфейс прикладной программы.
Функциональный интерфейс, поддерживаемый операционной системой (ОС) или
специальной программой, который позволяет прикладной программе использовать
специфические данные или функции ОС или программы.
APRP (Adaptive Pattern Recognition) — адаптивное распознавание образов.
ASCII (American Standard Code for Information Interchange) — Американский
стандартный код для обмена информацией — соглашение для представления
символьной информации; код для представления английской текстовой информации,
используемый с отдельными модификациями в большинстве вычислительных
систем.
Authentication — установление личности пользователя, делающего попытку доступа к
системе.
Authorization — определение набора привилегий, которыми обладает пользователь.
Backup — резервное копирование. Процесс (регулярный или разо вый) копирования
данных на другие носители, обычно оптичв»'
ские или ленточные. Все файлы или только недавно измененные маркируются для
последующего копирования.
BLOB (Binary Large Object) — тип данных СУБД, используется для хранения
произвольной информации, которая может быть представлена в двоичном виде. Тип
данных BLOB является частью структуры базы данных, которая обеспечивает
полную функциональность СУБД для манипулирования BLOB-элементами. То есть
BLOB-элементы могут создаваться, удаляться, проверяться или копироваться. Но
чаще всего отсутствует возможность работы внутри BLOB. Например, невозможно
извлечение частей текста, индексирование и перемещение по BLOB.
CASE-средства (технологии) — программные средства, поддерживающие процессы
создания и сопровождения ИС, включая анализ и формулировку требований,
проектирование прикладного ПО (приложений) и баз данных, генерацию кода,
тестирование, документирование, обеспечение качества, конфигурационное
управление и управление проектом, а также другие процессы.
CCITT (Consultative Committee on International Telegraphique et Telephonique) —
Международный консультативный комитет по телеграфии и телефонии, МККТТ, в
настоящее время ITU-T. CCITT Group 4 — один из стандартов по сжатию
изображений.
CD-ROM (Compact Disc Read Only Memory) — постоянная память на компакт-дисках
емкостью более 600 Мбайт. Низкая цена способствует массовому распространению
данных, записанных на CD-ROM.
Client — прикладная программа, которая делает запрос программе сервера на получение
информации или выполнение задания сервером от имени клиента. Клиент и сервер
взаимодействуют через специальный протокол. Клиент и сервер могут работать на
различных хостах в сети и эти хосты могут быть компьютерами совершенно
различной конфигурации и платформы.
Collaborative Authoring — совместное создание документа группой людей, даже если
они находятся в различных местах или работают в различное время.
COM (Component Object Model) — составляющая программного обеспечения,
поддерживающая OLE 2.
Content — содержательная часть данных документа, в противоположность атрибутам.
Может включать текст, изображения, видео, звук, программы или любой другой
материал, содержащийся на
бумаге, дискете, компакт-диске (CD-ROM) и др. Отметим, что некоторые системы
управления документами расценивают данные как один из атрибутов.
СР 866 — распространенная в РФ кодировка символьной информации на базе кода ASCII
с расширением его до 256 символов: кодовая страница 866 для IBM PC, в части
кириллицы отсортирована по алфавиту, используется для работы с
немодифицируемыми (нерусскоязычными) программами в ОС типа MS-DOS,
сохраняет наиболее часто используемые в программах псевдографические знаки.
Data mining — «добыча» данных. Набор методов, позволяющих извлекать из сырых
данных ранее неизвестные знания о зависимостях и закономерностях поведения
рассматриваемого объекта. При этом все результаты формулируются в текстовых и
графических формах, удобных для восприятия человеком.
Data model — модель данных. Описание содержания базы данных на более
детализированном уровне, чем требуется непосредственно системе управления базы
данных.
Data transformation — преобразование данных. Процесс изменения данных при
начальной загрузке или при выполнении перемещения данных. Данные могут быть
преобразованы для улучшения удобочитаемости при объединении данных из
различных источников, для улучшения качества данных при их суммировании и т. д.
Data warehouse — хранилище (склад, кладовая) данных. База данных, разработанная для
решения прикладных задач, в основном, in области принятия решений. Данные
извлекаются из файловых систем операционных систем, из всевозможных СУБД и т.
п. Затем они преобразуются и объединяются, чтобы стать подходя щими для анализа
пользователями.
Database design — проектирование базы данных. Проект базы данных описывает
организацию данных в БД на детальном уровне, требуемом СУБД для управления
этими данными. Описывает pa i деление данных на таблицы и столбцы, и основные
типы I столбцах, например, целое число или 8-символьная строка. Проектирование
базы данных — это область деятельности адмишх i ратора базы данных. Простые
проекты базы данных соответстну» ют информационной модели базы данных,
содержание которой имеет представление, ориентированное на пользователя.
DBMS (Database management system) — Система управления базой данных.
DDE (Dynamic Data Exchange) — динамический обмен данными. Digital Video — видео,
фиксируемое в цифровом формате.
DirectX — предложенная Microsoft система команд управления позиционированием
виртуального звукового источника.
Distribution Media — среда вывода для хранения и копирования документов.
DMS (Document Management System) — Система управления документами.
Document Content Model — структура составного документа.
Document Interchange Format — правила представления документов с целью обмена.
Document Retrieval — поиск, выборка и использование документа из архивного
хранилища.
downsizing — разукрупнение, децентрализация средств обработки данных. Переход с
больших ЭВМ на ПК конечного пользователя и ЛВС.
dpi (dot per inch) — плотность печати или разрешение сканирования в точках на дюйм.
dpi (dots per inch — точек на дюйм) — единица измерения разрешения, в частности,
оптического разрешения сканера.
DSL — Dictionary Specification Language, «язык описания словарей». В электронном
словаре ABBYY Lingvo так называется встроенный инструмент, позволяющий
пользователю создавать и редактировать собственные словари. Эти словари
впоследствии могут быть подключены к Lingvo наряду с типовыми словарями из
комплекта поставки.
DTD (Document Type Definition) — определение типа документа — начало (преамбула)
SGML-документа, где определяются компоненты документа и его структура.
Описание типа (шаблона) документа.
ЕАХ (Environmental Audio Extensions) — модель добавления реверберации в A3D, с
учетом звуковых препятствий и поглощения звуком,
EDI (Electronic Data Interchange) — обмен данными и документами между различными
пользователями согласно стакДЯрТНЫМ (ANSI X.I2, EDIFACT) правилам.
EDIFACT (Electronic Data Interchange For Administration, Commerce And Transport)
— электронный обмен данными в управлении, торговле и на транспорте (ISO 9735—
1987).
Embedding — размещение (вложение, внедрение) данных в составном документе, при
котором данные и связанные с ними управляющие приложения физически
размещены внутри документа.
Firewall — защитный экран, брандмауэр, противопожарная стена — жаргон системных
администраторов. Системный компонент, выполняющий роль шлюза в сети, т. е.
система или набор систем, через которую должен проходить весь трафик между
внешней сетью (например, Internet) и внутренней сетью организации. Механизм,
защищающий пакеты внутренней сети от попадания во внешнюю (глобальную) сеть
и наоборот.
FlexiCapture — метаязык, разработанный специалистами компании ABBYY для описания
структуры гибких форм. Используется для разработки описания гибкой формы
FlexiLayout в программе ABBYY FlexiCapture Studio.
FlexiLayout — описание структуры гибкой формы в терминах языка FlexiCapture. Это
описание разрабатывается в программе ABBYY FlexiCapture Studio и передается в
ABBYY FormReader или приложение на базе ABBYY FineReader Engine. FlexyLayout
— своего рода «инструкция» о том, как следует искать и идентифицировать поля на
гибкой форме.
FTP (File Transfer Protocol) — протокол передачи файлов — сетевой протокол для
передачи файлов между компьютерами. Клиентская программа, использующая FTPтранзакции, является или ftp или браузером паутины. Серверной программой для
FTP-транзакций является ftpd.
GB — гигабайт (Гбайт).
GIF (Graphics Interchange Format) — формат обмена графическими данными.
Используется в качестве стандарта компактного хрв нения и распространения
файлов изображений в Internet.
Groupware — программное обеспечение, поддерживающее неформм лизованную
последовательность обработки документов. ПОЗВО ляет участвовать в
объединенном проекте многим сотрудникам, работающим в сети.
GUI (Graphical User Interface) — графический интерфейс пользам» теля.
HTML (Hypertext Markup Language) — язык высокого уровня для определения
структуры документов. Разработан в CERN и является одним из применений SGML.
В настоящее время разрабатывается третья версия HTML. Некоторые разработчики,
например, Netscape, создали свои расширения.
HTTP (Hyper Text Transfer Protocol) — сетевой протокол передачи (получения)
документов HTML.
ICR — аббревиатура слов Intelligent Character Recognition, «интеллектуальное
распознавание символов». Так называют технологии или системы, предназначенные
для массовой обработки документов, заполненных печатными буквами и цифрами от
руки, т. е. для распознавания рукописных символов. Если OCR-система должна
построить точную электронную модель исходного документа, то перед ICRсистемой такая задача не стоит. От ICR-системы требуется найти на изображении
документа информацию, извлечь ее и передать во внешнюю базу данных.
Извлеченные данные упорядочиваются по заранее заданным правилам, а как
выглядит и какую структуру имеет исходный документ, при этом несущественно.
ID — уникальный номер или идентификатор документа (записи) в БД.
Information object(s) — информационный объект(ы) — 1. Объект, который используется
в рассматриваемом процессе, может быть электронным либо материальным, в обоих
случаях он представляет собой либо сырые данные, либо результат работы. 2. Блоки,
из которых состоит документ. Например, текст, уравнения, штриховая графика,
векторные данные, извлечения из баз данных, фотографии, звуковая информация,
видео, программы.
Information warehouse — информационный склад. Архитектура, разработанная IBM в
начале 1990-х гг. для складируемых данных. Описывается в IBM Visual Warehouse.
Internet — всемирная компьютерная сеть — Сеть сетей, объединяющая множество
компьютерных сетей во всем мире и предоставляющая доступ к мировым
информационным ресурсам.
Interoperability — интероперабельность. Функциональная совместимость.
Intranet — интрасеть. Корпоративная сеть, использующая протоколы и стандарты
Internet.
IPA, принципы IPA (Integrity, Purposefulness, Adaptability) — принципы целостности,
целенаправленности, адаптивности. На этих принципах базируется восприятие
животных и людей, природных «чемпионов по распознаванию». И на этих же
принципах основаны технологии распознавания ABBYY. ABBYY FineReader —
система OCR, которая на всех этапах обработки документа действует в соответствии
с принципами IPA.
ISO (International Organization for Standardization) — Международная организация по
стандартизации (ВОС).
ISO 8859/5 — распространенная в РФ кодировка символьной информации на базе кода
ASCII с расширением его до 256 символов: используется в русскоязычных версиях
VAX/VMS и на ряде персональных компьютеров, получила достаточно широкое
распространение благодаря явной направленности на работу с русским языком. Эта
кодировка зафиксирована ГОСТ 19768—87.
Java — объектно-ориентированный язык для создания распределенных прикладных Webсистем.
JPEG — 1. Joint Photographic Experts Group — объединенная экспертная группа по
фотографии, разработавшая алгоритм сжатия изображения. 2. Стандартный
алгоритм сжатия неподвижного изображения, разработанный группой JPEG. Сжатие
по этому алгоритму основано на психовизуальном восприятии изображений
человеком и ведет к потере информации за счет исключения мелких деталей.
Коэффициент сжатия варьируется в пределах от 2 до 100 раз.
LAN (Local Area Network) — локальная компьютерная сеть.
Linking — объединение (связывание) объектов в составной документ, вследствие чего
ссылка связи, вставленная в документ, указывает на фактические данные, которые
физически находят* ся в другом месте документа или в каком-то другом документе.
Localization — локализация. Адаптация программного продукта к национальным
особенностям страны или географического ре гиона, в котором он используется.
Например, разработчики программ обработки текстов должны локализовать
алгоритмы сортировки списков для различных алфавитов.
Mapping — отображение. Процесс определения, какие преобраюин ния данных
требуются при начальной загрузке склада данный или при перемещении данных.
Результат «отображения» -то, что хранится в метаданных.
MDA (Multilevel Document Analysis) — Многоуровневый анализ документа.
Metadata — Метаданные.
Middleware — программное обеспечение, обеспечивающее интерфейс высокого уровня,
освобождающий разработчика прикладных программ от знания сложностей
аппаратных средств, операционной системы и сетевой семантики.
MIDI (Musical Instrument Digital Interface) — протокол передачи и интерпретации
команд управления воспроизведением звука. Применяется в звуковых картах и
определяет основные средства для управления расположением инструментов,
голосов, а также для деления на инструментальные группы (клавишные, ударные и т.
д.)
MIDI секвенсор — устройство, которое записывает и воспроизводит команды MIDI, а не
аудиосигналы.
MIME (Multipurpose Internet Mail Extention) — многоцелевое расширение электронной
почты Internet. Официально предложенный стандарт электронной почты в Internet.
MIME-формат позволяет включать в сообщение электронной почты помимо текста
также изображения, звук, видео.
Mosaic — один из первых графических браузеров для просмотра HTML-документов
всемирной паутины, разработанный NCSA.
MS-DOS — дисковая операционная система, созданная фирмой Microsoft. Однозадачная,
однопользовательская операционная система с интерфейсом командной строки.
Navigation — процесс целенаправленного перемещения от одного узла сети к другому.
Netscape — многоплатформный интерфейс — браузер для навигации и просмотра
информации в гипертекстовой системе WWW, разработанный Netscape
Communication Corporation.
NNTP (Network News Transfer Protocol) — сетевой протокол передачи новостей. Служит
для помещения и извлечения статей в телеконференциях.
OCR (Optical Character Recognition) — распознающая программа для ввода документов
с использованием оптического сканера. Характерным представителем относительно
дешевых OCR-программ является пакет FineReader. В качестве примера OCR-npoграммы для автоматического распознавания типографского набора можно привести пакет
CuneiForm 1.2R.
ODA (Office Data/Document Architecture) — архитектура деловых документов (стандарт
ISO 8613).
ODBC (Open Database Connectivity) — стратегический интерфейс Microsoft для вызова
данных в гетерогенной среде реляционных и нереляционных систем управления
базами данных. ODBC предназначен обеспечить универсальный набор команд
интерфейса для доступа к данным, что обеспечивает доступ к множественным
различным базам данных. Интерфейс используется разработчиком, чтобы
определить команды, которые затем транслируются драйверами для различных
видов SQL, используемого различными продавцами DBMS.
ODIF (Office Document Interchange Format) — формат обмена документами в
делопроизводстве (ISO 8613).
ODMA (Open Document Management API) — API для связи прикладных программ с
системой управления документами и другим групповым ПО.
OLAP (On-line analytical processing) — аналитическая обработка данных в оперативном
режиме. Прикладное ПО для анализа информации, хранящейся в базе данных.
OLE 2.0 (Object Linking and Embedding 2.0) — набор стандартных спецификаций и
способов их реализации, находящийся в собственности и поддерживаемый Microsoft
для составных документов.
On-line — 1. Режим работы с компьютером или каким-либо другим устройством, при
котором подразумевается постоянное с ним взаимодействие. Синонимы:
интерактивный, диалоговый, оперативный. 2. Постоянно включенное устройство;
неавтономный режим работы.
OODBMS (Object Oriented DBMS) — объектно-ориентированная система управления
базами данных. Система управления базами данных, выполняющая ряд функций,
основанных на объектных понятиях (концепциях). В зависимости от целей их
проектирования такие системы обладают одним или всеми из следующих свойств:
системы более гибкого типа, чем найденные в RDBMS; легкая связываемость с
помощью интерфейса с объектными языками; способность обрабатывать
неструктурированные и
мультимедийные данные; более быстрая эффективность, чем у RDBMS.
ORACLE — система управления реляционными базами данных и широкий набор
работающих с ней инструментальных средств разного уровня, доступные
практически на всех распространенных вычислительных машинах и операционных
системах.
OSI (Open System Interconnection) — связь открытых систем. Иной (не Internet) набор
сетевых протоколов, предложенный ISO. Этот стандарт сетевого и межсетевого
взаимодействия определяет семь уровней взаимодействия компонентов сети:
физический, канальный, сетевой, транспортный, сеансовый, уровень представления
данных и прикладной. Для каждого уровня разработан один или несколько
протоколов, которые обеспечивают сетевое взаимодействие широкого класса
устройств.
PDF — аббревиатура слов Portable Document Format, «универсальный формат
документов». Термин введен корпорацией Adobe, которой был разработан данный
формат. Удобство формата PDF в том, что он может быть прочитан специальной
программой — Adobe Acrobat, версии которой существуют почти для любых
платформ и операционных систем.
PDL (Page Description Language) — язык описания страниц. ЕДИНЫЙ формат для
передачи готового документа в нередпктируемом виде. Позволяет просматривать и
печатать документ пи ра'ишч ном оборудовании.
Plug-and-play — «вставляй и работай». Способ, реализуемый II УС1 ройствах для
массового непрофессиональною ПОЛЬЭОМТвЛЯ.
Point-and-click — «укажи и щелкни». В GUI способ ЗШУСКЙ ро \n\v\
ных приложений.
Postscript — распространенный формат электронных документов -язык описания
страниц печатных документом для лазерных принтеров и других устройств
ВЫНОДП, Разработан фирмой Adobe.
RAID (Redundant Array of Independent Disc) дисковый массив, обеспечивающий
резервирование и дублирование данных.
RDBMS (Relational Dadihiisc Management System) — реляционная система управления
бйзоми данных. Основная технология баз данных, используемая и складировании
данных. Реляционная технология 6ВЗЫ данных была определена Т. Коддом,
который также издал набор прижги, определяющих OLAP.
Recovery — восстановление, возобновление, возврат, возврат в исходное состояние.
Relational database — реляционная база данных.
Replication — процесс физического дублирования данных из одной базы данных в
другую. Дублирование увеличивает функциональные возможности преобразования
данных. Гетерогенное копирование, где исходные и целевые типы данных различны,
осуществляется разными средствами. Некоторые репликаторы позволяют
двунаправленное копирование, где любая копируемая база данных может
модифицироваться, тогда изменения автоматически распространяются в другую.
Repository — склад. Корпоративный информационный ресурс^ содержащий всю
разработку, предоставленную от анализа до кодов программ, и способный к
сохранению версий и конфигураций. Узловой центр для интегрированной среды
обработки с различным набором инструментальных средств и способствующий
использованию информации для стандартизации семантики.
Retrieval — процесс поиска, выборки документов или их частей в системах управления
документами.
Router — маршрутизатор, устройство для передачи сетевых пакетов из одной сети в
другую на основе информации, содержащейся в передаваемом пакете. Сетевой шлюз
является наиболее типичным представителем маршрутизаторов.
RPC (Remote Procedure Call) — вызов удаленной процедуры, дистанционный вызов
процедуры. Используется в серверной части приложения. Механизм RPC скрывает
от программиста детали сетевых протоколов нижележащих уровней.
Scan&Read, мастер Scan&Read — встроенное средство ABBYY FineReader,
позволяющее начинающему пользователю с первых же минут начать эффективно
работать с программой.
Scanning — сканирование — процесс преобразования информации, находящейся на
твердом носителе, в цифровой формат.
Schema — проект базы данных, написанный на языке областей определения данных
(DDL) специфической системы управлении базами данных.
Security — безопасность — функция системы, правила, ограничп вающие доступ к
документам: установление личности пользой!
теля, делающего попытку доступа, определение набора привилегий, доступных
пользователю.
SGML (Standard Generalized Markup Language) — язык разметки высокого уровня для
представления документов сложной структуры, обычно используемых в
технических приложениях.
SMTP (Simple Mail Transfer Protocol) — простой (упрощенный) протокол электронной
почты. Прикладная служба в сетях TCP/IP для передачи текстовых сообщений.
SNA (Systems Network Architecture) — сетевая архитектура систем. Разработана
корпорацией IBM для организации сети своих хост-машин и терминалов. Состоит из
семи уровней протоколов, которые подобны уровням модели OSI. Определяет
способы передачи информации: иерархический (связь между хост-машиной и
терминалами) и одноранговый (равноправный).
SQL (Structured Query Language) — структурированный язык запросов. Стандартный
язык запросов, используемый для обращения к реляционным базам данных.
Разработан фирмой IBM. ANSI-стандарты были изданы для SQL в 1986 и 1989 г.
TCP/IP (Transmission Control Protocol/Internet Protocol) — набор протоколов для
коммуникации в локальной сети или во взаимосвязанном наборе сетей. Основной
протокол Internet/Intranet.
TIFF (Tagged Image File Format) — теговый формат файла изображений.
Trigger — триггер — предшествующее событие в последовательной паре событий
процесса, трактуемое как причина последующего события этой пары. Синоним —
Event.
URL (Universal Resource Locator) — последовательность символов, обозначающая адрес
документа (или его части) на сервере Паутины. Типичный URL содержит 3 части:
используемый протокол при извлечении документа (ftp, http и др.); доменное имя
компьютера, где хранится документ; путь к документу (pathname) в локальной
файловой системе; синтаксис URL — protocol://server name/path.
View — показ — представление содержания документа в читаемой форме.
WAN (Wide Area Network) — глобальная вычислительная сеть.
Warehouse population — складская совокупность. Процесс извлечения данных из
исходных баз данных, преобразование их для
улучшения удобочитаемости и качества данных, транспортировка по физическим сетям,
объединение информации из различных источников, загрузка в склад данных.
Спецификация, реализация и управление складской совокупностью — это наиболее
трудный, дорогой и опасный процесс в складировании данных.
WWW (World Wide Web) — Всемирная паутина.
Х.400 — наборы протокольных стандартов для международной пересылки электронной
почты. Это стандарт для систем работы с сообщениями электронной почты
позволяет включать в сообщения не только текстовую, но и другую информацию,
например факсы и графические изображения. Поддерживается поставщиками в
основном в качестве инструмента, позволяющего работать с различными системами
электронной почты.
XML — extensible Markup Language, «расширяемый язык разметки». Современный
инструмент для создания и обработки документов; его возможности используются
многими программами.
Агрегат данных — именованная совокупность элементов данных, представленных
простой (векторной) или иерархической (группы или повторяющиеся группы)
структурой. Примеры — массивы, записи, комплексные числа и пр.
Агрегатные функции — вычислительные функции СУБД, реализующие при выводе
отчета или чтении таблицы данных вычисление агрегатных данных по группе
записей БД (строк таблицы) -МАХ (максимальное значение данного поля в
обработанной группе записей/строк),. MIN (минимальное значение), AVER (среднее
значение), COUNT (подсчет числа записей) и пр.
Адаптивная бинаризация, adaptive binarization, AB — способ обработки изображения;
алгоритм, выбирающий порог бинаризации it зависимости от контрастности данного
участка изображения. Дает возможность точно распознавать текст со сложных ориги
налов, например, ветхих, истертых страниц. Адаптивная бинаризация используется
ABBYY FineReader для повышения качества распознавания.
Администратор базы данных (АБД) — лицо или группа, уполномоченные для ведения
БД (модификация структуры и содержании БД, активизация доступа пользователей,
выполнение других административных функций, которые затрагивают всех
пользоип-телей). С этой целью он идентифицирует объекты БД и моделирует базу, используя язык описания данных. Администратор решает также все вопросы,
связанные с размещением БД в памяти, выбором стратегии доступа и ограничением
доступа к данным. В функции АБД входят также организация загрузки, ведения и
восстановления БД.
Анализ документа — процедура обработки изображения, в ходе которой OCR-программа
создает электронную редактируемую копию документа. Собственно распознавание
текста — одна из составных частей анализа документа.
Архитектура документа — структурное описание документа, включающее в себя все
входящие в него виды информации (текст, векторная и растровая графика, таблицы).
Атрибут — поле данных, содержащее информацию об объекте.
База данных (БД) — именованная совокупность взаимосвязанных данных,
отображающая состояние объектов и их отношений в некоторой предметной
области, используемых несколькими пользователями и хранящимися с минимальной
избыточностью. Базы данных предоставляют собой более жесткую среду для
хранения нежели файловые системы ОС. Базы данных характеризуются
многопользовательским интерфейсом, протоколированием, словарями данных для
моделирования метаданных, определяемой пользователем структурой, жесткими
типами данных и сложными языками запросов.
Байт — 1. Единица количества информации, равная обычно восьми битам. 2. Ячейка
памяти, соответствующая одному байту.
Безопасность — защита данных от преднамеренного или непреднамеренного доступа,
модификации или разрушения.
Библиографические данные (записи) — выходные данные (включают авторов,
заголовок, классификационный индекс, место публикации и пр.), иногда реферат.
Бинаризация — перевод изображения в бинарный формат, когда каждая точка может
быть либо белого, либо черного цвета. Бинаризация выполняется всеми OCRпрограммами в процессе подготовки изображения к распознаванию. В некоторых
случаях качество бинаризации очень сильно влияет на точность распознавания.
Бит — 1. Двоичная единица количества информации. 2. ЕДИНИЦ1 объема памяти,
соответствующая одному биту информации
Битрейт (bitrate) — ширина потока (битовая скорость). Для звукового сигнала термин
обозначает общую ширину потока, безразлично к тому, монофонический или
стереофонический сигнал он содержит, варьируется от наибольшего для МРЗ,
равного 320 кбит/с (320 килобит в секунду), до 96 кбит/с и ниже.
Браузер — прикладная программа клиента, которая позволяет просматривать, извлекать и
показывать содержание документов, находящихся на серверах Всемирной паутины.
Наиболее распространенные браузеры — Netscape Navigator и Internet Explorer.
Валидация — автоматическая проверка распознанных данных на соответствие заданным
правилам. Например, проверка на попадание численных данных в определенный
интервал, проверка совпадение сумм, указанных цифрами и прописью, проверка на
соответствие формату или заданному значению.
Верификация — проверка распознанных данных оператором. Производится путем
сличения результатов распознавания с исходным изображением части документа.
Технология верификации реализована в продуктах ABBYY с учетом основных
психосоматических особенностей человека: выработки привычек, использования
навыков, целостности и целенаправленности восприятия.
Вид документа — элемент классификации множества документов, циркулирующих в
организации.
Видеоадаптер — электронная плата, генерирующая видеосигнал, посылаемый
видеодисплею по кабелю.
Восстанавливаемость — запроектированная возможность восстановления целостности
БД после любого сбоя системы.
Всемирная паутина (WWW) — Internet-обслуживание, которое дает возможность
пользователям читать и выбирать документы со всего мира.
Вторичный документ — документ, являющийся результатом аналити-ко-синтетической
переработки одного или нескольких первичных документов.
Гипертекст — информационная система из узлов данных и смысловых связей между
ними.
Глобальная вычислительная сеть — сеть передачи данных, охватывающая
значительное географическое пространство (регион, страну, ряд стран, континенты).
Данные — информация, обработанная и представленная в формализованном виде для
дальнейшей обработки
Дескриптор — предназначенное для координатного индексирования документов и
информационных запросов нормативное ключевое слово, по определенным
правилам отобранное из основного словарного состава того или иного естественного
языка.
Дескрипторный язык — информационно-поисковый язык, словарный состав которого
состоит из дескрипторов, а использование основано на принципе координатного
индексирования.
Документ — агрегат данных в документальных системах (АИПС), имеющий
иерархическую структуру и, кроме форматных полей (элементы или агрегаты
данных фиксированной длины), обычно содержащий текстовые поля, или
символьные
последовательности
неопределенной
длины,
логически
подразделяющиеся на параграфы (PAR, SEGM), предложения (SENT), слова
(WORD).
Естественный язык — язык, словарь, грамматические правила которого обусловлены
практикой применения и не всегда формально зафиксированы.
Запись логическая — идентифицируемая (именованная) совокупность элементов или
агрегатов данных, воспринимаемая прикладной программой как единое целое при
обмене информацией с внешней памятью. Запись — это упорядоченная в
соответствии с характером взаимосвязей совокупность полей (элементов) данных,
размещаемых в памяти в соответствии с их типом.
Запись физическая — совокупность данных, которая может быть считана или записана
как единое целое одной командой ввода-вывода.
Запрос (информационный) — сообщение, обычно неформатированное, информационнопоисковой системе со стороны абонента, содержащее его информационную
потребность и подвергающееся автоматическому индексированию.
Иерархическая модель данных — использует представление предметной области БД в
форме иерархического дерева, узлы которого связаны по вертикали отношением
«предок—потомок». Навигация в БД представляет собой перемещение по вертикали
и горизонтали в данной структуре. Одной из наиболее популярных иерархических СУБД была Information Management System (IMS) компании IBM,
появившаяся в 1968 г.
Импорт (загрузка, download) — утилита (функция, команда) СУБД, служащая для
чтения файлов операционной системы, которые содержат данные из базы данных,
представленные в некотором коммуникативном формате.
Инвертированный файл (список) — файл, предназначенный для быстрого
произвольного поиска записей по значениям ключей, организованный в виде
независимых упорядоченных списков (индексов) ключей — значений определенных
полей записей основного файла.
Индекс —'таблица ссылок на объекты, используемая для определения адреса записи.
Индексирование — формирование описания документа как совокупности дескрипторов,
выбираемых из заранее созданных словарей понятий либо из текстов документов.
Информационная система — система, предназначенная для хранения, обработки,
поиска, распространения, передачи и предоставления информации.
Информационная технология — совокупность методов, производственных процессов и
программно-технических средств, объединенных в технологический комплекс,
обеспечивающий сбор, создание, хранение, накопление, обработку, поиск, вывод,
копирование, передачу и распространение информации.
Информационно-поисковая система (ИПС) — программная система для хранения и
поиска данных по неформатированным запросам. Для общения пользователя с ИПС
разработчики системы стремятся применять упрощенный естественный язык.
Информационно-поисковый язык (ИПЯ) — искусственный язык, обеспечивающий
компактную, строго алгоритмизированную запись содержания документов и
запросов в ИПС. ИПЯ можно определить как специализированную семантическую
систему, состоящую из алфавита, правил образования (грамматики) и правил
интерпретации (семантики).
Информационные
ресурсы
—
совокупность
накопленной
информации,
зафиксированной на материальных носителях в любой форме, обеспечивающей ее
передачу во времени и пространен»1 В контексте автоматизированных
информационных
систем
ПОЙ
информационными
ресурсами
обычно
подразумевают информн
ционные массивы и базы данных, рассматриваемые совместно с информационными
технологиями, обеспечивающими их доступность.
Информационный агент — интеллектуальный агент (агент знаний). Программа,
делаюшая документ самоосведомленным посредством анализа его содержания и
сравнения этого содержания с профилем пользователя или уровнем его интересов.
Наиболее передовой задачей интеллектуального агента является получение сжатого
содержания документа в виде автоматической аннотации.
Информационный запрос — записанный на естественном языке текст, выражающий
некоторую информационную потребность.
Информационный поиск — процесс отыскания в поисковом массиве таких записей,
которые соответствуют признакам, указанным в информационном запросе.
Информация — сведения, воспринимаемые человеком и (или) специальными
устройствами как отражение фактов материального или духовного мира в процессе
коммуникации.
Искусственный язык — язык, специально созданный и регулируемый на основе
согласованных принципов.
Классификация — процесс соотнесения содержания документов с понятиями,
зафиксированными в заранее составленных систематических схемах.
Клиент — программы, написанные как пользователями, так и поставщиками СУБД,
внешние или «встроенные» по отношению к СУБД. Программа-клиент организована
в виде приложения, работающего «поверх» СУБД и обращающегося для выполнения
операций с данными к компонентам СУБД через интерфейс внешнего уровня.
Клиент/сервер — технология (архитектура) взаимодействия клиента и сервера. Клиент —
программа, запрашивающая у сервера информацию или выполнение какого-либо
задания на сервере от имени клиента. Сервер — прикладная программа,
исполняющая запросы клиента. Клиент и сервер взаимодействуют по
определенному протоколу. Программа клиента и программа сервера могут
располагаться как на одной машине, так и на совершенно различных компьютерах
произвольной сети.
Ключ — значение (элемент данных), используемый для идентификации или определения
адреса записи.
Ключевое поле — поле в структуре записи. Поле определяют как ключевое (или
индексированное) для убыстрения или упрощения операций поиска и/или для
модификации операций обработки данных.
Ключевое слово — предметное слово, выбираемое из некоторого текста (документа) и
используемое для координатного индексирования этого текста (документа).
Код — система представления информации в виде данных, состоящая из набора условных
знаков и правил присвоения им значений.
КОИ (ГОСТ 19768—74) — распространенная в РФ кодировка символьной информации на
базе кода ASCII с расширением его до 256 символов: используется в ряде систем
типа UNIX; в части кириллицы эта кодировка не отсортирована по алфавиту и,
следовательно, не позволяет использовать большинство зарубежных программ без
соответствующих модификаций.
Коммуникативные (обменные) форматы данных — соглашения о представлении
агрегатов информации при передаче.
Контекстный поиск — разновидность операции поиска определенного набора символов,
в ходе которой пользователь может указать, что просматривать нужно только
некоторые файлы (выбранные по какому-то признаку).
Контрастность — параметр, показывающий, насколько самый темный участок
изображения отличается от самого светлого. Влияет на качество распознавания.
Координатное индексирование — индексирование, при котором основное содержание
документа представляется в виде сочетания ключевых слов или дескрипторов.
Лемматизация — нахождение начальной формы слова по любой его словоформе.
Например, дано слово «погоняемый» — найдено слово «погонять». Лемматизация
реализована в ABBYY Retrieval & Morphology Engine, что позволяет системе
эффективнее проводить полнотекстовую индексацию документов, в том числе и
многоязычных.
Логическая структура БД — определение БД на физически независимом уровне.
Логическая структура документа — в ODA предназначена для представления
произвольных иерархических видов организации информации. Например, рубрикация документа, включение в текст таблиц и рисунков.
Логический файл — файл в представлении прикладной задачи, состоящий из логических
записей, структура которых может отличаться от структуры физических записей,
представляющих информацию в памяти.
Локальная вычислительная сеть (ЛВС) — коммуникационная система,
поддерживающая в пределах одного здания или некоторой ограниченной
территории один или несколько высокоскоростных каналов передачи цифровой
информации, предоставляемых подключаемым устройствам для кратковременного
монопольного использования.
Мастер диаграмм (Excel) — совокупность встроенных автоматизированных процедур,
позволяющих выбрать тип диаграммы и для него выполнить все необходимые
операции. Существуют следующие типы диаграмм: линейчатая, круговая, точечная,
поверхностная, диаграмма с областями, кольцевая, лепестковая, пузырьковая,
биржевая, а также гистограмма и график.
Метаданные — информация, которая описывает другие данные, с помощью таких
атрибутов, как их структура, ассоциации, типы и диапазоны. См. также Data Model.
Метаданные чрезвычайно важны в складировании данных (Data Warehousing).
Методы поиска — совокупность моделей и алгоритмов реализации отдельных
технологических этапов, таких, как построение поискового образа запроса, отбор
документов (сопоставление поисковых образов запросов и документов), расширение
и реформу-лирование запроса, локализация и оценка выдачи.
Механизмы поиска — реализованные в системе модели и алгоритмы процесса
формирования выдачи документов в ответ на поисковый запрос.
Модель данных — базовый инструментарий, обеспечивающий на формальном
абстрактном уровне конкретные способы представления объектов и связей.
Модель документа —- понятие охватывает аспекты создания, преобразования, хранения,
поиска, передачи и отображения документов.
Модель физическая — определяющая размещение и способы поиска данных на внешних
запоминающих устройствах СУБД.
Морфологический поиск — поиск с учетом морфологии (всех возможных форм слова).
Например, если в строке поиска введено «хрюкать» — в результатах поиска
присутствуют «хрюкающий», «хрюкало» и другие производные от заданного слова.
Морфологический поиск реализован в системе электронных словарей ABBYY
Lingvo.
Мультимедиа — среда, материал, состоящий из комбинации текста, графики, видео,
мультипликации и звука, представляющий таким образом информацию в более
понятном и удобообрабаты-ваемом виде.
Мэйнфрейм — компьютер высокой мощности, разработанный для решения наиболее
интенсивных вычислительных задач. Обычно используется одновременно многими
пользователями.
Навигатор (browser) — программа навигации и просмотра, размещающаяся на рабочем
месте пользователя, клиентская программа в сети Всемирной паутины.
Навигация — целенаправленная, определяемая стратегией последовательность
использования методов, средств и технологий конкретной АИПС для получения и
оценки результата поиска.
Независимость данных логическая (физическая) — свойство системы,
обеспечивающее возможность изменять логическую (физическую) структуры
данных без изменения физической (логической).
Носитель информации (данных) — средства регистрации, хранения, передачи
информации (данных).
Операционная система (ОС) — общее название программ и программных комплексов,
расширяющих функциональные возможности аппаратуры вычислительных машин,
повышающих эффективность использования вычислительных средств и
облегчающих взаимодействие пользователя с машиной.
Открытая система — 1. Система, имеющая возможность расширения за счет средств
среды, в которой она функционирует. 2. Система, независимая от изготовителей ИС,
удовлетворяющая требованиям ряда международных стандартов.
Открытость. Свойство информационных технологий и систем, пред полагающее
способность объединять разные информационные системы, аппаратуру и
программные продукты различных производителей, что делает возможным обмен
между ними даним ми, распределенный доступ к информационным ресурсам.
Отношение (relation) — агрегат данных, хранящийся в одной из таблиц (строка таблицы)
табличной, реляционной БД или создаваемый виртуально в процессе выполнения
операции над базой данных при выполнении запросов к данным.
Поисковый образ документа (ПОД) — описание документа, выраженное средствами
ИПЯ и характеризующее основное смысловое содержание или какие-либо другие
признаки этого документа, необходимые для его поиска по запросу.
Поисковый образ запроса (ПОЗ) — записанный на ИПЯ текст, выражающий смысловое
содержание информационного запроса и содержащий указания, необходимые для
наиболее эффективного осуществления информационного поиска.
Полнотекстовые документы (записи) — полный (или почти) исходный текст
журнальной статьи или другого документа.
Пользователь БД — программа или человек, обращающийся к базе данных с помощью
средств управления данными СУБД.
Постреляционная СУБД (ПРСУБД) — система управления базами данных,
поддерживающая расширенную реляционную модель данных. Расширения могут
носить различный характер, в частности, ADABAS поддерживает повторяющиеся
групповые поля (фактически вложенные таблицы) в экземплярах отношений.
Предметная область (ПрО) —- набор объектов, представляющих интерес для
актуальных или предполагаемых пользователей, когда реальный мир отображается
совокупностью конкретных и абстрактных понятий, между которыми фиксируются
определенные связи.
Проектирование базы данных — упорядоченный формализованный процесс создания
системы взаимосвязанных описаний — моделей предметной области, которые
связывают (фиксируют) хранимые в базе данные с объектами предметной области,
описываемые этими данными.
Протокол — совокупность определений (соглашений, правил), регламентирующих
формат и процедуры обмена информацией между двумя или несколькими
независимыми устройствами или процессами, т. е. описание того, как программы,
компьютеры или иные устройства должны действовать, когда они взаимодействуют
друг с другом.
Профиль документа — в ODA набор свойств документа, которые относятся к документу
в целом.
Рабочая станция — комбинация устройств ввода-вывода и вычислительных аппаратных
средств, используемых отдельным пользователем. Однако чаще так называют
мощный автономный компьютер для выполнения прикладных программ, требующих
высокоэффективных, обычно дорогих средств обработки информации со
значительными вычислительными или графическими возможностями. В последнее
время так еще называют персональные компьютеры или терминалы вычислительной
сети.
Разметка — дополнительная информация, включаемая в документ и выполняющая
функции выделения логических элементов данного документа и задания процедур
обработки выделенных элементов.
Разрешение оптическое — параметр сканера, характеризующий предельно достижимую
детальность считывания информации с оригинала, указывается в точках на дюйм
(dpi).
Распознавание документа — построение редактируемой электронной копии бумажного
документа. Как правило, проводится в два этапа; сначала с помощью сканера
получают электронную «фотографию» страницы, затем обрабатывают ее
специальной OCR-программой. Результатом работы OCR-программы становится
точная электронная копия документа, которую можно редактировать, сохранять в
различных форматах, распечатывать и т. д.
Распределенная база данных — совокупность баз данных, которые обрабатываются и
управляются по отдельности, а также могут разделять информацию.
Редактор — программа, обычно используемая для создания текстовых файлов или
внесения изменений в существующий текстовый файл. Редактор обладает
некоторыми возможностями текстового процессора, но уступает ему в мощности.
Релевантность — свойство некоторой информации (документ, факт, и пр.)
удовлетворять информационную потребность пользователя АИС (relevant —
относящийся к делу).
Реляционная алгебра — алгебра (язык), включающая набор операций
для манипулирования отношениями.
Реляционная база данных — база данных, состоящая из отношений, Здесь вся
информация, доступная пользователю, организована и виде таблиц, обычно
имеющих уникальные имена, состояние
из строк и столбцов, на пересечении которых содержатся значения данных, а операции
над данными сводятся к операциям над этими таблицами.
Реляционная СУБД (РСУБД) — система управления базами данных, поддерживающая
реляционную модель данных (РМД).
Репозитарий — архив, склад, кладовая.
Рунет — сокращенное название для «русского», т. е. русскоязычного и РФориентированного Internet. Робот-индексировшик Yandex автоматически считает
серверы в доменах su, ru, am, az, by, ge, kg, kz, md, ua, uz принадлежащих Рунету.
Остальные серверы вносятся в базу, если на них найден текст на русском языке или
если владельцы ресурсов убедят администрацию поисковой машины в том, что их
сервер интересен пользователям русскоязычного Internet.
Сервер — программа, реализующая функции СУБД: определение данных, запись—
чтение—удаление данных, поддержку схем внешнего—концептуальноговнутреннего уровней, диспетчиро-вание и оптимизацию выполнения запросов,
защиту данных.
Сетевая модель данных (модель CODASYL). Предложенная CODASYL модификация
иерархической модели, в которой одна запись могла участвовать в нескольких
отношениях предок/потомок.
Сетевой сервер — сетевой (хост-) компьютер, выполняющий системные функции
отработки сетевых протоколов для связанных с сервером других сетевых
компьютеров, обычно рабочих станций. Сетевой сервер обычно выполняет одну или
несколько обслуживающих функций, таких, как файловый сервер, FTP-cep-вер, Webсервер и др.
Система управления базами данных (СУБД) — совокупность языковых и программных
средств, предназначенных для создания, ведения и совместного использования БД
многими пользователями.
Словарь данных — исчерпывающий набор таблиц или файлов, представляющий собой
каталог всех описаний данных (имен, типов). Может содержать также информацию
о пользователях, привилегиях и т. д., доступную только администратору базы
данных. Является центральным источником информации для СУБД, АБД и всех
пользователей.
Содержание документа — в ODA представляет собственно информацию документа:
текст, рисунки и т. п.
Структура данных линейная — порядок следования элементов данных, который имеет
линейный характер и соответствует порядку расположения элементов в памяти.
Таблица — основная единица информации в системе управления реляционной базой
данных. Состоит из одной или более единиц информации (строк), каждая из которых
содержит значения некоторого вида (столбцы). Тег — признак. Часть элемента
данных (обычно один или несколько
разрядов), определяющих его тип.
Тезаурус — семантическая сеть, в которой понятия связаны регулярными и устойчивыми
семантическими отношениями — иерархическими (например, род—вид, целое-—
часть), ассоциативными, а также отношениями эквивалентности.
Текстовый слой (PDF-документа) — часть документа, сохраненного в формате PDF,
которая содержит часть текста или даже весь текст документа. ABBYY FineReader
способен «читать» текстовые слои PDF, что резко повышает качество распознавания
подобных документов.
Терминал — устройство, содержащее видеоадаптер, дисплей и клавиатуру. Адаптер и
дисплей (иногда и клавиатура) обычно скомпонованы в одном устройстве.
Технологии поисковые — унифицированные (оптимизированные в рамках конкретной
АИПС)
последовательности
эффективного
использования
в
процессе
взаимодействия пользователя с системой отдельных средств поиска для устойчивого
получения конечного и, возможно, промежуточных результатов. Типы данных —
совокупность соглашений о программно-аппаратурной форме представления и
обработки, а также ввода, контроля и вывода элементарных данных; к типам данных
прежде всего относятся классические типы — целое число, действительное число,
булевское значение. Топология БД — схема распределения компонент базы данных
по физическим носителям, в том числе различным узлам вычислительной сети.
Точка сохранения — момент времени, когда в БД записывается пси работа в транзакции.
В транзакции может применяться ряд точек сохранения, выступающих в роли промежуточных точек для работы.
Точность распознавания — основной параметр, характеризующий качество работы
OCR-программы. Численно равен отношению количества правильно распознанных
символов к общему количеству символов в документе и выражается в процентах.
Транзакция — последовательность операций над данными базы, переводящая БД из
одного непротиворечивого состояния в другое, которая может быть представлена
как одно «событие».
Триггер (включения, запроса, удаления и пр.) — группа команд языка запросов или
программирования (в среде СУБД), которая исполняется при наступлении
определенного условия/события (конец файла, считывание записи, изменение
значения поля и пр.).
Уровни представления данных — концептуальный, внутренний и внешний. Внутренний
уровень — глобальное представление БД, определяет необходимые условия в
первую очередь для организации хранения данных на внешних запоминающих
устройствах. Представление на концептуальном уровне является обобщенным
взглядом на данные с позиций предметной области. Внешний уровень представляет
потребности пользователей и прикладных программ.
Утилита СУБД — программа, которая запускается в работу командой операционной
системы главного компьютера и выполняет какую-то функцию над базой данных
(обычно на физическом уровне данных), либо команда (функция ядра СУБД,
доступная только АБД), реализующая аналогичную операцию.
Файл — именуемая единица информации, поддерживаемая операционной системой.
Доступ к данным реализуется либо в рамках ОС, либо пользовательскими
программами, либо в рамках СУБД, либо комбинированно. Обычно ОС может
предоставить пользовательским программам не более двух типов файлов: за-писеориентированные, когда при обращении к файлу из пользовательской программы
считывается или выводится в файл запись (агрегат или элемент данных —
логическая
единица
информации)
и
потоко-ориентированные,
когда
пользовательской программе предоставляется для записи или чтения физический
элемент файла (очередной бит или байт данных).
Файл ASCII (ASCII-File) — файл, содержащий символьную информацию,
представленную только ASCII-кодами «левой части»
(первые 128 символов кодовой таблицы, или код Latin-1) и символьную разметку.
Файл базы данных — физический файл ОС, используемый для размещения БД.
Управление данными в таком файле производится совместно ОС и СУБД. Крайние
варианты размещения БД по файлам: 1) все данные БД — в одном файле (файл
DATA, СУБД ADABAS); 2) каждая таблица БД — в отдельном файле ОС (.DBFфайлы системы FoxPro). Промежуточный вариант размещения, например ORACLE,
— база данных состоит из одного или более табличных пространств, которые в свою
очередь состоят из одного или более файлов базы данных.
Файл бинарный — файл, содержащий произвольную двоичную информацию (текст с
бинарной разметкой, программа, графика, архивный файл).
Файл графический — бинарный файл, содержащий данные, обычно полученные с
помощью растрового сканера и соответствующие двухмерному изображению
объекта.
Файл-сервер — установленное в сети устройство хранения файлов, доступное всем
пользователям сети. Не только хранит файлы, но и управляет ими, поддерживает
порядок при запросе файлои пользователями сети и вносит в них изменения. Файл
текстовый — файл, содержащий символьную информацию и одном из
соответствующих кодов, и коды, управляющие режимом отображения символов на
печать и экранные устройства. Формат — способ расположения и представления
данных на носителе информации.
Форматы файлов — представление информации на уровне взаимодействия
операционной системы с прикладными программами. Целостность — свойство БД,
при котором она удовлетворяет некоторым определенным ограничениям значений
данных и сохраняет это свойство при всех модификациях (замена, добавление или
удаление) данных.
Шлюз — устройство для соединения разнотипных сетей, работающих по разным
протоколам связи в целях обеспечения передачи информации из одной сети в
другую.
Экспорт (выгрузка, upload) — утилита (функция, команда) СУБД, служащая для вывода
информации из БД (обычно одной из таблиц) в файл(ы) операционной системы, организованные в некотором коммуникативном
формате.
Электронная доска объявлений (BBS) — станция электронной почты. Услуга в
компьютерной сети для автоматического приема сообщений и обслуживания
запросов на их просмотр и получение.
Электронная почта — передача сообщений по компьютерной сети. Электронная почта
представляет собой вариант почтовой службы, который предназначен для
взаимодействия компьютеров (или терминалов). Дает пользователю возможность
отправлять и принимать сообщения и (в некоторых случаях) изображения или
речевые послания, предназначенные как индивидуальным адресатам, так и группам
пользователей (конференции).
Электронная таблица — прикладная программа, используемая обычно для составления
бюджета, прогнозирования и других задач, связанных с финансами. Документ
электронной таблицы состоит из ячеек, сформированных по строкам и колонкам.
Каждая ячейка может содержать текст, числовые данные или формулу,
использующую значения из других ячеек. Для облегчения расчетов в электронной
таблице имеются встроенные функции стандартных вычислений.
Электронно-цифровая подпись (ЭЦП) — аналог личной подписи сотрудника, который
служит для заверения электронных документов. Гарантией однозначной
авторизации подписанного электронного документа и невозможности подделки
такой подписи является специальная криптографическая функция, лежащая в основе
алгоритма выработки ЭЦП.
Электронный документ — документ, носителем которого является электронная среда —
МД, МЛ, компакт-диск и т. д.
Элемент данных (элементарное данное) — неделимое именованное данное,
характеризующееся типом (напр., символьный, числовой, логический и пр.), длиной
(в байтах) и обычно рассчитанное на размещение в одном машинном слове
соответствующей разрядности. Это минимальная адресуемая (идентифицируемая)
часть памяти — единица данных, на которую можно ссылаться при обращении к
данным. Ранние языки программирования (Алгол, Фортран) были рассчитаны на
обработку элементарных данных или их простейших агрегатов — массивов
(матрицы, векторы). С появлением ЯП Кобол появляется возможность
представления и обработки агрегатов разнотипных данных (записей). В
реляционных БД элементарное данное есть элемент
таблицы. Иногда используется термин поле записи в качестве синонима.
Элемент текста — часть текста, ограниченная начальной и конечной метками (при
использовании SGML).
Язык манипулирования данными (ЯМД). ЯМД обычно включает в себя средства
запросов к базе данных и поддержания базы данных (добавление, удаление,
обновление данных, создание и уничтожение БД, изменение определений БД,
обеспечение запросов к справочнику БД).
Язык описания данных (ЯОД) — средство внутрисистемного определения данных,
представляющего обобщение внешних взглядов. Описание представляет собой
модель данных и их отношений, т. е. структур, из которых образуется БД.
Язык структурированных запросов (SQL). Основной интерфейс пользователя и АБД
для запоминания и поиска информации в базе данных для ряда СУБД (Oracle, MS
SQL Server и пр.). Включает в себя в качестве подмножеств следующие категории
операторов: 1) язык описания данных (ЯОД). Эти операторы определяют (CREATE)
или удаляют (DROP) объекты базы данных. Примеры: CREATE TABLE, CREATE
INDEX, DROP TABLE, RENAME TABLE; 2) язык управления данными (ЯУД). Эти
операторы управляют доступом к данным и к базе данных. Примеры: GRANT
CONNECT, GRANT SELECT, UPDATE ON, REVOKE DBA; 3) язык
манипулирования данными (ЯМД). Эти операторы запрашивают и обновляют
реальные данные. Примеры: SELECT, INSERT, DELETE, UPDATE.
Download