Автоматизированная обработка текстовых массивов

advertisement
Аннотация рабочей программы дисциплины «Автоматизированная
обработка текстовых массивов»
Цель изучения
дисциплины
Целью освоения дисциплины «Автоматизированная обработка
текстовых массивов» является формирование у обучающихся
системного представления о методах автоматизированной обработки
естественно-языковых текстовых массивов на всех уровнях
лингвистического
анализа;
ознакомление
обучающихся
с
теоретическими концепциями, практическими методами и системами
автоматизированной обработки естественно-языковых текстовых
массивов.
Место дисциплины
Дисциплина «Автоматизированная обработка текстовых массивов»
в структуре
относится к базовой части учебного планапо направлению подготовки
образовательной
45.03.02 Лингвистика.
программы
В результате освоения дисциплины выпускник должен обладать
следующими компетенциями:
- умеет работать с основными информационно-поисковыми и
экспертными
системами,
системами
представления
знаний,
синтаксического и морфологического анализа, автоматического синтеза
и распознавания речи, обработки лексикографической информации и
автоматизированного перевода, автоматизированными системами
Формируемые
идентификации и верификации личности (ПК-21);
компетенции
- владеет методами формального и когнитивного моделирования
естественного языка и методами создания метаязыков (ПК-22);
владеет методами формального и когнитивного моделирования
естественного языка и методами создания метаязыков (ПК-23);
владеет стандартными способами решения основных типов задач в
области лингвистического обеспечения информационных и других
прикладных систем (ПК-24).
В результате освоения дисциплины обучающийся приобретает
следующие навыки:
Знать: общие принципы построения систем автоматической обработки
текста (письменного и устного); структуру систем синтеза и анализа;
построение графематического, морфологического, синтаксического
анализа (для одной из моделей ЕЯ); основные формальные модели для
уровней графематического, морфологического, синтаксического и
семантического анализа текстовых массивов; основные алгоритмы
автоматической обработки текстовых массивов при порождении речи;
Знания, умения и
морфологическом и синтаксическом анализе текстовых массивов;
навыки,
основные принципы автоматической обработки фонетических,
получаемые в
лексических, грамматических элементов естественного языка;
результате
основные этапы обработки текста в системах автоматического синтеза
освоения
и распознавания речи; практические возможности современных систем
дисциплины
автоматической обработки естественного языка; принципы построения
систем автоматического индексирования и реферирования тестовых
массивов.
Уметь: охарактеризовать принципы морфологического,
синтаксического анализа (на примере одной из систем);. описывать
подмножества языка для различных метаязыков (на уровне
графематики, морфологии; синтаксиса); работать с системами
морфологического и синтаксического анализа текста.
Иметь навыки: работы с инструментами автоматической обработки
естественного языка; моделирования морфологических и
синтаксических структур на одном из метаязыков; работы с
морфоанализаторами, автоматическими словарями; автоматического
реферирования текста с использованием компьютерных средств.
1. Автоматическая обработка устной речи
2. Автоматы, формальные грамматики и языки
3. Ввод, распознавание и графематический анализ текста
4. Морфологический анализ в системах автоматической обработки текста
5. Синтаксический анализ в системах автоматической обработки текста
Содержание
дисциплины
6. Семантический анализ в системах автоматического анализа текста
7. Словарная поддержка
8. Синтез текстов на естественном языке
9. Лингвистическое обеспечение прикладных систем различного назначения
10. Автоматическое преобразование текста
Основная и дополнительная литература
1. Ахо А., Ульман Дж. Теория синтаксического анализа, перевода и
компиляции. Т.1-2. - М., 1978.
2. Баранов А.Н. Введение в прикладную лингвистику. - М.: Изд-во
ЛКИ, 2007. – 360 с.
3. Всеволодова А.В. Компьютерная обработка лингвистических
данных: учебное пособие. М.: Флинта: Наука, 2007. – 96 с.
4. Гладкий А.В. Синтаксические структуры естественного языка.
М.: Изд-во ЛКИ, 2007. – 152 с.
5. Зубов А.В., Зубова И.И. Основы искусственного интеллекта для
лингвистов: Учеб. пособие. – М.: Университетская книга, Логос,
2007. – 320 с.
6. Леонтьева Н.Н. Автоматическое понимание текстов: системы,
модели, ресурсы. - М.: Академия, 2006.
7. Лосев А.Ф. Введение в общую теорию языковых моделей:
учебное пособие. М., 2004.
8. Марчук Ю.Н. Компьютерная лингвистика: учебное пособие. М.:
Используемые
Восток-Запад, 2007. – 317 с.
информационные,
9. Пиотровский Р.Г. Инженерная лингвистика и теория языка. Л.:
инструментальные
Наука, 1979
и программные
10. Потапова, Р.К. Новые информационные технологии и
средства
лингвистика: учебное пособие. М.: КомКнига, 2005. – 364 с.
11. Рубашкин В.Ш. Представление и анализ смысла в
интеллектуальных информационных системах. М.: Наука, 1989.
12. Хомский Н., Миллер Дж. Введение в формальный анализ
естественных языков: Пер с англ. М.: Едиториал УРСС, 2003. –
63 с.
13. Хопкрофт Дж., Мотвани Р., Ульман Дж. Введение в теорию
автоматов, языков и вычислений. М., 2007. – 528 с.
14. Захаров В.П. Информационно-поисковые системы. СПб., 2005.
15. Коваль С.А. Лингвистические проблемы компьютерной
морфологии. СПб., 2005.
16. Мельчук И.А. Опыт теории лингвистической модели "Смысл –
Текст". М., 1999.
17. Падучева Е.А. Динамические модели в семантике лексики. М.,
2004.
18. Пиотровский
Р.Г.,
Бектаев
К.Б.,
Пиотровская
А.А.
Математическая лингвистика. М.: Высшая школа, 1977. 383 с.
19. Севбо И.П. Структура связного текста и автоматизация
реферирования. М.. 1969.
20. Сухотин Б.В. Выделение морфем в текстах без пробелов между
словами. М.: Наука, 1984. 96 с.
21. Леонтьева Н.Н. Общесемантический компонент в систем
понимания текста // Проблемы прикладной лингвистики. М..
2002.
22. Налимов В.В. Вероятностная модель языка: О соотношении
естественных и искусственных языков. Томск, М., 2003.
23. Труды международной конференции "Корпусная лингвистика2008". – СПб.: С.-Петербургский гос. Ун-т, 2008. 418 с.
24. Шайкевич А.Я. Пространство семантических словарей // Язык
как материя смысла. М.: "Азбуковник", 2007.
25. Шенк Р. Обработка концептуальной информации. М., 1980.
26. Якушин
Б.В.
Алгоритмическое
индексирование
в
информационных системах. М., 1978.
Программное обеспечение и Интернет-ресурсы:
1. Автоматическая обработка текста – http://www.aot.ru/
2. Каталог лингвистических программ и ресурсов в сети –
http://www.rvb.ru/soft/catalogue/catalogue.html
3. Лингвистика в России: ресурсы для исследователей –
http://uisrussia.msu.ru/linguist/index.jsp
4. Российская
ассоциация
искусственно
интеллекта
–
http://www.raai.org/
5. Национальный корпус русского языка–http://corpora.yandex.ru/
6. Увлекательная лингвистика– http://katori.pochta.ru/
7. Московский лингвистический журнал – http://mjl.rsuh.ru/
8. Вестник Ивановского государственного университета. Серия
«Филология»- http://lib.ivanovo.ac.ru/
9. Вестник
Воронежского
Государственного
университета
«Лингвистика
и
межкультурная
коммуникация»
http://www.vestnik.vsu.ru /
10.Вестник
Красноярского
государственного
университета.
Гуманитарная серия– http://lib.krasu.ru/
11.Международная конференция по компьютерной лингвистике–
http://www.dialog-21.ru/
12.Научно-техническая информация. Сер.2. Информационные
процессы и системы – http://catalog.viniti.ru/search_extra.asp
13.Электронная
лингвистическая
библиотека
–
http://www.superlinguist.com/
14.Журнал Вычислительные методы и программирование: http://num-meth.srcc.msu.ru/
15.Журнал Компьютерная лингвистика и интеллектуальные
системы - http://www.dialog-21.ru/conference/?id=157806
16.Образование. Лингвистика. Технологии & Коммуникация –
http://alumni.iubip.ru/Sokolova/index.htm
17.Language Learning & Technology - http://llt.msu.edu/
18.Internet TESL Journal (For ESL-EFL Teachers) - http://iteslj.org/
19.The Modern Journal of Applied Linguistics - http://mjal.org/
20.Indian
Journal
of
Applied
Linguistics
http://www.highbeam.com/Indian+Journal+of+Applied+Linguistics/publicati
ons.aspx
21.«Академия Google». http://scholar.google.com. Поиск научной
литературы по различным дисциплинам.
22.Scholar.ru. Поиск информации научного происхождения из
научных центров и вузов для ученых, специалистов, аспирантов,
студентов, учащихся.
23.Российское образование: Федеральный портал http://www.edu.ru.
24.Электронная гуманитарная библиотека http://www.gumfak.ru.
25.Википедия – Свободная энциклопедия http://ru.wikipedia.org
26.Морфологический анализатор http://starling.rinet.ru/morph.htm ;
27.Лингвоанализатор http://www.rusf.ru/books/analysis/index.htm ;
28.Русский морфологический словарь Дмитрия Григорьева
(majorgray@mail.ru);
29.Автоматическая обработка текстов на естественном языке и
компьютерная лингвистика : учеб. пособие / Большакова Е.И.,
Клышинский Э.С., Ландэ Д.В., Носков А.А., Пескова О.В., Ягунова Е.В.
— М.: МИЭМ, 2011. // http://www.webground.su/ ;
30.Ягунова Е.В. Исследование перцептивной устойчивости фонем
как элементов речевой цепи // Человек говорящий: исследования XXI
века: колл. монография под ред. Л.А.Вербицкой, Н.К. Ивановой.
Иваново, 2012, с. 67-75 //http://www.webground.su/ ;
31.Ландэ Д. В., Снарский А. А., Безсуднов И. В. ИНТЕРНЕТИКА.
Навигация в сложных сетях: модели и алгоритмы. Москва, 2009 //
//http://www.webground.su/ ;
Обучающие компьютерные программы и специализированные модули:
a. Система дистанционного обучения Moodle;
b. Электронные учебники из серии «Читай и работай»,
размещенные на сервере кафедры и в системе Moodle;
c. Текстовый процессорMicrosoft Office Word;
d. Обозреватель Internet Explorer;
e. Система анализа текстов TextAnalyst 2.0;
f. Программа
автоматического
реферирования
TextReferent 1.0;
g. Программа контент анализа текстов Text-Analizer;
h. Система редактирования морфологических словарей
MorphWizard;
i. Русская
морфология
для
программистов
RusLemmatizer.zip .
Для освоения данной дисциплины требуются следующие
инструментальные и программные средства:
-лекционная аудитория, оборудованная компьютером и
мультимедийным проектором;
-лицензионное программное обеспечение: ОС Microsoft Windows
XP/7, офисный пакет Microsoft Office 2007;
- -канал связи с Интернетом.
Фонд оценочных
средств текущего
Проблемные лекции; дискуссии в режиме «круглого стола»;
контроля
контрольные задания; рефераты; доклады; лекции-конференции.
успеваемости
обучающихся
Форма итоговой
Экзамен.
аттестации
Download