Технологии обработки текста и звучащей речи. Рабочая

advertisement
ФГБОУ ВПО «Тверской государственный университет»
Филологический факультет
Кафедра фундаментальной и прикладной лингвистики
(наименование кафедры, факультета)
Утверждаю:
Декан филологического_ф-та
М.Л. Логунов
«___»____________ 2013 г.
Рабочая программа дисциплины
Технологии обработки текста и звучащей речи (3 курс)
035800 «Фундаментальная и прикладная лингвистика»
Общий
Профиль подготовки
Квалификация (степень выпускника)
Бакалавр_фундаментальной и прикладной лингвистики
Форма обучения
_________очная_______
Обсуждено на заседании кафедры
Составитель:
«__»____________ 2013 г.
к.ф.н., доцент Е.П. Максимова
Протокол № __
______________________
Зав. кафедрой____________
Тверь 2013
II. Пояснительная записка
1. Цели и задачи дисциплины
Целями освоения дисциплины (модуля)
являются
Цель дисциплины состоит в формировании следующих компетенций:
владение
основными методами инструментального анализа звучащей речи (ПК-8);
владение
принципами создания представительных текстовых массивов, корпусов
текстов,
корпусов звучащей речи, мультимодальных корпусов, электронных
словарей разных
типов, лингвистических баз данных и умением пользоваться этими
ресурсами (ПК15); умение пользоваться лингвистически ориентированными
программными
продуктами (ПК 16), умением провести квалифицированное тестирование
эффективности лингвистически ориентированного программного
продукта (ПК-18).
2.Место дисциплины в структуре ООП бакалавриата
Учебная дисциплина «Технологии обработки текста и звучащей речи»
входит в базовую часть общепрофессионального цикла (модуль «Языковые
технологии») ФГОС ВПО. Курс связан со следующими дисциплинами: общая
фонетика, общая морфология, общий синтаксис, семантика, общая и
компьютерная лексикография, технологии корпусной лингвистики.
3.Общая трудоемкость дисциплины составляет
2 зачетных
единицы, 72часа.
4. Компетенции обучающегося, формируемые в результате освоения
дисциплины (модуля)
В результате освоения дисциплины обучающийся должен знать: основные
идеи и достижения в области речевых технологий, автоматического
распознавания и
синтеза речи, общие принципы построения систем обработки
естественного языка,
базовую структуру человеко-машинного взаимодействия, математические
модели,
применяемые в лингвистике, устройство лингвистических процессоров,
типологию
систем, обеспечивающих взаимодействие с ЭВМ на естественном языке;
уметь:
работать с основными системами автоматической обработки текста,
анализа и
синтеза речи, информационными системами, системами автоматического
перевода;
владеть: основными приемами построения обучающих систем, систем
автоматического реферирования, индексирования и перевода, систем
распознавания
и синтеза речи, гипертекстовыми технологиями5. Образовательные
технологии: радиционная лекция, проблемная лекция, дебаты, метод малых
групп, упражнения, различные типы тестов, работа с лингвистически
ориентированным программным обеспечением, работа в Интернет.
5. Образовательные технологии
В
процессе
освоения
дисциплины
используются
следующие
образовательные технологии, способы и методы формирования компетенций:
традиционная лекция,
проблемная лекция, метод малых групп, упражнения,
различные типы тестов,
работа с
лингвистически
ориентированным
программным обеспечением, работа в Интернет.
6. Формы контроля – экзамен.
III. Учебная программа
Рабочая учебная программа
Наименование разделов и тем
Всего
1. Автоматическая обработка
2
естественного языка. Общие принципы и
сферы применения.
2. Оптимизация общения с ЭВМ.
4
Системы обработки естественного языка.
Базовые компоненты систем,
обеспечивающих взаимодействие с ЭВМ.
Аудиторные
Самостоязанятия
тельная
работа
Лекци Практии
ческие
работы
2
2
2
3. Типология систем, обеспечивающих
взаимодействие с ЭВМ. Вопросноответные системы, диалоговые системы
решения задач, системы обработки
связных текстов.
4. Теория и практика информационнопоисковых систем. Основные понятия
информационного поиска. Типы
информационно-поисковых систем.
Информационно-поисковые языки.
5. Моделирование общения.
Компьютерные модели диалога.
Программа «Элиза», ее алгоритмы.
6. Компьютерное моделирование
структуры сюжета. Морфологический,
синтаксический и когнитивный подходы.
7. Гипертекстовые системы
представления текста. История развития.
Теоретические основы гипертекста.
Элементы типологии гипертекста.
Некоторые гипертекстовые системы.
8. Компьютерное моделирование языка и
речи. Статистико-дистрибутивный
метод.
9. Дешифровка кодированного текста.
10. Авторизация текста. Множественная
неопределенность, сравнение по образцу,
конкуренция образцов.
11. Машинный перевод. Основные этапы
развития. Элементы периодизации
стратегий, типология систем. Основные
области использования машинного
перевода. Некоторые известные системы
машинного перевода. Перспективы
развития систем машинного перевода.
12. Технологии обработки звучащей
речи. Основные направления речевых
технологий: анализ речи, синтез речи,
шумоочистка, идентификация по голосу.
13. История создания систем анализа и
синтеза речи.
4
2
2
4
2
2
6
2
2
2
2
2
4
6
2
4
6
2
4
4
4
2
2
4
4
2
2
4
2
2
6
4
2
14.Фонетические основания систем
анализа и синтеза речи.
Экспериментальные данные
современной фонетики и их роль в
речевых технологиях.
15. Основные методы синтеза речи:
аллофонный, дифонный, слоговой,
компилятивный.
16.Современное состояние и
перспективы развития речевых
технологий.
ИТОГО
4
2
5
2
3
1
72
19
2
3
2
19
34
V. Оценочные средства для текущего контроля успеваемости,
промежуточной
аттестации но итогам освоения дисциплины и учебно-методическое
обеспечение
самостоятельной работы студентов
1 семестр
Максимальная оценка учебной работы: 60 баллов
Оценка по модулям:
1. (7 неделя): 15 баллов (рубежный контроль) + 15 баллов (текущая
работа) = 30 баллов
2. (14 неделя): 15 баллов (рубежный контроль) + 15 баллов (текущая
работа) = 30 баллов
Рубежный контроль по модулю:
Модуль № 1. Предмет и задачи фонетики в системе языка. Фонетика,
фонология, морфология. Устройство и функционирование речевого и
слухового аппарата человека, основы речепроизводства и речевосприятия,
механизм речи и закономерности их развития. Модификации звуков в потоке
речи. Артикуляционные и акустические классификации звуков речи . Фонема
как базисная фонологическая единица языка. Системы транскрипции.
Для успешного выполнения тестовых заданий рекомендуется выполнение
практических заданий из Л.Р. Зиндер. Введение в языкознание: Сб. задач.
М, 1998 (1987). раздел «Фонетика», «Морфонология»
Калабина Н.С. Практикум по введению в языкознание. Разделы «Фонетика»,
«Письмо».
Примерные тестовые задания по 1 модулю
1.
С работой каких органов связано деление согласных на глухие и
звонкие?
A. Языка,
Б. Голосовых связок
B. твердого неба,
Г. альвеол.
2.
Сила (интенсивность) звука зависит от:
A. Частоты колебаний,
Б. Протяженности его во времени,
B. амплитуды, или размаха, колебаний.
Г. громкости.
3.
Определите согласный звук русского языка
признакам: переднеязычный, зубной, взрывной, звонкий.
A. Б,
Б. Г,
по
следующим
в.д,
Г. 3.
4.
Определите гласный звук русского языка по следующим признакам:
переднего
ряда,
среднего
подъема,
нелабиализованный.
А.Э,
Б. А,
B. О,
Г. Ы.
5.
Укажите язык вокалический:
A. Русский,
Б. Немецкий,
B. французский,
Г. Английский.
6.
Найдите полную
А. Ланно из ладно,
Б. В чечении из теченбии,
В. дважды из дватды,
Г. балалайка из балабайка.
регрессивную
контактную
ассимиляцию:
7.
Укажите
регрессивную
А. Февраль из феврарь,
Б. Мести из метти,
В. Пролубь из прорубь,
Г. ярмарка из ярманка.
контактную
диссимиляцию:
8.
Укажите гаплологию:
A.Табакур из табакокур,
Б. Наждак из наджак,
B. ндрав из нрав,
Г. вострый из острый.
9.
Укажите эпентезу:
A.
Знаменосец из знаменоносец,
Б. Ларивон из Ларион,
B. вена (укр.) из она (рус),
Г. вузол (укр.) из узел (рус).
10.
С работой каких органов связано деление
твердые и мягкие?
A. Голосовых связок,
Б. Альвеол,
B.
Средней части спинки языка и твердого неба
Г. кончика языка и альвеол.
согласных
на
11.
Частота колебаний за единицу времени определяет:
A. Силу звука,
Б. Высоту звука,
B. громкость звука,
Г. длительность звука.
12.
Какие фонетические
сжатый, просьба?
A. Диссимиляция,
Б. Аккомодация,
B. ассимиляция,
Г. метатеза.
процессы
наблюдаются
в
словах
типа:
VI. Учебно-методическое и информационное обеспечение дисциплины
(модуля)
а) основная литература:
Баранов А.Н. Введение в прикладную лингвистику. М., 2005.
1. Залевская А. А. Информационные технологии в лингвистике:
практикум: для студентов 1 курса [Электронный ресурс] Тверь: твер. Гос. унт, 2012. 39 с. Режим доступа: http://texts.lib.tversu.ru/texts/997722ogl.pdf
б) дополнительная литература:
Литература к проблеме "АВТОМАТИЧЕСКАЯ ОБРАБОТКА
ЗВУЧАЩЕЙ РЕЧИ"
Бондарко, Л.В. Звуковой строй современного русского языка. М., 1977.
Бондарко, Л.В. Фонетическое описание языка и фонологическое
описание речи. Л., 1981.
Бондарко, Л.В. и др. Реализация фонем и их восприятие // Проблемы и
методы экспериментально-фонетического анализа речи. Л., 1980.
Деркач, М.Ф. и др. Динамические спектры речевых сигналов. Львов,
1983.
Жарков, И.В., Слободянюк, С. Л., Светозарова, Н.Д. Автоматический
акцентно-интонационный транскриптор произвольного русского текста //
Бюллетень ФФРЯ.
Звучащий текст. М., 1983.
Зиндер, Л.Р. и др. Развитие фонологических идей Л.В. Шербы //
Проблемы и методы экспериментально-фонетического анализа речи. Л.,
1980.
Зиновьева, Н.В. Механизмы извлечения лингвистической информации
из спектрального представления речевого сигнала. АКД. М., 1986.
Зиновьева, Н.В. Система акустических ключей к распознаванию
фонетических единиц русского языка // Экспериментальная фонетика. М.,
1989.
Зиновьева, Н.В., Кривнова, О.Ф. Прикладные системы с
использованием фонетических знаний // Проблемы фонетики. М., 1993.
Зиновьева, Н.В., Кривнова, О.Ф. База фонетических знаний как
компонент машинного фонетического фонда русского языка // Вестник МГУ.
Сер. 9. Филология. 1989. N 5.
Зиновьева, Н.В., Кривнова, О.Ф. Лингвистическое обеспечение
программного синтеза речи // Вестник МГУ. Сер. 9. Филология. 1994. № 3.
Златоустова, Л.В., Потапова, Р.Г., Трунин-Донской, В.Н. Общая и
прикладная фонетика. М., 1986.
Кейтер, Дж. Компьютеры — синтезаторы речи. М., 1985
Кузнецов, В.И., Скрелин, П.А. Естественность синтезированной речи //
Бюллетень ФФРЯ. Бохум—СПб. 1994. N 5.
Обжелян, Н.К. Трунин-Донской, В.Н. Речевое общение в системах
"Человек — ЭВМ". Кишинев, 1985
Проблемы и методы экспериментально-фонетического анализа речи.
Л., 1980.
Светозарова, Н.Д. и др. Просодика // Проблемы и методы
экспериментально-фонетического анализа речи. Л., 1980.
Фант, Г. Акустическая теория речеобразования. М., 1964.
Фант, Г. Анализ и синтез речи. Новосибирск, 1970.
Физиология речи. Восприятие речи человеком // Чистович, Л.А. и др.
Л., 1976.
Фланаган, Дж.Л. Анализ, синтез и восприятие речи. М., 1968.
Большой энциклопедический словарь: Языкознание. М., 1998
Лингвистический энциклопедический словарь. М., 1990.
Литература к проблеме "АВТОМАТИЧЕСКАЯ ОБРАБОТКА
ПИСЬМЕННОГО ТЕКСТА"
Аллен, Дж. Ф., Перро, Р. Выявление коммуникативного намерения,
содержащегося в высказывании // Новое в зарубежной лингвистике. Вып. 17.
М., 1986.
Апресян, Ю.Д., Богуславский, И.М., Иомдин, Л.Л. и др.
Лингвистическое обеспечение системы ЭТАП-2. М., 1989.
Белоногов, Г.Г., Кузнецов, Б.А. Языковые средства
автоматизированных информационных систем. М., 1983.
Белоногов, Г.Г., Новосёлов, А.П. Автоматизация процессов
накопления, поиска и обобщения информации. М., 1979
Виноград, Т. Программа, понимающая естественный язык. М., 1976.
Гончаренко, В.В., Шингарева, Е.А. Фреймы для распознавания смысла
текста. Кишинев, 1984.
Городецкий, Б.Ю. Семантические проблемы построения
автоматизированных систем обработки текстовой информации //
Вычислительная лингвистика. М., 1976.
Городецкий, Б.Ю. О лингвистическом подходе к теории
информационных языков // Исследования по структурной и прикладной
лингвистике. М., 1975.
Городецкий, Б.Ю. Актуальные проблемы прикладной лингвистики //
Новое в зарубежной лингвистике. Вып. 12. М., 1983.
Городецкий, Б.Ю. Компьютерная лингвистика: моделирование
языкового общения // Новое в зарубежной лингвистике. Вып. 24. М., 1989.
Городецкий, Б.Ю., Раскин, В.В. Методы семантического исследования
ограниченного подъязыка. М., 1971.
Гудман, Б.А. Идентификация референта и связанные с ней
коммуникативные неудачи // Новое в зарубежной лингвистике. Вып. 24. М.,
1989.
Дракин, В.И., Попов, Э.В., Преображенский, А.Б. Общение конечных
пользователей с системами обработки данных. М., 1988.
Ершов, А.П. Методологические предпосылки продуктивного диалога с
ЭВМ на естественном языке // ВФ. 1981. N 8.
Звегинцев, В.А. Язык как фактор компьютерной революции // НТИ.
Сер. 2. 1985. N 9.
Искусственный интеллект. В 3-х кн. Кн. 1. Системы общения и
экспертные системы. М., 1990.
Карбонелл, Дж., Хейз, Ф. Стратегии преодоления коммуникативных
неудач при анализе неграмматичных языковых выражений // Новое в
зарубежной лингвистике. Вып. 24. М., 1989.
Карпова, Г.Д., Пирогова, Ю.К., Кобзарева, Т.Ю., Микаэлян, Е.В.
Компьютерный синтаксический анализ: описание моделей и направлений
разработок // Итоги науки и техники. Серия "Вычислительные науки". Т. 6.
М., 1991.
Кибрик, А.Е. Очерки по общим и прикладным вопросам языкознания.
М., 1992.
Ленерт, В., Дайер, М.Г., Джонсон, П.Н., Янг, К. Дж., Харли, С. BORIS
— экспериментальная система глубинного понимания повествовательных
текстов // Новое в зарубежной лингвистике. Вып. 24. М., 1989.
Маккьюин, К. Дискурсивные стратегии для синтеза текста на
естественном языке // Новое в зарубежной лингвистике. Вып. 24. М., 1989.
Мальковский, М.Г. Диалог с системой искусственного интеллекта. М.,
1986.
Мельчук И. А. Опыт теории лингвистических моделей "Смысл <=>
Текст". М., 1974.
Минский, М. Фреймы для представления знаний // Психология
машинного зрения. М., 1978.
Попов, Э.В. Экспертные системы. М., 1987.
Поспелов, Д.А. Логико-лингвистические модели в системах
управления. М., 1981.
Селфридж, М. Интегральная обработка обеспечивает надежное
понимание // Новое в зарубежной литнгвистике. Вып. 24. М., 1989.
Скороходько, Э.Ф. Лингвистические проблемы обработки текстов в
автоматизированных ИПС // Вопросы информационной теории и практики.
№ 25. М., 1974.
Скрэгг, Г. Семантические сети как модели памяти // Новое в
зарубежной лингвистике. Вып. 12. М., 1983.
Статистика речи и автоматический анализ текста / Отв. ред. Р.Г.
Пиотровский. Л., 1980.
Уилкс, Й. Анализ предложений английского языка (Части I и II) //
Новое в зарубежной лингвистике. Вып. 12.. М., 1983.
Чарняк, Ю. Умозаключения и знания (Части I и II) // Новое в
зарубежной лингвистике. Вып. 12. М., 1983.
Шенк, Р., Лебовиц, М., Бирнбаум, Л. Интегральная понимающая
система // Новое в зарубежной лингвистике. Вып. 12. М., 1983.
Экспертные системы для персональных компьютеров: методы,
средства, реализации. Минск, 1990.
Литература к проблеме ПРИКЛАДНАЯ ЛЕКСИКОЛОГИЯ И
ЛЕКСИКОГРАФИЯ
Автоматизация подготовки словарей. — М., 1988. — С. 3—63.
Алексеев П. М. Частотные словари английского языка и их
практическое применение // Статистика речи и автоматический анализ
текста. Л., 1971. — С. 160—178.
Алексеев П. М. Семантические частотные словари // Статистика речи и
автоматический анализ текста. Л., 1973. —С. 20—36.
Апресян Ю. Д. Толковый словарь и интегральное описание языка // ВЯ,
1986, № 5. — С. 57—70.
Борода М. Г., Поликарпов А. А. Закон Ципфа—Мандельброта и
единицы различных уровней организации текста // УЗ Тартуского гос. ун-та.
Вып. 689. (Квантитативная лингвистика и автоматический анализ текстов.)
Тарту, 1984. — С. 35— 60.
Герд А. С. Специальные словари и их источники // Современная
русская лексикография: 1981. Л., 1983. [С. 136--142.]
Герд А. С., Богданов В. В., Роменская В. Ф. и др. Информационнопоисковый тезаурус как объект лексикографии // Структурная и прикладная
лингвистика. Вып. 1. Л., 1978. — С. 160-171.
Городецкий Б. Ю. Проблемы и методы современной лексикографии //
НЗЛ. Вып. XIV. М., 1985. — С. 5—22.
Денисов П. Н. Лексика русского языка и принципы ее описания. Изд. 2е. М., 1993. — С. 3—56.
Зубов А. В., Чапля А. И., Чапля С. В. Автоматическое выделение
ключевых слов // Структурная и прикладная лингвистика. Вып. 1. Л., 1983. —
С. 198—204.
Караулов Ю. Н. Общая и русская идеография. М., 1976. —С. 338—351.
Каримова Г. О., Поликарпов А. А. Принципы выделения гиперлексемы
как единицы лексической системы языка // Деривационные гнезда и типы в
синхронии и диахронии. Владивосток, 1989. — С. 158—167.
Колодяжная Л. И., Поликарпов А. А. Исследование системных
характеристик лексики на основе компьютерной версии синонимического
словаря // Труды машинного фонда русского языка. Т. 2. М., 1992. — С. 3—
14.
Мандельброт Б. Теория информации и психолингвистика. Теория
частот слов // Математические методы в социальных науках. М., 1973. —С.
316—337.
Марусенко М. А. О формировании словника словаря статистически
устойчивых научно-технических терминов // Структурная и прикладная
лингвистика. Вып. 2. Л., 1983. — С. 82—88.
Поликарпов А. А. Полисемия: системно-квантитативные аспекты // УЗ
Тартуского гос. ун-та. Вып. 774. Тарту, 1987. — С. 135—154.
Поликарпов А. А. Теоретические проблемы прикладной лексикологии
// Вестник МГУ. Сер. 9. Филология. 1989. № 5. — С. 64—73.
Поликарпов А. А., Бушуева О. В. Опыт построения контекстуального
словаря и анализ его устройства // Теоретические и практические проблемы
прикладной лингвистики. М., 1988. — С. 40-65.
Поликарпов А. А., Курлов В. Я. Стилистика, семантика, грамматика:
опыт анализа системных взаимосвязей (По данным толкового словаря) // ВЯ,
1994, № 1. — С. 62—75.
Сахарный Л. В. Частотный словарь индексирования. Пермь, 1974. — С.
3—18.
Шайкевич А. Я. Дистрибутивно-статистический анализ в семантике //
Принципы и методы семантических исследований. М., 1976. — С. 353—378.
Щерба Л. В. Опыт общей теории лексикографии // Щерба Л. В.
Языковая система и речевая деятельность. Л., 1974. — С. 265—304.
Азарова И.Р. и др. Разработка автоматических словоуказателей и
конкордансов для художественных текстов // Структурная и прикладная
лингвистика. Вып. 2. Л., 1983.
Андрукович П. Ф., Королев Э. И. О связи статистических и лексикограмматических свойств слов // НТИ. Сер. 2. N 4, 1977.
Андрющенко В. М. Автоматизация в лексикографии. Современное
состояние и новые возможности // Советская лексикография. М., 1988.
Виноградов В. В. Избранные труды. Лексикология и лексикография.
М., 1977.
Караулов Ю. Н. Лингвистическое конструирование и тезаурус
литературного языка. М., 1981.
Караулов Ю. Н., Молчанов В. А., Афанасьев В. А., Михалев Н. В.
Анализ метаязыка словаря с помощью ЭВМ. М., 1982.
Колодяжная Л. И. Принципы создания филологического словаря на
персональном компьютере // Матер. III Всесоюзн. конференц. по созданию
машинного фонда русского языка. М., 1990.
Котелова Н. З. Теоретические аспекты лексикографического описания
новых слов // Советская лексикография. М., 1988.
Мартыненко Г. Я. Некоторые закономерности концентрации и
рассеяния элементов в лингвистических и других сложных системах //
Структурная и прикладная лингвистика. Вып. 1. Л., 1983.
Мошкович Ж. Г. Проблема лемматизации при автоматизированной
подготовке словарей и текстов // Матер. III Всес. конф. по созданию
машинного фонда русского языка. М., 1990.
Новое в зарубежной лингвистике. Вып. XIV. Проблемы и методы
лексикографии. М., 1983.
VII. Материально-техническое обеспечение дисциплины (модуля)
1. http://slovari.yandex.ru.
2. Энциклопедия «Википедия»: http://en. Wikipedia. Org;
3. электронное учебное пособие «Sensimetrics series in human
communication: Speech production and perception».
4. Матусевич М.А. История фонетических учений. Электронный
учебник. (сайт кафедры экспериментальной фонетики и
методики преподавания иностранных языков СПбГУ).
5. Официальный сайт Международной Фонетической Ассоциации
Download