Компьютерные технологии в филологии

advertisement
Утверждаю
________________________________
Зав. кафедрой
________________________________
Утверждено Ученым советом
филологического факультета
МГУ имени М.В. Ломоносова
________________________________
________________________________
Председатель Совета
д.ф.н. проф. М.Л. Ремнева
Программа курса
«Компьютерные технологии в филологии»
по направлению подготовки 032700 «Филология»
уровня подготовки высшего профессионального образования
магистратуры с присвоением квалификации (степени) «магистр»
II. Шифр дисциплины
III. Цели и задачи дисциплины.
А. Цели дисциплины.
Внедрение компьютерных технологий в научно-исследовательскую практику
магистрантов-лингвистов с целью углубления и интенсификации
исследовательского процесса.
Б. Задачи дисциплины.
1) Ознакомление магистрантов с основными областями
компьютеризации лингвистических исследований.
и
задачами
2) Ознакомление магистрантов с основными видами информационных
технологий, использующих и облегчающих лингвистический анализ; с
проблемами разработки и совершенствования лингвистического обеспечения
индустриальных информационных систем; с основными видами такого
обеспечения и современным состоянием его разработки.
3) Ознакомление с основными функциями и возможностями средств создания и
исследования лингвистических баз данных, в том числе корпусов текстов; а
также с лингвистическими анализаторами; формирование основных навыков
работы с ними.
IV. Место дисциплины в структуре ООП:
А. Информация об образовательном стандарте и учебном плане:
— тип образовательного стандарта и вид учебного плана: учебный план
АИС "Учебный план учебного комплекса МГУ", ММ_ФИЛОЛОЛОГИЯ
— направление подготовки (в соответствии с образовательным
стандартом): 032700.68 "Филология"
Б. Информация о месте дисциплины в образовательном стандарте и учебном
плане:
— базовая часть;
— тип: обязательный, профессиональный цикл
— курс: 1 год обучения в магистратуре филологического факультета МГУ;
— семестр: 1
В. Перечень дисциплин, которые должны быть освоены для начала
освоения данной дисциплины: "Информатика", курс дисциплин по
специальности "Современный русский язык" и "История русского
языка".
Г. Общая трудоемкость (в ак. часах и зачетных единицах); 72 час, 2,00
зачётных единиц
Д. Форма промежуточной аттестации: коллоквиумы, рефераты, лабораторные
работы, письменные работы;
V. Формы проведения:
семинары: 36 часов
самостоятельная работа: 36 часов
— формы текущего контроля (обсуждение прочитанного, коллоквиумы,
проверка заданий, рефераты и др.);
Итоговая форма контроля: зачет
VI. Распределение трудоемкости по разделам и темам, а также формам проведения
занятий с указанием форм текущего контроля и промежуточной аттестации:
Трудоемкость (в ак. часах) по формам
занятий (для дисциплин) и видам работ
(для практик)
Аудиторная работа (с разбивкой по
формам и видам)
№
п/п
Наименование разделов и тем дисциплины
/ Наименование разделов (этапов) практики
Лекции
Раздел I.
Практические
занятия
(семинары) /
Полевые
работы
4
Лабораторная
работа /
Камеральная
работа
Самостоя
тель-ная
работа
4
12
12
компьютерных технологий в
лингвистике. Электронные базы
данных и корпуса текстов,
доступные для исследования.
Раздел III.
возможности стандартных и
специализированных средств
обработки текстов, создания и
исследования баз данных.
Проверка
выполненны
х заданий.
Коллок
виум
8
8
Обсуждение
прочитанного
Проверка
выполненны
х заданий.
12
12
Обсуждение
прочитанного
Проверка
выполненны
х заданий.
Проблемы разработки
лингвистических анализаторов.
Индустриальная обработка
языковых данных и место в ней
лингвистического анализа.
Раздел IV. Функциональные
Обсуждение
прочитанного
Коллок
виум
Области компьютеризации
лингвистических исследований.
Раздел II. Результаты применения
Формы
контроля
VII. Содержание дисциплины по разделам и темам (этапам) – аудиторная и самостоятельная
работа:
1. Раздел I. Области компьютеризации лингвистических исследований.
Ознакомление магистрантов с общим кругом областей и проблем
компьютерного моделирования и анализа материала естественного языка.
1.1. Название темы
Общие проблемы компьютерного моделирования и анализа материала
естественного языка.
Содержание темы
Анализ соотношения онтологии естественного языка и средств и приёмов
формального отображения его устройства в алгоритмах вычислительных
устройств. Особенности моделирования синхронных срезов и диахронных
процессов языка.
1.2. Название темы
Построение и анализ синхронных и диахронных текстовых и речевых
корпусов.
Содержание темы
Обобщение опыта создания и использования текстовых корпусов в целях их
лингвистического анализа. Принципы отбора и маркировки текстов,
организации текстовой базы и системы манипулирования лингвистическими
данными.
1.3. Название темы
Построение и анализ синхронных и диахронных словарных баз данных.
Содержание темы
Анализ задач, средств и приёмов создания и использования баз данных по
русским и английским словарям различных типов.
1.4. Название темы
Разработка и реализация на компьютере математических моделей языкового
существования-развития.
Содержание темы
Выявление и анализ проблем разработки и использования компьютерных
математических моделей синхронии и диахронии языка.
1.5. Название темы
Разработка и приложение комплекса математических средств анализа
устройства текста с помощью компьютера.
Содержание темы
Анализ мирового опыта и собственных разработок лаборатории общей и
компьютерной лексикологии и лексикографии (ЛОКЛЛ филфака МГУ) в
области математического анализа текстов.
1.6. Название темы
Авторские корпуса текстов и их использование в лингвистическом и
литературоведческом анализе.
Содержание темы
Принципы отбора и маркировки текстов, текстологические и др. проблемы.
1.7. Название темы
Создание и анализ БД по психолингвистическим экспериментам по
выявлению уровня и характера знания лексики носителями русского языка
Содержание темы
Анализ методики сбора данных по указанным экспериментам, создания на их
основе БД, её пополнения общеязыковыми данными и квантитативносистемного лингвистического анализа.
Раздел II. Результаты применения компьютерных технологий в лингвистике.
Электронные базы данных и корпуса текстов, доступные для исследования.
2.1. Название темы.
Лингвистически ориентированные продукты в Интернете.
Содержание темы
Обзор электронных конкордансов, корпусов текстов, лексикографических баз
данных и пр., имеющихся в Интернете.
2.2. Название темы.
Национальный корпус русского языка: состав, типы информации и
функциональные возможности.
Содержание темы
2.3. Название темы.
Специализированные корпуса текстов (на материале электронных корпусов
ЛОКЛЛ МГУ) - анализ принципов и целей создания, результатов и
возможностей их использования.
Содержание темы
«Полистилевой корпус современного русского языка; «Компьютерный
корпус русских газет конца 20 века" (ККРГК 20 века); корпус «Стихи и
драматургия Пушкина», «Корпус художественных произведений А.П.Чехова».
2.4. Название темы
Специализированные неологические БД, их использование для вскрытия
закономерностей лексико-семантической и словообразовательной эволюции
русского языка.
Содержание темы
Анализ принципов создания БД по новым словам «Корпуса русских газет
конца 20 века» и результаты её использования при анализе закономерностей
развития русской лексики. БД лексических неологических данных по словарю
«Новые слова и значения» (1984).
2.5. Название темы
Использования БД при анализе закономерностей исторического развития
лексики и.-е. языков.
Содержание темы
БД по «Словарю древнерусского языка». БД по «Этимологическому словарю
славянских языков». БД по глоттохронологическому списку индоевропейских
языков. БД по «Хронологическому морфемно-словообразовательному
словарю русского языка» (ХМССРЯ).
2.6. Название темы
Использование БД для изучения синонимии.
Содержание темы
Базы данных по «Словарю синонимов» русского языка А.П.Евгеньеой (1975)
и английскому словарю синонимов «Webster’s New Dictionary of Synonyms» и
результаты их использования при анализе закономерностей устройства
лексической синонимии этих языков.
2.6. Название темы
«Тезаурусные» базы данных.
Содержание темы
БД на основе «Тезауруса синонимов русской речи»; БД на основе
«Семантического словаря русского языка».
2.7.Название темы
Исследование грамматических особенностей и вариантов словоизменения с
помощью БД «Грамматический словарь русского языка» А.А. Зализняка
Содержание темы
Получение частотных словарей на основе данной БД. Исследование с их
помощью системы частей речи, вариантов русского словоизменения и
ударения.
2.8.Название темы
Разработка и компьютерная реализация модели эволюции лингвистических
систем (на основе «Модели жизненного цикла языкового знака»).
Содержание темы
Анализ проблем разработки системной теории эволюции знаковых единиц и
ансамблей в Языке Человека, формализация и квантификация основных
параметров, подбор математического аппарата, постановка вычислительных
экспериментов и их интерпретация.
Раздел III. Проблемы разработки лингвистических анализаторов.
Индустриальная обработка языковых данных и место в ней лингвистического
анализа.
3.1. Название темы
Информационный поиск (ИП) в Интернете.
Содержание темы
Анализ проблем лингвистического обеспечения ИП
3.2. Название темы
Машинный перевод (МП).
Содержание темы
Анализ лингвистических проблем МП.
3.3. Название темы
Интеллектуальный поиск информации (ИПИ) в текстовых массивах (data
mining)
Содержание темы
Анализ лингвистических проблем ИПИ
3.4. Название темы
Системы распознавания устной речи
Содержание темы
Анализ лингвистических проблем построения и использования систем
распознавания устной речи
3.5. Название темы
Автоматическая классификация и распознавание текстов различных типов.
Содержание темы
Анализ проблем автоматической классификации и распознавания текстов
различных типов (индивидуальная, гендерная и жанровая специфика)
3.6. Название темы
Контекстуальные словари (КС) и экспертные системы для сбора
контекстуальной информации по снятию многозначности лексических
единиц
Содержание темы
Анализ опыта разработки контекстуальных словарей на русском и
английском материале. Принципы разработки экспертных систем для
ускорения разработки КС.
3.7. Название темы
3.8. Основные компоненты и виды лингвистических анализаторов.
Автоматический морфологический анализ и синтез.
Содержание темы
Анализ проблем разработки и использования лемматизаторов и
морфологических анализаторов в анализе данных русского языка.
3.9. Название темы
Автоматический морфемный анализ.
Содержание темы
Анализ проблем разработки и использования морфемных анализаторов в
приложении к данным русского языка.
3.10. Название темы
Разработка денотативно-смысловых анализаторов
Содержание темы
Анализ проблем разработки и использования тезаурусов в денотативносмысловом анализе данных русского языка
3.11. Название темы
Разработка семантико-синтаксических анализаторов.
Содержание темы
Анализ проблем разработки и использования лексико-семантических и
формальных синтаксических признаков в разработке алгоритмов
синтаксического анализа текстов русского языка.
3.12. Название темы
Разработка устно-речевых анализаторов.
Содержание темы
Анализ проблем разработки и использования устно-речевых анализаторов
3.13. Название темы
Разработка комплексных лингвистических анализаторов и экспертных
лингвистических систем.
Содержание темы
Анализ систем МП как примера комплексных лингвистических анализаторов.
Использование экспертных лингвистических систем при решении
индивидуально-автороведческих проблем, распознавании гендерных, жанровых
и иных характеристик текстов.
Раздел IV. Функциональные возможности стандартных и специализированных
средств обработки текстов, создания и исследования баз данных.
4.1.Название темы
Лингвистические функции и возможности Word.
Содержание темы
Особенности получения элементарной статистики. Возможности
расширенного поиска и замен. Проблема проверки орфографии и пунктуации,
реферирования, составления предметных указателей, анализа стиля, сравнения
текстов. Подготовка текстов для корпусов, создаваемых магистрантами.
4.2.Название темы
Создание и исследование баз данных с помощью Excel.
Содержание темы
Создание базы данных. Подготовка материала для БД, создаваемых
магистрантами. Анализ материала с помощью сводных таблиц и диаграмм.
Использование формул.
4.3.Название темы
Основные возможности, предоставляемые макросами Excel.
Содержание темы
Разбор основных возможностей VBA и некоторых макросов,
автоматизирующих анализ данных.
4.4. Название темы
Создание, разметка и исследование корпусов текстов с помощью системы
Dictum-2 (ЛОКЛЛ МГУ).
Содержание темы
Знакомство с функциями системы. Самостоятельное создание и обработка
электронного корпуса текстов. Извлечение из него материала для собственной
БД.
4.5.Название темы
Компьютерная информационно-исследовательская система «ИСТОК»(ЛОКЛЛ
МГУ) и проведение с ее помощью исследования размеченного корпуса текстов
Содержание темы
Знакомство с функциями системы. Проведение самостоятельного исследования
конвертированных в неё корпусов.
4.6. Название темы
Квантитативное исследования стиля текстов с помощью программы
«StyleAnalyser» (ТомскГУ, ЛОКЛЛ МГУ)
Содержание темы
Знакомство с функциями системы и реализованными в ней статистическими
функциями. Проверка с помощью этих инструментов различительной силы
разных лингвистических признаков на текстах разных жанров и авторов.
VIII. Перечень компетенций, формируемых в результате освоения дисциплины
- способность самостоятельно формулировать научные проблемы на основе
адекватного анализа научной традиции и современных тенденций (М-ОНК-2);
- способность к самостоятельному пополнению, критическому анализу и
применению теоретических и практических знаний в сфере гуманитарных наук для
собственных научных исследований и практической деятельности (М-ОНК-3).
- владение основными методами, способами и средствами получения, хранения,
переработки информации; умение анализировать и совершенствовать методы,
способы и средства работы с информацией, в соответствии с поставленными
задачами (М-ИК-3);
- владение навыками использования программных средств, способность
самостоятельно определять и осваивать необходимое для профессиональной
деятельности аппаратное и программное обеспечение (М-ИК-4).
способность к поиску, критическому анализу, обобщению и систематизации
научной информации, к постановке целей исследования и выбору оптимальных
путей и методов их достижения (М-СК-2);
- способность к самостоятельному обучению и разработке новых методов
исследования, к изменению научного и научно-производственного профиля
деятельности; к инновационной научно-образовательной деятельности (М-СК-3);
- умение выстраивать прогностические сценарии и модели развития
коммуникативных и социокультурных ситуаций (М-СК-5).
- знание актуальных проблем и современных методов филологической науки,
понимание структуры и перспектив развития филологии как области знаний,
междисциплинарных связей филологии (М-ПК-1);
- умение применять филологическую теорию в прикладных областях (М-ПК-7);
-умение трансформировать различные типы текста (изменение стиля, жанра, целевой
принадлежности текста, перевод словесных
гипертекстовые и электронные и т.п.) (М-ПК-9);
текстов
в
мультимедийные,
печатных
в
-умение оказывать филологические экспертные и консультационные услуги в
различных областях науки и образования, культуры, производства, общественнополитической жизни и государственного управления (М-ПК-14);
IX. Используемые образовательные,
производственные технологии:
научно-исследовательские
А. Аудиторные занятия и самостоятельная работа
и
научно-
Б. Работа с оригинальными программными средствами, базами данных и
корпусами текстов ЛОКЛЛ филологического ф-та МГУ.
В. Подготовка самостоятельного продукта (БД или корпуса текстов),
пригодного для использования обучаемым и другими специалистами – как
практическая реализация полученных знаний.
X. Учебно-методическое обеспечение самостоятельной работы студентов,
оценочные средства контроля успеваемости и промежуточной аттестации:
А. Учебно-методические рекомендации для обеспечения самостоятельной
работы студентов:
Самостоятельная
работа
студентов
обеспечивается
доступностью
рекомендуемой литературы, доступностью основных программных
продуктов и систем, обсуждаемых в курсе, для студентов (в лаборатории
общей и компьютерной лексикологии и лексикографии филологического
факультета, на материальной основе и собственных компьютернолингвистических продуктах которой базируется данный курс).
Б. Примерный список вопросов и заданий для проведения текущей и
промежуточной аттестации (а также тем для докладов и рефератов):
- Типы информации (зоны) в толковом словаре и организация БД для анализа
словаря по этим зонам.
- Анализ проблем автоматической классификации и распознавания текстов
различных типов (индивидуальная, гендерная и жанровая специфика
текстов).
- Анализ проблем разработки и использования лемматизаторов и
морфологических анализаторов в анализе данных русского языка.
- Анализ принципов и целей создания, системный анализ БД по
закономерностям сохранности общеславянского лексического фонда в
современных славянских языках.
- Анализ принципов и целей создания и результатов использования Корпуса
«Стихи и драматургия Пушкина».
- Анализ принципов и целей создания и результатов использования
Чеховского корпуса
- Анализ принципов и целей создания БД по корпусу газетных текстов конца
20 века, результаты её использования при анализе закономерностей развития
русской лексики.
- Анализ принципов и целей создания БД по «Хронологическому морфемнословообразовательному словарю русского языка», результаты её
использования при анализе закономерностей словообразовательного
развития русской лексики.
- Анализ принципов и целей создания БД по русской и английской
лексической синонимике (по материалам словарей «Словарь синонимов»
А.П. Евгеньевой и «Webster’s New Dictionary of Synonyms»), результаты её
использования при анализе закономерностей устройства лексической
синонимии русского английского языка.
- Принципы сбора данных, организации и анализу БД по тестированию
индивидуального знания лексики
и др.
- Исследовательские задания:
каждый магистрант должен с использованием предоставляемых ему
компьютерных средств создать и исследовать базу данных или корпус
текстов, связанный с темой его научно-исследовательской работы.
XI. Учебно-методическое и информационное обеспечение дисциплины
Основная литература к курсу.
№
п/п
Разд
ел
Автор
Отв.
редактор Место
Название книги /
Издатель(для
издастатьи
ство
коллектив- ния
ных работ)
Год
издания
Название
журнала
(сборника)
Том
(выпуск)
Номер Раздел
журнала
журна
про/
ла
граммы
сборник
а
Аверина С.
А., Азарова
И. В.,
Алексеева
Е.Л. и др.
Прикладное
языкознание.
СПб.
Изд-во
СПбГУ.
1996.
III
2
Алексеев
П.М.
Статистическая
лексикография
(типология,
составление и
применение
частотных
словарей). –
Л.:
ЛГПИ им.
А.И.
Герцена,
1975.
I
3
Аношкина
Ж.Г.
Подготовка
частотных
словарей и
конкордансов на
компьютере.
М.,
4
Бакулов А.
Д.,
Леонтьева
Н. И.,
Шаляпина 3.
М.
Отечественные
системы
машинного
перевода //
М.,
5
Беляева Л.
Н., Герд А.
С., Убин И.
И.
Автоматизация в
лексикографии //
СПб.
6
Хронологический
морфемноБогданов
словообразовате
В.В.,
льный словарь
Крюкова
русского языка:
О.С.,
создание базы
Поликарпов данных и ее
А.А.
системноквантитативный
анализ //
1
М.:
1995.
1990.
Искусственный
интеллект.
Кн. 1.
Систем
ы
общения
и
экспертн
ые
системы
.
III
Изд-во
1996.
СПб. Ун-та
Прикладная
лингвистика.
I
Московски
1998
й лицей,
Вопросы
общего,
сравнительноВып.2. исторического,
сопоставительн
ого языкознания.
II
№
п/п
Разд
ел
Автор
Отв.
редактор Место
Название книги /
Издатель(для
издастатьи
ство
коллектив- ния
ных работ)
Компьютерные
Гринбаум О.
аспекты
Н.
стилеметрии //
Год
издания
Название
журнала
(сборника)
Том
(выпуск)
Номер Раздел
журнала
журна
про/
ла
граммы
сборник
а
СПб.
Изд-во
1996.
СПб. Ун-та
Прикладное
языкознание.
II
Исаев И. А.
Опыт
автоматизации
лексикографичес
ких
исследований.
Система DIALEX
//
М.,
Ин-т
русского
языка
Российско 1996.
й
академии
наук.
Слово
Достоевского.
II
9
Казакевич
О.А.
Исследование
текстовых баз
данных в
лингвистических
исследованиях:
обзор
9зарубежных
работ //
М.
1988
Научнотехническая
информация.
10
Исследование
системных
параметров
Колодяжная
лексики на
Л.И.,
основе
Поликарпов
компьютерной
А.А.
версии
синонимического
словаря //
М.,
11
СистемноКолодяжная
квантитативное
Л.И.,
исследование
Поликарпов
русской
А.А.
синонимии //
Сыктывк.
Сыкты гос.
1997.
вкар: университ
ет,
7
8
12
Кукушкина
О.В.
Словарная база
данных
"Грамматический
словарь русского
языка" А.А.
Зализняка //
13
Кукушкина
О.В.,
Поддубный
В.В.,
Поликарпов
А.А.,
Шевелев
О.Г.
Автоматическая
классификация
текстов корпуса
русских текстов
конца ХХ века по
жанровым типам
и источникам. //
14
Проверка
теоретически
Кукушкина предсказанных
О.В.,
неодериватологи
Отв. ред.
Поликарпов ческих
М.И.Черн
А.А.,
закономерностей
ышёва).
Токтонов
данными русской
А.Г.
корпусной
неодериватогра
фии // (
Серия 2. №6,
I
Т. 2.
II
Альманах
"Говор".
Ч.1. D. -
II
Сыктывк.
Cыкты гос.
Альманах
1997. вкар: университ
"Говор".ет,
Ч.1. D. -
II
Ин-т
русского
языка
РАН. -
Труды
машинного
1992. фонда русского
языка.
Изд-во
Москв
Моск. уна,
та,
2007.
Русский язык:
исторические
судьбы и
современность.
Труды и
материалы.
М.,
2008.
–
Теория и
история
славянской
лексикографии.–
15
Кукушкина
О.В.,
Поликарпов
А.А.,
Хмелёв Д.В.
Определение
авторства текста
с
использованием
буквенной и
грамматической
информации //
М.,
2001.
Проблемы
передачи
информации.
16
Диск CD-ROM:
КИИСа.
Корпусная
информационнопоисковая
Кукушкина,
система . Выпуск
О.В., А.А.
1. "Поэзия и
Поликарпов,
драматургия
В.В.Федотов
А.С. Пушкина и
.
Путеводитель по
Пушкину". – МГУ
им.
М.В.Ломоносова.
Филологический
М.:
2006.
http://www.philol.
msu.ru/~humlang
/articles/polystylc
orp.html
Изд-во
Моск. унта,
Т. 37,
№2 -
II
II
II
IV
№
п/п
Разд
ел
Автор
Отв.
редактор Место
Название книги /
Издатель(для
издастатьи
ство
коллектив- ния
ных работ)
Год
издания
Название
журнала
(сборника)
Том
(выпуск)
Номер Раздел
журнала
журна
про/
ла
граммы
сборник
а
факультет.
Кафедра
русского языка.
Лаборатория
общей и
компьютерной
лексикологии и
лексикографии,
17
Читаем и
исследуем.
Работа с
корпусами
Кукушкина, текстов с
О.В., А.А.
помощью
Поликарпов, информационноВ.В.Федотов исследовательск
.
ой системы
КИИСа. Выпуск
1: «Поэзия и
драматургия
А.С.Пушкина». -
М.:
Изд-во
Моск. унта,
2006. -
IV
18
Мартыненко Основы
Г.Я.
стилеметрии. –
Л.:
Изд-во
Ленингр.
ун-та,
1988.
–
I
19
Марусенко
М. В.
Атрибуция
анонимных и
псевдонимных
литературных
произведений
методами
теории
распознавания
образов.
Л.,
1990.
I
20
Мельников
Г. П.
Системология и
языковые
аспекты
кибернетики. -
Москв Советское
1978.
а:
радио,
http://www.philol.
msu.ru/~lex/melni
kov/meln_r/titl.ht
m
21
Диссипативная
стохастическая
Поддубный,
динамическая
В.В., А.А.
модель развития
Поликарпов.
языковых знаков
//
М.
2011
Компьютерные
исследования и
т. 3,
моделирование.
-
22
Эволюционное
обоснование
"Закона
Менцерата" и
Поликарпов поиск базовой
А.А.
функциональной
зависимости
длин морфем от
их позиционных
характеристик //
Новос
Изд.
ибирск
НГПУ,
,
2005.
Квантитативная
лингвистика:
Исследования и
модели. -
II
23
Поликарпов
А.А.,
Бушуева
О.В.
Опыт
построения
контекстуальног
о словаря и
анализ его
устройства //
1988.
–
Теоретические и
практические
проблемы
прикладной
лингвистики. –
IV
24
Поликарпов
А.А.,
Кукушкина
О.В.,
Виноградов
а В.И.,
Пирятинска
я Е.Ф.,
Савчук С.О.
Компьютерный
под ред.
корпус текстов
М.Н.Волод М.:
современной
иной.
русской газеты //
Язык средств
массовой
информации. –
II
25
Стилистика,
семантика,
грамматика:
Поликарпов опыт анализа
А.А., Курлов системных
В.Я.
взаимосвязей
(на основе
анализа данных
толкового
М.:
М.
Изд-во
Моск. унта,
Академиче
ский
2008.
проект;
–
Альма
Матер,
1994. -
Вопросы
языкознания,
I
№ 2. -
№ 1,
II
I
№
п/п
Разд
ел
Автор
Отв.
редактор Место
Название книги /
Издатель(для
издастатьи
ство
коллектив- ния
ных работ)
Год
издания
Название
журнала
(сборника)
Том
(выпуск)
Номер Раздел
журнала
журна
про/
ла
граммы
сборник
а
словаря) //
26
Степень
абстрактности и
субъективности
Поликарпов смысла –
А.А.,
факторы
Селезнева- варьирования
Елецкая
степени
Л.А.
сохранности во
времени его
лексических
обозначений //
Составите
ль В.А.
М.:
Кочергина.
–
Изд-во
Моск. унта,
2004
Сравнительноисторическое
исследование
языков:
Современное
состояние и
перспективы.
Сб. статей по
материалам
международной
научной
конференции
(Москва, 22-24
января 2003 г.). /
II
Изд-во
Моск. унта,
Проблемы
славянского
языкознания в
контексте
индоевропейског
о сравнительноисторического
языкознания.
2001. Тез. докл. научн.
конф. Москва,
филологический
факультет МГУ
им.
М.В.Ломоносова
. 30-31 октября
2001 г. -
II
Язык. Глагол.
Предложение. К
70-летию
2000. Георгия
Георгиевича
Сильницкого. -
II
27
Зависимость
сохранности
общеславянской
лексики во
Поликарпов
времени от
А.А..
категориальной
принадлежности
и возраста слов
//
М.:
28
Закономерности
образования
новых слов:
Поликарпов моделирование
А.А..
процесса и его
экспериментальн
ое исследование
//
Изд-во
Смоле
Смоленск
нск,
ого ун-та
29
Шайкевич
А.Я.
Дифференциаль
ные частотные
словари и
исследование
языка
Достоевского (на
материале
романа “Идиот”)
//
30
A System for
Compilation and
Kolodyazhna Analysis of
Czap, H.,
ya, L.I.,
Computerized
Nedobity
Polikarpov, Philological
W. (eds).
A.A.
Dictionaries Using
a Personal
Computer.
31
Study of
Quantitative
Correlations
Kolodyazhna between
ya, L.I.,
Stylistics,
Polikarpov. Grammar and
A.A.
Polysemy of
Words (On the
Basis of Ozhegov
Dictionary) //
32
Kukushkina
Olga V.,
Polikarpov
Anatoliy A.
DicTUM-1 - A
System for
Dictionary-Text
Universal
Manipulations and
Analysis //
33
Kukushkina, Using Letters and
O. V.,
Grammatical
М.:
Ин-т
русского
языка
Российско 1996.
й
академии
наук.
Слово
Достоевского.
II
Frankf Indeks
urt/M. Verlag,
1990
TKE`90:
Terminology and
Knowledge
Engineering.
II
Москв
а,
Qualico-94. 2-ая
Международная
конференция по
квантитативной
1994. - лингвистике, 20- Vol.2.
24 сент. 1994 г.,
Москва, МГУ,
филологический
факультет. -
II
Mosco
w. -
1996
XI International
Conference
"History and
Computing",
Moscow, Moscow
State Universiti,
August 20-24
1996. -
М.
2001
Problems of
Information
IV
II
№
п/п
Разд
ел
Автор
Polikarpov,
A. A., and
Khmelev,
D. V.
Отв.
редактор Место
Название книги /
Издатель(для
издастатьи
ство
коллектив- ния
ных работ)
Год
издания
Statistics for
Authorship
Attribution //
Название
журнала
(сборника)
Том
(выпуск)
Номер Раздел
журнала
журна
про/
ла
граммы
сборник
а
Transmission.
Leipzig
,
Linguistische
ArbeitsBerichte.
Institut fuer
Linguistik Universitaet
Leipzig. 3.
2000. - Europaeische
Konferenz
"Formale
Beschreibung
slavischer
35Spachen,
Leipzig 1999".
Vol.37,
Mosco
w–
Varna,
2004.
–
Text Processing
and Cognitive
Technologies.
№ 75.-
II
2006.
–
Contributions to
the Science of
Text and
Language: Word
Length Studies
and Related
Issues. –
№ 9,
II
34
Chronological
Morphemic and
Word-Formational
Dictionary of
Polikarpov A. Russian: Some
A.
System
Regularities for
Morphemic
Structures and
Units //
35
Cognitive
Mechanisms for
Emergence of
Polikarpov A.
some Regularities
A.
of Human
Language
Evolution //
36
Towards the
Foundations of
Menzerath’s Law:
On the Functional
Polikarpov A.
Dependence of
A.
Affixes’ Length on
their Positional
Number within
Words //
37
Koehler,
Polikarpov A. On the Model of
Dordre
R., Rieger,
Kluwer,
A.
Word Life Cycle //
cht:
B. (eds.)
38
Using Corpus for
the Benefit of
Neoderivatology:
Theoretical and
Experimental
Polikarpov A.
Study of New
A.
Words Based on
Data from
«Polystylistic
Corpus of Modern
Russian Texts» //
Dordre
Springer,
cht:
Contributions to
1993. - Quantitative
Linguistics. -
Frantisek
Sticha,
Mirjam
Praha: Academia, 2008.
Fried (eds.)
//
Grammar and
Corpora.
Gramatika a
Korpus 2007.
(Selected
contributions from
the conference
“Grammar and
Corpora, Sept.
25-27, 2007,
Liblice). —
Issue
2. -
II
II
IV
Дополнительная литература к Программе
№
п/п
Автор
Название книги / статьи
Отв.
редактор
(для
коллективных работ)
Место
ИздаГод
издательство издания
ния
Название
журнала
(сборника)
1
Апресян Ю.Д.
и др.
Лингвистическое
обеспечение системы
ЭТАП-2.
М.,
Наука,
1988.
2
Ахмеджанов
М.С., Э.И.
Королёв,
А.А.Поликарпо
в,
И.И.Ратцева,
М.М.Розенбер
г,
Т.Г.Тройнова.
Дистрибутивностатистический метод
анализа лексики и его
реализация на ЭВМ //
М.:
Изд-во
Моск.
ун-та,
1989.
Прикладные
аспекты
лингвистики. –
3
Бакулов А. Д., Теоретические аспекты
Леонтьева Н. машинного перевода //
1990.
Искусственны
й интеллект.
М,
Том (выпуск)
журнала /
сборника
Номер
журнала
№№
разделов
программы
III
II
Кн. 1. Системы
общения и
III
№
п/п
Автор
Название книги / статьи
Отв.
редактор
(для
коллективных работ)
Место
ИздаГод
издательство издания
ния
Название
журнала
(сборника)
Н.
Том (выпуск)
журнала /
сборника
Номер
журнала
№№
разделов
программы
экспертные
системы.
4
Баранов А. Н.,
Немецкая корпусная
Добровольски
лингвистика //
й Д. О.
М.
5
Виноградов В. Проблема авторства и
В.
теория стилей.
М.,
6
ГаазеРапопорт М.
Г., Поспелов
Д. А.,
Семенова Е.
Т.
Имитация сказочного
мира //
Изд-во
Тартуско
Тарту, го
1984.
универс
итета,
7
Герд А. С.
Научно-техническая
лексикография //
СПб.,
8
Гребенников
А.О. (сост.).
Частотный словарь
рассказов А.П. Чехова.
9
Караулов Ю.
Н.
Лингвистическое
конструирование и
тезаурус литературного
языка.
10
Кобозева И.
Моделирование
М., Лауфер Н.
общения в человекоИ., Сабурова
машинных системах //
И. Г.
М.,
11
Кукушкина
О.В.,
Поликарпов
А.А.
Жанровое
распределение русских
предлогов в корпусе
современной газеты //
Минск,
12
Кукушкина
О.В.,
Поликарпов
А.А.,
Пирятинская
Е.Ф.
«Полистилевой корпус
текстов современного
русского языка»: задачи,
принципы, первичный
анализ
Под ред.
Г.Я.
СПб:
Мартыненко.
М.,
1998
Наука,
Вестник МГУ.
Сер.
Иностранные
языки.
№ 1.
II
1961.
Изд-во
СПб. Ун- 1996.
та
IV
Уч. зап.
Тартуского
гос. ун-та.
Вып. 688.
Принципиальн
ые вопросы
теории
знаний.
II
Прикладное
языкознание.
IV
Изд-во
СПбГУ.
1998.
II
Наука,
1981.
IV
1987.
Лингвистическ
ое
обеспечение
информацион
ных систем.
I
2003.
Язык и
социум. –
II
М.
2006
http://www.phil
ol.msu.ru/~hum
lang/articles/pol
ystylcorp.html
II
Наука,
Труды
машинного
фонда
русского
языка.
Т. 1.
II
13
Леннгрен Л.,
Ферм Л.
Уппсальский машинный
фонд русского языка //
М.
Ин-т
русского
1991.
языка
РАН
14
Леонтьева Н.
Современное состояние
Н, Шаляпина
машинного перевода //
3. М.
М.,
1990.
Искусственны
й интеллект.
Кн. 1. Системы
общения и
экспертные
системы.
III
15
Маккьюин К.
Дискурсивные стратегии
для синтеза текста на
естественном языке //
М.,
1989.
Новое в
зарубежной
лингвистике.
Вып. XXIV.
Компьютерная
лингвистика.
II
16
Мартин Дж.
Организация баз данных
в вычислительных
системах.
М.,
1980.
17
Олкер X. Р.
Волшебные сказки,
трагедии и способы
изложение мировой
истории //
М.,
18
Панков И. П.,
Захаров В. П.
Информационнопоисковые системы //
СПб.,
19
Поддубный,
В.В., А.А.
Поликарпов.
Вывод закона
синхронного
полисемического
распределения
языковых знаков на
основе диссипативной
стохастической
динамической
модели эволюции знако
вых ансамблей //
М.:
Добросв
2011
ет,
20
Поликарпов
А.А.
Теоретические
проблемы прикладной
лексикологии //
М.
1989
Наука,
IV
1987.
Язык и
моделировани
е социального
взаимодейств
ия.
II
1996.
Прикладное
языкознание.
I
Синхронное и
диахронное в
сравнительноисторическом
языкознании.
II
Вестник МГУ.
Сер.9
Филология.
№ 5. -
I
№
п/п
21
22
Автор
Название книги / статьи
Отв.
редактор
(для
коллективных работ)
Место
ИздаГод
издательство издания
ния
Поликарпов
А.А.
Проблемы и
перспективы
автоматизации
лексикологического и
лексикографического
анализа с помощью
ЭВМ //
Киев:
Поликарпов
А.А., Крюкова
О.С.
О системном
соотношении краткого и
среднего толковых
словарей русского языка
//
Название
журнала
(сборника)
Том (выпуск)
журнала /
сборника
Номер
журнала
№№
разделов
программы
Наукова
1990. думка,
Использовани
е ЭВМ в
лингвистическ
их
исследования
х. -
I
Изд-во
Тартуско
Тарту: го
1989. универс
итета,
Квантитативна
я лингвистика
и
автоматически
й анализ
текстов. -
II
2001. -
Русский язык:
исторические
судьбы и
современност
ь.
Международн
ый конгресс
русистовисследовател
ей. Москва,
филологическ
ий ф-т МГУ
им.
М.В.Ломоносо
ва. 13-16
марта 2001 г.
Труды и
материалы. -
II
II
Поликарпов
А.А.,
Кукушкина
О.В.,
Виноградова
В.Б., Савчук
С.О.
Компьютерный корпус
текстов русских газет
конца 20-го века:
создание,
категоризация,
автоматизированный
анализ языковых
особенностей //
М.:
24
Поликарпов
А.А.,
Филимонова
Т.В.
О системной
зависимости негативно
окрашенных
денотативно-смысловых
и субъективнооценочных
характеристик
фразеологических
единиц от их возраста //
М.
2005.
Text
Processing and
№ 11,
Cognitive
Technologies.
25
Попов Э. В.,
Особенности
Преображенск
реализации ЕЯ-систем //
ий А. Б.
М.,
1990.
Искусственны
й интеллект.
26
Севбо И. П.
Графическое
представление
синтаксических структур
и стилистическая
диагностика.
Киев,
27
Сзлтон Г.
Автоматическая
обработка, хранение и
поиск информации.
М,
1973.
28
Слокум Дж.
Обзор разработок по
машинному переводу:
история вопроса,
современное состояние
и перспективы развития
//
М.,
1989.
29
Субботин М.
М.
Гипертекст. Новая
форма письменной
коммуникации //
М.
ВИНИТИ
1994.
.
30
Хмелёв
Дмитрий
Викторович.
Лингвоанализатор 3эпсилон.
М.
http://www.phil
ol.msu.ru/~lex/
khmelev/
II
М.,
Когнитивные
исследования
за рубежом.
Методы
искусственног
о интеллекта в
моделировани
и
политического
мышления.
II
23
31
Макроструктура
повествования и
Цимбурский В.
механизмы его
Л.
социального
воздействия //
Изд-во
Моск.
ун-та,
Кн. 1. Системы
общения и
экспертные
системы.
Наукова
1981.
думка,
1990.
I
II
III
Новое в
зарубежной
лингвистике.
Вып. XXIV.
Компьютерная
лингвистика.
III
Информатика
Т. 18.
III
№
п/п
Автор
Название книги / статьи
Отв.
редактор
(для
коллективных работ)
Место
ИздаГод
издательство издания
ния
32
Шайкевич А.
Я.
Конкорданс к
прозаическому тексту (К
выходу в свет
конкорданса к
«Преступлению и
наказанию») //
33
Шайкевич А.
Я.
Количественные методы
//
М.,
34
Шайкевич А.
Я.
Дистрибутивностатистический анализ в
семантике //
М.,
35
Элти Дж.,
Кумбс М.
Экспертные системы:
концепции и примеры.
М.,
36
Ред.
Л.С.Ковтун ,
СПб:
Д.М.
Поцепня,
Словоупотребление и
стиль писателя.
В. Программное
подразделов:
обеспечение
Название
журнала
(сборника)
Том (выпуск)
журнала /
сборника
Номер
журнала
1995.
Русистика
сегодня.
№2.
Наука,
1990.
Лингвистическ
ий
энциклопедич
еский словарь.
II
Наука,
1976.
Принципы и
методы
семантических
исследований.
II
Изд-во
СПбГУ.
и
1987.
IV
1995. –
II
Интернет-ресурсы
–
с
№№
разделов
программы
II
выделением
Программное обеспечение:
1. Microsoft Office 2007
2. Продукты ЛОКЛЛ филфака МГУ и ТомскГУ(Dictum-2, «Istok», StyleAnalyser)
Интернет-ресурсы:
http://www.philol.msu.ru/~humlang, http://www.philol.msu.ru/~lex,
http://www.ruscorpora.ru, http://feb-web.ru,
http://lit-info.ru и др.
XII. Материально-техническое обеспечение дисциплины / практики:
А. Помещения: учебные аудитории
Б. Оборудование: стационарные ПЭВМ и индивидуальные ноутбуки
Программа составлена в соответствии с требованиями ОС МГУ по направлению подготовки
«Филология».
Разработчики программы:
проф. О.В.Кукушкина, проф. А.А.Поликарпов
Download