4. Цели и задачи освоения учебной дисциплины

advertisement
Министерство образования и науки Российской Федерации
ФГБОУ ВПО «Армавирская государственная педагогическая академия»
Институт прикладной информатики, математики и физики
Кафедра информатики и информационных технологий обучения
РАБОЧАЯ ПРОГРАММА ДИСЦИПЛИНЫ
по дисциплине по выбору 4_1: Б1.В.ДВ.4.2 «Автоматизированная обработка
текстовых массивов»
Направление подготовки:
45.03.02 Лингвистика
Профиль подготовки: Перевод и переводоведение
Квалификация (степень) выпускника:
бакалавр
Форма обучения:
очная
Составитель: Фомченко Ж.А.
Армавир – 2015 г.
B450302-14-1_2.PLM.XML
2. Обоснование РПД
Рабочая программа по дисциплине «Б1.В.ДВ.4.1 «Автоматизированная обработка
текстовых массивов» разработана в соответствии с требованиями ФГОС ВО к
обязательному минимуму содержания и уровню подготовки дипломированного
выпускника и предназначен для студентов, обучающихся по направлению 45.03.02
Лингвистика.
Рабочая программа дисциплины рекомендована к утверждению учебнометодической комиссией на заседании кафедры информатики и ИТО «___» от «_____»
___________ 2015г., протокол № __.
Автор (составитель): ст. преподаватель Фомченко Ж.А.
Рабочая программа дисциплины утверждена на заседании кафедры информатики и
ИТО
«____»_________________ 20___ г. протокол № ____
Заведующий кафедрой
______________/ Бельченко В.Е.
2
3. Содержание РПД
2. Обоснование РПД ................................................................................................................................2
4. Цели и задачи освоения учебной дисциплины .................................................................................4
5. Перечень планируемых результатов обучения по дисциплине (модулю), соотнесенных с
планируемыми результатами освоения образовательной программы ...............................................4
6. Место учебной дисциплины в структуре ООП ВО ..........................................................................5
7. Объем дисциплины (модуля) (в зачетных единицах с указанием количества академических
или астрономических часов, выделенных на контактную работу обучающихся с преподавателем
(по видам учебных занятий) и на самостоятельную работу обучающихся) ......................................6
8. Содержание дисциплины (модуля) (структурированное по темам (разделам) с указанием
отведенного на них количества академических или астрономических часов и видов учебных
занятий) .....................................................................................................................................................6
9. Перечень учебно-методического обеспечения для самостоятельной работы обучающихся по
дисциплине (модулю) ............................................................................................................................11
10. Фонд оценочных средств для проведения текущего контроля и промежуточной аттестации
обучающихся по дисциплине (модулю) ..............................................................................................12
11. Технологическая карта дисциплины (модуля) ..............................................................................17
12. Перечень основной и дополнительной учебной литературы, необходимой для освоения
дисциплины (модуля) ............................................................................................................................18
13. Перечень ресурсов информационно-телекоммуникационной сети «Интернет» (далее – сеть
«Интернет»), необходимых для освоения дисциплины (модуля) .....................................................19
14. Методические указания для обучающихся по освоению дисциплины (модуля) ......................19
15. Перечень информационных технологий, используемых при осуществлении
образовательного процесса по дисциплине (модулю), включая перечень программного
обеспечения и информационных справочных систем (при необходимости) ..................................19
16. Описание материально-технической базы, необходимой для осуществления
образовательного процесса по дисциплине (модулю) .......................................................................20
17. Дополнительные материалы ...........................................................................................................20
3
4. Цели и задачи освоения учебной дисциплины
Цели курса:
Целью освоения учебной дисциплины «Автоматизированная обработка текстовых
массивов» является формирование у будущих бакалавров по направлению подготовки 45.03.02
Лингвистика системы компетенций в области методик автоматизированной компьютерной
обработки текстовых массивов.
Достижение поставленной цели предполагает решение следующих задач:
 изучение форматов представления текстовых данных;
 овладение методами автоматизированной обработки данных текстового формата;
 овладение методами использования программного обеспечения для редакции и
анализа текстов;
 овладение методами проектирования и использования программных средств
обработки текстов.
5. Перечень планируемых результатов обучения по дисциплине (модулю),
соотнесенных с планируемыми результатами освоения образовательной
программы
Коды
компетенций
ОПК-12
ОПК-13
ОПК-16
ОПК-17
ПК-19
Название компетенции
Форма текущего контроля качества
компетенции
ПК - профессиональные компетенции профиля
способностью работать с различными - тестирование
носителями информации,
распределенными базами данных и
знаний, с глобальными
компьютерными сетями
способностью
работать
с - тестирование
электронными словарями и другими
электронными
ресурсами
для
решения лингвистических задач
владением
стандартными - тестирование
методиками поиска, анализа и
обработки материала исследования
способностью оценивать качество - тестирование
исследования в своей предметной
области,
соотносить
новую
информацию с уже имеющейся,
логично
и
последовательно
представлять
результаты
собственного исследования
способностью работать с основными - тестирование
информационно-поисковыми
и
экспертными системами, системами
представления
знаний,
синтаксического и морфологического
анализа, автоматического синтеза и
распознавания
речи,
обработки
4
ПК-20
ПК-21
лексикографической информации и
автоматизированного
перевода,
автоматизированными
системами
идентификации
и
верификации
личности
владением методами формального и - тестирование
когнитивного
моделирования
естественного языка и методами
создания метаязыков
владением основными математико- - тестирование
статистическими методами обработки
лингвистической
информации
с
учетом элементов программирования
и
автоматической
обработки
лингвистических корпусов
В результате освоения дисциплины
массивов» обучающийся должен:
«Автоматизированная обработка текстовых
Знать:
 значение, роль и место информации в развитии современного общества;
 методы оценки объёма информации и скорости её передачи;
 методы поиска актуальной информации в глобальных компьютерных сетях.
Уметь:
 применять качественные и количественные методы в психологических и
педагогических исследованиях;
 осуществлять сбор и первичную обработку информации, результатов
психологических наблюдений и диагностики;
 организовывать индивидуальную и совместную учебную деятельность обучающихся,
основанную на применении развивающих образовательных программ.
Владеть:
 основными методами, способами и средствами получения, хранения, переработки
информации;
 навыками работы с компьютером как средством управления информацией.
6. Место учебной дисциплины в структуре ООП ВО
Дисциплина «Автоматизированная обработка текстовых массивов» относится к блоку
дисциплин по выбору Б1.В.ДВ.4.2 ФГОС ВО.
Освоение содержания дисциплины «Автоматизированная обработка текстовых
массивов» следует после изучения 2-х семестрового курса «Информационные технологии в
лингвистике».
Освоение содержания дисциплины «Автоматизированная обработка текстовых
массивов» предваряет прохождение учебной и производственной практик.
5
7. Объем дисциплины (модуля) (в зачетных единицах с указанием количества
академических или астрономических часов, выделенных на контактную
работу обучающихся с преподавателем (по видам учебных занятий) и на
самостоятельную работу обучающихся)
Семестр
4
Трудоемкость
зач. ед.
час
Лекции,ч
ас.
Практические
занятия,час.
2
72
10
20
В том числе в интерактивной форме
Выписка из рабочего учебного плана
Лаб.
СРС,
Форма
работы,час
час
аттестации
.
42
Зачет
-
8. Содержание дисциплины (модуля) (структурированное по темам
(разделам) с указанием отведенного на них количества академических или
астрономических часов и видов учебных занятий)
8.1. Структура учебной дисциплины
№
п/п
1
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
Разделы курса, темы занятий
Раздел 1: Теоретический инструментарий
обработки текстовых массивов.
Тема 1.1.
Математическая лингвистика и её
математический базис: классификация
языков и грамматик.
Тема 1.2.
Классификация языков и грамматик Н.
Хомского.
Тема 1.3.
Математические инструменты обработки
цепочек языков четырёх классов.
Тема 1.4.
Обработка естественного языка общее
направление развития искусственного
интеллекта и математической
лингвистики.
Тема 1.5.
Компьютерный анализ и проблема
понимания смысла языка.
Тема 1.6.
Компьютерный синтез конструкций
естественного языка.
Тема 1.7.
Компьютерное генерирование грамотно
оформленного текста.
Тема 1.8.
Тематический план изучения дисциплины
Всего
Из них
Всего
СРС
аудит
Лекц.
Практ
Лаб
часов
часов
.
7
3
1
2
4
7
3
1
2
4
7
3
1
2
4
5
3
1
2
2
5
3
1
2
2
5
3
1
2
2
5
3
1
2
2
4
2
2
2
6
2
2.1
2.2
2.3
2.4
2.5
2.6
Компьютерное построение и
использование синтаксических деревьев.
Раздел 2: Практическое освоение
инструментов обработки текстовых
массивов.
Тема 2.1.
Работа со словарями общего и
специального назначения.
Тема 2.2.
Работа с базами знаний языков, словарями
корней слов.
Тема 2.3.
Машинный перевод текста.
Тема 2.4.
Компьютерная обработка языковых
конструкций.
Тема 2.5.
Компьютерное генерирование текста.
Тема 2.6.
Компьютерное воспроизведение
синтаксических деревьев.
ИТОГО
16
2
1
1
14
4
2
1
1
2
5
1
1
4
4
-
5
1
1
4
3
1
1
2
5
1
1
4
72
30
20
42
4
10
Структура учебной дисциплины
Таблица 2.
Содержание дисциплины
№
раздела
1
2
Наименование раздела
Форма рубежного контроля
Теоретический инструментарий
обработки текстовых массивов.
Практическое освоение инструментов
обработки текстовых массивов.
Рубежное
компьютерное
тестирование
Защита
подготовленных
решений
(лабораторные
работы)
8.2. Виды занятий и их содержание:
Планы и содержание лекционных занятий
Раздел 1: Теоретический инструментарий обработки текстовых массивов.
Лекция 1:Математическая лингвистика и её математический базис: классификация
языков и грамматик.
Содержание.
1. Понятие алфавита, символов алфавита, слов алфавита. Понятие языка над алфавитом.
2. Классификация языков.
3. Понятие регулярного языка.
4. Понятие рекурсивно-перечислимого языка.
5. Инструменты распознавания цепочек регулярных и рекурсивно-перечислимых языков.
7
6. Синтаксис и семантика языка. Понятие грамматики.
7. Порождающие и распознающие грамматики Хомского.
Лекция 2:Классификация языков и грамматик Н. Хомского.
Содержание.
Порождающие грамматики Хомского как способ задания языка.
Иерархия грамматик Хомского: 4 класса грамматик.
Свободные грамматики.
Контекстно-зависимые грамматики.
Контекстно-свободные грамматики.
Регулярные грамматики.
1.
2.
3.
4.
5.
6.
Лекция 3:Математические инструменты обработки цепочек языков четырёх классов.
Содержание.
1. Машины Тьюринга в качестве распознающих устройств свободных языков.
2. Линейно-ограниченные автоматы в качестве распознающих устройств контекстнозависимых языков.
3. Автоматы с магазинной памятью в качестве распознающих устройств контекстносвободных языков.
4. Конечные автоматы в качестве распознающих устройств регулярных языков.
Лекция 4:Обработка естественного языка общее направление развития искусственного
интеллекта и математической лингвистики.
Содержание.
1. Обработка языковых конструкций естественного языка как вектор развития теории
искусственного интеллекта и математической лингвистики.
2. Лексические базы знаний.
3. Обработка и разбор естественных языков.
4. Проверка орфографии.
5. Машинный перевод.
6. Построение тезаурусов.
7. Построение синтаксических деревьев.
Лекция 5:Компьютерный анализ и проблема понимания смысла языка.
Содержание.
1. Формализация уровней языковых явлений.
2. Орфография и правописание.
3. Словари для простых слов.
4. Словари многословных единиц.
5. Статистический анализ текста.
6. Построение синтаксических деревьев.
Лекция 6:Компьютерный синтез конструкций естественного языка.
Содержание.
1. Лингвистические модели и их типы. Модели синтезирующие, аналитические,
порождающие.
2. Моделирование различных аспектов речевой деятельности. Модели различных уровней
языка и речи (в фонетике, словообразовании и морфологии, синтаксисе, семантике, прагматике).
3. Использование моделей различных уровней языка и речи в системах автоматической
обработки конструкций естественного языка.
Лекция 7:Компьютерное генерирование грамотно оформленного текста.
Содержание.
8
1. Многоязычные генераторы природного языка, использующий языковые универсалии,
типологии, и примитивы.
2. Построение словарей и грамматик для широкого спектра языков, включая исчезающие
языки.
3. Подготовка начальных проектов машинных версий перевода.
4. Адаптация машинных версий перевода профессионального качества.
Лекция 8:Компьютерное построение и использование синтаксических деревьев.
Содержание.
1. Конвертеры размеченного текста в синтаксические деревья.
2. Редакторы построения синтаксических деревьев.
3. Форматы файлов с сохраняющимися в них образами синтаксических деревьев.
Планы и содержание практических занятий
Раздел 1: Теоретический инструментарий обработки текстовых массивов.
Практическое занятие 1:Математическая лингвистика и её математический базис:
классификация языков и грамматик.
Содержание.
1. Построение слов языка над заданным алфавитом.
2. Определение грамматических правил построения языковых конструкций.
3. Синтаксис и семантика языка. Сфера применения коммуникативной грамматики.
Практическое занятие 2:Классификация языков и грамматик Н. Хомского.
Содержание.
1. Иерархия грамматик Хомского: 4 класса грамматик.
2. Свободные грамматики.
3. Контекстно-зависимые грамматики.
4. Контекстно-свободные грамматики.
5. Регулярные грамматики.
Практическое занятие 3:Математические инструменты обработки цепочек языков
четырёх классов.
Содержание.
1. Машина Тьюринга  устройство распознавания цепочек свободных языков.
2. Линейно-ограниченный автомат  устройство распознавания цепочек контекстнозависимых языков.
3. Автомат с магазинной памятью  устройство распознавания цепочек контекстносвободных языков.
4. Конечный автомат  устройство распознавания цепочек регулярных языков.
Примерная тематика лабораторных занятий
Раздел 2: Практическое освоение инструментов обработки текстовых массивов.
Лабораторная работа 1:Работа со словарями общего и специального назначения.
Содержание.
1. Синхронное управление языковыми конструкциями, оформленными с использованием
нескольких языков (языковые конструкции различных языков связаны общей идеей).
2. Интегрирование возможностей нескольких словарей (включение словоформ, образцов
фраз и произношений).
Интернет-ресурсы по теме 2.1:
9
http://sourceforge.net/projects/texai/files/ интегрирование возможностей WordNet 2.1,
КМУ-словаря (с указанием произношения), Викисловаря.
http://www.termbases.eu создание и управление терминологией на нескольких языках
(присутствует единая объединяющая концепция).
http://www.intelliwebsearch.com/index.asp словарь специальных терминов.
Лабораторная работа 2:Работа с базами знаний языков, словарями корней слов.
Содержание.
1. Работа с лексической базой знаний английского языка.
2. Работа с этимологическим словарём греческих и латинских корней английских слов.
3. Работа с базой данных французского языка (лексические корни и прочие лексические
элементы).
Интернет-ресурсы по теме 2.2:
http://wordnet.princeton.edu/лексическая база знаний английского языка.
http://ablemedia.com/ctcweb/showcase/roots.htmlэтимологический словарь греческих и
латинских корней английских слов.
http://www.lexique.org открытый исходный код базы данных французского языка.
Лабораторная работа 3:Машинный перевод текста.
Содержание.
1. Offline-перевод текста с подключением специализированных словарей.
2. Online-перевод текста.
3. Offline-переводчики текста для профессиональных переводчиков.
Интернет-ресурсы по теме 2.3:
http://similis.org/linguaetmachina.www/index.phpполнофункциональный
инструмент
машинного перевода, предназначенный для менеджеров проектов и переводчиков.
http://linguistlist.org/sp/get-software.cfm?submissionid=12195716программа PRESEMT для
переводчиков.
http://www.star-ts.com/downloads-translator-tools-transit-nxt.shtmlпрограммы
для
переводчиков.
http://www.linguistsassistant.com/ словари и переводчики языков, находящихся на грани
исчезновения.
http://www.verbumsoft.com/products.aspx?p=3 портал для внештатных переводчиков,
ведущий учет переводческих агентств.
Лабораторная работа 4:Компьютерная обработка языковых конструкций.
Содержание.
1. Разбор конструкций естественных языков (проверка орфографии, тезаурус, атрибуция
текста).
2. Развитие языковой среды, позволяющее формировать и формализовать уровни
языковых явлений (орфография и правописание, словари для простых слов, многословные
единицы, структурный синтаксис, статистический анализ).
3. Обработка неадаптированного текста, создание морфологических стандартов
(выделение морфем, сортировка и фильтрация списков).
4. Сортировка записей (по дате, времени, длине строки; построение обратных словарей).
Интернет-ресурсы по теме 2.4:
http://www.langsoft.ch/разбор конструкций естественных языков.
http://www.nooj4nlp.net/pages/nooj.html развитие языковой среды, формализация уровней
языковых явлений.
http://linguistica.uchicago.edu/alchemist.html обработка неадаптированного текста,
создание морфологических стандартов в формате XML.
10
http://billposer.org/Software/msort.html сложная утилита сортировки.
Лабораторная работа 5:Компьютерное генерирование текста.
Содержание.
1. Генераторы конструкций природного языка, использующие языковые универсалии,
типологии, и примитивы.
2. Построение словарей и грамматик для широкого спектра языков.
3. Создание начальных вариантов перевода ёмких первоисточников.
Интернет-ресурсы по теме 2.5:
http://www.linguistsassistant.com помощник лингвиста.
Лабораторная работа 6-7:Компьютерное воспроизведение синтаксических деревьев.
Содержание.
1. Конвертирование словесных конструкций в синтаксические деревья, сохраняемые в
виде графических файлов.
2. Построение синтаксических деревьев в специализированных графических редакторах.
Интернет-ресурсы по теме 2.6:
http://ironcreek.net/phpsyntaxtree/ конвертер языковых конструкций в синтаксические
деревья.
http://ltc.sourceforge.net/ прорисовка языковых синтаксических деревьев.
http://mshang.ca/syntree/ генератор синтаксических деревьев.
http://treebuilder.ru/ профессиональный редактор обработки синтаксических деревьев.
http://www.ece.ubc.ca/~donaldd/treeform.htmинструмент построения синтаксических
деревьев.
9. Перечень учебно-методического обеспечения для самостоятельной работы
обучающихся по дисциплине (модулю)
Тема
Тема 1.1.
Тема 1.2.
Тема 1.3.
Тема 1.4.
Тема 1.5.
Тема 1.6.
Тема 1.7.
Тема 1.8.
Количество
часов,
Содержание заданий,
отводимых
выносимых на СРС
на
выполнение
заданий
Вопросы раздела: самостоятельная работа по
4
теме 1.1
Вопросы раздела: самостоятельная работа по
4
теме 1.2
Вопросы раздела: самостоятельная работа по
4
теме 1.3
Вопросы раздела: самостоятельная работа по
2
теме 1.4
Вопросы раздела: самостоятельная работа по
2
теме 1.5
Вопросы раздела: самостоятельная работа по
2
теме 1.6
Вопросы раздела: самостоятельная работа по
2
теме 1.7
Вопросы раздела: самостоятельная работа по
2
теме 1.8
Сроки
проверки
результатов
СРС
11-я неделя
11-я неделя
11-я неделя
11-я неделя
11-я неделя
11-я неделя
11-я неделя
11-я неделя
11
Тема 2.1.
Тема 2.2.
Тема 2.3.
Тема 2.4.
Тема 2.5.
Тема 2.6.
Задания раздела: содержание темы 2.1
Задания раздела: содержание темы 2.2
Задания раздела: содержание темы 2.3
Задания раздела: содержание темы 2.4
Задания раздела: содержание темы 2.5
Задания раздела: содержание темы 2.6
2
2
2
2
2
4
3-я неделя
4-я неделя
6-я неделя
7-я неделя
8-я неделя
9-я неделя
10. Фонд оценочных средств для проведения текущего контроля и
промежуточной аттестации обучающихся по дисциплине (модулю)
переченькомпетенцийсуказаниемэтаповихформированиявпроцессеосвоенияобразовательной
программы:
Компетенция ОПК-16
 владением стандартными методиками поиска, анализа и обработки материала
исследования (ОПК-16)
Этапы формирования компетенции
Знает
Умеет
Владеет
Контрольные вопросы к Задания к практическим
Индивидуальные задания к
практическим
работам работам раздела 1 (1-13);
работам раздела 2 раздела 1 (1-13); раздела 2 раздела 2 (1-8)
№1,3,5,8.
(1-8)
Тестирование
Выполнение СРС по
темам 2.3, 2.4.
Показатели и критерии оценивания компетенции на различных этапах её
формирования, шкала оценивания
Знает
Умеет
Владеет
Ответы на контрольные Умет использовать
Владеет навыками работы
вопросы к практическим программные возможности, программами и иными
работам раздела 1 (1-13); при выполнении
источниками информации
раздела 2 (1-8)
практических заданий по
при выполнении
разделу 1 (1-13); разделу 2
индивидуальных заданий
Тестирования на оценку (1-8).
Индивидуальные задания к
более «удовлетворительно».
работам раздела 2 Выполнение СРС по
№1,3,5,8.
темам 2.3, 2.4 на оценку
более «удовлетворительно».
 способностью работать с различными носителями информации, распределенными
базами данных и знаний, с глобальными компьютерными сетями (ОПК-12)
Этапы формирования компетенции
Знает
Умеет
Владеет
Контрольные вопросы по
Выполнение заданий к
СРС по темам лекций 2.2,
темам лекций 2.2, 2.4, 2.5.
практическим работам
2.4, 2.5.
Ответы на вопросы
раздела 2 - №2,4,5.
экзамена № 19-22
Показатели и критерии оценивания компетенции на различных этапах её
формирования, шкала оценивания
Знает
Умеет
Владеет
Ответы на контрольные Умеет работать с базами
Владеет навыками поиска
12
по темам лекций 2.2, 2.4, данных, сетью Интернет при
2.5
выполнении практических
заданий к работам раздела 2
- №2,4,5.

информации в
лингвистических базах
данных, работой с
информацией на
лингвистических порталах
при выполнении
практических заданий к
работам раздела 2 - №2,4,5.
Выполнение СРС по темам
лекций 2.2, 2.4, 2.5. на
оценку более
«удовлетворительно»
способностью работать с электронными словарями и другими электронными
ресурсами для решения лингвистических задач (ОПК-13)
Этапы формирования компетенции
Знает
Контрольные вопросы по
темам лекций 1.3, 2.1, 2.4.
Умеет
Выполнение заданий к
практическим работам
раздела 2 - №2,3,6,7,10
Владеет
СРС по темам лекций 1.3,
2.1, 2.4.
Индивидуальные задания в
практических работах
раздела 2 - №2,3,6,7,10
Показатели и критерии оценивания компетенции на различных этапах её
формирования, шкала оценивания
Знает
Умеет
Владеет
Ответы на контрольные Показывает умение работать Владеет навыками работы с
вопросы по темам лекций со словарями и другими
электронными словарями и
1.3, 2.1, 2.4. на оценку более лингвистическими
другими лингвистических
«удовлетворительно»
ресурсами при выполнении
ресурсами при выполнении
заданий к практическим
индивидуальных заданий в
работам раздела 2 практических работах
№2,3,6,7,10 на оценку более раздела 2 - №2,3,6,7,10.
«удовлетворительно
Выполнение СРС по темам
лекций 1.3, 2.1, 2.4.
на оценку более
«удовлетворительно»
Типовые контрольные задания или иные материалы, необходимые для оценки знаний,
умений, навыков и (или)опыта деятельности, характеризующих этапы формирования
компетенций в процессе освоения образовательной программы:
Код
к.т.
Lab_1
Lab_2
Lab_3
Lab_4
Контролёр
Преподаватель
работ
Преподаватель
работ
Преподаватель
работ
Преподаватель
Время
лаб. Лабораторное занятие
лаб. Лабораторное занятие
лаб. Лабораторное занятие
лаб. Лабораторное занятие
Форма
Балл
Защита
результата
Защита
результата
Защита
результата
Защита
4
4
4
4
13
Lab_5
Lab_6
Lec_1
работ
Преподаватель
работ
Преподаватель
работ
Лектор
лаб. Лабораторное занятие
лаб. Лабораторное занятие
Плановая
консультация
результата
Защита
результата
Защита
результата
Тестирование
4
4
10
Успешным считается прохождение контрольной точки, если достигнут результат:
1. На лабораторном занятии защищены результаты выполнения всех заданий темы
(количество заданий различных тем варьируется в диапазоне от 1-го до 4-х).
2. В ходе тестирования по материалам лекций набрано 65% максимума (100%).
Промежуточная аттестация по дисциплине.
Промежуточная аттестация обучающихся проводится в форме зачета. Результат работы в
семестре  количество баллов, набранных при прохождении текущих контрольных точек.
Кроме того, обучающийся может подготовить проект (6 баллов).
Промежуточная аттестация обучающегося считается успешно завершившейся, если
обучающийся набрал не менее 45 баллов из 100 возможных.
В случае набора менее 45 баллов обучающийся может воспользоваться одной из
следующих возможностей:
 подготовить тезисы сообщения, выбрав одну из предложенных тем (6 баллов);
 пройти контрольную точку Lec_1 (10 баллов).
А. Формы промежуточного, рубежного и итогового контроля по дисциплине.
Формы текущего и промежуточного контроля (в виде зачета), сроки контроля и темы, по
которым проводится контроль, указаны в соответствующих таблицах.
Б. Задания и требования к зачёту
Примерный перечень вопросов теста текущего контроля знаний по дисциплине.
(контрольная точка Lec_1)
1. Обработка естественного языка (NaturalLanguageProcessing, NLP) как общее
направление развития искусственного интеллекта и математической лингвистики.
2. Компьютерный анализ и проблема понимания смысла языка.
3. Синтез естественного языка и генерирование грамотно оформленного текста.
4. Математическая лингвистика и её математический базис: классификация языков и
грамматик.
5. Грамматики Н. Хомского четырёх классов.
6. Математические инструменты обработки цепочек языков четырёх классов.
7. Словари, интегрированные словари, специальные словари.
8. Базы знаний языков, словари корней слов.
9. Машинный перевод, перевод с ограниченными и специализированными словарями.
10. Программное обеспечение для обработки языковых конструкций.
11. Генерирование грамотно выстроенного текста.
12. Построение и использование синтаксических деревьев.
13. Классификация разговорных форм.
ПОЛОЖЕНИЕ
14
по выстраиванию личностно-ориентированной траектории освоения
содержания дисциплины «Автоматизированная обработка текстовых массивов»
2 курс 4 семестр
Работа по освоению содержания дисциплины контролируется инструментом, именуемым
балльно-рейтинговой системой.
Для получения зачёта
обучаемый должен набрать
не менее 45 баллов
из 100 максимально возможных.
Интерпретация балльно-рейтинговой системы осуществляется в соответствии с
ПОЛОЖЕНИЕМ о балльно-рейтинговой системе Армавирской государственной педагогической
академии.
В соответствии с этим положением:
Система балльно-рейтингового оценивания
Максимальная сумма баллов, которую студент может набрать за семестр по каждой
дисциплине в ходе текущего, рубежного, промежуточного контроля, составляет 100 баллов.
Из указанных 100 баллов 60 баллов отводится на текущий контроль: 30 баллов на
аудиторную работу, 30 баллов на СРС.
На рубежный контроль отводится 30 баллов.
На промежуточный контроль отводится 10 баллов.
Наименование
контрольной точки
Форма
текущего контроля
аудиторных
занятий
Форма
текущего контроля
самостоятельной
работы
Вес
контрольной
точки
Текущий контроль
Посещение
лекционных занятий
Посещение
лабораторных и
практических
занятий
Работа со словарями
общего и
специального
назначения.
Работа с базами
знаний
языков,
словарями
корней
слов.
Машинный перевод
текста.
Компьютерная
обработка языковых
конструкций.
Компьютерное
генерирование
Посещение занятий:
20 баллов за 100%
Посещение занятий:
10 баллов за 100%
20
10
Защита подготовленных
решений (лаб. работы)
Защита подготовленных
решений (лаб. работы)
Защита подготовленных
решений (лаб. работы)
Защита подготовленных
решений (лаб. работы)
Защита подготовленных
решений (лаб. работы)
4
4
4
4
4
15
текста.
Компьютерное
воспроизведение
синтаксических
деревьев.
Доклад (сообщение)
на научно-практич. и
пр. конференциях,
подготовка тезисов/
статей для
публикации;
участие в олимпиаде
по дисциплине
Защита подготовленных
решений (лаб. работы)
4
6
Рубежный контроль
Работа со словарями
общего и
специального
назначения.
Работа с базами
знаний
языков,
словарями
корней
слов.
Машинный перевод
текста.
Компьютерная
обработка языковых
конструкций.
Компьютерное
генерирование
текста.
Компьютерное
воспроизведение
синтаксических
деревьев.
Подготовка проекта.
Защита подготовленных
решений (лаб. работы)
4
Защита подготовленных
решений (лаб. работы)
4
Защита подготовленных
решений (лаб. работы)
Защита подготовленных
решений (лаб. работы)
4
4
Защита подготовленных
решений (лаб. работы)
4
Защита подготовленных
решений (лаб. работы)
4
Защита проекта
6
Промежуточный контроль
Теоретический
инструментарий
обработки текстовых
массивов.
Компьютерное
тестирование
ИТОГО:
10
100
При добавлении этих баллов к общей сумме баллов соблюдаются ограничения на максимально
возможное количество баллов в каждом из разделов:
1. Текущий контроль аудиторных занятий и самостоятельной работы – не более 60 баллов
2. Промежуточный контроль – не более 10 баллов
Таким образом, существует несколько способов для набора необходимых 45 баллов.
16
11. Технологическая карта дисциплины (модуля)
Институт прикладной информатики, математики и физики
Кафедра информатики и ИТО
Направление: 45.03.02 Лингвистика
Профиль: Перевод и переводоведение
Группа: ВЯ-ТМП-2-1
Дисциплина: Д/В - Б1.В.ДВ.4.2 «Автоматизированная обработка текстовых массивов»
Коэффицие
нт
Макси
мальна
я
оценка
Число баллов за 1
мероприятие
Максима
льное
число
баллов
30
Кол-во
Текущий контроль
меропри (аудиторная работа)
ятий
0,769230769
1
0,769230769
10
13
0,076923077
5
0,384615385
5
13
0,333333333
1
0,333333333
5
15
0,133333333
5
0,666666667
10
15
30
1
5
5
10
2
0,2
5
1
15
15
1
5
5
1
2,0
10
20,0
5
40
40
2
Посещение лекции,
ведение конспекта
Активная работа на
лекции
Посещение
лабораторного занятия,
ведение конспекта
защита лабораторной
работы, письменный
опрос
Текущий контроль
(внеаудиторная работа)
Самостоятельное
выполнение расчета
(доказательства и т.п.),
аналогичного
разобранному на лекции
Выполнение основного
домашнего задания,
полученного на
практическом занятии
Выполнение
творческого
инициативного проекта,
участие в НИРС
(выступление на
студенческой
конференции,
подготовка к
публикации тезисов и
статей)
Рубежный контроль
Контрольная работа
17
12. Перечень основной и дополнительной учебной литературы, необходимой
для освоения дисциплины (модуля)
1.
2.
3.
4.
5.
Основная литература
Информатика. Базовый курс: учебник для вузов. 3-е изд. Стандарт третьего поколения /
Симонович С.В. - СПб.: Питер, 2012 - 640 с. 6Ф7, 32.973, И74.
Учебно-методическое пособие по созданию мультимедийных образовательных
презентаций / В.И. Путылин.- Армавир: РИО АГПА, 2011.- 40 с. 6Ф, 32, П90.
Компьютерный практикум по информатике. Офисные технологии: учеб. пособ. / Г.В.
Калабухова.- М.: ИНФРА-М, 2013.- 336 с. 6Ф7, 32.81, К17.
Сычев А.В. Web-технологии [Электронный ресурс]/ Сычев А.В.— Электрон.текстовые
данные.— М.: Интернет-Университет Информационных Технологий (ИНТУИТ), 2009.—
262 c.— Режим доступа: http://www.iprbookshop.ru/16684.— ЭБС «IPRbooks», по паролю.
Алексеев В.Е. Графы и алгоритмы. Структуры данных. Модели вычислений
[Электронный ресурс]: учебник/ Алексеев В.Е., Таланов В.А.— Электрон.текстовые
данные.— М.: БИНОМ. Лаборатория знаний, Интернет-Университет Информационных
Технологий
(ИНТУИТ),
2013.—
320
c.—
Режим
доступа:
http://www.iprbookshop.ru/16085.— ЭБС «IPRbooks», по паролю.
Дополнительная литература
Вирт Н. Алгоритмы и структуры данных [Электронный ресурс]: учебное пособие/ Вирт
Н.— Электрон.текстовые данные.— М.: ДМК Пресс, 2010.— 272 c.— Режим доступа:
http://www.iprbookshop.ru/7965.— ЭБС «IPRbooks», по паролю.
7.
Костюкова Н.И. Графы и их применение. Комбинаторные алгоритмы для программистов
[Электронный ресурс]: учебное пособие/ Костюкова Н.И.— Электрон.текстовые
данные.— М.: БИНОМ. Лаборатория знаний, Интернет-Университет Информационных
Технологий
(ИНТУИТ),
2013.—
311
c.—
Режим
доступа:
http://www.iprbookshop.ru/16086.— ЭБС «IPRbooks», по паролю.
8.
Златопольский Д.М. Программирование. Типовые задачи, алгоритмы, методы
[Электронный ресурс]: учебное пособие/ Златопольский Д.М.— Электрон.текстовые
данные.— М.: БИНОМ. Лаборатория знаний, 2012.— 230 c.— Режим доступа:
http://www.iprbookshop.ru/12264.— ЭБС «IPRbooks», по паролю.
9.
Стивенс Р. Delphi. Готовые алгоритмы [Электронный ресурс]: учебное пособие/ Стивенс
Р.— Электрон.текстовые данные.— М.: ДМК Пресс, 2007.— 384 c.— Режим доступа:
http://www.iprbookshop.ru/7818.— ЭБС «IPRbooks», по паролю.
6.
10.
11.
12.
13.
14.
15.
Периодические издания
http://linguistlist.org/pubs/journals/get-journals.cfm?journalid=177
журнал
об
автоматической обработке естественного языка.
http://linguistlist.org/pubs/journals/get-journals.cfm?JournalID=3291
построение
математических моделей в лингвистике.
http://linguistlist.org/pubs/journals/get-journals.cfm?JournalID=8560
англо-немецкорусский журнал по прикладной лингвистике.
http://www.wordorigins.org/ - журнал об этимологии слов.
http://linguistlist.org/pubs/journals/get-journals.cfm?JournalID=4172
педагогический
журнал.
http://linguistlist.org/pubs/journals/get-journals.cfm?JournalID=3291 - журнал занимающийся
исследованием дискурса.
18
13. Перечень ресурсов информационно-телекоммуникационной сети
«Интернет» (далее – сеть «Интернет»), необходимых для освоения
дисциплины (модуля)
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
http://www.termbases.eu создание и управление терминологией на нескольких языках.
http://www.intelliwebsearch.com/index.asp словарь специальных терминов.
http://wordnet.princeton.edu/лексическая база знаний английского языка.
http://ablemedia.com/ctcweb/showcase/roots.htmlэтимологический словарь греческих и
латинских корней английских слов.
http://www.lexique.org открытый исходный код базы данных для французского языка.
http://similis.org/linguaetmachina.www/index.phpполнофункциональный
инструмент
машинного перевода, предназначенный для менеджеров проектов и переводчиков.
http://www.langsoft.ch/разбор конструкций естественных языков.
http://www.nooj4nlp.net/pages/nooj.html инструмент переработки и развития языковой
среды.
http://linguistica.uchicago.edu/alchemist.html инструмент чтения неадаптированных
текстовых файлов и создания морфологических стандартов в формате XML.
http://billposer.org/Software/msort.html сложная утилита сортировки.
http://www.linguistsassistant.com многоязычный генератор природного языка.
http://ironcreek.net/phpsyntaxtree/конвертер помеченных слов в синтаксические деревья.
http://ltc.sourceforge.net/ инструмент для прорисовки языковых синтаксических деревьев,
http://mshang.ca/syntree/ генератор синтаксических деревьев.
http://treebuilder.ru/программа, позволяющая вручную строить языковые деревья
синтаксиса.
http://www.ece.ubc.ca/~donaldd/treeform.htmинструмент построения синтаксических
деревьев.
http://lp20.org/toney/инструмент классификации разговорных форм.
http://www.liwc.net/инструмент статистической обработки словесных категорий.
14. Методические указания для обучающихся по освоению дисциплины
(модуля)
описание последовательности действий студента или «сценарий изучения дисциплины»
предоставляется преподавателем, ведущим занятия.
15. Перечень информационных технологий, используемых при
осуществлении образовательного процесса по дисциплине (модулю), включая
перечень программного обеспечения и информационных справочных систем
(при необходимости)
 операционные системы WindowsXP, Vista, Windows 7;
 пакет офисных программ MS Office (MS Word, Excel, Power Point, Publisher);
 сетевой ресурс, обеспечивающий доступ к электронной библиотеке курса, в
частности, к материалам РПД по дисциплине «Автоматизированная обработка текстовых
массивов»;
19
- Интернет-доступ, позволяющий осуществлять подбор материалов для
выполнения заданий, подготовки информационного проекта и научных
сообщений.
16. Описание материально-технической базы, необходимой для
осуществления образовательного процесса по дисциплине (модулю)
 компьютерный класс для проведения лабораторных занятий по дисциплине,
оснащённый компьютерами с процессорами классов Pentium или CoreDuo (количество
компьютеров  не менее 12 укомплектованных компьютерами рабочих мест);
 видеопроектор и в качестве средства поддержки лекционных занятий;
 интерактивная доска в качестве средства поддержки лекционных занятий;
 Интернет-доступ, позволяющий осуществлять подбор материалов для
выполнения заданий, подготовки информационного проекта, научных сообщений,
реферата.
17. Дополнительные материалы
20
Download