Машинный фонд башкирского языка

advertisement
Лаборатория лингвистики и
информационных технологий
Лаборатория создана при ИИЯЛ в 2000 г.
для исполнения пунктов по информатизации
башкирского языка, принятых в Меропрятиях
Государственной программы сохранения,
изучения и развития языков народов
Республики Башкортостан
Лаборатория лингвистики и
информационных технологий
В лаборатории работают 6 человек:
заведующий – 0,4 ставки
снс, к.ф.н. Бускунбаева Л.А. – 1 ст.
мнс Ишмухаметова А.Ш. – 1 ст.
ст. лаб. Ибрагимова А.Д. – 1 ст.
ст. лаб. Рафикова Л.Р. – 1 ст.
ст. лаб. Мигранова Л.Г. – 1 ст.
Научная деятельность лаборатории
за 2006-2010 гг.


Кандидатская диссертация – 1
Работа на диссертацией - 3
Публикации лаборатории за 20062010 гг.


Научные статьи – 28
Монографии и словари 5
Монографии и словари





Сиразитдинов З.А., Шамсутдинова Г.Г. Частотный словарь
языка публицистики. Уфа, Гилем-2006.
Хисамитдинова Ф.Г., Сиразитдинов З.А. Русско-башкирский
словарь-справочник водных объектов РБ. Уфа, 2007.
Бускунбаева Л.А.
Хисамитдинова Ф.Г., Сиразитдинов З.А., Суфьянова Н.Ф.
Русско-башкирский словарь-справочник названий улиц
городов РБ. Уфа – 2009.
Сулеманов В.С., Сиразитдинов З.А. Русско-башкирский
словарь астрономических терминов. Уфа, 2009.
Публикации лаборатории в 2010 г.










Ишмухаметова А. Ш. К квантитативно-статистическому методу изучения языка эпосов/Материалы
научной конференции Урал-Алтай: через века в будущее. Уфа, 2010
Сиразитдинов З.А. К вопросу об автоматическом порождении словоизменительных форм
глаголов башкирского языка/Материалы научной конференции Урал-Алтай: через века в будущее.
Уфа, 2010
Сиразитдинов З.А. Информационная лингвистическая система “машинный фонд башкирского
языка” /Материалы научной конференции Урал-Алтай: через века в будущее. Уфа, 2010
Сиразитдинов З.А., Полянин А.И., Ибрагимова А.Д. О статистике посещения машинного фонда
башкирского языка/Материалы научной конференции Урал-Алтай: через века в будущее. Уфа, 2010
Бускунбаева Л. А. Явление субституции в башкирском языке/ Материалы научной конференции
Урал-Алтай: через века в будущее. Уфа, 2010
Сиразитдинов З.А., Бускунбаева Л.А., Каримоав Р.Н. О текстологической базе данных
диалектологического подфонда “Машинного фонда башкирского языка”/
Сиразитдинов З.А., Ибрагимова А.Д., Ишмухаметова А.Ш. Диалектологический подфонд
машинного фонда башкирского языка/Актуальные проблемы диалектологии языков народов
России. Уфа, 2010
Сиразитдинов З.А. К проблеме автоматического порождения глагольных словоизменений
башкирского языка/
Бускунбаева Л.А., Ишмухаметова А.Ш./ Сиразитдинов З.А. о составлении морфологической базы
данных/ в печати
словоизменения именных и глагольных форм башкирского языка /в печати
Лаборатория лингвистики и
информационных технологий
В 2006-2010 гг. лабораторией проведены работы:




Работа с компанией Paratype по созданию 18 башкирских
шрифтов в кодировке Unicode (2006-2007 гг.).
Совместная работа с Microsoft по реализации поддерки
башкирскому языку в ОС Windows (Vists, Windows) (20062009).
Работа с компанией ЛИНУКС ИНК (Санкт-Петербург) по
разработке пилотного проекта по внедрению и поддержке
программных решений построенных на базе Open Source
продуктов (2008 г.).
Разработка информационной системы Машинный фонд
башкирского языка (2006-2010 гг.).
Работа по башкирским шрифтам (с
Paratype)



Корректировка дизайна башкирских букв.
Тестирование шрифтов в разных версиях
текстовых (Word, PageMaker, QExpres) и
графических (Coral, Photoshop) редакторов.
Распространение шрифтов по организациям и
консультирование.
Список разработанных шрифтов


















Шрифт Academy
Шрифт Baltica
Шрифт Literaturnajaj
Шрифт Pragmatica
Шрифт Arabskij
Шрифт Decor
Шрифт Newton
Шрифт PT Sans
Шрифт Bodoni
Шрифт CourRoug
Шрифт Futura
Шрифт JournSan
Шрифт PragShad
Шрифт Lazurski
Шрифт NewJourn
Шрифт ITCChart
Шрифт Bannikov
Шрифт Courier
Работа с Microsoft




Передача раскладки башкирской
клаваитуры.
Перевод системных сообщений.
Тестирование отладочных версий ОС
Vista
Тестирование отладочных версий ОС
Windows 7
Раскладка башкирской клавиатуры
для Microsoft
Работа с компанией ЛИНУКС ИНК
(Санкт-Петербург)



Согласование раскладки клавиатуры.
Тестирование шрифтов Паратайпа в
Линукс.
Тестирование самой работы ОС Нау
Линукс.
Машинный фонд
башкирского языка http://mfbl.ru

Машинный фонд башкирского языка (МФ
БЯ) — это специально разработанная для
лингвистов, преподавателей башкирского
языка, студентов и учащихся старших
классов система поиска филологической
информации.
Структура машинного фонда
башкирского языка http://mfbl.ru
Графический интерфейс
Программное обеспечение на обработку
запроса
Программное обеспечение на редактирование
базы данных
База
База
База
База
База
База
База
7
6
5
4
3
2
1
Машинный фонд башкирского языка
http://mfbl.ru







Машинный фонд башкирского языка представляет
собой информационно-поисковую систему и включает
следующие подфонды (блоки)
Генеральная картотека
Лексикографический подфонд
Грамматический подфонд
Экспериментально-фонетический подфонд
Подфонд «Каталог рукописных книг»
Подфонд «Каталог старопечатных книг»
Диалектологический подфонд
http://mfbl.ru
Генеральная картотека. Структура
представления информации
слово
парадигма…
пометы
парадигма… парадигма…
иллюстрация… иллюстрация… иллюстрация
выход. данные… выход. данные… выход. данные
http://mfbl.ru
Генеральная картотека. Система
лексикографических помет.
Пометы:
часть речи
происхождение
нарицательное/собственное
диалектное/литературное
устаревшее/неологизм
стилистические
Генеральная картотека http://mfbl.ru


Включает слова активного и пассивного
пластов башкирского языка
Количество зафиксированных лексем —
92034 единиц.
Количество иллюстрационного материала
— 83757 единиц.
Генеальная картотека
Объем лексикографической базы
http://mfbl.ru







Общее количество словарей — 47:
Двуязычные общефилологические – 5
Двуязычные терминологичекие словари — 31
Одноязычные словари — 4
Частотные словари — 3
Словари-справочники — 4
Общий объем лексикографической базы —
654000 словарных статей
Лексикографический подфонд
Двуязычные общефилологические
словори (с башкирского языка):
 Башкирско-русский (академический)
 Башкирско-английский
Лексикографический подфонд
Двуязычные общефилологические словори (на
башкирский язык):
 Русско-башкирский (академический 2-х томник)
 Русско-башкирский (Ураксин, 2004)
 Англо-башкирский
Лексикографический подфонд





















Терминологические словари
по пчеловодству
по животноводству
по зоологии
по ботанике
по лесному делу
сельскохозяйственных терминов
экономических терминов
общественно-политических терминов
юридических терминов
медицинских терминов
педагогических и психологических теминов
по черчению
по физике
по астрономии
по технике
по математике
по информатике
по химии
по географии
по изобразительному искусству
для работников торговли и общественного питания
Лексикографический подфонд




Одноязычные словари
толковый словарь башкирского языка
фразеологический словарь
синонимический словарь
орфографический словарь
Лексикографический подфонд






Словари-справочники
Русско-башкирский словарь-справочник названий
населенных пунктов РБ
Русско-башкирский словарь-справочник водных
объектов РБ
Русско-башкирский словарь-справочник названий
улиц городов РБ
Русско-башкирский словарь-справочник названий
горных объектов РБ
Словарь арабских и персидских заимствований в
башкирском языке
Лексикографический подфонд
Частотные словари:
 частотный словарь языка науки
 частотный словарь языка публицистики
 частотный словарь языка прозы
 частотный словарь языка произведений
Д.Юлтыя
 частотный словарь эпоса Урал-батыр
Расположение ссылки на Русско-башкирский
словарь на сайте БГУ
http://mfbl.ru/bash/rusbash
Вид начальной страницы русско-башкирского
словаря http://mfbl.ru/bash/rusbash
Пример выдачи перевода в русско-башкирском
словаре http://mfbl.ru/bash/rusbash
Грамматический подфонд
(академическая грамматика башкирского языка)
http://mfbl.ru
Экспериментально-фонетический
подфонд http://mfbl.ru
Экспериментально-фонетический
подфонд http://mfbl.ru
Экспериментально-фонетический
подфонд http://mfbl.ru
Фрагмент фонетического словаря
(объем словаря 8000 единиц) http://mfbl.ru
Подфонд рукописных книг http://mfbl.ru
Подфонд старопечатных книг
http://mfbl.ru
Подфонды старопечатных и
рукописных книг http://mfbl.ru

Общий объем каталогов старопечатных и
рукописных книг составляет описания
более 3000 книг
Диалектологического подфонда
Диалектологический подфонд
лексическая база
база диалектологического
атласа
текстологическая база
Лексическая база данных
диалектологического подфонда
http://mfbl.ru
В лексическая база диалектологического
подфонда содержит более 52000 лексических
единиц с шестью информационными полями:






диалектное слово;
часть речи,
диалект,
говор,
литературная норма,
русский перевод.
Лексическая база данных
диалектологического подфонда
http://mfbl.ru
База данных диалектологического атласа
http://mfbl.ru



База данных диалектологического атласа
содержит 170 карт с изоглоссами по
диалектам и говорам башкирского языка.
Для атласа выбраны 250 населенных
пунктов РБ и областей РФ, где проживают
башкиры.
В работе использованы материалы
диалектологических экспедиций
сотрудников ИИЯЛ.
Текстологическая база
диалектологического подфонда
http://mfbl.ru
Структура базы данных
диалектный текст
диалект
говор
год записи
образование информатора
пол информатора
возраст информатора
национальность
Текстологическая база
диалектологического подфонда
http://mfbl.ru
Текстологическая база
диалектологического подфонда
http://mfbl.ru




Все параметры, за исключением года записи, выбираются из
ниспадающего меню. Год записи пользователь вводит сам.
Образование включает следующие поля фиксации: без
образования, начальное, неполное среднее, среднее, среднее
техническое, высшее.
Возраст информатора задается в виде шкалы лет: 5-10, 11-20, 2130, 31-40, 41-50, 51-60, 31-70, 71-80, 81-90, 91-100.
Программное обеспечение позволяет производить поиск текстов
по любому из 7 параметров или по комбинации этих параметров.
Текстологическая база данных позволит быстро выбирать
иллюстрационный материал для лингвистических исследований и
явится ценным аппаратом и источником данных для
социолингвистических исследований на уровне носителей
диалектов.
Текстологическая база
диалектологического подфонда
http://mfbl.ru

Объем текстологической базы данных на
данное время составляет 500 текстов.
Представление география посещаемости
системы в машинном фонде http://mfbl.ru
Диаграмма географии посещения сервера
с Машинным фондом башкирского языка
(единица учета — количество посещений) http://mfbl.ru
РБ
РФ
Дальнее зарубеж ье
Ближ нее зарубеж ье
Диаграмма посещаемости разделов
Машинного фонда (единицей учета является количество
обращений на поиск) http://mfbl.ru
Лексикографическая база
Генеральная картотека
Грамматическая база
Экспериментально-фонетическая база
Каталог старопечатныхкниг
Каталог рукописных книг
Диалектологическая база
Работа лаборатории в 2010 г.




Введены описания 300 старопечатных книг.
Введены описания 200 рукописных книг.
Введено в генеральную картотеку 5000 карточек с
иллюстративными материалами.
Введены в подфонд следующие словари: синонимический,
башкирско-турецкий, турецко-башкирский, частотный
словарь языка произведений Д.Юлтыя, конкорданс и
частотный словарь языка эпоса Урал-батыр; 9
терминологических словарей: по медицине (по ред.
Азнабанва Р.), географии, библиотечному делу, физике,
дипломатии, горным объектам, химии, этике, мифологии.
Работа лаборатории в 2010 г.

В морфологическом подфонде создана новая
база — база квантитативных данных
морфологического подфонда. На основе анализа
текстов общим объемом в 600 000 словоформ по
трем функциональным стилям: наука,
художественная проза, публицистика получены
количественно-статистические данные
грамматических категорий словоизменения
именных и глагольных форм башкирского языка.
Работа лаборатории в 2010 г.

В текущем году создан блок для выдачи
статистических данных посещаемости
отдельных подфондов машинного фонда
и выдачи географии посещения.
Финансирование лаборатории





2006 г. — 200,0 тыс. рублей.
2007 г. — 500,0 тыс. руб.
2008 г. — 1280,0 тыс. руб
2009 г. — 1300,0 тыс. руб.
2010 г. — 1600,0 тыс. руб.
Download