Ньянна

advertisement
НЬЯННА
Научный руководитель – С.М. Садчиков, к.т.н., доцент
Московский инженерно-физический институт (государственный университет),
ИССЛЕДОВАНИЕ СОЗДАНИЯ МНОГОЯЗЫКОВЫХ
САЙТОВ
Современный разработчик сталкивается с необходимостью поддержки разных
языков в рамках одного проекта. Под языком подразумеваем любой естественный
язык, в алфавите которого присутствуют символы. В докладе рассматриваются
многоязычные приложения на сайте в самых различных аспектах. Приводятся
примеры использования языка Мьянмы на подобных сайтах.
Рассмотрим аспекты сайтов, где может возникнуть потребность в
различных языках:
 неструктурированный текст на естественном языке;
 структурированные данные;
 изображения, содержащие текст или другие языковонациональные или государственные особенности;
 цифры (например, в языке Мьянмы).
Кроме языкового аспекта часто возникают близкие по смыслу
«региональные» аспекты, например, такие как текущее время и его
формат, географическо-адресная информация и другое.
Большинство
современных
сайтов
содержат
динамическое
наполнение, которое, как правило, хранится в базах данных или XMLфайлах. Эти данные появляются на веб-страницах, благодаря серверным
языкам (скриптам), таким как PHP, Java, VBScript, Jscript, Perl и др.
Одна из проблем при создании многоязыковых сайтов – это
отображение данных различными шрифтами на различных языках на вебстранице и хранение информации на различных языках на сервере. Эта
проблема решается использованием кодировки “Юникод” UTF-8 [1].
Юникод UTF-8 – это стандарт, созданный консорциумом Unicode –
организацией, содействующей использованию единого набора символов
для любых языков. Принцип работы Юникода заключается в том, что для
каждого символа, независимо от платформы, программы или языка,
предусмотрена
уникальная
кодовая
позиция.
Программа,
поддерживающая Юникод, может обрабатывать данные на любом языке.
Простейший способ работы с символьными данными в многоязычных
базах данных заключается в том, чтобы всегда применять основанные на
Юникоде типы данных nchar, nvarchar и nvarchar, а не соответствующие
им типы char, varchar и text, использующие другие кодировки.
Если страница на естественном языке может просто быть переведена и
храниться практически независимо, то структурированные данные, как
правило, сильно связаны друг с другом, например, представляют собой
классическую базу данных (реляционную, постреляционную или др.). Для
многоязыковых сайтов нужно работать с базами данных, которые
достаточно удобны для работы с терминологическими словарями на
многих языках (создание, изменение, представление в удобном виде). При
этом понятие словаря мы расширяем на любые данные: фамилии, имена,
географические данные, любые названия и др., перечень которых не
зафиксирован, а может постоянно меняться по мере наполнения или
изменения сайта. В силу использования большого количества языков,
вводимые данные не всегда могут быть переведены сразу на все языки.
В настоящее время для создания многоязыковых сайтов веб-мастеры
часто используют системы CMS. (Content Management System, система
управления содержанием сайта). С помощью CMS легко создать вебсайты, в том числе многоязыковые. Сердце любой CMS – хранилище
информации, как правило, это некая база данных. Одни из популярных
CMS-систем для создания многоязыковых сайтов – это Joomla, Mambo,
OpenCMS, Drupal, "Битрикс", свзяка Microsoft SharePoint Portal Server
(CMS) и Microsoft Content Management Server 2001 (SPPS) и т.д.
Обозреваемые системы не включают поддержку языка Мьянмы. В
результате проведенного исследования в CMS Joomla и Mambo была
включена поддержка языка Мьянмы. Соответствующее дополнение было
предложено на рассмотрение разработчикам CMS.
Для работы многоязыковых сайтов, в базе данных нужно создать
таблицу языков со своими индексами. Для каждого поля данных,
требующего перевода, необходимо обеспечить возможность хранения
информации на всех языках. Если на веб-странице должна появиться
информация на некотором языке, мы делаем SQL-запрос с
соответствующим параметром языка. Если отсутствует перевод на
некоторый язык, выводятся данные языка по умолчанию, о чем
появляется соответствующее предупреждение на странице
В результате исследования был создан учебно-информационный сайт
кафедры с поддержкой различных языков, включая язык Мьянмы
Список литературы
1.
Поддержка языков в MS SQL Server. http://www.interface.ru/home.asp?artId=6041
Download