Методика формирования ключевых слов краеведческой тематики

advertisement
Методика формирования словаря ключевых слов краеведческой
тематики
Специфика исторической краеведческой тематики
Под ключевым словом понимается слово, несущее в тексте наибольшую
смысловую нагрузку.
Словарь ключевых слов обеспечивает максимально адекватный
тематический поиск. Он показывает весь объем отраженной в «Архиве
периодических изданий Кузбасса» информации по различным темам.
В то же время, словарь является отражением истории, отпечатком
развития региона. По нему можно судить о том, чем жил Кузбасс, например,
в 1945 году. Определенные выводы можно сделать по частоте, с которой
встречаются те или иные ключевые слова. Так, на первом месте по частоте
встречаемости стоит понятие «Машинно-тракторные станции (МТС)». В
каждой газете приводится сводка ремонта тракторов на МТС. Очевидно, это
было главнейшей задачей и составляло первоочередную необходимость.
Подавляющее количество ключевых слов свидетельствует о
важнейших на тот период времени сферах жизни региона. Это
восстановление промышленности, сельского хозяйства и др.
Очень
приветствовалось
внедрение
рационализаторства
на
производстве, повышения эффективности труда – об этом говорят такие
ключевые слова, как метод Агаркова, изобретательство, новаторы,
рационализаторство,
социалистическое
соревнование,
стахановское
движение, стахановцы, экономия электроэнергии.
Характерное свидетельство времени – мощный пласт ключевых слов,
связанных с идеологией, партийной работой и пропагандой советского
строя.
Идеологические ключевые слова чаще всего составляют названия
всевозможных учреждений: Исполком Кемеровского областного совета
депутатов трудящихся; Кемеровская городская партийная организация;
Кемеровский областной комитет ВЛКСМ и т.д. Также много слов,
отражающих работу партийных и комсомольских организаций: коммунисты,
комсомольские организации, комсомольско-молодежные бригады, Красное
знамя, партийная работа, агитация, партийные организации и др.
Ключевые слова необходимо создавать при аналитической росписи
статей, в которых приводятся конкретные факты, цифры, исторические
события. Если это сводка работы предприятия за определенный период
времени, то желательно выделять те статьи, где анализируется временной
интервал от 3 месяцев, так как в газетах военного периода много коротких
сводок по работе предприятия от одного дня до недели, что представляет
небольшую историческую значимость, но создаст значительный
информационный шум.
Общие правила формирования ключевых слов
Критерии слов, которые не следует считать ключевыми
1) Все служебные слова (предлоги, союзы, частицы и т.п.) следует
считать «неключевыми»;
2) Термины, частота встречаемости которых в данном документальном
массиве мала, не следует включать в словник ключевых слов. Часто
встречающиеся, но весьма общие термины (например, «описание»,
«устройство», «конструкция», «метод», «система») следует либо
исключать, либо употреблять в сочетании с другими словами,
сужающими их значение;
3) Термины, не относящиеся к данной терминологической области,
включать в словник ключевых слов не имеет смысла;
4) Полисемичные термины включаются только в тех значениях, в
которых они употребляются в данной тематической области, с
соответствующими пояснениями.
2. При составлении словника ключевых слов целесообразно
ориентироваться
на использование единичных ключевых слов.
Использование устойчивых словосочетаний допускается в тех случаях,
когда они удовлетворяют приведенным ниже лингвистическим или
прагматическим критериям распознавания устойчивых словосочетаний.
Лингвистические критерии распознавания устойчивых словосочетаний
приведены в табл. 1.
Таблица 1
Правила распознавания устойчивых словосочетаний
Правило
1. Словосочетание является устойчивым, если над
ним без потери смысла нельзя провести ни одной из
следующих операций:
а) заменить составляющие его слова синонимами;
б) заменить прилагательное существительным с
предлогом;
в) заменить основное слово его производным;
г) изменить порядок слов в словосочетании.
Пример
ни одной из этих операций
нельзя произвести над
словосочетанием «железная
дорога»
2. Словосочетание является устойчивым, если при
его образовании одно из слов изменяет свое
значение, т.е. происходит переосмысление одного из
компонентов словосочетания.
«легкая промышленность»
(переосмысливается прилагательное «легкая»);
«земная ось» (переосмысливается
существительное «ось»)
3. Словосочетание можно считать устойчивым, если
оно употребляется только в единственном числе,
либо преимущественно во множественном числе.
«автоматический перевод»,
«термореактивная бумага»,
«библиотечное дело»,
«английский язык»,
«восточные языки»,
«строительные материалы»,
«продукты питания».
4.Словосочетание является устойчивым, если оно
имеет один или несколько синонимов.
«стеклоотливные машины» –
«линотипы»;
«полупроводниковые триоды» «транзисторы»;
«суперпозиционные
перфокарты» – «просветные
карты» – «визуальные
перфокарты»;
«символическая
логика» – «математическая
логика» – «алгебра логики»
5.
Устойчивыми
являются
словосочетания,
представляющие собой имена собственные или
включающие собственные имена в качестве
компонентов.
«Новая Гвинея», «Латинская
Америка», «таблица
Менделеева», «эффект
Доплера», «маятник Фуко»
Словосочетание является устойчивым, если оно удовлетворяет
хотя бы одному из перечисленных в таблице критериев.
3.
Прагматические
критерии
распознавания
устойчивых
словосочетаний:
1) Следует сохранить словосочетание, если в данном словаре
ключевых слов очень мала вероятность использования его
компонентов по отдельности;
2) Следует сохранять часто встречающиеся словосочетания,
разделение которых в принципе возможно, но неэкономично с
точки зрения ввода в автоматизированную информационную
систему.
4. Существительные, прилагательные и причастия записываются в
именительном падеже (например, законы, поиск, правовые,
информационные и т.п.)
5. При выборе между формами единственного и множественного
числа рекомендуется придерживаться правил, представленных в
таблице 2.
Таблица 2
Использование единственного и множественного числа при
нормализации ключевых слов
Тип термина
Критерий выбора числа
Единственного
множественного
1.Термины,
Если термин выражает
обозначающие
видовое
(единичное
субстанции, вещества понятие). Например:
(химические
сталь.
соединения,
смеси,
материалы).
2.Термины,
Если термин выражает
родовое (общее
понятие). Например:
Кварциты.
Если термин выражает Если термин выражает
обозначающие
видовое
(единичное
свойства,
условия, понятие). Например:
характеристики.
мощность, напряжение,
частота.
родовое
понятие).
условия
физические
свойства.
3. Термины, служащие
для
обозначения
приборов,
оборудования.
Применяется всегда.
Например: Блюминги.
4.Термины,
обозначающие
Процессы
Не применяется
Применяется всегда.
Не применяется
Например:
Благоустройство
поиск,
хранение,
чтение.
5. Термины, в состав В
зависимости
которых входят имена смысла
собственные.
Метод Агаркова
6.Наименование
научных
дисциплин.
(общее
Например:
залегания,
от В
зависимости
от
смысла
Законы
Ньютона
Применяется
всегда. Не применяется
Например: гидравлика,
физика, биология.
7.Термины,
Не применяется
обозначающие
исчисляемые события и
явления.
Применяется всегда.
Например:
разряды,
взрывы,
войны.
Общее правило использования единственного и множественного числа
заключается в том, что форма множественного числа употребляется для
исчисляемых понятий, а форма единственного числа - для неисчисляемых
понятий.
6.
Прилагательные
и
причастия
записываются
в
форме
именительного падежа множественного числа мужского рода (например,
ручные, автоматизированные, информационные).
7.
При определении порядка слов в словосочетания для обеспечения
экономичности
и
единообразия
формулировок
ключевых
слов
рекомендуется использовать инвертированную форму записи (например,
технологии информационные; системы библиотечные автоматизированные).
8. Географические названия используются в том же виде, как и в
географических справочниках или картах (например, Кемеровская область,
Беловский район, Алтайский прииск); Но названия городов, рек, пишутся с
добавление обозначения понятий. Например: Анжеро-Судженск (город),
Барзас (река)
9. Имена собственные, присвоенные неодушевленным предметам,
событиям и т.п., а также объединениям и партиям, пишутся без
кавычек, и в скобках добавляется обозначение понятия.
Например, Вапрус (колхоз) Манеиха (шахта) Москва (кинотеатр), За
сталинский урожай (газета) и т.п.;
Если предприятие названо именем какого-либо деятеля, пишется без
кавычек и скобок: шахта им. Молотова, шахта Коксовая им. Сталина.
(слово «имени» сокращается до им.)
10. Официально принятые и устоявшиеся понятия (светские и
религиозные праздники, термины народного календаря и
лечебника) записываются полными словосочетаниями и без кавычек.
Например, День Победы, Международный женский день 8 марта, День
коня. При наличии нескольких вариантов названий предпочтение
отдается более краткому. Например, Рождество Христово записывается Рождество, 8 марта;
11. Названия технических средств записываются с конкретизацией
названия или номера модели; при этом отдельным ключевым
словом записывается тип изделия. Например, автомобили, ВАЗ 2106;
холодильники, ЗИЛ 204; самолеты, Boeing 408.
В случае, если изделие является продуктом регионального производства, в
скобках дописывается релятор. Например: Томь (посевной комплекс).
12. Названия иностранных фирм и торговые марки записываются на
языке оригинала либо по-русски, если в издании фигурирует только
русская транскрипция. Например, IBM, Panasonic, Коника;
13. Названия войн записываются как устойчивое словосочетание
названия войны и отдельно — слово «войны». Например,
Великая Отечественная война, войны; Первая мировая воина, войны.
14. Ключевыми словами могут быть ГОСТированные и
общепринятые сокращения и аббревиатуры, при этом они записываются
без точек между буквами. Например, СССР, ВКП(б), ГОСТ, ТУ и т.д.;
Менее распространенные сокращения добавляются после полного варианта
написания: Машинно-тракторные станции (МТС). Областной
драматический театр.
15. Глаголы записываются в виде отглагольного существительного.
Например, преобразуют - преобразование;
16. Наречия заменяются на соответствующие прилагательные.
Например, автоматически - автоматические;
17.Деепричастия
преобразуются
в
соответствующие
существительные. Например, поставляя - поставка;
18. При описании века используют арабские цифры и «В» без точки
и пробелов. Например, 19В, 20В. Устоявшиеся названия веков
записываются как одна лексическая единица. Например, Серебряный век,
Бронзовый век;
19. Годы записываются арабскими цифрами и буквой «Г» для
одного года или «ГГ» для интервала лет. Например, 1954г, 1941-1945гг;
20. Десятилетия записываются арабскими цифрами, дефис, «е»,
интервал и «ГГ». Например, 20-е гг; 20-50-е гг.
21. Персоналии следует по возможности записывать с полными данными –
фамилия, имя, отчество, в скобках кратко указывать направление их
деятельности Ходыкин Иван Павлович (начальник шахты), Юткина А. К.
(картофелевод), Меркурьев В. В. (актер)
Присоединение реляторов в данном случае обусловлено необходимостью
быстрого и адекватного поиска персоналии в тексте газеты, а также помогает
различить деятелей и определить специфику их деятельности.
22. В дескрипторном словаре достижение однозначности осуществляется
следующим образом:
Синонимия устраняется с помощью помет см. Например,
Языковедение
см. ЯЗЫКОЗНАНИЕ
ЯЗЫКОЗНАНИЕ
См. лингвистика
22. Омонимия и полисемия устраняется с помощью развертывания
слова до словосочетания либо помет в круглых скобках.
Например, ТЕХНОЛОГИИ БИБЛИОТЕЧНЫЕ
ТЕХНОЛОГИИ ИНФОРМАЦИОННЫЕ
БИБЛИОГРАФИЯ (деятельность)
БИБЛИОГРАФИЯ (наука)
БИБЛИОГРАФИЯ (указатель литературы)
Download