НЕОБХОДИМОСТЬ ВЫДЕЛЕНИЯ КЛЮЧЕВЫХ СЛОВ ДЛЯ СВЁРТЫВАНИЯ ТЕКСТА

advertisement
НЕОБХОДИМОСТЬ ВЫДЕЛЕНИЯ КЛЮЧЕВЫХ СЛОВ
ДЛЯ СВЁРТЫВАНИЯ ТЕКСТА
Даркулова К.Н., Ергешова Г.
Южно-Казахстанский государственный университет им. Мухтара Ауэзова
Шымкент, Казахстан
В последние десятилетия в лингвистике заметно активизировался интерес к проблемам
грамматики и семантики текста, к исследованию закономерностей речевого построения и
языковой организации текстов различных типов. Это обусловлено, в первую очередь,
сложностью и многоаспектностью определения самого понятия «текст», нерешенностью
вопроса о составе текстовых признаков и категорий.
Одной из наиболее сложных исследовательских задач является решение в теоретическом
аспекте вопроса, об интерпретации содержательной стороны текста, о понимании его
целостного смысла и описании семантической структуры. Решение этой задачи неразрывно
связано в филологии с проблемой ключевых слов текста.
Сочетания «ключевые слова», «ключевое слово» общеизвестны и широко используются
в школьной и вузовской практике преподавания филологических дисциплин. Умение
выделять ключевые слова очень важно как студенту, выполняющему научную работу
(реферат, аннотацию и т.д.), так и специалисту, ученому.
Популярность методики выделения ключевых слов связана в первую очередь с
развитием информационно-поисковых систем, где правильно подобранные ключевые слова
и фразы облегчают нахождение текста в сети Интернет. На сегодняшний момент
совершенствуются методы поиска в Интернете с помощью ключевых слов, на каждом сайте
существует своя система поиска.
Актуальность темы определяется тремя факторами: теоретическим (лингвистическим),
прикладным и практическим (учебным).
1. К настоящему времени назрела необходимость обобщения и систематизации всех
существующих точек зрения на феномен ключевых слов для уточнения терминологического
статуса
этого
понятия,
выявления
его
теоретической
сущности,
определения
функциональной природы и роли ключевых слов как особых лексико-семантических единиц
текста.
2. Эта проблема непосредственно связана с индексированием текста, с реферированием
и, конечно, с разработкой методики релевантного «поискового образа» документа, а также с
усовершенствованием
компьютерных
поисковых
систем.
Компьютеры
научились
"понимать" смысл текста и самостоятельно выделять ключевые слова. Сегодня все
поисковые системы используют в своей работе присущие текстам закономерности.
3.
Нам, как будущим специалистам, учёным, необходимо приобретение навыков
работы с научным текстом, извлекать нужную информацию из текстов, выступать на
профессиональные темы, уметь свёртывать, сжимать информацию, решать типовые
стандартные
и
профессионально-ориентированные
задачи
с
целью
овладения
профессионально-коммуникативными умениями работы.
Первая попытка теоретического решения проблемы ключевых слов была предпринята в
40-е годы XX века в работах А. Н. Соколова, А. А. Смирнова, посвященных вопросам
психологии памяти и проблеме понимания речевого высказывания. А. Н. Соколов называл
ключевые слова текста «опорными» или «обобщающими» словами. Следует отметить,
что психологическое понимание сущности ключевых слов получило дальнейшее развитие в
работах А. Р. Лурии, Л. В. Сахарного, Л. Н. Мурзина, А. С. Штерн, А. А. СироткоСибирского и других авторов.
Под ключевыми словами мы понимаем такие языковые единицы, которые
представляют текст в свёрнутом виде, являясь носителями его смысла.
Цель работы - рассмотреть проблему ключевых слов и выделить их на материале текста
по специальности.
Как известно, не все слова в тексте равнозначны. Есть слова, которые позволяют
представить текст в свёрнутом виде, при этом такое представление достаточно точно
отражает содержание исходного текста. Мы постоянно используем такой метод, например,
при конспектировании лекций, книги или статьи. Ключевые слова – это те слова, которые
могут представить основное содержание текста.
Основное содержание всякого документа (текста) может быть выражено с помощью
определенных слов, взятых непосредственно из этого текста. Как правило, к каждому
развернутому тексту можно составить целый набор ключевых слов различного объема (от 5
до 15 слов). Но вообще количество ключевых слов может варьироваться в широких
пределах. Согласно мнению Л.В. Сахарного и А.С. Штерн [2], самым оптимальным является
небольшой набор ключевых слов и словосочетаний – 7-10 слов. В отдельных случаях
компрессия может привести к выделению одного основного ключевого слова, которое
является самым частотным знаменательным словом.
Ключевое слово — слово в тексте, способное в совокупности с другими ключевыми
словами представлять текст. Набор ключевых слов близок к аннотации, плану и конспекту,
которые тоже представляют документ с меньшей детализацией, но лишён синтаксической
структуры.
Заметим, что термин «ключевые слова» в значительной степени условен: как ключевые
знаки в тексте могут выступать не только слова, но и словосочетания и даже предложения
В качестве основных смысловых единиц, выделяемых из исходного текста на 2-м этапе,
могут выступать: 1) целые ключевые предложения; 2) ключевые словосочетания и слова.
Ключевое (опорное) слово — это термин, относящийся к основному содержанию текста и
повторяющийся
в
нем
несколько
раз
учетом
(с
всех
возможных
синонимов).
Ключевое словосочетание — это сочетание слов, среди которых есть одно или несколько
ключевых.
Ключевым предложением считается предложение, содержащее два и более ключевых
слова или ключевых словосочетания.
Т.о., 1) ключевыми словами считаются такие знаменательные слова текста, которые с
учетом
всех
синонимов
встречаются
в
тексте
наибольшее
число
раз;
2) ключевым предложением считается предложение текста, которое:
а) имеет несколько ключевых слов;
б) содержит ключевые слова на небольшом расстоянии друг от друга.
Ключевые слова обладают рядом существенных признаков:
1) высокая степень повторяемости данных слов в тексте, частотность их употребления
2) способность знака конденсировать, свертывать информацию, выраженную целым текстом,
объединять «его основное содержание»; этот признак особенно ярко проявляется у
ключевых слов в позиции заглавия.
Однако выбор ключевых слов является очень непростой операцией и требует серьезного
подхода. Следует выбирать те ключевые слова, которые наиболее точно отражают
специфику именно вашей темы. При этом необходимо избегать случайных и общих фраз и
не рекомендуется повторять несколько раз одни и те же ключевые слова. То есть процесс
выделения ключевых слов является еще и аналитическим.
Методика
выделения
ключевых
слов.
Благодаря
многим
лингвистическим
исследованиям был выявлен алгоритм «формального определения зон наиболее вероятного
расположения ключевых слов в тексте». Именно так обозначал их Л.В. Сахарный [3]. Вопервых, мы выявляем наиболее часто повторяющееся слово в тексте. Во-вторых, выделяются
местоимения и синонимы к нему. Третий шаг – необходимо установить интервал между
основным словом и словами слева и справа от него. Оптимальным интервалом обычно
является интервал в три слова, это так называемая тематическая зона. Затем из этих слов
выбираются знаменательные слова, или же только имена существительные. Это зависит от
задач исследования. В-пятых, выбор падает на последние слова предложения, которые чаще
всего и оказываются ключевыми. Это рематическая зона расположения ключевых слов.
Место и количество ключевых слов в тексте. Ключевые слова, повторяясь, могут
встречаться в любой части текста и не имеют фиксированной, жестко закрепленной в нем
позиции. Исследователи заметили, что они нередко концентрируются в начале произведения,
а также относительно часто функционируют как заглавия. Однако это лишь тенденция,
которая проявляется далеко не всегда. Ключевые слова по-разному распределяются в
конкретных текстах, часто не совпадают с заглавием. По-разному (в зависимости от
характера текста) решается и вопрос об их количестве.
Принадлежность слова, словосочетания или предложения к числу ключевых
определяется специальными статистическими коэффициентами.
Ключевое слово в анализе текста— набор слов, представляющих содержание текста и
получаемых лингвистическими и математическими методами (например, анализируя частоту
появления слова в тексте).
Воспользовавшись «Анализатором текста» [4], по подсчету ключевых слов, мы
установили, что наиболее употребительными в тексте «Трансгенные животные» являются
слово животное —15 употреблений, трансгенные — 14, клетка — 7, днк — 6, создание – 4,
гены, первый, орган, стволовые, эмбриональный, организм – 3. Остальные слова, в том числе
человек, биотехнология и др. встретились по 1-2 раза.
Особое место в семантической структуре текста занимают ключевые слова животные и
трансгенные ,вынесенные
в
позицию
заглавия.
Это
подтверждает
достоверность
выявленных ключевых слов.
Выполнив статистико-математическую часть анализа, следует приступать к собственно
лингвистической. Ведь
ключевые слова выражают в тексте не только содержательную,
сторону, но и образуют ряд связанных отношениями обусловленности «опорных» знаков.
Ключевые слова в тексте «Трансгенные животные» выделены повторами разных типов:
лексическими, синонимическими, морфемными, синтаксическими. Они последовательно
занимают сильные позиции текста (заглавие, начало или конец абзаца).
Ключевое слово, как мы видим, — это лексическая единица, разные значения которой
одновременно реализуются в тексте, при этом в нем обязательно актуализируются и ее
деривационные
и
ассоциативные
связи.
Ключевые
слова
образуют
в
тексте
семантические комплексы: вокруг них группируются синонимичные им единицы,
слова, ассоциативно с ними связанные, наконец, однокоренные слова, повтор которых
в том или ином контексте, как правило, не случаен.
Дальнейшая наша работа состоит в выявлении таких семантических и ассоциативных
комплексов (с т.з. образования словообразовательных гнёзд - выбор однокоренных слов,
группировки тематических групп, а также морфологических, синтаксических средств). В
результате будут получены ключевые слова анализируемого текста, и возможно, количество
и перечень ключевых слов, указанных выше, изменится.
Использованная литература
Даркулова К.Н., Мусантаева М.А. Русский язык: Научный стиль. Текст. Лексические и
грамматические особенности научного стиля./Учебное пособие. Шымкент: ЮжноКазахстанский государственный университет им. М. Ауезова
2010.- 192 с. с
приложениями.
2. Сахарный Л. В., Штерн А. С. Набор ключевых слов как тип текста // Лексические
аспекты в системе профессионально-ориентированного обучения иноязычной речевой
деятельности. Пермь: Пермский политехнический ун-т, 1988. С. 34—51.
3. Сахарный Л. В. Расположение ключевых слов в структуре развернутого текста (к
изучению деривационных механизмов компрессии текста) // Деривация в речевой
деятельности (Общие вопросы. Текст. Семантика). Пермь, 1988. С.27—29.
4. www.shipbottle.ru. Инструмент для формирования запросов к поисковым системам.
1.
Download