Компонентный анализ

advertisement
Методы исследования в
лексико-семантической
парадигматике
Лекция 4
Компонентный анализ:
Цель - описание лексических значений.
Компонентный анализ = это
последовательность процедур, которая,
будучи применённой к словам языка,
ставит в соответствие каждому слову
определённым образом организованный
набор семантических компонентов.
КОМПОНЕНТНЫЙ АНАЛИЗ
используется для выделения сем в значениях слов и
заключается в выявлении дифференциальных и
интегральных сем путём их попарного сопоставления
внутри группы близких по значению слов (ЛСГ).


Минимальный компонентный анализ
способствует разграничению значений небольшой
группы семантически близких слов путём
интуитивного анализа значений.
цель - разграничить значения небольшой группы
семантически близких слов.
Правила проведения минимального
компонентного анализа
1.
2.
3.
4.
5.
Записать слова в столбик;
Выделить и записать интегральную сему (у всех слов
одинакова).
Сопоставить значения первого и второго слова, определить
дифференциальные семы и приплюсовать к интегральным \;
Сопоставить первое и третье слово, выделить
дифференциальные семы и приплюсовать.
Проверить наличие этих дифференциальных сем в третьем
значении и в последующих значениях
Выявить в каждом слове отличающийся от других набор сем.
кровать = предмет мебели + для лежания + 0
кресло = предмет мебели + для сидения + с подлокотниками
стул = предмет мебели + для сидения + без подлокотников
ПОЛНЫЙ КОМПОНЕНТНЫЙ АНАЛИЗ
Цель – выявить все компоненты значений сравниваемых слов
Правила проведения
1.
Сформировать с помощью словарей ЛСГ слов.
2.
В толковом словаре найти определение каждого слова и
выделить в нём семы.
3.
Составить общий список сем, встречающийся в словах.
4.
Составить таблицу семного состава слов анализируемой
группы.
5.
Отметить знаком + наличие сем в каждом анализируемом
значении. При выделении антонимичной семы внести её в
таблицу.
6.
Проверить разграниченность значений.
7.
При необходимости внести в таблицу дополнительные семы.
Компонентный анализ ЛСГ «Лечебные учреждения»
Леч.
Для
Учреж тяж.
дение больн
ых
Обсл.
врача
ми
разн.с
пец.
Больница
+
+
+
Госпиталь
+
+
+
Поликлиника
+
Амбулатория
+
Диспансер
+
Обслу
Для
Проф
ж.врач прихо илакт
.узкой дящих
ика
спец. больн
Воен
ное
Граж
данс
кое
+
+
+
+
+
+
+
+
+
+
+
+
Выделение дифференциальных сем
ЛСГ прилагательных “good-looking”
Beautiful
Extremely good-looking, much more so than
most women
Pretty
Good-looking in an ordinary way but not really
beautiful or sexually exciting
Good-looking, especially in a way that makes
you feel sexually interested
Attractive
Striking
Good-looking or very attractive, especially
because a woman has a particular feature, such
as hair or eyes, that is beautiful and unusual
Handsome
Good-looking in an unusual way, especially
because a woman is tall or strong or looks as if
she has a strong character
ТЕЗАУРУСНЫЙ МЕТОД ПОСТРОЕНИЯ СЛОВАРЕЙ
Тезаурус П.М. Роже 1852г.
Цель - облегчить выражения понятий и помочь при
написании сочинений.
Тематические классы:
1. Абстрактные отношения,
2. Пространство,
3. Материя,
4. Разум,
5. Воля,
6. Чувственные и моральные силы.
Синонимы тезауруса:
Идеологический
2. Идеографический,
3. Концептуальный
На входе словаря мы имеем семантические
содержательные категории,
упорядоченные с помощью той или иной
классификации, а на выходе – слова,
выражающие данную содержательную
категорию.
1.
Подходы к описанию соответствия
между формой и содержанием в языке:
1.
2.
Семасиологический исходит от формы и
идёт к установлению её содержания;
Ономасиологический исходит от единицы
содержания и идёт к установлению
способов формального выражения этого
содержания.
Тезаурус имеет 4 входа:
1.
2.
3.
4.
К → К, вход от концепта к концепту, от одного
понятия к другому (синоптическая схема).
К → З, вход от концепта к знаку, от понятия к
слову;
З → К, вход от знака к концепту,
соответствующий алфавитному списку слов с
указанием их адресов в понятийных полях
тезауруса;
З → З, вход от знака к знаку, необходимый для
тех тезаурусов, в которые наряду со словами
входят и словосочетания.
Тезаурус
– средство описания парадигматической
структуры плана содержания языка,

Тезаурусная презентация, или тезаурусное
определение лексического значения такая характеристика значения слова,
когда каждое слово в тезаурусе
характеризуется набором адресов тех
семантических полей, в которые оно
входит.


Тезаурусы различаются между собой по
лежащей в их основе синоптической
схеме, то и презентация значения одного и
того же слова в этих тезаурусах будет
различной:
Семантическая характеристика слова
задаётся прежде всего иерархической
цепочкой имён классов, в которые оно
входит, где имя класса репрезентирует
соответствующую понятийную область или
отдельное понятие.
Иерархическая цепочка глаголов
cпрашивать и ask
1.
2.
3.
4.
Л.М. Васильев: речевое взаимодействие ⊃
контакт ⊃ вопрос;
В.В. Морковкин: человек ⊃ человек в
обществе ⊃ коммуникация мыслей и
чувств ⊃ речевое общение ⊃ вопрос;
П.М. Роже: интеллект ⊃ формирование
идей ⊃ предварительные условия и
операции ⊃ вопрос;
Бах и Харниш: иллокуция ⊃
коммуникация ⊃ побуждение ⊃ вопрос.
Методы выделения лексических
группировок
1.
Идеографическая классификация лексики
Ю.Н. Караулова:
«Вселенная»
«Человек»
небо
небесные тела
земля
растительный мир
животный мир;
душа и разум
человек как
общественное
существо;
социальная
организация и
институты
МЕТОД ЦЕПОЧКИ СЛОВАРНЫХ ДЕФИНИЦИЙ
1.
2.
Из словарного толкования
интересующего нас слова выписываются
слова, используемые для толкования его
значения.
Выписанные слова подвергаются той же
самой процедуре пока не перестанут
появляться новые слова.
Выделение ЛСГ
«произведения живописи»
1.
2.
3.
4.
5.
6.
набросок – предварительный, в общих чертах
сделанный рисунок;
рисунок – нарисованное изображение,
воспроизведение чего-л.;
изображение – см. изобразить;
изобразить – воспроизвести в художественном
образе;
воспроизведение – в словаре отсутствует;
воспроизвести – возобновить, повторить в
копии, воссоздать.
МЕТОД ЦЕПОЧКИ СЛОВАРНЫХ ДЕФИНИЦИЙ
1.
2.
3.
определить при помощи словаря
синонимов некоторый набор единиц
данной ЛСГ
построить цепочку дефиниций для
каждого из них;
обобщить результаты, взаимно
перепроверяя все единицы по словарю.
ОПРЕДЕЛЕНИЕ СОСТАВА ЛСГ МЕТОДОМ
СТУПЕНЧАТОЙ ИДЕНТИФИКАЦИИ

1.
2.
основывается на методике компонентного анализа
и использовании словарных дефиниций
идентификатор – элемент толкования, имеющий
наиболее общее значение,
конкретизаторы отражают дифференциальные
семантические признаки значения:
купить = приобрести + за деньги; достать =
приобрести + с трудом; заработать =
приобрести + работая
Прием ступенчатой идентификации



позволяет определить ЛСГ слов как совокупность
единиц, толкуемых через одни и те же словаидентификаторы.
предполагает несколько ступеней, каждая из
которых последовательно сужает круг
идентификаторов, выявляя в конечном итоге
наиболее общие, отражающие родовую сему
ЛСГ, ее архисему.
единицы, в семантике которых выделены
идентификаторы группы, будут входить в данную
ЛСГ, а идентификаторы разных ступеней будут
отражать иерархическую организацию данной
ЛСГ.
Анализ глаголов обладания в русском языке.
Всего выявлено 94 глагола

Идентификаторы 1 ступени: (28) брать, получить,
приобрести, купить, собрать, принять, добыть,
достать, набрать;

Идентификаторы 2 ступени: (14) добыть, получить,
нанять, взять, приобрести, принять, достать,
схватить, набрать, обзавестись, украсть, присвоить,
стать, делать;

Идентификаторы 3 ступени: (5) стать, сделать,
достать, взять, принять, приобрести, присвоить;

Идентификаторы 4 ступени: взять, принять, стать,
сделать.
Метод ступенчатой идентификации







Преимущества метода –
в определенной формализации процедуры анализа;
в использовании приемов компонентного анализа;
он позволяет определить состав ЛСГ;
выявить основные семантические компоненты слов этой
группы;
выявить иерархию единиц в группе.
Недостатки –
необходимость предварительного интуитивного выделения
данной группы слов;
опора на словарные дефиниции не всегда оказывается
плодотворной из-за многочисленных
непоследовательностей в толкованиях слов в словарях.
АНАЛИЗ СЛОВАРНЫХ ДЕФИНИЦИЙ ЛЕКСЕМ
-
-
анализ дефиниций интересующих
исследователя лексем в толковых
словарях;
выделение компонентов этих словарных
дефиниций и интерпретации их как
отдельных дифференциальных признаков
значения слова – сем.






женщина – взрослое лицо женского пола: семы –
лицо, взрослое, женский пол
веялка – сельскохозяйственная машина, на
которой веют зерно: семы – машина,
сельскохозяйственная, для веяния зерна
кабан – дикая свинья, а также самец дикой
свиньи: семы – свинья, дикая, самец
квартал – часть города, ограниченная
пересекающимися улицами: семы – часть
города, ограничена пересекающимися улицами
набегаться – бегая, утомиться: семы –
утомиться, в результате бега
накалить – накаливая, нагреть до очень высокой
температуры: семы – нагреть, путем
накаливания, до очень высокой температуры
МЕТОД СЛОВАРНЫХ ДЕФИНИЦИЙ ЛЕКСЕМ
позволяет выявить основные, ядерные
дифференциальные семы, а также
архисемы значений;
 не позволяет с остаточной полнотой
выявить периферийные семы. Например,
Она не донесет такой чемодан, она же
женщина! сема «физически слабая, недостаточно
выносливая».

Литература:



Кобозева И.М. Лингвистическая
семантика. М.: УРСС, 2000. – С. – 109-134.
Попова З.Д., Стернин И.А. Лексическая
система языка. Учебное пособие.
Воронеж, 2006. – С. – 108-168.
Стернин И.А. Значение слова и его
компоненты. Воронеж, 2003. – 19с.
Download