Из: (с. 134-160) Сборник трудов участников Пятой Международной конференции «Горизонты прикладной лингвистики и лингвистических технологий» (MegaLing-2009), Украина, Киев, 21-26 сентября 2009 года. Киев, ДОВИРА, 2009. – 528с. РОЛЬ ТРИАДЫ И МЕТОНИМИИ В СЕМАНТИЧЕСКОЙ ОРГАНИЗАЦИИ СОСТАВНОГО ТЕРМИНА Виктор Глумов Нижний Новгород, Россия Филиал Российского Государственного Гуманитарного Университета в г. Нижний Новгород Аннотация. Выявленные в английских и русских составных терминах (компаундах – compounds) и формально описанные 20 семантических признаков вида инструментальность, количественность, локативность и т.п. считаются уточнителями некоторого центра в семантической структуре компаунда. Этим центром предлагается считать универсальную семантическую триаду <субъект-процесс-объект>, реализуемую в компаунде полностью или частично. Прямые или косвенные отношения между элементами компаунда зафиксированы в специальном тезаурусе. Формализация содержания связей в пределах компаунда затрудняется широко распространенным явлением метонимии. Возникающие своеобразные метонимические провалы (pits) между смыслами элементов компаунда предлагается «мостить» каскадом, составленным из базовых 3-членных предложений (примитивов). Каждый хранимый в тезаурусе примитив выражает прямые парадигматические связи между признаками терминируемого понятия. Предлагаемый подход может способствовать построению эффективных лексических единиц, столь ожидаемых многочисленными приложениями. Ключевые слова: составные термины (компаунды), семантическая структура термина, онтология, примитивы, метонимия, каскадирование. Annotation. Recognized within English and Russian multiword terms (compounds) and represented formally, 20 semantic features similar to instrumentality, quantitativeness, locativeness and the like are thought to specify some core or centre within a lineally-arranged compound semantic structure. A certain universal semantic triad <subject-processobject> is suggested to be such a centre. Direct and indirect relations within the body of a compound are specially declared in the thesaurus. Formalizing interelement relations within a compound is heavily hampered by the presence of widely spread metonymy. The emerging metonymical pits between the semantic features of the compound are suggested to be bridged via certain cascades compiled of basic 3-member sentences called primitives. Each thesaurus-held primitive declares immediate paradigmatic links between features of the notion concerned. The approach suggested may be found useful for constructing efficient lexical units so much awaited by their numerous applications. Keywords: compounds, term semantic structure, ontology, primitives, metonymy, cascading. Автоматический анализ и синтез текста, машинный перевод, автоматическое извлечение информации из текста (data mining), объектно-признаковые языки, языки программирования, а также многоязычный поиск информации (cross-language search) (в котором дескриптор чаще всего имеет вид составного термина и на дескриптор порой накладывается требование по длине), нормализация и стандартизация отраслевых терминологий, сфера образования (где эффективно построенный термин может способствовать оптимальному усвоению отраслевых понятий) – вот далеко не полный перечень областей, нуждающихся в оптимально построенном термине. Планируя наблюдение над внешней и глубинной структурами термина, мы считаем, что наибольшими трудностями в этом наблюдении могут быть: 1) определение объема содержания понятия «терминоэлемент» (Этот термин впервые был предложен Д.С. Лотте в [10]). Это понятие является принципиальным при нормализации и стандартизации терминологий, при формировании терминосистем с наименьшим количеством терминоэлементов, при описании процессов свертывания и развертывания терминоструктуры и т.д.; 2 2) распознавание терминированности или нетерминированности того или иного терминоэлемента; например, в термине первая космическая скорость следует распознавать специальное отраслевое значение, возложенное на обыденное слово первая. Терминированность, а именно значение количественности, следует видеть и в терминах вида легкий бетон [9,с.22], тяжелый бетон [9,с.26], особо тяжелый бетон [9,с. 26]. В нашем случае объектом исследования являются английские и русские составные термины (компаунды) английского и русского подъязыков цифровой вычислительной техники и программирования. Примечание 1. Современная литература на английском языке для названия «составной термин» предлагает однословный термин – компаунд (a compound), а сам же процесс построения компаунда назван компаундированием (compounding). Нужно признать, что эти английские имена отличает отсутствие описательности и присутствие системности (a compound – compounding). По-видимому, это есть как раз тот случай, когда калькирование иностранного термина полезно, а не вредно. Назвать же составной термин «соединением», а процесс формирования таких соединений каким-то туманным сочетанием (вспомним «соединение химическое», «соединение военное» и т.п.) – такая попытка чревата еще большей неразберихой. Это лишний раз подтверждает мысль о важности эффективно построенного терминологического знака. Каждый термин может одновременно иметь как пре-, так и постпозицию. Извлеченный текстовый термин подвергался двухэтапной обработке: 1) моделированию его внешней или поверхностной структуры [4; 6] и 2) моделированию его семантической (или глубинной) структуры [4]. ПЕРВЫЙ ЭТАП НАБЛЮДЕНИЯ НАД ТЕРМИНОСТРУКТУРОЙ На первом этапе исследования каждый элемент в наблюдаемом компаунде был представлен тремя формальными признаками – морфологическим, позиционным и синтагматическим. Такое – безусловно трудоемкое – описание терминоэлемента отвечало особенностям внешнего выражения связей в английских и русских терминах. Позиционный и синтагматический признаки особенно необходимы для представления английских терминов, ибо – согласно классику английского языкознания Г. Суиту (Henry Sweet) и Ч. Фризу (Ch. C. Fries) [20,с.94] – само местоположение слова в словосочетании имеет вполне определенное значение. Эту роль позиции элемента в так называемой «формуле» строения сложных лингвистических образований подчеркивал и А.И. Смирницкий [13,с.19; 14,с.37]. Укажем особенности формирования нашей поверхностной модели компаунда. 1) Описание каждого элемента компаунда с помощью вышеуказанных признаков составляет поверхностную модель компаунда. Признак «поверхностная» несколько условен, ибо распознать термин в тексте, затем распознать в нем элементы, соотнести каждый элемент с одним из морфологических классов (tagging), зафиксировать связь между элементами – эти операции возможны лишь на логико-семантических основаниях. 2) Компонентом нашей модели является и сам термин. В результате, такая модель – однажды сформированная – становится неким микробанком, к которому можно программно и неоднократно обращаться с запросами – разумеется, в пределах тех сведений, что были вручную заложены в него предварительно [4;5]. 3) В терминах нижеуказанных видов мы усматривали присутствие двух элементов. Примечание 2: На этапе предмашинной обработки термина границы между его элементами обозначались следующими условными знаками: грамматически главный элемент (т.е. ядро) обозначался знаком * (звезда); искусственно созданная граница между элементами обозначалась знаком #, а знаком ^ обозначалось, напротив, объединение двух наборов символов – например, *оператор GO^TO. Укажем некоторые примеры. а) H- #*data; холлеритные *данные; C- # *compiler (т.е. транслятор программ, написанных на языке С , или транслятор С-программ); GOTO *statement оператор GOTO; б) many-sided *configuration; многосторонняя *конфигурация; read-only *memory; постоянная *память; в) FORTRAN- #*compiler; ФОРТРАН- #*транслятор (т.е. транслятор для ФОРТРАН-программ); RAM- #*memory (= random- #access *memory, т.е. память с произвольной выборкой/доступом). Если же термин вида ФОРТРАН-транслятор имел и описательный вид – скажем, транслятор для ФОРТРАНпрограмм, тогда фиксировалось наличие 4 элементов: *транслятор для ФОРТРАН- #программ. (Второе значение этого термина здесь не обсуждается.) 2 3 4) Формирование поверхностной модели предполагает разбиение составного термина на элементы. Такое разбиение возможно только на семантических основаниях. Например, искусственный пробел ставился в случае дельта- #* конфигурация, но не ставился в случае delta-like дельтообразный, потому что delta и delta-like принимались нами выражающими один и тот же семантический признак <сходство, подобие>. (Сравните также присутствие <сходства> в рыбном термине *рыба- #звезда и в строительном термине сэндвич- #*панель). По мере усложнения содержания информационных потребностей описательные возможности нашей модели можно наращивать, т.е. встраивать новые внешние (а со временем и глубинные) признаки и этим готовить модель для удовлетворения все более растущих «интеллектуальных» потребностей пользователя. Машинной обработке подвергались 4 экспериментальных массива, а именно: 1) массив из 2000 английских составных терминов, 2) массив из 2000 русских составных терминов, 3) массив из 2000 английских поверхностных моделей и 4) массив из 2000 русских поверхностных моделей. В терминологических массивах один термин употреблялся только один раз. Английские термины на русский язык не переводились. И английские и русские термины извлекались из неадаптированных текстов [4]. Предлагаемая поверхностная 3-хпризнаковая модель позволяет выявить частоты длин составных терминов (длина измеряется в терминоэлементах), частоты морфологических категорий в терминоструктуре, частоты морфологических конструкций терминов, а также выявить частоты появления конкретных морфологических категорий в той или иной позиции терминоструктуры. Также возникает возможность: а) сформировать ранжированный перечень синтагматических цепей вида , , и т.д.; б) выявить частотность классов лексических значений, возникающих в той или иной точке терминоструктуры слева или справа от ядра термина, если ядро занято конкретным семантическим (глубинным) признаком. Ниже укажем некоторые статистико-вероятностные результаты машинной обработки поверхностных моделей [4; 5]. Примечание 3: В примерах и рисунках применялись следующие условные обозначения. а) английские морфологические классы: N – английское существительное общего падежа; Nacr – существительное-акроним (например, элемент ROM- в термине ROM- #*memory постоянное запоминающее устройство, ПЗУ; N-1 и N1 – существительное в 1-ой препозиции или 1-ой постпозиции относительно ядра; ING и ED – причастие-I и причастие-II; VN – отглагольное существительное; GER*– герундий, являющийся ядром составного термина; ADJ– полное или краткое прилагательное; ADJ1 – сложно-составное прилагательное вида errorproof устойчивый от ошибок, сбоеустойчивый; I– идентификатор, т.е., например, зависимый элемент RESIDENT в термине RESIDENT-#*routine стандартная *программа RESIDENT. б) русские морфологические классы: C и Cрод – существительное именительного и родительного падежей; На Рис. 1 в круглых скобках указаны сами предлоги. А) СТАТИСТИКО-ВЕРОЯТНОСТНОЕ ПОВЕДЕНИЕ МОРФОЛОГИЧЕСКИХ КЛАССОВ В АНГЛИЙСКОМ ТЕРМИНЕ На Рис. 1 для каждой позиции структуры английского термина перечислены морфологические классы и указаны вероятности их появления в этой позиции. Сумма вероятностей появления всех английских морфологических классов в данной позиции равна единице. Классы или предлоги с вероятностью меньше 0,01 в столбцах не указаны. На этом рисунке с помощью «волн» мы хотим лишь показать некую динамику изменений активности морфологических классов в конкретных позициях влево и вправо от ядра термина. Опираясь на содержание наших семантических признаков, которые будут описаны во второй части этого доклада, кратко опишем поведение некоторых морфологических классов в зависимости от того, какой семантический признак появляется в ядерной позиции термина, т.е. становится грамматически господствующим. Возьмем на Рис.1 конкретную точку терминоструктуры, а именно 1-ую препозицию. На рисунке видно, что в этой точке самым активным является существительное. Если и ядро выражено существительным, тогда мы имеет конструкцию N-1 – N*. 3 4 ADJ / N/ ADJ1 / I/ 0.44 0.34 0.11 0.11 ADJ / N/ NACR / ADJ1 / N/ 0.56 ADJ / 0.14 GER / 0.09 ADJ1 / 0.08 ED / 0.06 NACR / 0.04 I/ 0.02 ADV / 0.01 ADJ / N/ ADJ1 / I/ ED / ADV / ING / INF / 0.46 0.3 0.07 0.05 0.04 0.04 0.02 0.02 0.4 0.36 0.15 0.09 N/ 0.49 ADJ / 0.22 ED / 0.08 ADJ1 / 0.04 NACR / 0.04 ADV / 0.04 ING / 0.04 I/ 0.03 GER / 0.02 N/ GER / VN / NACR / (of) / 0.48 N/ 0.17 (for)/ 0.07 I/ 0.06 ADJ / 0.04 (in) / 0.04 (with)/ 0.04 (on) / 0.03 (to) / 0.02 (by) / 0.02 (from)/0.01 (over)/ 0.01 (at) / 0.01 0.85 0.1 0.04 0.01 N/ GER / (in) / ADJ / VN / (of) / ED / N/ 0.56 ADJ / 0.15 GER / 0.04 (to) / 0.04 ADJ1 / 0.03 ED / 0.03 NACR / 0.03 (of) / 0.02 (from)/0.02 (for)/ 0.01 (in) / 0.01 (on) / 0.01 0.78 0.04 0.04 0.03 0.03 0.02 0.02 N/ ADJ / GER / ADJ1 / ING / (in) / N/ 0.61 ADJ / 0.09 (of) 0.07 (on) 0.05 ED / 0.04 NACR / 0.04 VN / 0.03 (over)/ 0.03 (with)/ 0.01 0.78 0.06 0.06 0.04 0.04 0.02 N/ 1 N/ 0.76 ADJ / 0.12 (of) / 0.12 Рис.1. Вероятности появления английских морфологических классов в позициях терминоструктуры Частоту этой морфологической конструкции отмечают многие исследователи. Мы же пойдем дальше и попытаемся описать семантически причины появления морфологического класса в 1-й препозиции. Случай 1. N-1 – N* (ядро хранит <действие>) Итак, для случая N-1 – N* что будет происходить в 1-ой препозиции, если ядерная позиция будет занята глубинным признаком <действие>? а) Тогда в 1-й препозиции может появиться признак <объект>-существительное. Например: program compilation трансляция программ; image digitization отцифровка изображений; б) может появиться признак <инструментальность>-существительное. 4 5 Например, computer programming машинное программирование (т.е. программирование с помощью машин); computer synthesis машинный синтез (т.е. автоматизированный синтез или синтез с помощью ЭВМ). Случай 2. N-1 – GER* (ядро хранит <действие>) Если ядро занято признаком <действие>, но оно выражено морфологическим классом «герундий», тогда 1-ую препозицию может оккупировать <инструментальность>: laser programming лазерное программирование. Russian compound terms left English compound terms nucleus right d i s t r i b u t i o n f=1174 18.29% f=2000 31.15% left f=3246 50.56% nucleus right d i s t r i b u t i o n f=2848 47.51% f=2000 33.37% f=1146 19.12% Гистограмма 2. Распределение вероятностей появления морфологических классов в пре- и постпозициях русской и английской терминоструктур 5 6 Случай 3. N-1 – N* (ядро хранит <часть>) В этом случае 1-ую препозицию может занять семантический признак <целое>: computer memory машинная память (т.е. память машины). Случай 4. ADJ-1 – VN* (ядро хранит <действие>) Если мы имеем случай «прилагательное – отглагольное существительное», тогда при ядре-<действие> 1-ую препозицию может занять признак <инструментальность>: automatic processing автоматическая обработка; half-automatic processing полуавтоматическая обработка; manual processing ручная обработка. На Рис.1 прилагательное оккупирует 1-ую препозицию с вероятностью 0,14, но это не значит, что эта вероятность принадлежит только <инструментальности>. Здесь прилагательное может выражать и другие глубинные признаки. Случай 5. (N-2 + ED-2 )ins – N* action (ядро хранит <действие>) В этом случае в 1-ой препозиции может возникать причастие прошедшего времени (ED-1), а во 2-ой препозиции – существительное (N-2). Отметим, что в данном случае инструментальность выражается двумя терминоэлементами – (N-2 + ED-1 )ins : computer-aided analysis автоматизированный анализ (т.е. анализ с помощью ЭВМ); computer-aided design машинное проектирование; computer-based data processing автоматизированная обработка данных. (Сравните выражение инструментальности морфологической конструкцией «наречие – причастие прош. вр.» в терминах другой тематической области: ionically-damaged layers слои кристалла, разрушаемые ионным способом (т.е. с помощью ионов). Случай 6. N-1 – N* (ядро хранит <целое>) В этом случае препозитивное существительное N-1 может обозначать признак <часть>: core memory стержневая память (т.е. память на магнитных стержнях). Примечание 4: Какова в позициях терминоструктуры частотность самих семантических признаков – такое сверхтрудоемкое наблюдение могло бы составить отдельную тему исследований. Но к этому семантическому наблюдению все равно надо стремиться, ибо такие сведения могут быть принципиально важными как при автоматизации распознавания терминоэлементов в тексте, так и при автоматизации «понимания» текста вообще. Трехпризнаковое описание каждого терминоэлемента позволяет наглядно сопоставить английскую и русскую терминоструктуры (см. гистограмму 2) и увидеть особенности расширения каждой. Гистограмма 2 показывает, что русская терминоструктура имеет прогрессивное (В. Ингве) расширение, т.е. расширение вправо от ядра (nucleus), а английская регрессивное, т.е. влево от ядра. [Название «лево- и правоветвящиеся структуры» Н. Хомского мы здесь не используем.] В русской постпозиции (right) выявлено 50,56% употреблений морфологических классов от всего количества их употреблений в экспериментальном массиве русских терминов, а препозитивные классы составили лишь 18,29% , т.е. почти в 3 раза меньше, чем в постпозиции. Прогрессивное расширение русской терминоструктуры (*система обработки данных, *устройство высокоскоростной отцифровки оптических изображений) привносит некую описательность термину, делает его похожим на предложение дефиниции. (Cр. *самолет с изменяющейся геометрией крыла, *больной с высоким хирургическим риском). Английская же терминоструктура имеет явную тенденцию к регрессивному расширению – 47,51% (two-pass *compiler двухпроходной *транслятор, binary-coded decimal *representation двоичнозакодированное десятичное *представление, statement-by-statement *debugging пооператорная *отладка), а не к прогрессивному расширению – 19,12% (*reading in data *считывание данных). В приведенных примерах иногда видно, что и в английских и в русских терминах-эквивалентах направление расширения терминоструктуры совпадают, но эти отдельные факты тенденцию не описывают. Вышеуказанные тенденции английской и русской терминоструктур подтверждаются обсчетом весьма доверительных массивов моделей – повторяем, было обработано 2000 английских и 2000 русских моделей неповторяющихся терминов. Сколько морфологических категорий претендуют на ближайшие места перед и после ядра, т.е. плотность классов, – это показано в Таблице 3. Здесь следует отметить, что в английских препозициях от (-5) до (-1) морфологические категории активнее русских в несколько раз. По-видимому, это объясняется существующим аналитизмом английского языка, в т.ч. способностью английского существительного играть роль препозитивного атрибута. 6 7 Б) ВЫВОДЫ ПО ПЕРВОМУ ЭТАПУ НАБЛЮДЕНИЯ ЗА ТЕРМИНОСТРУКТУРОЙ 1) Разбиение термина на элементы с опорой на семантические признаки Вычленяя в термине элементы, полезно заимствовать практику информационного поиска, а именно, присвоение ключевому слову статуса «дескриптора» или «недескриптора», т.е. синонима. Например, при многоязычном поиске документ, содержащий термин холлеритные данные, считается релевантным как документу, содержащему термин H-data, так и документу с Hollerith data. Это – синонимичные термины. Поэтому, на этапе ввода термина H-data в наш экспериментальный массив он подвергался предварительному «редактированию» и принимал форму H- # * data . В результате, все три варианта термина (холлеритные *данные, Hollerith *data, H- # * data ) содержали 2 программно-опознаваемых элемента. Если такое редактирование применить в информационном поиске, т.е. на этапе индексирования документа и поискового запроса, то оно может способствовать достижению столь желанной монотонности и устойчивости индексирования. Общее количество морфологических классов, возникающих с любыми вероятностями в конкретных позициях терминоструктуры Терминоструктура -5 -4 -3 -2 -1 * 1 2 3 4 5 6 7 Русская – 1 3 5 10 2 11 15 14 12 8 5 – Английская 4 4 9 10 9 4 6 12 7 6 6 3 10 Таблица 3. Морфологическая плотность в пре- и постпозициях Но что делать, если в тексте это же самое понятие описано более расширенно – «данные на перфокартах, закодированные методом Германа Холлерита»? Это описание является частью дефиниции [21,с.205]. К тому же терминоэлемент Hollerith используется и самостоятельно: термин Hollerith сам выражает понятие «холлеритова система кодирования» [21,с 205], а также присутствует и в составном термине Hollerith strings холлеритовы цепочки [21,с.205]. В нашем случае длинные сочетания вида «данные на перфокартах, закодированные методом Германа Холлерита» объектами нашего исследования не считались и в исходный экспериментальный массив терминов не включались. 2) Об английском морфологическом классе «герундий». В сочетаниях вида data processing system (N-2 – GER-1 – N*) , система обработки данных (C* – Cрод – Срод) ing-форма считалась нами активным герундием. Здесь триаду <деятель-действие-объект> можно развернуть в стандартное трехчленное предложение system PROCESSES data, где объект (data – прямое дополнение) прочно связан с действием. Прочность связи между объектом и действием сохраняется и в терминах, где реализуется усеченная формула <действие-объект>: data *processing (N-1 – GER*) обработка данных. Действиегерундий и его объект-существительное сохраняются и в термине reading in data считывание данных.. 3) Условный морфологический класс «идентификатор». В терминах вида *язык Ада, LISP- #*language, ЛИСП- #*язык, команда compare^register, LIFO- #*list подчеркнутые элементы считались нами «идентификаторами». Введение этого условного морфологического класса терминоэлементов помогло нам внести определенную стабильность в процесс предмашинного редактирования терминов. Можно сказать, что наши три морфолого-синтагматических признака обеспечивают достаточно полное описание поверхностной структуры компаунда. Но как бы много подробностей о поверхностной структуре компаунда такое описание ни сообщало, тем не менее, само содержание межэлементных связей в теле компаунда остается неизвестным. Поэтому, целью следующего этапа наших наблюдений над терминоструктурой было формализованное представление самой семантической организации компаунда. 7 8 ВТОРОЙ ЭТАП НАБЛЮДЕНИЯ НАД ТЕРМИНОСТРУКТУРОЙ Линейность семантической организации термина Разрабатывая свой подход к формализованному представлению семантики термина, мы рассуждаем следующим образом. Если речь – письменная или устная – линейна, значит и линейна структура или организация составного термина. То есть, эту структуру можно мыслить в виде некоторой линейной последовательности позиций или ниш, где каждая позиция несет, нагружена, наделена некоторым глубинным значением, несет некую идею. Здесь возможна аналогия с линейно-организованной числовой последовательностью, где каждый разряд (т.е. место) нагружен вполне определенным значением (significance), «весом» (weight). При производстве числовой речи человек загружает каждый числовой разряд конкретным местным значением. Выбор такого локального значения определяется целью числовой речи человека. Здесь уместно отметить, что, по-видимому, впервые сравнение структуры, «формулы» словосочетания с организацией «сложных числовых образований» сделал А.И. Смирницкий [13,с.19]. Анализ семантики составных терминов позволил выделить в них присутствие следующих абстракций, которые мы назвали семантическими признаками. Они – следующие: активный субъект-деятель, фиктивный субъект-деятель, действие, объект, назначение-цель, конкретизация, инструментальность, локативность, сходство, устойчивость, партитивность, аблятивность (т.е. отсутствие признака), квантитативность, сделанный=из/материал, идентификатор, адресность/фамильность, язык, счисление. Мы считаем, что эти признаки надлексичны, они выражают достаточно абстрактные идеи, чтобы считаться универсальными, т.е. они способны возникать в терминах любой предметной области. Но мы допускаем, что содержание некоторых из них не столь надлексично, чтобы причислить признак к разряду универсальных. В последующем мы обсудим проблемы слияния однородных признаков в более абстрактные, более глубинные категории. Особенности распознавания семантического признака Предлагаемые семантические признаки (иногда будем их называть просто «признаки») извлекались из неадаптированных текстов вручную, причем, признак распознавался путем анализа и ближайших окрестностей термина. Из текста извлекалась номинативная группа, затем каждый компонент группы анализировался на присутствие терминированности или нетерминированности. Анализ объема содержания опирался на наше понимание терминируемой производственной ситуации, при этом анализ иногда проходил как бы на срезе двух языков. Можно отметить, что выявлению семантического признака способствовало то, что в английском термине он иногда оформлен отчетливее, чем в русском термине. Широко распространенная английская препозиция способствует распознаванию содержания признака, русская же высокочастотная постпозиция придает термину описательность, т.е. расплывчатость. Хотя иногда термины обоих языков имеют препозицию: binary *control, двоичное *управление, octal *representation, восьмиричное представление, binary-coded decimal representation, двоично-закодированное десятичное *представление О семантической триаде Рассматривая компаунд как линейную цепочку семантических позиций, мы вправе задать себе следующие вопросы: когда и почему данный нетриадный признак появляется в той или иной позиции? Зависит ли его поведение от семантики ядра? Какова должна быть значимость (significance) признака, чтобы претендовать на место ближе к ядру? По-видимому, на ближайшее место к ядру должен претендовать признак, обладающий наибольшей информативностью, т.е. несущий самую существенную информацию об оттенках терминируемого понятия. Подсчитывая значимость признака, следует учитывать и то, что ядерная позиция может быть занята субъектом фиктивным, т.е. малоинформативным. Подобно многоразрядному числу, линейная структура компаунда может содержать несколько семантических признаков. Линейность подсказывает вполне оправданный вопрос: должен существовать некий остов, некая опора, слева и справа от которой должны лежать уточняющие признаки. То есть, должна существовать некая прочная конструкция, обусловленная целью научно-технической речи. Эту конструкцию можно сравнить с «формулой» А.И. Смирницкого, реализуемой в терминологическом сочетании [14,с. 37]. 8 9 В попытках «взвесить» роль каждого семантического признака, в стремлении найти некий стержень или опору, вокруг которого признаки расположены в линейной терминоструктуре, нам следует обратиться к той материальной действительности, которую терминологический язык отражает, выражает с помощью своих лингвистических значений. Итак, каков же материальный мир английского и русского подъязыков вычислительной техники? 1) В этом мире можно отметить следующую особенность – всегда существует широкий класс материальных предметов (компьютер, оборудование, аппаратное обеспечение; программа, программное обеспечение, алгоритм и т.д.), которые выполняют широкий класс действий/процессов (read in, read out, convert, debug, compile, считывать, выводить, преобразовывать, отлаживать, собирать и т.д.) над широким классом других предметов (данные, числа, цифры, файлы, информация, знаки, изображения, образы и т.д.). В данной области знания можно выделить класс сущностей (класс деятелей), которые выполняют вполне перечисляемый набор действий над вполне конкретными сущностями – объектами. Такая схема, по-видимому, присутствует и в большинстве других предметных областей. 2) В своей научно-технической речи человек, по-видимому, стремится как можно быстрее заявить главное, существенное, но при этом стремится свой терминологический знак сделать максимально коротким. Реализуется принцип – максимум информации в минимум времени. Что такое «самое главное»? Это – ответы на вопросы: Кто делает? Что делает? Над чем совершается действие? В качестве некоего рабочего приема для формализованного представления смысла компаунда нами принято решение – тройку признаков (деятель, действие и объект действия) считать стержнем линейно-организованной семантической структуры компаунда. Слева и справа от каждого опорного признака могут возникать и все остальные уточняющие семантические признаки. Деятеля (субъекта), его действие и объект этого действия – каждого такого участника терминируемой ситуации назовем актантом, а всю группу – семантической триадой или триадой [4,с.99]. Объект мы иногда будем называть «страдальцем». Нами принимается, что актантные признаки и их уточняющие признаки обладают одним уровнем абстракции, т.е. все они однородны, гомогенны. Способы реализации триады в компаундах Триада реализуется полностью или частично, словесно, морфемно или смешанным способом. Полная реализация триады. Триада реализуется полностью в терминах: а) вида data-processing system, система обработки данных, information extraction technique, способ извлечения информации. Здесь триада выражена словесно, аналитически, под каждый признак выделено отдельное слово; б) вида data processor, процессор/обработчик данных, program debugger, отладчик программ. Здесь два актанта – <действие> и <субъект> – выражены морфемно, синтетически. в) вида газораспределитель, кораблестроитель, нефтеанализатор. Здесь вся триада выражена морфемно. Термины с полной реализацией триады назовем триадными. Словесное представление признаков, при необходимости, можно свернуть в морфемное и наоборот: image digitization software <=> image digitizer; программа отцифровки изображений <=> отцифровщик изображений; нефтеанализатор <=> прибор/программа/система анализа нефти. Триадный термин способен быть развернутым в стандартное трехчленное предложение с сохранением глубинной структуры деятель-действие-объект: system PROCESSES data; система ОБРАБАТЫВАЕТ данные. Возможен и такой вид фиксации отношений между актантами: действие (ДЕЯТЕЛЬ, объект). Заполнив эту конструкцию конкретными лексическими значениями, получим программноопознаваемый вид: process (SYSTEM, data) или обрабатывать (СИСТЕМА, данные). Частичная реализация триады. Двухактантные термины (актанты даны курсивом): – image processing, обработка изображений, pattern recognition, распознавание образов, two-pass compiler, двухпроходной транслятор, – самолетостроение, нефтеочистка, энергосбережение, кроветворение. Одноактантные термины: two-pass compiling или two-pass compilation, двухпроходная трансляция/транслирование/сборка, high-speed debugging, высокоскоростная отладка, black memory, 9 10 «черная» память (термин поясним позже), двоичный разряд, binary digit, laser programming, лазерное программирование. О неактантных семантических признаках В нашем случае каждый семантический признак представлен 4-хаспектной моделью, которая содержит: 1) описание объема содержания признака, 2) лексическое выражение признака, 3) морфолого-семантическое описание признака и 4) трансформацию (т.е. проверочную или диагностическую процедуру для определения объема содержания вычленяемого признака). Пример описания признака инструментальность Аспект 1. Описание содержания признака: из двух анализируемых слов составного термина грамматически подчиненное обозначает орудие (средство), с помощью которого выполняется действие, обозначенное вторым словом, или характеризуется предмет, обозначенный вторым словом. Аспект 2. Примеры лексического выражения признака (из специализированного тезауруса): машинное программирование, автоматическое управление, деление вычитанием, computer programming, computer-aided programming, automatic check Аспект 3. Морфолого-семантическое описание признака: инструментальность – действие Пинс + C* действие ADJ ins + VN* action лазерное программирование automatic programming (автоматическое программирование) автоматическое присвоение (адресов) ПЧинс + C*действие автоматизированный синтез Nins + GER*action computer programming (машинное программирование) ПЧинс + С* субъект машиночитаемый носитель ADJ ins + N*action automatic design (автоматическое проектирование) Пинс + С* субъект машинные функции N ins + N* action computer control (машинное управление) C*действие + C инс программирование лазером умножение сложением (N-2 + ED-1) ins + N* action computer-assisted control (автоматизированное управление) computer-made functions (машинные функции) C*действие + (с=помощью + Cрод) инс программирование с помощью машин (N-1 + ED) ins + VN* action computer-aided programming (машинное программирование) Выше помета “ins” при терминоэлементе обозначает <инструментальность>, а “action” – признак <действие>. 10 11 Аспект 4. Трансформационная процедура T инс–действие <=> подлежащее + пассив. сказуемое + прямое дополнение или T инс–деятель <=> подлежащее + пассив. сказуемое + косв. дополнение computer control <=> control IS=MADE by computer automatic programming <=> programming IS=MADE division by subtraction <=> subtraction IS=MADE by automate или automatically by division машиночитаемый носитель <=> носитель СЧИТЫВАЕТСЯ машиной умножение сложением <=> умножение ВЫПОЛНЯЕТСЯ сложением Особенности актантов 1) Сила межактантных связей Простота и наглядность, сочетающиеся одновременно с прочностью межактантных связей, обусловливают широкое применение триадных терминов в любой предметной области: high-speed data-processing system high-speed binary-coded decimal data processing system content extraction system. NASA-sponsored computer-based big-sized image processing system noise-imitating technology самоходный дробеметный агрегат для очистки днища корабля Такие триадные термины часто свертываются – частично или полностью – в морфемный вид. Например: noise-imitator шумоимита́тор, content-extractor смыслоизвлека́тель (смыслоэкстрактор), дробеме́т. Такая свертка возможна, если нет сопротивления со стороны лексического значения терминоэлемента. Например, лексическое значение элемента данные в терминах обработчик данных, процессор данных не разрешает поместить семантический объект в препозицию, а разрешает лишь расположить объект в постпозиции (обработчик данных, а не «данных обработчик», обработчик образов, а не «образов обработчик»). Кстати, это очень интересная проблема – почему триаду в таких терминах нельзя выразить морфемно – скажем, в виде траншеекопатель, газоанализатор и т.п. Безусловно, машинный вариант таких пока несвертывающихся терминов может иметь формализованный вид объект-действие-деятель, но это, повторяем, лишь машинный вариант, а не текстовый вариант. 11 12 Отметим традиционную направленность развертки триады в двух подъязыках: Английский подъязык Регрессивная (т.е. левая, назад от ядра) развертка: объект <= действие <= ДЕЯТЕЛЬ Примеры: data processing system (система обработки данных) noise (-) imitating technology (способ имитации шума) content extraction system Русский подъязык Прогрессивная (т.е. правая, вперед от ядра) развертка: ДЕЯТЕЛЬ => действие => объект Примеры: система обработки данных способ имитации шумов (а не «шумоимитирующий способ») система извлечения смысла (а не «смысл(о)извлекающая система») (система извлечения смысла) Ср.: Регрессия высокочастотна и в русской терминологии: энергосберегающая технология, шумопоглотитель, патентодержатель, градостроитель, газоанализатор (Ср. в термине тигр-людоед расположение актантов нарушено – субъект-объект-действие. линейное Безусловно, структура вида шумопоглотитель, траншеекопатель, газоанализатор в русских отраслевых терминологиях тоже высокочастотная, но русская частота все же уступает частоте английской. Почему? По-видимому, здесь сказывается (упомянутая выше) особенность самих лексических значений терминоэлементов, их индивидуальность. Большая сила межактантных связей обусловливает частично или полностью морфемный вид компаунда: content-bearing unit => content bearer (смыслонесущая единица => носитель смысла), text-synthesizing system => text-synthesizer (система синтеза текста => синтезатор текста), текстосинтезатор, газоанализатор, кровеохладитель. Свертывается ли или развертывается внешнее выражение триады – само содержание межактантных отношений сохраняется. Отметим поведение «страдальца». Реализуется ли триада полностью или частично – прочность связи между действием и объектом-прямым дополнением сохраняется. Эту более тесную связь между глаголом и его прямым дополнением, чем между глаголом и его косвенным дополнением (хотя косвенное дополнение во многих языках помещается ближе к глаголу, чем прямое) отмечал еще О. Есперсен ([8];см. в [1,с.151]). Нам эта мысль кажется интересной, ибо составной термин способен развертываться в предложение с прямым и косвенным дополнениями. (Такое устойчивое поведение объекта по отношению к действию можно использовать в информационном поиске для достижения монотонного и устойчивого индексирования.) Эту устойчивость можно представить так: обрабатывать (СИСТЕМА, данные). Также можно принять, что такое выражение может развертываться в программно опознаваемое предложение вида СИСТЕМА обрабатывает данные. Сам способ записи здесь подчеркивает «страдания» объекта. «Страдалец» представлен тускло, неярко. Господин ситуации здесь СИСТЕМА, это – субъект, он может быть реальным или фиктивным. Процесс выделен жирно, это – будущий предикат. Итак, перед нами развернута сцена, где один актант активный (active), а другой (т.е. объект) пассивный (passive), страдающий, лишь принимающий на себя воздействие. (Вспомним русские термины «действительный залог», «страдательный залог») 2) Абстрактность морфемы -ER Для случая терминов вида image digitizer отцифровщик данных, где действие и субъект представлены морфемно, нужно отметить большую абстрактность высокочастотной морфемы –er (-or). Ее значение шире, чем, скажем, узко-отраслевое значение морфем в медицинских и геологических терминах вида невроз и курчатовит. Эти медицинские и геологические морфемы уже подверглись стандартизации – в термине вида невроз за корневой морфемой закреплено только значение объект 12 13 заболевания, а за суффиксальной – заболевание; в терминах же вида курчатовит суффиксальная морфема выражает идею о минерале. Выше мы отмечали, что словесно или морфемно выражена триада – устойчивость межактантных связей сохраняется. По-видимому, такая прочность обусловлена тем, что эти связи прямые, непосредственные, работает связь «управление». Такую прямую связь получают те лексические значения, которые дружественны друг другу, т.е. они лексически совместимы. О МЕТОНИМИИ И КАСКАДИРОВАНИИ В исследуемых подъязыках существует широкий слой терминов вида binary control, двоичное управление, binary numeration system, двоичная система счисления, в которых рядом стоящими часто оказываются элементы с казалось бы лексически несовместимыми, лексически далекими друг от друга значениями. В теле термина эти элементы грамматически (т.е. формально) связаны, но парадигматические (онтологические, внетекстовые) связи между ними не прямые, а косвенные. Такое грамматическое содружество лексически далеких элементов в пределах одного термина придает термину определенную яркость и оттенок иносказательности. Например, в английском термине black memory букв. «черная» память (т.е. память, содержащая данные о черных образах) парадигматическая связь между элементами вообще не просматривается, как не просматривается она и в терминах с латинскими элементами – post mortem dump (т.е. «посмертный» дамп). Мы считаем, что такие семантические пропасти или провалы (pits) между элементами в термине возникли в результате действия метонимических явлений, т.е. переподчинение признака от одного понятия к другому понятию. Имя-признак как бы покидает своего прежнего парадигматического «хозяина» и становится грамматически зависимым от нового хозяина. Строго говоря, для терминов binary computer двоичный компьютер, binary arithmetics двоичная арифметика парадигматически неточно будет сказать: computer IS binary компьютер ЕСТЬ двоичный, arithmetics IS binary арифметика ЕСТЬ двоичная. А случай black memory трансформировать в сообщение memory IS black – эта операция вообще кажется странной. Такие семантические пропасти между элементами в термине мы предлагаем «мостить» с помощью каскада стандартных 3-хчленных предложений (примитивов – primitives). Каскад может содержать один или несколько базовых предложений. Каждый примитив фиксирует прямые (непосредственные) парадигматические связи между подлежащим-субъектом, сказуемым-действием и прямым дополнением-объектом. В каскаде самое нижнее предложение является самым опорным, базовым, фундаментальным. (О форме тезаурусного представления прямых или косвенных связей между элементами термина мы здесь не говорим.). Процесс формирования каскада называется каскадированием (cascading). Разные метонимические термины требуют разное количество примитивов. Например, для термина binary numeration двоичное счисление каскадирование не требуется, ибо с точки зрения данной понятийной системы целесообразнее считать, что признак двоичность определяет понятие счисление непосредственно. Выразим эту прямую связь с помощью предложения numeration IS binary система=счисления ЕСТЬ двоичная. Здесь налицо тот самый случай, когда грамматическая связь совпадает с парадигматической. В нашем тезаурусе такой примитив будем хранить в виде IS (NUMERATION,binary) Для термина binary data двоичные данные уже потребуется формировать 2-хступенчатый каскад: data HAS numbering system данные ИМЕЮТ систему счисления numbering system IS binary система счисления ЕСТЬ двоичная Для cлучая black memory, базовый (или нулевой) примитив будет, по-видимому, заявлять цвет ИМЕЕТ волну, если учитывать современную способность техники распознавать волны, излучаемые цветом. Такое каскадирование или «наведение мостов» (bridging) через метонимические пропасти может 13 14 способствовать, например, проектированию эффективного регулируемого языка (controlled English) – для оптимального описания смысла документа и поискового запроса. О «ГОЛУБОГЛАЗОСТИ», «ТОНКОСТЕННОСТИ», «ЧЕТЫРЕХМОТОРНОСТИ» В линейно организованной структуре компаунда позиция <партитивность> может заполняться лексическим значением вида «голубоглазость» (или «тонкостенность» или «четырехмоторность» и т.п.). Мы используем здесь толкование А.И. Смирницким значений вида «голубоглазость» (“blueeyedness”) в сложных словах вида long-nosed длинноносый, short-legged коротконогий и т.п. [13,с.118]. Подробнее о формализованном представлении этой ситуации см. в [7,с.128-136], где ситуации вида thick-walled tank толстостенная цистерна (т.е. цистерна с толстыми стенками), concrete-surfaced runway (взлетная полоса с бетонным покрытием), many-sided configuration многосторонняя конфигурация (т.е. конфигурация со многими сторонами), three-bladed propeller трехлопастный пропеллер (т.е. пропеллер с 3 лопастями), one-armed man однорукий мужчина (т.е. мужчина с одной рукой), four-engined aircraft четырехмоторный самолет и т.п. предлагается описывать с помощью наших трехчленных каскадных примитивов [4; 7]. ВЫВОДЫ ПО СЕМАНТИЧЕСКОМУ ЭТАПУ НАБЛЮДЕНИЯ ЗА ТЕРМИНОСТРУКТУРОЙ Формулируя свой рабочий подход к семантическому моделированию компаунда, мы должны, повидимому, уяснить себе степень абстрактности таких категорий, как «творительный места – где?», «творительный времени – когда?», «творительный образа действия – как?» (они предложены А.А. Потебней), а также абстрактность, скажем, семантических падежей Ч. Филлмора [17] и категорий В.Л. Уорфа [16]. Изучив опыт предшественников, мы должны принять рабочее решение по формализованному представлению таких абстракций. При этом, следует подумать и о проверке содержания каждого признака – чтобы содержание признака не переливалось в содержание другого признака. Для кластирования выделенных нами семантических признаков применим опыт В.Л. Уорфа, а именно, его «скрытые категории» или «криптотипы» [16]. Один из криптотипов – согласно В.Л. Уорфу – несет значение «форма+бесформенное вещество»: «мешок муки», «брусок меди» и т.д. Он считал, что в английском языке это значение обычно выражается грамматической формой вида N* + OF + N1 (cup of tea) или N-1 + N* (wood stick деревянная палка/посох). Подобные формы В.Л. Уорф называл формулами, в которых предлог OF имеет явное значение «содержащийся». Если сравнить наш признак <сделанный=из> c этим криптотипом, то, по-видимому, криптотип более абстрактен: медный гвоздь, карман семечек, река крови, океан слез). Наш вывод: в последующем этот криптотип мы можем использовать для иерархизации наших семантических признаков. Возьмем наш следующий признак – <конкретизация>. Мы приписали ему содержание: «Из двух анализируемых слов термина грамматически главное обозначает лишь общий класс предметов, процессов или способов, а подчиненное слово конкретизирует и уточняет этот класс, неся существенную информацию о терминируемом понятии» [4,с.100-102]. То есть, при анализе терминов вида программные средства, средства программирования, способ трансляции, programming aids (программные средства), quantization process (процесс квантования) подчеркнутые элементы считаются именами информационно-недостаточными, они «обязательно требуют распространителей, обеспечивающих определенность и однозначность называния, полноту обозначения.» [12,с.16]. И здесь можно видеть, что вышеуказанный криптотип тоже поглощает наш признак. Идея «безбрежности» массы и жесткой «формы» или конфигурации для этой массы – эта идея нам кажется ценной, и ее можно применить для представления наших текстовых ситуаций вида способ трансляции или compiling technique. Такой безбрежностью могут быть наши отраслевые «действия», а формой будут «средства, программы, способы, методы, инструкции»и т.п. Тогда нашу конкретизацию придется назвать не семантической, а понятийной категорией. Но ведь дело не в названии, а в содержании и – что существенно – в диагностическом тестировании обнаруженной категории. Наш семантический признак <идентификатор> тоже может быть включен в данный криптотип. Значение данного криптотипа, похоже, покрывает значение и категории количественности [2], которую И.А. Бодуэн де Куртенэ выделял как отдельную. Но это требует дальнейших наблюдений. И наконец, обсуждая трудности семантической формализации, нельзя не вспомнить особенности известных 10 Аристотелевых категорий: 1) substance, 2) quantity, 3) quality, 4) relation, 5) place, 6) time, 7) position, 8) state, 9) action, 10) affection [19]. Их большой уровень абстрактности может служить своеобразным ориентиром при будущей иерархизации выделенных нами признаков. Подчеркивая стихию разных языков и трудности определения внеязыкового содержания категорий, 14 15 О. Есперсен отмечал [8,с.50]: говоря «о различиях между языками, мы наблюдаем, как предметы, представленные словами, группируются самым различным образом соответственно капризам данного языка. То, что сливается воедино в одном языке, различается в другом.» «Эти категории являются универсальными, поскольку они применимы ко всем языкам, хотя они редко выражаются в этих языках ясным и недвусмысленным способом. Некоторые из них относятся к таким фактам внешнего мира, как пол, другие – к умственной деятельности или к логике. За отсутствием лучшего термина я буду называть эти категории понятийными категориями.» [8,с.58]. «Грамматические категории представляют собой в лучшем случае симптомы, или тени, отбрасываемые понятийными категориями, иногда «понятие», стоящее за грамматическим явлением, оказывается таким же неуловимым, как кантовская вещь в себе.» [8,с.61-62]. Семантический элемент терминоструктуры, по-видимому, является основополагающим лингвистическим понятием для формирования термина. Единственным способом проверки объема содержания такого терминоэлемента оказывается трансформационная процедура. ЗАКЛЮЧЕНИЕ 1) В настоящее время отчетливо просматривается противоречие между огромными возможностями современной вычислительной техники, систем связи, высокими описательными способностями языков программирования и пока еще слабыми выразительными способностями информационно-поисковых языков (ИПЯ) дескрипторного типа. Эффективность автоматизированного поиска документов, а именно его точность и полнота, оставляют желать много лучшего. Уже давно существующая потребность в многоязычном поиске еще больше подчеркивает это противоречие. Современный дескриптор обычно имеет вид составного термина (компаунда). Попытки автоматизации самого процесса индексирования, что принесло бы столь желанную монотонность и устойчивость описания смысла документа и запроса – результат этих попыток также зависит от решения терминологических проблем. Как построен термин, т.е. в чем заключается эффективность организации его элементов в теле термина, какова сила связи между элементами, как терминоэлемент выигрывает сражение за свое место у грамматически главного ядра термина – на эти и другие интересные вопросы еще нужно ответить. Только после этого можно будет предложить эффективную организацию лексической единицы. Здесь существует некая аналогия с автоматическим построением названия лекарства, когда мы идем от содержания (т.е. известных компонентов лекарства) к созданию имени с наперед заданными (и программно-распознаваемыми) свойствами. Стремление построить эффективную терминологию имеет давнюю историю. Еще в 30-е годы прошлого века принципиальную значимость отраслевых терминологий в СССР понимали видные ученые-нелингвисты и ученые-лингвисты: необходимость упорядочения (т.е. нормализации и стандартизации) терминологий видели академик С.А. Чаплыгин [18], курирующий в то время терминологические исследования в стране, известный инженер-лингвист Д.С. Лотте [10; 11], известный лингвист Г.О. Винокур [3]. 2) Остро ощущается отсутствие единого подхода к описанию внешней и внутренней структур термина. Такой подход создал бы возможность получать «дружественные», совместимые терминологические результаты, объединяя этим дорогостоящие исследовательские усилия. 3) Создавая единую методику наблюдения за терминами, нужно полагать, что возникающие новые утонченные понятия, демонстрирующие прогресс науки и техники, не будут названы терминамипоездами, т.е. терминами-дефинициями. Надо ожидать, что названия этих понятий будут иметь вид коротких терминологических знаков, но с углубленными метафорическими отношениями между элементами знака. Эти отношения придают знаку яркость и необычность, а это способствует лучшему осмыслению терминируемого понятия и запоминанию самого терминознака. (Но за это приходиться платить трудностями формализации семантики). Поэтому, формальное представление значений таких терминов нужно будет проводить с помощью весьма абстрактных категорий. Мы должны как бы заранее запастись достаточной абстрактностью категорий с тем, чтобы с их высот взглянуть на стихию текста. Высокая абстрактность категорий затем позволит провести иерархическое упорядочение семантических признаков, очертить границу между содержанием таких групп гомогенных признаков. Это может создать основу для последующего кластирования (clustering) признаков. Из вышесказанного вытекает следующая возможная процедура опознавания признаков: вначале мы пытаемся выделить случаи с одинаковой лексичностью – скажем, случаи вида «голубоглазости», интуитивно усматривая реализацию в них глубинного значения <партитивности>, далее, заимствуя криптотип «ФОРМА+БЕСФОРМЕННОЕ ВЕЩЕСТВО», мы сливаем все партитивности в этот криптотип. Иными словами, мы проходим все ступени ниже показанного каскада, где нижняя ступень 15 16 содержит стихийное (локальное) значение, средняя – значение надлексическое, а верхняя – самую высокую абстракцию. голубоглазость партитивность ФОРМА+БЕСФОРМЕННОСТЬ Феномены каждой ступени, каждого слоя этого каскада являются гомогенными. Трехактантная триада может стать стержнем при формализованном описании линейной организации термина. Построение «мостов» через метонимические пропасти в терминоструктуре предлагается производить с помощью базовых примитивов, т.е. стандартных трехчленных предложений, фиксирующих парадигматические отношения между признаками понятий. Такое фиксирование производится в специальном тезаурусе. Наблюдая над термином как наиболее информативным фрагментом научно-технического текста, мы ожидаем, что количество типов связей, присутствующих в данной терминосистеме, меньше количества связей, присутствующих вообще в естественном языке. Ибо мир терминологии несколько уже, чем вообще мир материальных и идеальных сущностей. Нужно быть готовым к тому, что наш семантический терминоэлемент может быть выражен в русском термине словесно, в английском словесно и морфемно, а, скажем, в немецком чаще всего морфемно. В этом месте уместно вспомнить слова, кажется, Л.В. Щербы о том, что самым устойчивым объектом для исследования является морфема. С этим трудно не согласиться, если вспомнить, что многоморфемный немецкий термин может быть длиной в целую строчку. 4) В целом, предложенное нами 3-хпризнаковое описание внешней структуры термина и 4-хаспектное представление семантического признака может помочь подойти к изучению проблемы как «сказывается» (А.А. Потебня) научно-техническая мысль. ЛИТЕРАТУРА 1) Ю.Д. Апресян. Идеи и методы современной структурной лингвистики (краткий очерк). -М.: Изд-во «Просвещение», 1966. – 302с. 2) И.А. Бодуэн де Куртенэ. Количественность в языковом мышлении//Избр. тр. по общему языкознанию.-М.,1963. Том 2,с. 278-287. 3) Г.О. Винокур. О некоторых явлениях словообразования в русской технической терминологии//Тр. Московского института истории, философии и литературы.-М.,1939, том 5, с.3-54. 4) В.И. Глумов. Структурно-семантическая организация составных терминов русского и английского языков (на материале текстов по вычислительной технике и программированию). Дис. на соиск. уч. ст. к. филолог. н. (10.02.21 – структурная, прикладная и математическая лингвистика). Горький, Горьковский государственный университет им. Н.И. Лобачевского, 1986.–168с. (Приложение – 81с.) 5) В.И. Глумов. Распознавание составного термина в тексте и подготовка к машинной обработке (нулевой этап). (с.41-63). Материалы межрегиональной научно-практической конференции «Научнометодическая и учебная деятельность ВУЗа в связи с переходом на многоуровневую систему образования», Нижний Новгород, Филиал Российского государственного университета (РГГУ) в г. Нижнем Новгороде, 23-24 октября 2008 года. Нижний Новгород, издание Филиала РГГУ в г. Нижнем Новгороде, 2008. – 279с. 6) В.И. Глумов. Статистико-вероятностные особенности поверхностной структуры английских и русских составных терминов (первый этап). (с.63-84). Материалы межрегиональной научнопрактической конференции «Научно-методическая и учебная деятельность ВУЗа в связи с переходом на многоуровневую систему образования», Нижний Новгород, Филиал РГГУ в г. Нижнем Новгороде, 23-24 октября 2008 года. Нижний Новгород, издание Филиала РГГУ в г. Нижнем Новгороде, 2008. – 279с. 7) В.И. Глумов. О формализованном представлении лексических значений «голубоглазость» или «толстостенность» в англо-русских составных терминах. (с.128-136). Материалы 2-ой Международной научно-практической конференции «Информационные технологии в гуманитарном образовании», Пятигорск, Пятигорский государственный лингвистический университет (ПГЛУ), 22-23 апреля 2009 года. Изд. ГОУ ВАО «Пятигорский государственный лингвистический университет». 2009. – 554с. http://itgo.pglu.ru. 8) О. Есперсен. Философия грамматики. (Перев. с англ.) (Otto Jespersen. The Philosophy of Grammar). Изд. 3-е. –М.: URSS, 2006. – 408с. 16 17 9) Информационно-поисковый тезаурус промышленности строительных материалов. Раздел «БЕТОН И ЖЕЛЕЗОБЕТОН». Сост. И.П. Архангельская, В.И. Глумов, Б.Н. Головин, Т.М. Горшкова, В.Р. Максимов, Г.М. Матвеев, Л.И. Ручина, В.М. Сергевнина, И.Н. Школьник, О.А. Ломакина. Москва, Всесоюзный НИИ научно-технической информации и экономики промышленности строительных материалов (ВНИИЭСМ) Минстройматериалов СССР. 1981. – 223с. 10) Д.С. Лотте. Изменение значений слов как средство образования научно-технических терминов. //Изв. АН СССР. Отделение технических наук. 1940, №6,с.73-90. 11) Д.С. Лотте. Некоторые принципиальные вопросы отбора и построения научно-технических терминов//Изв. АН СССР. Отделение технических наук. 1940, №7, с.79-98. 12) Русская грамматика (в 2-х томах). -М.:Наука, 1980. Том 2:Синтаксис. – 709с. 13) А.И. Смирницкий. Лексикология английского языка. -М.: Изд-во лит-ры на иностр. языках, 1956. – 260с. 14) А.И Смирницкий. Синтаксис английского языка. Изд. 3-е. -М.: URSS. 2009. – 296с. 15) Э. Сэпир. Язык: Введение в изучение речи. -М.-Л.:Соцэкгиз, 1934. – 223с. 16) В.Л. Уорф. Отношение норм поведения и мышления к языку//Новое в лингвистике. 1960. -Вып. I, с. 135-169. (Перев. с англ.) 17) Ч. Филлмор. Дело о падеже//Новое в зарубежной лингвистике.-1980. –Вып. 10: Лингвистическая семантика, с.69-495. (Перев. с англ.) 18) С.А. Чаплыгин, Д.С. Лотте. Задачи и методы работы по упорядочению технической терминологии. -Изв. АН СССР. Отделение технических наук, 1937, с. 867-883. 19) http://en.wikipedia.org/wiki/Categories_(Aristotle) 20) Ch.C Fries. The structure of English: An Introduction to the Construction of English Sentences. –New York, 1952. 21) Charles J. Sippl and Charles P. Sippl. Computer dictionary and handbook. Howard W. Sams & Co.,Inc. The Bobbs-Merrill Co.,Inc., Indianapolis, Kansas City, New York, 1972.– 778p. 17