Е.Ф.Скороходько, проф.
НЕОНІМИ В АНГЛОМОВНОМУ НАУКОВОМУ ТЕКСТІ
Розглядаються неоніми в аспекті їхнього походження, структури, вживання та розподілу в науковому тексті.
Лексичний компонент наукового тексту справедливо асоціюється перeдусім з фаховим терміном. Термін є головним структуротвірним чинником наукового тексту. Саме термін несе інформацію, заради якої створено статтю чи моноґрафію. Звідси випливають і кількісні показники: на 100 слів тексту часто припадає до 30-35 термінів.
Проте існують мовні одиниці, які попри свою нечисленність, відіграють у науковому тексті неабияку роль. Йдеться про неоніми – слова чи словосполуки, які сконструював автор тексту, щоб дати назву щойно запропонованому поняттю [3].
Поняття, що зустрічаються в науковому тексті, можна класифікувати за двома ознаками: усталеністю та наявністю імені. Це дає три катеґорії понять (табл.1).
Таблиця 1
Типи понять у науковому тексті
Катеґорія
|
Усталеність
|
Ім'я
|
Загальновживане поняття
|
+
|
+
|
Іменоване нове поняття
|
—
|
+
|
Неіменоване нове поняття
|
—
|
—
|
Нове тут назване поняття, вперше використане у досліджуваному тексті. Його необхідними формальними ознаками є наявність дефініції у тексті та відсутність такої у фахових словниках. Проте ці ознаки не є достатніми. З одного боку, авторам наукових текстів часто доводиться уточнювати, в якому саме значенні вони використовують той чи інший багатозначний термін, з другого – лексикографічні джерела, як правило, взагалі не фіксують вузькоспеціальних та рідко вживаних понять. Іменем загальновживаного поняття є термін, іменованого нового – неонім. Мовним вираженням неіменованого нового поняття є опис. На відміну від терміна (і термінологічного неологізму, зокрема) неонім, як ім'я щойно введеного поняття, не є усталеною мовною одиницею. Він вживається лише автором.
За формою неоніми найчастіше є складними словами або словосполуками. Мовні одиниці, утворені ланцюжком іменникових основ (N+N, N+N+N тощо) тут зараховано до складних слів, незалежно від їхнього оформлення [7]. Структурну чи семантичну різницю між термінами типу database та knowledge base не можна вважати релевантною. Тому терміни типу decision trellis, event association, chain density vector, knowledge discovery tool, version-space split-merge algorithm кваліфікуємо як складні слова. Серед словосполук трапляються прикметникові та прийменникові форми: extensional database, lexical chainer, set of concept hierarchies, color variance of adjacent pixels.
Одиницю, в якій іменникову основу заступає словосполука, умовно назвімо синтаксичним складним словом. Наприклад, базою неоніма elastic graph dynamic link model є складне слово graph link model. Кожний з двох перших його компонентів розгорнуто у словосполуку за рахунок прикметникових означень elastic та dynamic. Утворені словосполуки зайняли місця іменникових основ. Структуру цього неоніма можна зобразити так: elastic graph dynamic link model
Подібно утворено неоніми high level personal concept < (high level) + (personal concept), stroke spatial character recognition < stroke + ((spatial character) + recognition), divide and conquer optimization < (divide and conquer) + optimization. Такі одиниці поширені також у термінології.
Ще один тип багатокомпонентних одиниць, типових як для наукової термінології, так і, особливо, для неонімів, можна умовно назвати комплексною словосполукою. Це – словосполука, один із компонентів якої є синтаксичним складним словом. Наприклад, словосполука intelligent environment перетворюється на комплексну внаслідок розгортання іменника environment у синтаксичне складне слово (environment development environment agent-based development environment):
intelligent agent-based development environment
Зрідка зустрічаються також однослівні неоніми. Найчастіше вони є результатом семантичного термінотворення: прототипом неоніма correlation “рівняння, що моделює теплопередавання на стику метал/ливарна форма (ливарне виробництво)” слугував статистичний термін correlation “міра зв'язку між змінними”: skeleton “середня вісь (в аналізі зображень)” є трансформом слова skeleton “кістяк”.
Переосмислення зазнають і компоненти неонімів. Template у неонімі translation template означає не так шаблон, як узагальнену схему відповідності між одиницями двох мов, в якій конкретні компоненти цих одиниць (наприклад, афікси) замінено певними змінними величинами.
В поодиноких випадках неоніми виникли завдяки нестандартним штучним операціям. Наприклад, С.Фредкін створив модель пошуку інформації, в якій використано деревовидну структуру (tree). Цій моделі він дав назву trie. Нове слово є фрагментом кореневої морфеми іменника retrieval (< retrieve < ME retreven < MF retrouver). Для відрізнення в усному спілкуванні від терміна теорії графів tree [tri:] автор неоніма запропонував вимовляти його як try [6].
Неоніми структурно складніші за нотоніми (імена відомих понять). Найпростіший показник структурної складності мовної одиниці її лексична довжина S, тобто кількість компонентів (основ повнозначних частин мови, що входять до її складу). Якщо серед нотонімів кількісно переважають двокомпонентні терміни типу database, canonical representation, data structure, domain knowledge, то серед неонімів – трикомпонентні (member-linked similarity, negatively significant event, set of concept hierarchies тощо). На друге місце серед нотонімів виходять однокомпонентні терміни, серед неонімів – чотирикомпонентні (табл. 2).
Таблиця 2
Розподіл нотонімів та неонімів за лексичною довжиною
Кількість
компонентів
|
Кількість нотонімів, %
|
Накопичена кількість нотонімів, %
|
Кількість неонімів, %
|
Накопичена кількість неонімів, %
|
1
|
36,6
|
36,6
|
1,6
|
1,7
|
2
|
44,5
|
81,1
|
25,0
|
26,6
|
3
|
14,3
|
95,4
|
31,7
|
58,3
|
4
|
3,1
|
98,5
|
28,3
|
86,7
|
5
|
1,5
|
100,0
|
6,7
|
93,3
|
6
|
0,0
|
100,0
|
6,7
|
100,0
|
Різниця між лексичною довжиною нотонімів та неонімів в усіх випадках є статистично значущою. Ймовірність помилки не перевищує 1-2%, а для трикомпонентних одиниць – 0,02%.
Мал.1. Лексична довжина нотонімів та неонімів
На мал.1 в узагальненому вигляді представлено співвідношення кількості неонімів та нотонімів різної довжини.
Ці дані цілком узгоджується із виявленою раніше закономірністю – позитивною кореляцією між структурною та семантичною складністю мовної одиниці [4]. Неонім є іменем нового поняття, вперше використаного у тексті. Таке поняття є похідним від деяких інших. Наприклад, автор пропонує новий метод автоматичного реферування та пошуку текстів, якому він дав назву unified mental annotation and retrieval tool. Відповідне поняття визначається через відомі поняття “hybrid information retrieval system”, “semantic category scheme”, “clustering information”, “semantic relation” тощо, тобто є похідним від цих останніх. Оскільки перелічені поняття входять до складу поняття “unified mental annotation and retrieval tool”, вони простіші за нього. Відтак значення неоніма unified mental annotation and retrieval tool містить значення термінів-нотонімів hybrid information retrieval system, semantic category scheme тощо в якості семантичних складників. Тому неонім семантично складніший за нотоніми.
Структурна складність переважної більшості неонімів призводить до того, що вони часто мають паралельні абревіатурні (ініціального чи складноскороченого типу) або абревіатурно-символьні форми: adaptive edge enhancement > AEE, color variance of adjacent pixels > CVAP, high level personal concept > HLPC, knowledge-rich database > KRDB, residual analysis and recursive partitioning > RAP (звідки – RAP pattern discovery), rule induction two in one > RITIO), median order statistic filter > MedOSF, report generation tool > REGENT, mining strong multiple-level association rules > Ml_.
Найчастіше неоніми зустрічаються у теоретичних статтях в царині сучасних напрямів, яким притаманний інтенсивний розвиток (новітні інформаційні технології, штучний інтелект, аерокосмічні дослідження тощо). Було обстежено 56 наукових статей, присвячених штучному інтелекту (інформаційному пошуку; видобуванню знань із бази даних; комп'ютерному аналізу, розпізнаванню та опрацюванню зображень; проектуванню мультимедійних систем) в журналах Information Systems, IEEE Transactions on Knowledge and Data Engineering, IEEE Transactions on Pattern Analysis and Machine Intelligence, International Journal of Pattern Recognition and Artificial Intelligence) і 10 статей з матеріалознавства та обробки металу в журналах Transactions of the ASME. Journal of Engineering Materials and Technology та Metallurgical and Materials Transactions за 1994-2003 роки.
У першій групі 23 статті (41%) містять неоніми. Серед них на статтю припадає в середньому 2,8 неоніма (табл. 3).
Таблиця 3
Розподіл неонімів за статтями
Кількість неонімів
|
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
Кількість статей
|
11
|
4
|
2
|
1
|
0
|
2
|
1
|
2
|
У другій групі тільки одна стаття містить неонім. Ймовірність того, що спостережена різниця є випадковою, складає 0,86%. Це підтверджує тезу про активніше створення неонімів саме в новітних галузях знання.
Неонім виражає поняття, що є результатом певного розумового процесу. Останній полягає у формуванні нового знання – нової теорії, концепції, нового методу, класу приладів тощо. Найчастіше саме ознайомлення читача з цим новим знанням, мовним втіленням якого є неонім, становить глобальну мету автора тексту. Такі неоніми назвемо цільовими. В окремих випадках автор вводить ще й похідні від цього поняття. Наприклад, розв'язуючи проблему адекватного формулювання запитів до бази даних, автор пропонує спеціальну формальну систему, названу ним conceptual query language (CQL). Опис цієї системи – головне комунікативне завдання автора тексту. Отже, conceptual query language – це цільовий неонім. Крім нього, автор вводить похідні неоніми, які позначають компоненти запропонованої системи: CQL input form, CQL query, CQL query processing archtecture, CQL syntax. Нарешті, третю групу неонімів складають назви понять, які відіграють допоміжну роль у розв'язанні центральної проблеми, що стоїть перед автором. Як правило, це нові прийоми, інструмент дослідження тощо. Відповідні неоніми назвемо підпорядкованими. Кількісне співвідношення одиниць цих трьох груп таке: цільові неоніми – 48,4%, похідні – 17,2%, підпорядковані – 34,4%.
Частина неонімів так і залишається оказіональними авторськими утвореннями, але деякі набувають більшого поширення і отримують статус термінологічних неологізмів, згодом загальноприйнятих стандартних термінів.
Наприклад, у 1964 році Х.Блум запропонував новий метод автоматичного аналізу зображень (виявлення “скелету” зображення) [8]. Він назвав його medial axis transformation (MAT). Цей метод було схвально прийнято, за минулі роки з'явилася низка послідовників Блума. Завдяки цьому назва методу успішно подолала шлях від неоніма до широковживаного терміна.
У 1958 році Дж.МакКарті вперше вводить поняття автоматичного керування комп'ютерною пам’яттю і пропонує відповідний неонім: garbage collection [14]. Згодом (близько 1976 року) завдяки І.У.Дікстрі та іншим з'явилися похідні неоніми на позначення компонентів системи автоматичне керування пам’яттю – mutator та collector [10]. Зараз всі ці неоніми перетворилися на широковживані терміни, зафіксовані у словниках. Це стосується також колишнього неоніма trie.
До неонімів, які згодом отримали статус термінів, належать також buildup area building extraction – модель виявлення контурів будинків в автоматичному аналізі зображень [15]; embedded zerotree wavelet image compression algorithm – алгоритм компресії зображень [17]; localized radial basis function – метод непараметричного описування орґанізації даних [16]; negation as failure – принцип, згідно з яким неможливість логічного виведення певних фактів вважається їхнім запереченням [9]; self-organizing map – спеціальний тип алгоритму кластеризації [11]; snake – модель виявлення контурів обличчя в автоматичному аналізі зображень [13] тощо. Серед колишніх неонімів є широковживані терміни: neural network “нейронна сітка”, data mining “видобування знань із бази даних”, decision tree “модель прийняття рішень, яка використовує деревовидну структуру”, classification tree “метод класифікації об'єктів, у якому приналежність об'єкта до певного класу визначається вимірюванням значень незалежної змінної” тощо.
Якщо базова термінологія галузей, пов'язаних із повсякденним життям людини (будівництвом, тваринництвом, частково ливарництвом, металургією, гідромеліорацією тощо), має корені у ремісничій лексиці [1; 2], то у новітних галузях знання, в яких переважає інтелектуальний складник, шлях утворення термінів починається здебільшого від неонімів: неонім → неологізм → “стихійний” термін → загальноприйнятий (стандартизований) термін.
Неоніми займають помітне місце у структурі наукового тексту. На мал.2 зображено типовий розподіл термінологічного складу наукової статті. Спеціальні терміни розбито на чотири групи: D – індикативні маркери (терміни з широким значенням, що виражають базові поняття відповідної галузі знання: data mining, machine learning тощо), U – немаркерні терміни (decision tree, directed acyclic graph тощо), F – інформативні маркери (терміни, що виражають складні вузькоспеціальні поняття: conditional independence statement, context specific independence тощо) та N – неоніми [5]. Середня семантична складність термінів цих груп збільшується в переліченому порядку.
Рис.2. Розподіл термінологічного складу наукової статті
На осі X показана відстань речення від початку тексту у відсотках до загальної кількості речень у тексті (Dist), на осі Y – місце першого, останнього та центрального входження (вживання) термінів відповідної групи (перша та друга вертикальні риски, маленький прямокутничок). Більший прямокутник позначає фрагмент тексту, який охоплює 50% входжень цих термінів, що прилягають до центрального входження. Зірочки позначають входження, відірвані від головного масиву відповідних термінів. Вертикальні пунктирні лінії відокремлюють центральні розділи тексту від вступу та підсумків.
Різниця в локалізації перших та останніх входжень термінів всіх чотирьох груп практично відсутня, проте 50-відсоткові відрізки та особливо центральні входження виявляють чітку тенденцію до збільшення відстані від початку тексту із збільшенням семантичної складності мовної одиниці. Ймовірність похибки не перевищує 3,62%. Це свідчить, по-перше, що у тексті реалізовано комунікативну стратегію поступового ускладнення [5], по-друге, що неоніми, як мовні одиниці з великим інформативним потенціалом, тяжіють до прикінцевих фрагментів центральних розділів тексту.
Рис.3. Термінологічна щільність тексту
Аналіз термінологічної щільності також переконує у цьому: з віддаленням від початку тексту зменшується частота семантично простих термінів і збільшується частота складніших термінів (мал.3). Ламана лінія відбиває фактичні дані (кількість термінів відповідної групи на відрізок тексту, який охоплює 5% речень), крива – апроксимацію за методом найменших квадратів, пряма – лінійну апроксимацію, яка ілюструє загальну тенденцію зміни частоти. Найбільш стрімким є зростання частоти цільових та похідних неонімів.
Таким чином, можна констатувати, що неоніми (передусім цільові та похідні) займають чільні місця як у коґнітивній, так і в комунікативній структурах тексту. Решта термінів підпорядковані неонімам, допомагаючи їм передати ту інформацію, заради якої створено текст.
1. Гринев С. В. Введение в терминоведение. М., 1993. 310 с. 2. Малевич Л. Д. Особливості української термінології донаукового періоду // Мовознавство. 1999. № 4-5. С.51-58. 3. Скороходько Е. Ф. Терміни, що виражають нові знання, у структурі англомовних наукових текстів // Вісник Харківського національного університету. № 471. Іноземна філологія на межі тисячоліть. Х., 2000. С.235-240. 4. Скороходько Е. Ф. Сіткове моделюваня лексики: лінгвістична інтерпретація параметрів семантичної складності // Мовознавство. 1995. № 6. С.19-28. 5. Скороходько Е. Ф. Термін як репрезентант комунікативної стратегії побудови наукового тексту // Мовні і концептуальні картини світу. № 6. Книга 2. К., 2002. С.204-210. 6. Allerton P. A Trie Compaction Algorithm for a Large Set of Keys // IEEE Transactions on Knowledge and Data Engineering. Vol.8. Number 3. June 1996. P.476. 7. Bauer L. English word formation. Cambridge University Press, 1983/1996. 312 p. 8. Blum H. A transformation for extracting new descriptors of shape // Symp. on models for perceptron of speech and visual form. Cambridge: MIT Press, 1964. P.62-380. 9. Clark K. L. Negation as Failure. Logic and Databases. H.Gaillare and J.Minaker, eds. New York: Plenum Press, 1978. 10. Dijkstra E.W. et al. On-the-fly Garbage Collection: An Exercise in Cooperation. 1976. 11. Kohonen T. Self-Organizing Map. Berlin, Springer: 1995. 12. Lee R.S.T. An Intelligent Multiagent Based Facial Authentication System. International Journal of Pattern Recognition and Artificial Intelligence. Vol.16. No.4. 2002. P.481-500. 13. McCarthy J. Recursive functions of symbolic expressions and their computation by machine. 1960. 14. McKeon D.M. Toward automatic cartographic feature extraction // Mapping and Spatial modelling for Navigation. Ed. L.F.Pau. NATO ASI Series. Vol. F65: Springer Verlag. 1990. P.149-180. 15. Moody J. and Darken C.J. Fast Learning in Networks of Locally-Tuned Processing Units. Neural Computation. Vol.1. No.2. 1989. P.281-294. 16. Shapiro J.M. Embedded image coding using zerotrees of wavelet coefficients. IEEE Trans. Sygn. Process. No.12. 1993. P.3345-3462.
Neonyms, i.e. names of newly coined concepts are discussed along the following lines: their origin, structure, circulation, and distribution in the text.
Достарыңызбен бөлісу: |