імені Івана Франка
СТАТИСТИЧНА СТРУКТУРА ЛЕКСИКО-СЕМАНТИЧНИХ ПОЛІВ ДІЄСЛОВА В АВТОРСЬКИХ ТЕКСТАХ АНГЛОМОВНОЇ ПРОЗИ
Вивчено закономірності частотного розподілу лексико-семантичних полів (ЛСП) дієслів у текстах англійської художньої прози (приблизно 10 000 художніх творів). Проведено порівняльний аналіз такого розподілу в текстах різних авторів. Уведено квантитативно-частотне визначення ядра, близької та віддаленої периферії ЛСП. Показано, що константи запропонованого структурного поділу не залежать від кількісного та якісного складу ЛСП і характеризують системну організацію ЛСП дієслів. Виявлено область авторських ідіолектів в структурі ЛСП. Показано, що спектр маркерів авторського ідіолекта зміщений в область низькочастотної периферії ЛСП.
Ключові слова: семантичне поле, частота лексем, авторський стиль.
Словниковий склад сучасної англійської мови розглядається як система лексичних одиниць, зв’язаних одна з одною через приналежність до певних класів слів. Кожна лексична одиниця, будучи самостійною, характеризується певними відношеннями з іншими одиницями одного та різних з нею рівнів мовної структури [5, с.4]. У межах лексичного рівня семантичні відношення його складових прослідковуються в різних аспектах: дериваційному, епідигматичному, синтагматичному та парадигматичному. Кожний із вказаних аспектів може стати основою опису словникового складу мови. Одним з найтиповіших виявів системності лексики є семантичні угрупування слів, зокрема лексико-семантичні парадигми. Лексико-семантична парадигма – це сукупність лексичних одиниць, об’єднаних тотожністю семантичних ознак одного рангу, що відрізняються одна від одної індивідуальними уточнюючими ознаками. Такі парадигми бувають одно- та різноранговими, і, відповідно, утворюють горизонтальні та вертикальні ієрархічні структури. Однорангові парадигми утворюють єдиний лексико-семантичний рівень, різнорангові визначають глибину ієрархії та кількість рангів.
Лексико-семантичне поле (ЛСП) є сукупністю лексем, які об’єднані спільністю вираження одного поняття. Саме це поняття і є основою інтеграції слів у поле [5, с.4]. Лексеми, у смисловій структурі яких домінуюче положення займає ознака, що збігається з поняттям, інтегруючим поле, утворює його ядро. Лексеми, які містять дану ознаку опосередковано через субординативні компоненти відносяться до периферії поля. В основі лексико-семантичних полів лежать лексичні семи загального характеру, які можуть бути названими категоріально-лексичними [8, с.7]. Характер категоріально-лексичної семи визначає склад можливих диференційних ознак, які можуть бути представлені в словах одного ЛСП. В результаті слова одного ЛСП можуть бути пов’язані одне з одним не тільки за категоріально-лексичною семою, але і за уточнюючими її диференційними ознаками. Семантичні зв’язки уточнення є фундаментальними для семної структури слів і надають структурі ЛСП ієрархічний характер [8, с.9]. Недоліком досліджень, матеріалом яких існує той чи інший фрагмент лексики у вигляді певної семантичної області, є довільність у визначенні об’єму та меж цієї семантичної області. Цього недоліку легко уникнути при аналізі великих масивів невпорядкованої лексики, наприклад, суцільного списку слів. Порядок здійснення аналізу чергується таким чином, щоб забезпечити послідовний перехід від дефініції значення лексико-семантичного інваріанта до представлення його у вигляді набору сем та релем з наступною інтеграцією лесико-семантичних парадигм [5, с.8]. Лексемний склад ЛСП можна визначати декількома способами [6, c.20]: 1) ЛСП виділяється на основі загального поняття, що виражене словами ЛСП. Дослідник логічно розчленяє дійсність, яка його оточує і класифікує лексичні одиниці відповідно до виявлених ділянок дійсності. 2) ЛСП виділяють на основі певного слова (чи групи слів). За словником синонімів визначають набір синонімічних йому одиниць. Для попереднього визначення складу ЛСП використовують також суб’єктивний мовний досвід дослідника. Далі кожне з слів утвореної таким шляхом групи перевіряється у тлумачному словнику. Для кожного слова виписуються дефініції з декількох тлумачних словників. Компонентний аналіз дозволяє виявити лексичні одиниці, які мають хоча б одну спільну для даного ЛСП сему. Ці одиниці складають ЛСП. 3) ЛСП можна виділяти на основі статистичних даних про сумісну рекурентність слів у тексті, тобто про їх дистрибуцію. Чим більше випадків сумісного зустрічання слів, тим, відповідно, ці слова тісніше між собою пов’язані і можуть бути об’єднані в одне ЛСП. Даний метод називається дистрибутивно-статистичним. 4) ЛСП можна виділяти спираючись на дані асоціативного експерименту, які отримані у результаті опитування інформантів, тобто носіїв мови. Учасникам експерименту надаються слова, на кожне з яких в обмежений відрізок часу необхідно дати слова-реакцію. В ЛСП об’єднуються найбільш частотні слова-реакції.
Перспективними для вивчення закономірностей, що притаманні семантичним полям, є методи квантитативно-системного дослідження лексики [1,2,7,10,11,12,13,14,17]. В останніх широке застосування знаходять методи математичної статистики. Семантичним полям властива визначена кількість та певний ранговий розподіл лексем з відповідними частотними закономірностями [10,11,12]. Частотний розподіл лексем можна використати також для вивчення групових зв’язків між лексемами в рамках одного семантичного поля .
У даній статті методами комп’ютерного аналізу досліджуються закономірності статистичного розподілу семантичних полів дієслів у текстах англійської художньої прози та проводиться порівняльний аналіз частотного спектра ЛСП в авторських текстах різних авторів. Для аналізу було використано електронну текстову вибірку англійської художньої прози загальним обсягом біля 800 млн. слів, яка налічує приблизно 10 000 художніх творів 1000 різних авторів. Дана текстова вибірка розглядається як лінгвостилістична норма [3, с.12] для порівняльного аналізу частотного розподілу ЛСП дієслів в авторських текстах. Для аналізу частотного розподілу ЛСП дієслів в авторських текстах було вибрано твори А.Конан Дойля (33 твори), Дж.Лондона (38 творів), Г.Уелса (26 творів), Ч.Дікенса (52 твори), М.Твена (44 твори), О.Уайльда (18 творів). Авторський стиль цих письменників характеризується художньо-стилістичною виразністю та неповторністю. Загальний об’єм вибірки авторських текстів рівний близько 15 млн. слів.
Теорії поділу дієслів на лексико-семантичні поля та групи присвячено ряд публікацій. Різними авторами пропонуються різні підходи до формування лексико-семантичних полів та їхнього складу [5, 6, 8, 15, 16]. За основу для формування ЛСП дієслів вибрано класифікацію дієслів, запропоновану науковцями Прінстонського університету (США) ( G.A.Miller, C.Fellbaum, R.Tengi та ін.) і описану в мережі Інтернет [http://www.cogsci.princeton.edu/~wn]. Дана класифікація покладена в основу семантичного поділу дєслів в електронному тезаурусі WordNet. Нами розглянуто наступні ЛСП дієслів:
-
Дієслова активності тіла та догляду за тілом. Sweat, shiver, faint, ache, tire, sleep, freeze, snort, wink, wash, dress. (приблизно 300 лексем).
-
Дієслова зміни. Сhange, alter, vary, modify, adjust, conform, adapt. (близько 750 лексем).
-
Дієслова пізнання. Reason, judge, learn, memorize, understand, deduce, induce, infer, guess, assume, suppose…( приблизно 350 лексем).
-
Дієслова комунікації. Thank, appeal, quiz, plead, telex. (приблизно 700 лексем).
-
Дієслова боротьби, змагань. Face-off, run-off, handicap, arm, team, campaign, duel, fight, race. (приблизно 200 лексем).
-
Дієслова споживання. Drink, eat. (приблизно 130 лексем).
-
Дієслова контакту. Cover, cut, touch, stroke, hit, poke, elbow, finger, thumb. (приблизно 850 лексем).
-
Дієслова творення. Invent, conceive, engrave, weave, sew, bake... (приблизно 250 лексем).
-
Дієслова почуттів. Fear, miss, adore, love, despise, amuse, charm, encourage, anger (приблизно 250 лексем).
-
Дієслова руху. Move, travel, crawl, gallop, swim. (приблизно 500 лексем).
-
Дієслова чуттєвого сприйняття. Watch, spy, survey, witness, discover, gaze, stare, sniff, whiff, reek, stink, hurt, prickle, tingle, tickle, scratch. (приблизно 200 лексем).
-
Дієслова володіння, передачі, отримування. Have, hold, own, give, transfer, take, receive, bequeath, will, inherit, rob, loot, confer, beg, bribe, peddle, scalp, retail. (приблизно 300 лексем).
-
Дієслова соціальної взаємодії. Impeach, court-martial, franchise, gerrymander, excommunicate, petition, quarrel, veto. (приблизно 400 лексем).
-
Дієслова стану, буття, володіння. Cross, reach, surround, equal, suffice, necessiate, differ, lack, obviate, cover, require. (приблизно 200 лексем).
-
Дієслова погоди. Thunder, rain, snow, hail. (приблизно 70 лексем).
Далі на графіках замість повних назв ЛСП вказано їхні порядкові номери.
Для проведення досліджень, лексемний склад описаних вище ЛСП сформований шляхом використання словникових дефініцій тлумачних словників [4, 18, 19, 20], електронних тезаурусів мережі Інтернет [http://thesaurus.reference.com, http://www.dict.org], електронного тезауруса WordNet. Загальний список отриманих неозначених форм дієслів налічує близько 5000 лексем. Крім того, до складу ЛСП були включені форми дієслів для третьої особи однини, для минулого часу та дієприкметників минулого часу, для дієприкметників теперішнього часу і/або герундію. Отже, загальний об’єм дієслів, що входять у досліджувані ЛСП рівний близько 20000 лексем.
У великих масивах текстів появу певного слова в заданому місці можна вважати випадковою подією. Ймовірність такої випадкової події приймається приблизно рівною частоті цієї події, тобто відношенню числа заданих слів до числа всіх слів, які складають даний текст. Текстову частоту j-ї лексеми будемо обраховувати за наступною формулою:
(1)
де nj – кількість появ лексеми j у текстовій вибірці, яка містить загальну кількість лексем Ntext. Ймовірність того, що випадково зустрінута у тексті лексема відноситься до ЛСП f рівна сумі частот лексем, які належать до даного поля f
(2)
де Nf - кількість лексем у полі f.
Очевидним є те, що до розгляду залучено не всі дієслова англійської мови, а лише певну їх частину, тому доцільною буде характеристика частоти лексем певного ЛСП f у спектрі розглянутих ЛСП, яку можна оцінити за формулою
(3)
де Nsf - кількість розглянутих семантичних полів.
Величина Psf характеризує частоту того, що випадково зустрінута у тексті лексема відноситься до поля f, при умові, що ця лексема належить до досліджуваного спектра дієслів. Очевидно, що сума Psf за всіма семантичними полями рівна одиниці. Сукупність величин Psf характеризує частотну структуру розподілу ЛСП дієслів у текстах англомовної художньої прози.
Виявлені у текстах дієслова були поділені за семантичними полями і розміщені в порядку спадання текстової частоти в межах кожного семантичного поля. На рис.1 наведено розрахований розподіл частот Psf для досліджуваних ЛСП дієслів. Неоднорідність частотної струкури ЛСП зумовлена різною текстовою частотою вживання лексем різних ЛСП.
Рис.1 Структура лексико-семантичних полів дієслів у текстах
англомовної художньої прози. (По осі аргументів відкладено індекси ЛСП, а по осі значень - частоти Psf, розраховані за формулою (3))
Для дослідження внутрішньої структури ЛСП, як приклад, було розглянуто семантичне поле дієслів на позначення комунікації, яке налічує приблизно 700 лексем. Слова даного семантичного поля розташуємо в порядку зменшення ймовірності їх появи. Номер i слова у такій послідовності визначає ранг даної лексеми у частотній стуктурі семантичного поля. Досліджуване семантичне поле характеризується дискретною функцією, яка виражає залежність ймовірності i лексеми від рангу і. Така монотонна складна функція Р(і), яка апроксимує цю залежність, називається частотною кривою [18, с.3]. Оскільки для дослідження структури семантичного поля важлива не частота лексеми у сукупній вибірці, а частота лексеми в межах досліджуваного поля, то частоту лексеми приймемо рівною:
(4)
де Pfj – частота j-ї лексеми в семантичному полі, ni – кількість випадків і-ї лексеми в тексті. Розраховану частотну криву для ЛСП дієслів комунікації приведено на рис.2.
Рис.2 Частотна крива розподілу лексем в семантичному полі дієслів на позначення комунікації. (По осі аргументів відкладено індекси лексем в спадному частотному ряді ЛСП, а по осі значень - частоти Pfj )
Як випливає з характеру отриманої залежності (рис.2) перші лексеми поля займають значну частину частотної області ЛСП тим самим формуючи визначені межі ядра ЛСП. Аналіз словникових дефініцій виявлених лексем показав, що до високочастотних лексем входять семи загального характеру, а низькочастотні лексеми складаються із сем уточнюючого та диференційного характеру. Отже, встановлено зв’язок між текстовою частотою лексем та їхньою належністю до ядра чи периферії ЛСП: сукупність високочастотних лексем утворює ядро лесико-семантичного поля, а низькочастотні лексеми відносяться до периферії ЛСП. Введемо квантитативно-частотне визначення ядра та периферії ЛСП. Будемо вважати, що ядро ЛСП утворюють лексеми, сумарна частота яких не менша 0,5. Іншими словами, сумарне вживання лексем ядра ЛСП в текстах становить 50% від усіх лексем даного ЛСП. Наближеною периферією будемо вважати лексеми, на які припадають наступні 40% вживань у текстах лексем даного поля, і віддаленою периферією будемо вважати лексеми ЛСП, на які припадають останні 10% вживань у текстах. Причому лексеми для ядра, наближеної та віддаленої периферії послідовно лежать в частотному ряді ЛСП в порядку спадання частоти. Тобто вісь аргументів ОХ на рис.2 можна поділити двома точками на три частотні ділянки – ядро, близька периферія, віддалена периферія. Оскільки різні ЛСП містять різну кількість лексем, то доцільно ввести нову змінну, яка б чисельно характеризувала семантичну відстань лексеми до ядра ЛСП за аналогією з [4]. Якщо вважати, що семантичні відстані лексем у спадаючому частотному ряді ЛСП змінюються від 0 до 1 незалежно від кількості лексем у ЛСП, тоді семантичну відстань Sj j-ї лексеми від ядра ЛСП можна оцінити наступним виразом:
(5)
де j – ранг лексеми, Nf – кількість лексем у ЛСП. Тобто першій лексемі частотного ряду ЛСП відповідає значення 0, а останній значення 1. Для того, щоб знайти величину S0.5, яка ділить вісь рангів частотної кривої на ядро та периферію, небхідно ров’язати рівняння
(6)
де к0.5 – ранг останньої лексеми в початковій частині спадного за частотами ряду лексем, для якої сума частот лексем рівна 0.5. Аналогічне рівняння необхідно розв’язати для знаходження величини S0.9, яка розділяє вісь рангів лексем на близьку та віддалену периферію семантичного поля. У результаті проведеного розв’язку рівняння (6) для всіх розглянутих ЛСП встановлено, що межа розділу ядра та наближеної периферії характеризується величиною
S0.5= 0.05 ± 0.02 (7)
а межа розділу наближеної та віддаленої периферії ЛСП характеризується величиною
S0.9 = 0.3 ± 0.1 (8)
Лексеми спадаючого частотного ряду ЛСП, для яких Sj<0.05 становлять не менше 50% всіх вживань лексем даного ЛСП; лексеми, для яких Sj<0.3 становлять не менше 90% всіх вживань і лексеми, для яких Sj>0.3 становлять не більше 10% всіх вживань лексем даного ЛСП. Значення (7) (8) отримані шляхом усереднення величин отриманих для частотного розподілу розглянутих 15 семантичних полів дієслів у текстах художньої прози. У межах отриманої точності, дані величини не залежать від кількісного та якісного складу ЛСП і є константами системної організації лексем в ЛСП дієслів поряд із константою закону Ципфа [17, c.3] для частотного розподілу.
Розглянемо розподіл лексем в ЛСП дієслів на позначення комунікації в авторських текстах художньої прози. Для порівняльного аналізу вибрано тексти Дж.Лондона, М.Твена, О.Уайльда. Для побудови частотних кривих (рис.3, 4) виберемо вісь аргументів ОХ, сформовану для частотної кривої даного ЛСП у нормі, яку усереднено за текстами усіх авторів. По цій осі відкладено ранги лексем в порядку спадання текстової частоти для вибірки текстів лінгвостилістичної норми, частотну криву якої наведено на рис.2. По осі значень ОY відкладено значення частот лексем Pfj в ЛСП, розраховані за формулою (4).
Рис.3 Високочастотна область частотної кривої Pfj (j) розподілу лексем ЛСП дієслів на позначення комунікації в авторских текстах Дж.Лондона (крива 1), М.Твена (крива 2), О.Уайльда (крива 3)
Рис.4 Середньочастотна область частотної кривої Pfj (j) розподілу лексем ЛСП дієслів на позначення комунікації в авторских текстах Дж.Лондона (крива 1), М.Твена (крива 2), О.Уайльда (крива 3)
Як випливає з характеру отриманих кривих (рис.3, 4), частоти деяких лексем в авторських текстах суттєво відрізняються від їх частот у лінгвостилістичній нормі (рис.2). Одна з можливих причин такої відмінності зумовлена авторським стилем та розходженнями в авторських ідіолектах. В області середньочастотних рангів лексем розкид частот лексем для різних авторів є суттєвішим, ніж в області високочастотних рангів. Ці результати надають експериментальне обгрунтування припущенню, що спектр лексем авторського стилю зміщений в область низькочастотних рангів, тобто в область периферії ЛСП.
Розгляньмо розподіл дієслів у всіх досліджуваних ЛСП. На рис.5 розрахована частотна структура розподілу дієслів за ЛСП у текстах різних авторів. По осі аргументів відкладено індекси ЛСП, а по осі значень - частоти Psf, розраховані за формулою (3). У рамках кожного ЛСП відображено шість стовпців, які відображають частотний вклад даного ЛСП для текстів шести авторів у такій послідовності: А.Конан Дойл, Ч.Дікенс, Г.Уелс, Д.Лондон, М.Твен, О.Уальд.
Рис.5 Частотна структура ЛСП дієслів в авторських текстах (осі та величини, зображені на гістограмі, описані в тексті).
Суттєвий внесок у частотну структуру ЛСП здійснюють полісемні дієслова, які одночасно входять до складу двох і більше ЛСП. Вилучивши такі дієслова із розгляду отримано уточнену частотну структуру ЛСП (рис.6). Отриманий спектр має більший розкид частот ЛСП за авторами у порівнянні із спектром на рис.5., що зумовлює вищий класифікаційний потенціал щодо авторських стилів.
Рис.6 Частотна структура ЛСП (з вилученими полісемними дієсловами) в авторських текстах.
Для характеристики лексем досліджуваного семантичного поля в авторських текстах уведемо величину Dj, яка показує у скільки разів певна лексема j зустрічається частіше в авторських текстах у порівнянні з текстами лінгвостилістичної норми:
(9)
де Paj - частота лексеми, обрахована за формулою (1) у текстовій вибірці для певного автора; Ptj – частота лексеми в повній текстовій вибірці усіх авторів, тобто в лінгвостилістичній нормі.
На рис.7 наведено гістограму частотної структури ЛСП для текстів різних авторів, при умові, що до складу ЛСП ввійшли дієслова, для яких Dj>2, тобто дієслова, які зустрічаються в авторських текстах в два і більше разів частіше, ніж у текстах лінгвостилістичної норми. Як випливає з характеру отриманої гістограми, розкид частот одного ЛСП для різних авторів є сутєвішим, ніж у попередніх гістограмах (рис.5, 6).
Рис.7 Частотна структура ЛСП дієслів, для яких Dj>2
Спектр частот ЛСП сформованих у такий спосіб є характерним лише для певного автора і суттєво відрізняється від спектрів частот інших авторів. У таблиці 1 наведено приклади лексем різних ЛСП, для яких коефіціент D>1 у текстах трьох авторів: Дж.Лондона, М.Твена, О.Уайльда. Лексеми наведено в порядку спадання величини коефіціента Dj. Для кожної лексеми розраховано величину семантичної відстані Sj та наведено номер ЛСП. Такі лексеми можна вважати маркерами автрських ідіолектів.
Таблиця 1 Лексичні маркери авторського ідіолекта
Г.Уелс
|
Д.Лондон
|
M.Твен
|
Лексема
|
ЛСП
|
Dj
|
Sj
|
Лексема
|
ЛСП
|
Dj
|
Sj
|
Лексема
|
ЛСП
|
Dj
|
Sj
|
muddle
|
7
|
23,3
|
0,56
|
slather
|
7
|
82,8
|
0,88
|
fingerprint
|
8
|
43,6
|
0,76
|
bogey
|
7
|
21,3
|
0,8
|
sled
|
10
|
74,9
|
0,62
|
powwow
|
4
|
23,7
|
0,81
|
obsess
|
9
|
17,4
|
0,87
|
grubstake
|
12
|
73,9
|
0,86
|
shuck
|
2
|
15,6
|
0,56
|
punt
|
7
|
15,5
|
0,62
|
unlash
|
7
|
70,9
|
0,88
|
chaw
|
6
|
12,7
|
0,79
|
gesticulate
|
4
|
15
|
0,6
|
tauten
|
2
|
42,2
|
0,74
|
resurrect
|
1
|
10,9
|
0,77
|
profiteer
|
12
|
13
|
0,79
|
electroplate
|
7
|
34,8
|
0,86
|
splotch
|
7
|
10,3
|
0,8
|
wallpaper
|
7
|
11,8
|
0,78
|
snowshoe
|
10
|
33,9
|
0,76
|
teethe
|
1
|
9,4
|
0,79
|
disentangle
|
7
|
11,5
|
0,62
|
mush
|
10
|
29
|
0,71
|
cowhide
|
7
|
8,7
|
0,76
|
camouflage
|
11
|
11,1
|
0,83
|
bunk
|
12
|
26
|
0,58
|
drowse
|
1
|
8,2
|
0,65
|
whack
|
7
|
10,7
|
0,63
|
doss
|
1
|
25,3
|
0,83
|
swap
|
10
|
7,7
|
0,74
|
clamber
|
10
|
10
|
0,52
|
riffle
|
7
|
24,8
|
0,8
|
cooper
|
8
|
7,5
|
0,43
|
individualize
|
3
|
9,5
|
0,73
|
frazzle
|
1
|
23,2
|
0,84
|
boomerang
|
10
|
7,1
|
0,73
|
impact
|
7
|
8,7
|
0,58
|
resurrect
|
1
|
22,1
|
0,77
|
fart
|
1
|
7
|
0,76
|
attenuate
|
2
|
8,6
|
0,54
|
gouge
|
7
|
22,1
|
0,71
|
lynch
|
13
|
7
|
0,63
|
interlude
|
8
|
8,6
|
0,59
|
hunch
|
10
|
21,1
|
0,67
|
simplify
|
2
|
6,7
|
0,48
|
disconnect
|
7
|
8,3
|
0,6
|
befuddle
|
6
|
19,7
|
0,83
|
whoop
|
4
|
6,7
|
0,53
|
throb
|
11
|
8,3
|
0,57
|
hike
|
10
|
19,7
|
0,76
|
quarantine
|
2
|
6,3
|
0,51
|
unify
|
2
|
8
|
0,56
|
relive
|
3
|
19,4
|
0,78
|
duplicate
|
8
|
6,2
|
0,51
|
goggle
|
11
|
7,9
|
0,75
|
gibber
|
4
|
19,3
|
0,73
|
shovel
|
7
|
6
|
0,46
|
corrugate
|
7
|
7,7
|
0,71
|
prod
|
7
|
18,8
|
0,72
|
roost
|
2
|
5,8
|
0,47
|
superpose
|
7
|
7,7
|
0,77
|
swat
|
7
|
17,5
|
0,81
|
swag
|
10
|
5,8
|
0,71
|
foreshorten
|
2
|
7,4
|
0,62
|
hoodoo
|
14
|
16,5
|
0,9
|
slouch
|
10
|
5,8
|
0,61
|
yelp
|
4
|
7,1
|
0,61
|
clutter
|
2
|
16,4
|
0,61
|
alligator
|
2
|
5,6
|
0,49
|
crescendo
|
2
|
7
|
0,6
|
impact
|
7
|
15,1
|
0,58
|
calendar
|
3
|
5,6
|
0,48
|
readjust
|
2
|
6,9
|
0,56
|
recuperate
|
1
|
15
|
0,74
|
crick
|
1
|
5,5
|
0,74
|
indurate
|
2
|
6,8
|
0,64
|
orate
|
4
|
14,9
|
0,82
|
skip
|
10
|
5,5
|
0,58
|
flare
|
15
|
6,8
|
0,56
|
yelp
|
4
|
14,9
|
0,61
|
starboard
|
10
|
5,5
|
0,6
|
underline
|
4
|
6,6
|
0,77
|
yaw
|
10
|
14,1
|
0,75
|
swelter
|
1
|
5,2
|
0,69
|
slum
|
13
|
6,5
|
0,65
|
disrupt
|
2
|
13,9
|
0,63
|
tally
|
4
|
5,1
|
0,61
|
collide
|
7
|
6,3
|
0,7
|
burgeon
|
2
|
13,8
|
0,69
|
suds
|
7
|
4,8
|
0,74
|
disavow
|
4
|
6,1
|
0,69
|
sunburn
|
1
|
13,7
|
0,67
|
autograph
|
4
|
4,5
|
0,6
|
boo
|
4
|
6
|
0,69
|
sublimate
|
10
|
13,7
|
0,73
|
shred
|
7
|
4,5
|
0,51
|
subserve
|
13
|
5,9
|
0,76
|
clam
|
7
|
13,5
|
0,58
|
drivel
|
1
|
4,4
|
0,75
|
rearrange
|
2
|
5,7
|
0,53
|
collide
|
7
|
13,2
|
0,7
|
solidify
|
2
|
4,4
|
0,58
|
Незбіги частот лексем в авторських текстах частково зумовлені авторським стилем. Для кожного автора характерні свої сукупності лексем, частоти яких суттєво перевищують частоти, узагальнені за повною текстовою базою. Сукупності таких лексем, виявлені за певними семантичними полями у вибірках авторських текстів, можна розглядати як характерні ознаки авторського стилю. Усі лексеми, що характеризують семантичний аспект стилю авторів відносяться до віддаленої периферії за значенням величини Sj.
Ми розрахували середні значення величин Sj лексем, для яких виконуються наступні умови: Dj>1; Dj>2; Dj>4, тобто розглядались лексеми, які в авторських текстах зустрічаються просто частіше, частіше, ніж в два рази та частіше, ніж в чотири рази у порівнянні з текстами лінгвостилістичної норми. В результаті проведених розрахунків отримано наступні значення:
SD>1= 0.39 ±0.14;
SD>2= 0.5±0.15; (10)
SD>4= 0.59±0.12.
Значення отриманих величин усереднені для авторських текстів усіх шести досліджуваних авторів. Дані значення є константами, які характеризують область семантичного поля, у якій розміщений авторський лексикон. У відповідності до запропонованого нами поділу ЛСП, область авторського лексикону дієслів знаходиться у віддаленій периферії ЛСП. Як випливає з (10) із зростанням величини Dj зростає значення Sj, тобто чим частіше лексема зустрічається в текстах автора у порівнянні з лінгвостилістичною нормою, тим далі від ядра ЛСП вона розташована. Аналіз словникових дефініцій авторських лексем показав, що для них характерні уточнюючі диференціюючі спеціалізовані рідковживані семи.
Отже, лексико-семантичні групи дієслів у текстовій вибірці розподілені нерівномірно, утворюючи певну ієрархічну структуру. Розрахований частотний розподіл лексико-семантичних груп дієслів в авторських текстах англомовної художньої прози дає можливість виділити лексико-семантичну структуру авторського ідіолекта. Частоти деяких ЛСП можуть суттєво відрізнятись для різних авторів, що зумовлено незбігами в авторських ідіолектах і є лінгвістилістичною характеристикою авторських текстів. Найбільшим класифікаційним потенціалом володіє частотний розподіл ЛСП, котрі формують дієслова, для яких відношення частот лексем в авторських текстах та текстах лінгвостилістичної норми перевищує певне порогове значення. Зміна частотного розподілу лексем у семантичних полях дієслів для різних авторів стосується як високочастотних, так і низькочастотних лексем. Однак в області низькочастотних лексем розкид частот одних і тих самих лексем для текстів різних авторів є набагато суттєвішим. Отже, в області високочастотних лексем лежать лексеми номінативного, стилістично нейтрального характеру, а область авторського ідіолекта розташована на периферії ЛСП. Константи семантичних відстаней, які характеризують область авторських ідіолектів у структурі ЛСП, не залежать від кількісного та якісного складу авторських текстів, а відображають фундаментальні лексико-семантичні закономірності авторської лінгвостилістики.
-
Азнаурова Э.С. Очерки по стилистике слова. Ташкент, 1973. 2. Андреев С.Н. Исследование языковой системы при помощи ЭВМ (на материале деривационных и морфемных классов английских глаголов). Смоленск, 1987. 3. Арнольд И.В. Стилистика современного английского языка. М., 1990. 4. Білинський М.Е. Синоніміка англійського дієслова: Словник семантичних відстаней. Львів, 1999. 5. Вердиева З.Н. Семантические поля в соверменном английском языке. М., 1986. 6. Гольдберг В.Б. Контрастивный анализ лексико-семантических груп (на материале английского, русского и немецкого языков): Тамбов, 1988. 7. Грязнухина Т.А.,
Дарчук Н.П, Клименко Н.Ф. и др. Использование ЭВМ в лингвистических исследованиях/отв. ред. В.Перебейнос; АН УССР. Ин-т языковедения им. А. А. Потебни. К., 1990. 8. Кузнецова Э.В. Лексико-семантические группы русских глаголов. Иркутск, 1989. 9. Левицкий А.Э. Функциональные подходы к классификации единиц современного английского языка: Монография. К., 1998. 10. Левицкий В.В. Статистическое изучение лексической семантики. Черновцы, 1989. 11. Левицкий В.В., Стернин И.А. Экспериментальные методы в семасиологии. Воронеж, 1989. 12. Москович В.А. Статистика и семантика. М., 1969. 13. Пиотровский Р.Г. Математическая лингвистика. М., 1977. 14. Плотников Б.А. Дистрибутивно-статистический анализ лексических значений. Минск, 1979. 15. Сентенберг И.В. Лексическая семантика английского глагола. Учебное пособие к спецкурсу. М., 1984. 16. Сильницкий Г.Г, Андреев С.Н., Кузьмин Л.А., Кусков М.И., Лукьяненков К.Ф. Соотношение глагольных признаков различных уровней в английском языке.Мн., 1990. 17. Скляревич А.Н., Якубайтис Т.А. Возможное обоснование частотных закономерностей лексики текстов. Рига, 1984. 18. Longman Dictionary of English Language and Culture. Longman, 2002. 19. Oxford Advanced Learner’s Dictionary. New York, 1998. 20. Oxford Thesaurus. New York, 1994.
THE STATISTICAL STRUCTURE OF THE LEXICO-SEMANTIC FIELDS OF VERBS IN AUTHORS’ TEXTS OF ENGLISH FICTION.
O. Pavlyshenko
Ivan Franko Lviv National University
The English Department
Universytetska str.1, Lviv, Ukraine
The regularities of frequency distribution of the lexico-semantic fields of verbs (LSF) in English fiction are studied (approximately 10 000 literary texts). The contrastive analysis of such a frequency distribution in texts of varied authorship is conducted. The quantitative and frequency definition of the kernel, close and remote periphery of LSF is introduced. It is shown that the constants of the structural distribution offered do not depend on quantitative and qualitative structure of LSF and that they characterize the systemic organization of LSF of verbs. The area of the authors’ idiolects in the structure of LSF is revealed. It is pointed out that the spectrum of the markers of the authors’ idiolect is translocated into the region of low-frequency periphery of LSF.
Key words: semantic field, lexeme frequency, authors’ style.
Т.Ляшенко, асп.,
Львівський національний університет
ім. Івана Франка
ОСОБЛИВОСТІ ТЕМАТИЧНОЇ СТРУКТУРИ ТЕКСТІВ МИСТЕЦТВОЗНАВЧОЇ РЕЦЕНЗІЇ
У статті розглянуті особливості організації текстів мистецтвознавчої рецензії (МР) на рівні семантичної структури, яку утворюють логіко-семантичні відношення в тексті. Тематична структура текстів МР є ієрархічно організованою. Вгорі тематичної ієрархії знаходиться тема тексту, що виводиться на основі макропропозицій і забезпечує глобальну зв’язність текстів МР. Тематичний розвиток текстів, обумовлений комунікативними і ситуативними факторами, має відмінності у різновидах МР. Тематичну структуру текстів рецензії-репортажу та рецензії-анотації визначає дескриптивна форма розгортання теми, де головними структурними компонентами виступають подія, привід, результат. В текстах аналітично-оцінної рецензії переважає аргументативна форма розвитку теми з трьома експліцитно вираженими складовими: теза, аргумент, введення. У статті наведені головні моделі тематичної структури, які знаходять різні можливості реалізації в конкретних текстах МР.
Ключові слова: тематична структура, тема тексту, тематичний розвиток, макропропозиції.
Смислову структуру тексту слід розглядати як узгоджену єдність різних рівнів репрезентацї у свідомості певної комунікативної програми. Це передбачає наявність семантичних зв’язків не тільки між єдностями термінального рівня, а також між єдностями вищих рівнів як комплексами поверхневих одиниць [1, с.6-8]. Йдеться про розгорнуті сегменти тексту, які взаємодіють між собою не безпосередньо, а через пропозиції, що кумулюють смисловий зміст текстових блоків. Перехід до пропозицій вищого рівня дозволяє наочно представити семантичний каркас тексту. Завдяки цьому відкривається можливість дослідження організації тексту як цілого.
Відомий факт, що текст характеризується зв’язністю на локальному і глобальному рівнях. Локальна зв’язність визначається відношенням пропозицій сусідньо розташованих речень, їх тематично-рематичною організацією. Функцію глобальної зв’язності виконує тема тексту [2, с.13], яка знаходиться вгорі тематичної ієрархії тексту і формулюється на основі макропропозицій, що в свою чергу виводяться з ряду виражених у реченнях пропозицій [3].
Переважна більшість текстів МР має кілька тем повідомлення з різним ступенем релевантності, що обумовлює ієрархічність тематичної структури текстів. При визначенні головної теми (теми тексту) та другорядних тем (мікротем) необхідно враховувати принцип походження, за яким темою тексту слід вважати ту, від якої, на думку реципієнта, походять інші теми, та принцип узгодження, відповідно до якого тема тексту найкраще співвідноситься з його комунікативною функцією [4, с.56]. Другий принцип має місце у випадку рівноправного (у логіко-семантичному аспекті) подання тем тексту.
З принципом походження другорядних тем тексту пов’язане поняття розвитку теми, який передбачає мисленнєвий виклад головної теми. Оскільки тематичний розвиток тексту значною мірою обумовлений його комунікативними та ситуативними факторами (комунікативна інтенція, комунікативна мета, комунікативні партнери), які дещо відрізняються в текстах МР, має місце факт існування певних розбіжностей розвитку теми тексту у різновидах МР. Тематичну структуру тексту МР в цілому визначають дескриптивна та аргументативна форми розгортання теми, які в конкретних текстах МР знаходять різні можливості реалізації та комбінування.
1. Тематична структура тексту рецензії-репортажу (РР) має дескриптивний характер тематичного розвитку, його темою є одноразова подія, пов’язана з відкриттям виставки та демонстрацією її творів. Тема тексту при дескриптивній формі розвитку представлена її компонентами (мікротемами), підпорядкованими категоріям часу та простору [5, с.89].
Головними компонентами тематичної структури тексту РР, які відображають загальні моменти змісту тексту, є подія, привід, результат. Складовими компонента “подія”, що знаходять свій прояв в тексті РР, є перебіг події, з яким пов’язані питання Was?, Wie?; особи які причетні до даної події (Wer?); час і місце події (Wann?, Wo?). “Привід” висвітлює мотиви події (Warum?, aus welchem Anlaß?), “результат” події відображає певні її наслідки, виражені в оцінках, характеристиках, коментарях рецензента (Ist die Folge positiv/negativ?).
Зв’язки між головними компонентами тематичної структури РР являють собою відношення імплікативного типу за формулою причина – наслідок. Однак зв’язки на цьому рівні є малопродуктивними, оскільки для отримання основного змісту (макроструктури тексту) необхідне врахування суттєвих моментів рівня специфікації [1, с.11].
Наступний приклад типового тексту РР демонструє особливості розгортання тематичної структури в текстах цього різновиду МР.
-
Заголовок: „Maler am Mittelmeer: Farbe der Provence“
1) Gegen Ende des 19. Jahrhunderts setzte in Frankreich eine regelrechte Wanderung in Richtung Süden ein, welche die Kunstgeschichte festgehalten hat: Monet, van Gogh, Gauguin, Dufy, Matisse, Cézanne sind die berühmtesten unter den Malern, die sich in der Provence oder an der Mittelmeerküste niedergelassen haben. 2) Dieser Landschaft und den Künstlern, die sie gemalt haben, ist eine Ausstellung im Musée du Luxembourg in Paris gewidmet, die bis 31. Juli zu sehen ist. 3) Mit Bildern aus der Schule von Avignon, wo Frédéric Mistral seinen Schülern das Malen im Freien beibrachte, und solchen aus der Schule von Marseille, wo Seelandschaften zur Grundausbildung gehörten, rekonstruiert die Ausstellung die Tradition der Malerei im Süden Frankreichs und zeigt den Kontext, in dem die Zugereisten ihr Werk schufen. 4) Denn vom Impressionismus eines Monet zum Pointillismus eines Signac, vom Synthetismus eines Gauguin zum Expressionismus eines van Gogh, vom Fauvismus eines Derain zu den ersten kubistischen Bildern Bragues – die Geschichte der modernen Malerei scheint sich an der Küste des Mittelmeers abgespielt zu haben. 5) Die großen Meister sind mit einzelnen, meist kleinen Bildern vertreten, denn diese Ausstellung konzentriert sich auf die wenig bekannten Maler der Provence wie Henri Manguin, Marius Roux-Renaud, Maximilien Luce, Charles Camoin. 6) Ihre meist realistischen Bilder vermitteln den Eindruck einer farbenprächtigen Landschaft und zeigen die Bemühung um die genaue Nuancierung in der Wiedergabe. 7) Aber was diese Landschaft besonders macht, ist das Licht, und es ist wiederum das Farbe gewordene Licht, das Bilder besonders machen kann. 8) Die Entdeckung dieser Ausstellung ist ein pointillistisches Gemälde von Picabia aus dem Jahre 1909, das eine Landschaft bei Saint-Tropez zeigt – das schönste Bild die hier abgebildete Landschaft „Les Cyprès“ von Derain. (FAZ, 28.07.1995).
З метою аналізу тексту необхідно сформулювати головні компоненти тематичної структури, а також рівень специфікації за допомогою пропозицій. Тему тексту, яка частково виражена у 2) сегменті та заголовку тексту, можна визначити так: “Eine Ausstellung der Maler am Mittelmeer ist in Paris zu sehen“. Привід до цієї події виражений у 1) та 2) сегментах тексту: „Die Ausstellung ist den Künstlern gewidmet, die in der Provence oder an der Mittelmeerküste Seelandschaften gemalt haben.“ Прямим репрезентантом компоненту макроструктури “результат” є висловлювання у 3) сегменті: “Die Ausstellung rekonstruiert die Tradition der Malerei im Süden Frankreichs und zeigt den Kontext, in dem die Zugereisten ihr Werk schufen“. Кожен з компонентів макроструктури отримує в тексті специфікацію. Макропропозиція “привід” представлена висловлюванням, яке розкриває передісторію виникнення спілки художників, чиї твори демонструє виставка (1/2). Елементами, які специфікують подію, у наведеному тексті є відомості про митців (1/4/5), місце та час проведення виставки (2), інформація про те, яким чином вона організована (5). Компонентові “результат” підпорядковано кілька висловлювань, що стосуються загального значення виставки (4), характеристики та оцінки її творів (6/7/8).
Співставлення тематичної структури наведеного вище тексту РР з його комунікативно-цільовою структурою, демонструє наступне співвідношення: компоненти смислової структури “привід” і “подія”, презентуючи вихідну інформацію щодо виставки та передісторії її виникнення, відповідають інформативному комунікативному блоку (КБ) вертикальної структури тексту, компонент “результат” співвідноситься з оцінним КБ, КБ-характеристикою і КБ-коментарем, оскільки містить відповідно оцінки, характеристики та зауваження рецензента щодо значення виставки. Тематичну структуру згаданого тексту РР можна відобразити у схемі №1.
Схема №1
І
Інформативний КБ
нформативний КБ
Подія Привід
Специфікація Специфікація
Результат
Достарыңызбен бөлісу: |