Лінгвістична база даних українських художніх порівнянь
1
УДК: 811.161.2'374.7:004
Маковецька-Гудзь Ю.А.
Аспірант Інституту філології КНУ імені Тараса Шевченка
Лінгвістична база даних українських художніх порівнянь
Інститут філології Київського національного університету імені Тараса Шевченка
Стаття присвячена проблемі конструювання лінгвістичної бази даних художніх порівнянь. Визначено мету створення лінгвістичної бази даних – укладання електронного словника художніх порівнянь українського поетичного мовлення другої половини ХХ століття. Описано методику створення бази даних та етапи її проектування. Розглянуто проблеми, пов’язані з параметризацією бази даних. Визначено типи лінгвістичних моделей порівнянь: граматичні та лексико-семантичні. Описується методика визначення та опису моделей порівнянь.
Ключові слова: лінгвістична база даних, художнє порівняння, суб'єкт порівняння, об’єкт порівняння, електронний словник, модель.
Makovetska-Gudz Yu.A.
The linguistic database of Ukrainian similes
The article concerns the problem of forming the linguistic database of similes. Besides, it is defined the main aim of creating the linguistic database to be the base of electronic dictionary of similes of Ukrainian poetical language of the second part of XX century. The author described the methodology projecting the linguistic database and described stages of creating the database. The author pointed on the problems, which connected with parameterization the database. It is defined the types of linguistic patterns, such as grammatical and lexical-semantic. The author outlined the technique of creating and analyzing of patterns of the similes.
Key words: linguistic database, simile, sub>ject, object, electronic dictionary, pattern.
Комп’ютерні технології представлення лінгвістичних даних дозволяють по-новому розглянути взаємозв’язки лінгвістичних одиниць, виявити раніше невідомі закономірності. Використання формалізованих, певним чином упорядкованих лінгвістичних одиниць може дати поштовх до нових типологічних, компаративних та інших досліджень, про що свідчать сучасні лінгвістичні дослідження, в яких все частіше використовуються великі масиви даних – корпуси текстів, бази даних з різних розділів лінгвістики та ін.
Ефективним способом упорядкування мовних одиниць є лінгвістичні бази даних (ЛБД). Вони використовуються для забезпечення функціонування різних автоматизованих систем, що пов’язані з обробкою тексту (машинний переклад) та мовлення (інформаційні, навчальні системи аналізу людського мовлення). ЛБД забезпечують автоматизацію лексикографічної діяльності масового та спеціального призначення, тобто підготовку словників різних типів (навчальних, перекладних, тлумачних та ін.) [3]. Стратегія створення надійних ЛБД спрямована на їхнє багаторазове різноаспектне використання, тобто обробку мовних об’єктів, які подані в таких базах даних, за різними параметрами та типами інформації.
У зв’язку з тим, що на сьогодні найефективнішим способом укладання різноманітних електронних словників є використання баз даних, було створено ЛБД художніх порівнянь з метою подальшого укладання Електронного словника художніх порівнянь. Такий об’єкт дослідження було обрано невипадково, адже у зв’язку з великим інтересом до вивчення тропів виникає необхідність у створенні словника, що дозволяв би користувачеві у найбільш зручний спосіб отримати потрібну інформацію про мовну одиницю.
Мета статті – поетапний розгляд конструювання ЛБД художніх порівнянь та способів заповнення її структур лінгвістичними даними. Для вирішення поставленої мети потрібно було: а) проаналізувати загальні технології створення ЛБД; б) визначити технології для оптимальної організації баз даних для дослідження художніх порівнянь; в) визначити параметри для аналізу художніх порівнянь.
ЛБД художніх порівнянь була створена на основі українських поетичних текстів письменників другої половини ХХ століття. Матеріалом для неї послужив "Частотний словник сучасної української поетичної мови", представлений в мережі Інтернет лабораторією комп’ютерної лінгвістики Київського національного університету імені Тараса Шевченка на порталі www.mova.info. З нього було взято основний масив порівнянь, а потім додатково опрацьовувалися тексти, за допомогою яких було уточнено ширший контекст для порівняння. Для опрацювання було обрано порівняння з поезій Юрія Андруховича, Світлани Йовенко, Миколи Вінграновського, Івана Драча, Оксани Забужко, Ліни Костенко, Бориса Олійника, Івана Малковича, Дмитра Павличка та Василя Стуса (загалом 10 поетів). З поезій цих авторів відібрано близько двох тисяч художніх порівнянь.
При параметризації порівнянь виникали проблеми різного характеру. По-перше, для опрацювання відбиралися тільки ті порівняння, у яких порівнюються предмети, події чи явища. Морфологічно складники порівняння представлені такими частинами мови: іменники, займенники, особова форма дієслова та субстантивовані прикметники. Другою проблемою була недостатність контексту, яка вирішилася після додаткового опрацювання першоджерел. По-третє, до аналізу було залучено лише художні порівняння. Художнє порівняння – словесний вираз, у якому зіставлення предметів відбувається на основі однієї, найвиразнішої з точки зору автора, ознаки, а всі інші не беруться до уваги [5, 359-360]. Це індивідуально-авторське порівняння, що вживається у художньому творі.
ЛБД художніх порівнянь передбачає такі етапи конструювання:
Визначення мети створення БД [2]. Як було зазначено, ЛБД створювалася для укладання електронного словника художніх порівнянь. База даних, як об’єкт створений у середовищі Microsoft Access, є найкращою основою для програмування програми словника.
Визначення структури БД у вигляді базової та додаткових таблиць. Для лінгвістичного аналізу порівнянь потрібна базова таблиця, яка б містила усю необхідну та достатню інформацію про кожен троп. Тобто у ній повинні бути такі дані: порівняння, його складники та їхні характеристики. Окрім цього, зважаючи на специфіку матеріалу, вважаємо, що необхідними допоміжними таблицями повинні бути: "частина мови", "моделі" та "концепти синоптичної схеми".
Визначення необхідних полів у базовій таблиці. Оскільки для аналізу порівнянь важливими є характеристики їх складників – суб’єкта та об’єкта необхідно ввести такі поля: частина мови суб’єкта та об’єкта; когнітивна ознака, на основі якої порівнюються предмети; тезаурусний характер суб’єкта та об’єкта, який встановлюється через зв'язок лексико-семантичних варіантів (ЛСВ), що їх виражають, з концептами синоптичної схеми; структура та модель порівняння. Крім того, базова таблиця повинна містити поле з порівнянням та поле із зазначенням автора порівняння (див. мал.1).
Мал. 1. ЛДБ художніх порівнянь
Визначення індивідуального значення для кожного поля таблиці. Значення поля таблиці може бути текстовим, логічним, числовим, поле МЕМО (пам'яті), гіперпосилання та інші. Оскільки ми працюємо з текстовою інформацією, то значення майже всіх полів визначається як текстове. Для поля з порівнянням у контексті технологічно необхідним є логічне значення, тому що використання такого значення дозволяє в одне поле додавати розгорнені порівняння у контексті. Поля, в яких вказується інформація про приналежність ЛСВ до концептів синоптичної схеми є числовими, оскільки вони пов'язуються із додатковою таблицею. Такий тип подавання інформації є простішим для створення програми електронного словника.
Додавання даних та створення інших об'єктів для оперування в БД. Додавання даних робиться вручну. Для простоти користування створюються додаткові об’єкти у вигляді таблиць (див. п.2) та форми Microsoft Access. Форма є основним засобом організації інтерфейсу користувача в додатках Microsoft Access. Вона полегшує виведення та редагування даних, а також спрощує роботу з об’єктами БД.
Визначення зв'язків між таблицями та об'єктами БД. Перш за все базова таблиця зв’язується з формою для зручності користування. Також необхідним є зв'язок базової таблиці з додатковими: концепти синоптичної схеми та частина мови, з яких безпосередньо береться необхідна інформація.
Використання засобів аналізу у Microsoft Access. Засоби аналізу Microsoft Access дозволяють швидко відсортувати необхідний матеріал за встановленими критеріями та отримати кількісні дані.
Робота з базою даних передбачала заповнення її структурних частин відповідною лінгвістичною інформацією. Основна робота була пов’язана з встановленням різних типів моделей порівнянь.
Моделюванням порівнянь займалися А. Вежбицька, С.В. Ткачов, Л. М'яснянкіна та ін.. Так, польська дослідниця Анна Вежбицька [1, с.144] подає кілька можливих моделей: А (таке саме), як В; А схоже на В; А нагадує В; А має форму В та ін. Виходячи з цих моделей, можна говорити про те, що підстановка замість А чи В будь-якого ЛСВ, утворює порівняння. Виникають запитання: чи буде таке порівняння семантично коректним (правильним) і чи буде воно художнім. Проблема семантичної коректності порівняння вирішується на основі лексико-семантичних моделей порівнянь, а проблема з художністю порівняння – на основі його зв’язку з контекстом.
Моделюванням порівнянь в аспекті граматичної формалізації займався С.В. Ткачов. Він вважає, що моделі порівняння можуть бути будь-які, наприклад: «V+як+N («Жию, як статок»), Adj+як+N («Горки, як полин») або синтаксично ускладнені: Adj+як+Adj+N («Дробни, як маково заренко»), або синтаксично спрощені N+як+N («Хлів (чисті,) як апатика»)» [7, 7]. Ці моделі побудовані на основі логічних та народних порівнянь.
Розглянувши вищевказані приклади моделей порівнянь, можна говорити про два види моделей: морфологічну – за частиномовною приналежністю складників (С.В. Ткачов) та синтаксичну – за способами зв’язків у реченні, до якого входить порівняння: сполучникові чи безсполучникові.
Окрім цих двох, є ще третій тип моделей – лексико-семантичні. Наприклад, Л. М'яснянкіна на основі творчості М. Шолохова, за приналежністю компонентів порівняння до різних семантичних полів виокремлює такі семантичні моделі порівнянь: людина-людина, людина-тварина, людина-природа, людина-предмет, предмет-предмет, тварина-тварина, людина-вогонь, предмет-явище природи, предмет-тварина, тварина-людина, тварина-предмет [6]. Таким чином, маючи такі моделі, можна утворити нескінченну кількість порівнянь.
При аналізі художніх порівнянь з ЛБД було враховано вищезазначені моделі та на основі фактичного матеріалу виводились нові. Розглядаючи порівняння, вважаємо доцільним таку систематизацію моделей порівнянь:
Граматичні:
Морфологічні (моделі порівняння за частиномовною приналежністю його складників). Як свідчать кількісні дані, отримані з бази даних, частиномовна приналежність порівнянь, які позначають предмет, – це не лише іменники, а й займенники, які вказують на предмет, та особова форма дієслова, дуже рідко зустрічається субстантивований прикметник. Наприклад, "іменник – іменник" – "Ти площу прочитав, як письмена" (Ю. Андрухович) чи "займенник – іменник" – "Ти – відьма мого серця" (М. Вінграновський). Крім того, наприклад, можливі інші компаративні пари типу: місто – сузір’я, шия – душа, ти – книга, він – ангел та ін.
Синтаксичні. При виділенні моделей такого типу зверталася увага, передовсім, на структуру речення, в якому є порівняння. На цій основі було виділено: сполучникові порівняння та безсполучникові порівняння і їх моделі. За структурою моделі поділялися на прості й складні [4]. Наприклад, S – мов O – "Чути, як дихає місто, – мов мама вві сні" (О. Забужко), S, як O – "А мені ж, може, просто хочеться щастя, тугого й солодкого, як шоколад" (Л. Костенко).
Лексико-семантичні. Для створення таких моделей була розроблена спеціальна методика, яка базується на аналізі лексичного значення суб’єкта та об’єкта порівняння в термінах ідеографії. Для цього було укладено синоптичну схему для складників порівняння та опрацьовано контексти з порівняннями, відповідно було зроблено каталогізацію порівнянь зазначених поетів, описано основні складники порівняння (суб’єкт та об’єкт) у термінах ідеографії. Укладання синоптичної схеми передбачає використання концептів різних рівнів. В основі синоптичної схеми для суб'єкта та об'єкта порівняння лежать такі концепти першого рівня: Людина, Природа, Суспільство, Абстрактні поняття. Кількісний аналіз лексем різних рівнів, проведений за допомогою використання засобів аналізу у Microsoft Access, показав, що найчастотнішим для суб'єкта порівняння є концепт Людина в обох поетів, тому що антропоцентризм є основною ознакою творення порівнянь у художньому тексті.
Описана лінгвістична інформація повинна стати основою для укладання "Електронного словника художніх порівнянь", який укладатиметься за принципом ідеографічного опису лексичної парадигми компонентів порівняння. Виходячи з того, що словник укладається на основі ЛБД, він є відкритим для поповнення. Поповнення словника можливе за повної каталогізації та систематизації порівнянь за визначеною методикою та занесення результатів роботи у ЛБД у середовищі Microsoft Access.
Отже, за допомогою ЛБД художніх порівнянь можна вирішити такі завдання: 1) формально зіставити порівняння за їх структурою чи способом зв’язку основних компонентів; 2) знайти необхідну лексему чи модель порівняння; 3) вирахувати кількісні показники, що характеризують різні типи моделей порівнянь, статистику використання концептів синоптичної схеми; 4) на основі отриманих даних укласти електронний словник порівнянь. Програмова реалізація функцій формування та ведення БД дозволяє здійснювати її постійне розширення як по горизонталі (наприклад, додавати нові параметри аналізу порівнянь), так і по вертикалі (введення нових порівнянь).
Література:
1. Вежбицкая А. Сравнение-градация-метафора // Теория метафоры. – М.: Прогресс, 1990. – с.133-151;
2. Берко А.Ю., Верес О.М. Організація баз даних: практичний курс: Навчальний посібник / За ред. В.В. Пасічника – Львів: Вид-во Національного університету «Львівська політехніка», 2003 – 152с.;
3. Карпіловська Є.А. Вступ до комп’ютерної лінгвістики. – Донецьк: ТОВ "Юго-Восток, Лтд", 2003. – 184с.;
4. Маковецька Ю.А. Електронний словник порівнянь: проблеми і методи укладання // Прикладна лінгвістика 2006: проблеми і рішення: Тези науково-методичної конференції молодих науковців. – Миколаїв: НУК, 2006. – с. 73-75;
5.Мацько Л.І. та ін. Стилістика української мови: Підручник / Л. І. Мацько, О.М. Сидоренко, О. М. Мацько; Заред. Л. І. Мацько. – К.: Вища шк., 2003. – 462с.;
6. М’яснянкіна Л.І. Порівняння в ідіостилі М.О. Шолохова: функціонально-семантичний і прагматичний аспекти: Дис... канд. філол. наук. – Харків, 2002.;
7.Ткачов С.В. Словник порівнянь русинської мови. – Тернопіль, 1992.
Стаття опублікована у збірнику ВНУ.
Маковецька-Гудзь Ю.А. Лінгвістична база даних українських художніх порівнянь // Науковий вісник Волинського національного університету імені Лесі Українки. Філологічні науки, №2, 2008 – С. 238-242