МІНІСТЕРСТВО КУЛЬТУРИ УКРАЇНИ КИЇВСЬКИЙ НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ КУЛЬТУРИ І МИСТЕЦТВ
КОМП’ЮТЕРНА ЛІНГВІСТИКА Робоча навчальна програма для студентів напряму підготовки 6.050101 «Комп'ютерні науки»
КИЇВ – 2011
Укладач: Бадьоріна Л. М., старший викладач Затверджено на засіданні кафедри комп’ютерних наук Протокол № 15 від 22 квітня 2011 р. Рекомендовано до видання Головною вченою радою університету Протокол № 12 від 12 травня 2011 р.
2
ВСТУП Опис дисципліни та її предмета. «Комп’ютерна лінгвістика» належить до циклу дисциплін самостійного вибору студентів напряму підготовки «Комп’ютерні науки» освітньо-кваліфікаційного рівня «бакалавр». Викладається на третьому курсі в обсязі 180 год. (5 кредитів), підсумковим контролем знань є іспит. Метою дисципліни є ознайомлення з сучасним станом і досягненнями в галузі комп’ютерної лінгвістики, навчити розмежовувати типи інформації, знати принципи і вимоги до моделювання мовних одиниць, способи графічного зображення моделей, аналізувати особливості репрезентації мовних одиниць у лінгвістичних базах даних, володіти навиками роботи з вітчизняними і зарубіжними лінгвістичними програмними продуктами (електронними словниками, перекладачами, базами даних і т. ін.). Вивчення дисципліни базується на принципі професійної спрямованості, який передбачає створення навчально-інформаційного середовища, адекватного майбутньому професійному рівню фахівця з інформаційного забезпечення широкого спектру видів суспільної практики. Основними вимогами до рівня сформованості готовності студента до використання функцій прикладної лінгвістики в комп’ютерних системах виступають: - уміння вирішувати професійні завдання засобами сучасних інформаційнолінгвістичних технологій; - уміння обирати методично доцільні програмні засоби для вирішення конкретних завдань; - знання особливостей структури потоків інформації та каналів їх надходження, які забезпечують професійну діяльність; - уміння працювати з професійно важливою інформацією, тобто здійснювати її оцінку, систематизацію, аналіз, переробку; - уміння використовувати сучасні інформаційно-лінгвістичні технології для пізнання об’єктів, процесів та явищ сучасного інформаційного простору. У результаті вивчення навчальної дисципліни студент повинен знати: - основні тенденції розвитку засобів обчислювальної техніки, зокрема мовноінформаційних комп’ютерних систем; - базові терміни комп’ютерної лінгвістики; - загальні принципи і вимоги до побудови лінгвістичної моделі; - об’єкт та предмет вивчення комп’ютерної лінгвістики; - встановлювати типи лінгвістичних баз даних: словниково- та текстозорієнтовані; - пособи графічного зображення моделей фонем: табличну, деревну (орієнтований граф), кубічну (стереометричну); - спосіб побудови символьної моделі морфемної будови слова; - типи інформації; - раціональне використання службових каталогів комп’ютерних систем в залежності від практичних задач, які вирішуються. Студент повинен вміти: - розрізняти типи інформації за різними її ознаками; - розмежовувати інформацію, дані і знання; - розмежовувати бази даних і бази знань; 3
- встановлювати типи лінгвістичних баз даних: словниково- та текстозорієнтовані; - з’ясовувати тип лінгвістичної комп’ютерної системи; - використовувати електронні словники з метою знайти потрібну лінгвістичну інформацію; - встановлювати тип і пояснювати причини помилок машинного перекладу; - застосовувати пошукові системи мережі Internet з метою лінгвістичних досліджень; - за технічними вимогами вибрати структуру або розробити комп’ютерну систему, її складові елементи, визначити режими її функціонування та оцінити запроектовану ним систему. Ефективність засвоєння студентами дисципліни забезпечується за рахунок запровадження активних форм професійного навчання, поєднанні аудиторного навчання з практикою майбутньої професійної діяльності, що дозволяє формувати не тільки пізнавальні, а й професійні потреби, виховувати активну життєву позицію майбутнього фахівця. При виконанні лабораторних робіт створюються умови для суміщення активності студента з майбутньою професійною діяльністю. СИСТЕМА ОЦІНЮВАННЯ ЗНАНЬ СТУДЕНТІВ Навчальна дисципліна «Комп’ютерна лінгвістика» оцінюється за модульнорейтинговою системою. Вона складається з двох модулів. Результати навчальної діяльності студентів оцінюються за 100-бальною шкалою за накопичувальною системою. Форми поточного контролю: - виконання лабораторної роботи на занятті; - письмові роботи з теоретичного матеріалу; - реферати. Модульний контроль: результат вивчення кожного модуля складає підсумок всіх форм поточного контролю та виконання модульної контрольної роботи. Підсумковий контроль знань: іспит - проводиться у формі усної відповіді на питання та виконання практичного завдання. Умови допуску студента до іспиту: - відсутність заборгованостей з лабораторних занять; - відсутність заборгованостей з модульних контрольних робіт; - позитивні рейтингові бали за кожний модуль. Підсумкова оцінка За результатами вивчення курсу студент отримує підсумкову оцінку за 100-бальною системою, яка розраховується як сума оцінок з трьох модулів (стартовий рейтинг) та оцінки за іспит за такою шкалою оцінювання: Курс ІІІ, семестр 5 Змістовий модуль 1 (ЗМ1)
Змістовий модуль 2 (ЗМ2)
Іспит (КІ)
Разом (підсумкова оцінка ПО) 4
Максимальна оцінка в балах
33
24
30
100
Максимальна кількість балів за 1–2 модулі (стартовий рейтинг) – 70 балів. Розрахунок підсумкової оцінки: ПО = ЗМ1 + ЗМ2 + КІ Студент має можливість накопичити максимальну кількість балів у межах кожного модуля, використовуючи різні способи набуття знань. Бальна система оцінювання різних форм навчання студента в межах кожного модуля № з/п 1. 2. 3. 4.
Назви виду роботи, способи набуття знань
Бали за 1 заняття
Лекційні заняття: - відвідування, конспектування Лабораторні заняття: - виконання лабораторного завдання Самостійна робота: - письмові відповіді - реферат Модульна контрольна робота Всього за модуль Іспит Разом з дисципліни
Бали за всі заняття (максимальні) Модуль 1 Модуль 2
до 1
1х7=7
1х7=7
до 3
3х6=18
3х8=24
до 1 до 1 до 3
1х2=2 1х2=2 3х1=3 32
1х3=3 1х1=1 3х1=3 38
до 30 30 32 + 38 + 30 = 100 балів
Трансформація рейтингової оцінки Сума набраних рейтингових балів при семестровому контролі переводиться в оцінки системи оцінювання ECTS. Система передбачає семибальну шкалу (A, B, C, D, E, FX, F) та подвійне (описове та статистичне) визначення цих оцінок. Підсумковий рейтинговий бал 91 – 100 84 – 90 76 – 83 66 – 75 61 – 65 21 – 60 0 – 20
Підсумкова оцінка за шкалою ECTS A – відмінно B – дуже добре C – добре D – задовільно E – достатньо (задовольняє мінімальні критерії) FХ – незадовільно F – незадовільно (потрібна додаткова робота)
Традиційна екзаменаційна оцінка відмінно
Традиційна залікова оцінка
добре зараховано задовільно незадовільно
не зараховано
не допущено
не допущено
5
ТЕМАТИЧНИЙ ПЛАН для студентів денної форми навчання № з/п
Назви тем
Всього Годин
Види занять і розподіл годин Сам. Мод. Лекції Лабор. роб. конт.
Форми контролю
МОДУЛЬ 1. КОМП’ЮТЕРНА ЛІНГВІСТИКА
Розвиток лінгвістичноінформаційних технологій
10
4
Конспект Письмові відповіді
6
1.1.
1.2.
1.3. 1.4.
Використання Інтернет у лінгвістичних дослідженнях. Лінгвістичний алгоритм і лінгвістичний процесор Системи машинного перекладу. Машинний переклад за допомогою програми Pragma Інформація та дані. Типи та функції інформації. Мовна інформація
14
4
4
6
14
4
4
6
2
6
2
6
8
Бази даних і бази знань. Бази даних у лінгвістичних дослідженнях
10
Модульна контрольна робота № 1
2
2
Конспект Виконання лабораторног о завдання Реферат Конспект Виконання лабораторног о завдання Виконання лабораторног о завдання Конспект Виконання лабораторног о завдання Реферат
1.5.
2.1.
2.2.
2.3. 2.4.
2
МКР
Модульний 78 14 12 30 2 Всього контроль МОДУЛЬ 2. ЛІНГВІСТИЧНА ІНФОРМАТИКА. ЛІНГВІСТИЧНІ БАЗИ ЗНАНЬ Структурування та Конспект формалізація мовних даних. Виконання Представлення знань. 12 2 4 8 лабораторног База даних «Українські о завдання прийменники» Конспект Автоматизована обробка Виконання природної мови. Комп’ютерні 12 2 4 8 лабораторног лінгвістичні системи о завдання Конспект Комп’ютерна лексикографія. Виконання Інтегрована лексикографічна 16 2 4 10 лабораторног система «Словники України» о завдання Корпуси текстів: основні типи 12 2 10 Конспект і структура Реферат Письмові відповіді 6
2.5.
Сучасні напрямки досліджень і розробок. Перспективи розвитку лінгвістичних баз даних
20
2
2.6.
Семантичне моделювання. Модель об'єкт/відношення (модель Чена), ER-діаграми
16
2
14
16
2
14
2.7.
База знань. Моделі представлення знань. Застосування даних і знань в експертних системах Модульна контрольна робота № 2 Всього Разом з дисципліни
4
Конспект Виконання лабораторног о завдання Конспект Виконання лабораторног о завдання Конспект Виконання лабораторног о завдання
16
2
2
108
14
16
44
2
180
28
28
120
4
МКР Модульний контроль ІСПИТ
7
ЗМІСТ ДИСЦИПЛІНИ ЗА МОДУЛЯМИ МОДУЛЬ 1. КОМП’ЮТЕРНА ЛІНГВІСТИКА ТЕМА 1.1. РОЗВИТОК ЛІНГВІСТИЧНО-ІНФОРМАЦІЙНИХ ТЕХНОЛОГІЙ Лекція Основні концепції створення мовно-інформаційних систем. Місце дисципліни в системі підготовки фахівця. Концепції, моделі і стандарти лінгвістично-інформаційних систем. Визначення типів інформації, моделювання мовних одиниць. Володіння навиками роботи з лінгвістичними програмними продуктами. Завдання для самостійної роботи 1. Визначити принципи побудови фонологічної моделі запропонованої Р.Г. Піотровським. Дані занести в таблицю. 2. Визначити способи графічного зображення моделей фонем: табличну, деревну (орієнтований граф), кубічну (стереометричну), занотувати їх. Запитання для самоперевірки 1. Які існують системи машинного перекладу? Дати їм характеристику. 2. Де використовуються словниково-зорієнтовані бази даних? Література: 3, 17, 32. ТЕМА 1.2. ВИКОРИСТАННЯ ІНТЕРНЕТ У ЛІНГВІСТИЧНИХ ДОСЛІДЖЕННЯХ. ЛІНГВІСТИЧНИЙ АЛГОРИТМ І ЛІНГВІСТИЧНИЙ ПРОЦЕССОР Лекція Предмет і завдання корпусної лінгвістики. Українські корпуси текстів. Лінгвістичні ресурси в мережі Інтернет. Робота у мережі як спосіб роботи лінгвіста з мовним матеріалом. Пошук мовних одиниць, встановлення контексту, стильової належності. Лабораторне заняття Лінгвістичні ресурси в мережі Інтернет Мета: опанування практичними навичками роботи з лінгвістичними ресурсами. Завдання Етап 1. Встановити електронний словник Lingvo. Етап 2. Знайти потрібну інформацію про слово в електронному словнику Lingvo (Вимова, відмінювання, частиномовний статус, значення слова, наявність синонімів і т.д.) Етап 3. Використавши ресурси мережі Інтернет, знайти українські слова з коренем – драйв. Визначити, з яких морфем складаються ці слова, використовуючи ресурси бази даних. 8
Етап 4. Відредагувати текст, перекладений за допомогою Pragma. Результати виконання роботи контролюються і фіксуються викладачем протягом виконання відведеного навчального часу. Завдання для самостійної роботи 1. Дослідити корпус тексту як базу при вивченні мови. 2. Використовуючи корпус тексту за адресою http:/hnc.ilsp.gr., сформувати підкорпуси, використавши стандартну метатекстову розмітку. 3. Дослідити лінгвістичні ресурси мережі Інтернет. Законспектувати. 4. Написати реферат на тему: “Лінгвістичні проблеми семантичного Web-простору.” Запитання для самоперевірки 1. Які складові елементи лінгвістичної системи? 2. Які комп’ютерні системи опрацювання тексту? Література: 4, 27, 32. ТЕМА 1.3. СИСТЕМИ МАШИННОГО ПЕРЕКЛАДУ. МАШИННИЙ ПЕРЕКЛАД ЗА ДОПОМОГОЮ ПРОГРАМИ PRAGMA Лекція Системи машинного перекладу. Автоматизований переклад як лінгвістична задача. Загальна характеристика програмного продукту Pragma. Словники, мінімальні системні вимоги. Можливості Pragma: переклад слів, словосполучень і речень. Лабораторне заняття Можливості Pragma Мета: опанування практичними навичками роботи з автоматизованим перекладом. Завдання Етап 1. Встановити програми Pragma. Етап 2. Знайти потрібну інформацію про переклад слів, словосполучень і речень. Редагування перекладу, встановлення типу помилки та її причини. Етап 3. Використавши ресурси мережі Інтернет, знайти українські слова з коренем –драйв. Визначити з яких морфем складаються ці слова. Етап 4. Відредагувати текст, перекладений за допомогою Pragma. Результати виконання роботи контролюються і фіксуються викладачем протягом виконання відведеного навчального часу. Завдання для самостійної роботи 1. Дослідити проблему візуалізації лінгвістичних даних. 2. Охарактеризувати можливості фреймів для представлення знань про навколишній світ. 9
Запитання для самоперевірки 1. Для чого призначена символьна модель структури слів? 2. Де використовуються лінгвістичні бази даних, за якими типами їх класифікують? 3. Чим відрізняється лінгвістичний алгоритм від звичайного? Література: 21, 28, 32. ТЕМА 1.4. ІНФОРМАЦІЯ ТА ДАНІ. ТИПИ ТА ФУНКЦІЇ ІНФОРМАЦІЇ. МОВНА ІНФОРМАЦІЯ Лабораторне заняття Інтегрована лексикографічна система «Словники України» Мета: опанування практичними навичками роботи з лексикографічними системами. Завдання Етап 1. Встановити інтегровану лексикографічну систему «Словники України». Етап 2. Визначити можливості лексикографічної системи «Словники України» (версія 1.04): основний реєстр слів, правопис, транскрипція, парадигма, частиномовний статус, синоніми, антоніми, фразеологізми, можливості щодо додавання нових слів та їх характеристик. Етап 3. On-line версія лексикографічної системи «Словники України»: нові можливості і роботи з мовною інформацією («Український лінгвістичний портал» в мережі Інтернет (http://ulif.org.ua/)). Результати виконання роботи контролюються і фіксуються викладачем протягом виконання відведеного навчального часу. Завдання для самостійної роботи 1. Охарактеризувати лексикографічну систему «Словники України», її концепцію та мінімальні системні вимоги. 2. Охарактеризувати завдання, які вирішуються на етапі доморфологічної обробки природномовного тексту. 3. Охарактеризувати типи корпусів текстів, які використовуються в лінгвістичних дослідженнях. Запитання для самоперевірки 1. Які блоки включає в себе лінгвістичний процесор? 2. Які функції виконує лінгвістичний процесор? Література: 10, 19, 22.
10
ТЕМА 1.5. БАЗИ ДАНИХ І БАЗИ ЗНАНЬ. БАЗИ ДАНИХ У ЛІНГВІСТИЧНИХ ДОСЛІДЖЕННЯХ Лекція Бази даних і бази знань. Бази даних у лінгвістичних дослідженнях. База даних морфемно-словотвірного фонду Інституту мовознавства імені О.О.Потебні НАН України: принципи укладання, структура, типи мовної інформації, виконувані функції. Можливості одержання лінгвістичної інформації, створення запитів у базі, укладання нових типів словників. Лабораторне заняття Створення макросів для послідовного виконання текстових запитів Мета: опанування практичними навичками роботи з лінгвістичними базами даних. Завдання Етап 1. Відкрити вікно бази даних морфемно-словотвірного фонду Інституту мовознавства, вибрати закладку Макрос (macros) та натиснути кнопку Створити. Етап 2. Ввести макрокоманду (action) і виконати перший запит за допомогою закладки Відкрити Запит. Фразеологізми, можливості щодо додавання нових слів та їх характеристик. Етап 3. Створити запит на пошук фразеологізмів в тексті згідно з варіантом завдання. Результати виконання роботи контролюються і фіксуються викладачем протягом виконання відведеного навчального часу. Завдання для самостійної роботи 1. 2. 3. 4.
Дати порівняльну характеристику систем автоматичного реферування. Охарактеризувати особливості природної мови як системи. Охарактеризувати функціональні вимоги до інформаційно-аналітичних систем. Написати реферат на тему: “Системи машинного перекладу” Запитання для самоперевірки 1. Що таке семантичні стани одиниць мови? 2. Які види машинних словників? Література: 14, 24, 26. МОДУЛЬНА КОНТРОЛЬНА РОБОТА № 1
1. Побудувати синонімічну матрицю для словникової лексикографічної системи «Словники України». http://ulif.org.ua
статті
з
Інтегрованої
11
2. Перетворити з морфемної структури слів у символьну модель: радість, зображений, поні. 3. За прикладом побудувати модель представлення знань: Приклад: ▪ для систем управління: <ситуація> → <дія> <дія> → <результат> <ситуація> & <дія> → <результат> ▪ для систем діагностування: (самостійно) МОДУЛЬ 2. ЛІНГВІСТИЧНА ІНФОРМАТИКА. ЛІНГВІСТИЧНІ БАЗИ ЗНАНЬ ТЕМА 2.1. СТРУКТУРУВАННЯ ТА ФОРМАЛІЗАЦІЯ МОВНИХ ДАНИХ. ПРЕДСТАВЛЕННЯ ЗНАНЬ. БАЗА ДАНИХ «УКРАЇНСЬКІ ПРИЙМЕННИКИ» Лекція Структурування та формалізація мовних даних. Ідентифікація мовних даних. Представлення знань. Поняття про метамову. Типи метамов. Лабораторне заняття База даних «Українські прийменники» Мета: опанування практичними навичками роботи з базою даних «Українські прийменники». Завдання Етап 1. Визначити можливості бази даних українських прийменників, принципи і джерела укладання. Етап 2. Створити структуру словникової статті. Етап 3. Одержати потрібну лінгвістичну інформацію шляхом створення запитів у базі. Результати виконання роботи контролюються і фіксуються викладачем протягом виконання відведеного навчального часу. Завдання для самостійної роботи 1. Охарактеризувати дедуктивний та індуктивний методи в комп’ютерній лінгвістиці. 2. Представити граматичну структуру речення: "Деталь переміщується по конвеєру до кінцевого бункера“ в термінах формальної граматики. 3. Охарактеризувати модель «Смисл-Текст». Запитання для самоперевірки 1. В чому полягає проблема маркування текстів? 2. Що покладено в основу методу синтаксичного аналізу? Література: 4, 27, 32. 12
ТЕМА 2.2. АВТОМАТИЗОВАНА ОБРОБКА ПРИРОДНОЇ МОВИ. КОМП’ЮТЕРНІ ЛІНГВІСТИЧНІ СИСТЕМИ Лекція Перспективні стратегії обробки інформації і місце в них природної мови. Лінгвістичний процесор . Роль і структура інформаційного тезауруса. Види стандартних семантичних алгоритмів. Лабораторне заняття Робота з базою даних Морфемно-словотвірного фонду Мета: опанування практичними навичками роботи з базою даних. Завдання Етап 1. Перетворити морфемної структури слів у символьні моделі: редагування, казна-хто, радість, складоподіл, зелененький, анатомофізіологічний, поні, привітання, згортуватися, зображений. Етап 2. Створивши запит у базі морфемно-словотвірного фонду, знайти всі прикметники, які складаються з кореня, двох суфіксів, закінчення. Етап 3. Звіт занотувати. Результати виконання роботи контролюються і фіксуються викладачем протягом виконання відведеного навчального часу. Завдання для самостійної роботи 1.
Розглянути зонний принцип запису тексту традиційного словника (на прикладі граматики Л. І. Колодяжної). 2. Навести приклади лінгвістичних алгоритмів. 3. Охарактеризувати прикладні системи обробки природомовної інформації. Запитання для самоперевірки 1. На чому грунтується обробка словникових статей? 2. Для чого призначені текстозорієнтовані бази даних? Література: 8, 27, 34. ТЕМА 2.3. КОМП’ЮТЕРНА ЛЕКСИКОГРАФІЯ. ІНТЕГРОВАНА ЛЕКСИКОГРАФІЧНА СИСТЕМА «СЛОВНИКИ УКРАЇНИ» Лекція Структура і архітектура лексикографічних систем. Системна лексикографія та інтегрований опис мови. Лексикографічні середовища. Структура БД електронного граматичного словника. Лабораторне заняття Словники користувацьких програм автоматичного перекладу 13
Мета: ПроЛінг Офіс для WINDOWS. Опанування практичними навичками роботи з програмами-перекладачами. Завдання Етап 1. Перекласти текст з російської мови на українську та з української на російську за допомогою програми ПЛАЙ. Відредагувати переклад та встановити тип помилки та її причини. Етап 2. Використовуючи програму РУТА та її основний словник, здійснити пошук синонімів та перевірити орфографію та граматику. Розставити переноси та додати нові слова в словник. Етап 3. Укласти словникову статтю для внесення її в словник користувача програми автоматичного перекладу. Завдання для самостійної роботи 1. Охарактеризувати типи інформації за класифікацією А. О. Білецького. 2. Охарактеризувати призначення лексикографічних робіт. 3. Законспектувати призначення лінгвістичної експертизи тексту. Запитання для самоперевірки 1. В чому полягають проблеми формування корпусу текстів української мови? 2. Яке призначення лексикографічних систем? 3. Які вимоги до побудови лінгвістичних алгоритмів? Література: 7, 8, 12, 22, 42. ТЕМА 2.4. КОРПУСИ ТЕКСТІВ: ОСНОВНІ ТИПИ І СТРУКТУРА Лекція Предмет і завдання корпусної лінгвістики. Типи корпусів текстів, їх можливості і використання у лінгвістичних дослідженнях. Проблеми формування корпусу текстів української мови. Завдання для самостійної роботи 1. Навести приклади комп’ютерних словників. 2. Охарактеризувати діалектологічні текстові корпуси. 3. Охарактеризувати граматичні та синтаксичні мовні конструкції . 4. Написати реферат на тему: ” Дослідження мови на основі лінгвістичних корпусів”. Запитання для самоперевірки 1. Який принцип кодування мовної інформації? 2. В чому полягають технологічні аспекти створення корпусів? Література: 14, 22, 39. 14
ТЕМИ 2.5. СУЧАСНІ НАПРЯМКИ ДОСЛІДЖЕНЬ І РОЗРОБОК. ПЕРСПЕКТИВИ РОЗВИТКУ ЛІНГВІСТИЧНИХ БАЗ ДАНИХ Лекція Концепція баз даних і знань. Поняття «інформація» і «дані». База даних як модель предметної області. Основні компоненти системи баз даних. СУБД, її функції. Лабораторне заняття База даних «Українські прийменники» Мета: опанування практичними навичками роботи з БД «Українські прийменники» Завдання Етап 1. Визначити фізичну архітектуру бази даних: сторінки, типи сторінок, екстенти, типи екстентів. Етап 2. Встановити групи файлів: основні, група файлів користувачів, група файлів за замовчуванням. Етап 3. Визначити логічну архітектуру бази даних, її об'єкти: таблиці, подання − віртуальні таблиці, які визначаються запитами; індекси; збережені процедури − групи команд Transact-SQL. Результати виконання роботи контролюються і фіксуються викладачем протягом виконання відведеного навчального часу. Завдання для самостійної роботи 1. Охарактеризувати тенденції та перспективи розвитку технології баз даних. 2. Дати характеристику об’єктно-орієнтованих систем баз даних. 3. Охарактеризувати сучасні напрями досліджень і розробок баз даних. Запитання для самоперевірки 1. В чому відмінність концептуальної та технологічної бази даних та бази знань? 2. Які існують моделі представлення знань? Література: 4, 22, 24. ТЕМА 2.6. СЕМАНТИЧНЕ МОДЕЛЮВАННЯ. МОДЕЛЬ ОБ'ЄКТ/ВІДНОШЕННЯ (МОДЕЛЬ ЧЕНА), ER-ДІАГРАМИ Лекція Об'єкти, властивості, зв'язки між ними, набори об'єктів. Записи про об'єкти, атрибути, значення атрибутів. Модель об'єкт/відношення . Завдання для самостійної роботи 1. Законспектувати сценарії доступу до бази даних. 2. Охарактеризувати розподілені об’єктні технології обробки даних. 3. Описати технологію перетворення змістової частини бази даних в статичний документ. 15
Запитання для самоперевірки 1. Як здійснюється квазісемантичний пошук в базах даних ЛГС? 2. Як здійснюється семантична структуризація даних? Література: 4, 24, 27. ТЕМА 2.7. БАЗА ЗНАНЬ. МОДЕЛІ ПРЕДСТАВЛЕННЯ ЗНАНЬ. ЗАСТОСУВАННЯ ДАНИХ І ЗНАНЬ В ЕКСПЕРТНИХ СИСТЕМАХ Лекція Сучасні напрямки досліджень і розробок. Тенденції та перспективи розвитку технології баз даних. Завдання для самостійної роботи 1. Дати характеристику лінгвістичних баз даних. 2. Охарактеризувати структуру словникової статті у базі українських прийменників. 3. Законспектувати етапи створення інтелектуальної бази даних. Запитання для самоперевірки 1. Для чого призначені лінгвістичних бази даних? 2. За якими типами класифікують інформацію (класифікація за А. О. Білецьким)? Література: 8, 12, 22. МОДУЛЬНА КОНТРОЛЬНА РОБОТА № 2 1. Визначити об’єкт і предмет комп’ютерної лінгвістики. 2. Дати порівняльну характеристику системам машинного перекладу: RETRANS, PRAGMA, ЕТАП. 3. Представити граматичну структуру речення: "Деталь переміщується по конвеєрудо кінцевого бункера“ в термінах формальної граматики. 4. Описати етапи графемного аналізу тексту. Навести приклад. 5. Описати призначення та функції лінгвістичного процесора. 6. Привести приклади стандартних семантичних алгоритмів. ПИТАННЯ ДО ІСПИТУ 1. Комп’ютерна лінгвістика як різновид прикладної лінгвістики. Специфіка предмета її дослідження. 2. Інформація і дані. Визначення і відмінність. 3. Поняття структурування та формалізації інформації. 4. Типи інформації за класифікацією А. О. Білецького. 5. Типи інформації за джерелом її створення і за її формою. Приклади. 6. Типи інформації за її зв’язком із ситуацією і за джерелом її створення. Приклади. 16
7. Типи інформації за способом її оформлення, за сферою її призначення, характером її функціонального навантаження. Приклади. 8. Мовна інформація. Основні та додаткові її ознаки. 9. Поняття лінгвістичної моделі. Співвідношення моделі та її натурного об’єкта (оригіналу, прототипу, прообразу). Вимоги до побудови лінгвістичних моделей. 10. Поняття вирізняльних (диференційних) ознак мовних одиниць. Поняття опозиції мовних одиниць. Підстава опозиції (спільна ознака для зіставлення). Приклади. 11. Принципи побудови моделей фонем Р. Г. Піотровського. 12. Характеристика різних способів графічного зображення моделей Р. Г. Піотровського (деревна та кубічна (стереометрична). Продемонструвати на прикладах приголосних фонем. 13. Табличний спосіб представлення даних. Пояснити на прикладі класифікацій голосних та приголосних фонем української мови. 14. Поняття інтерфейсу, меню, режиму роботи. 15. Знання. Їхнє співвідношення з поняттями «інформація» та «дані». Знання декларативні та процедурні. Способи представлення. Приклади. 16. Поняття алгоритму. Блок-схема або граф-схема алгоритму та її складники. Крок алгоритму, правила алгоритму. Вимоги до побудови алгоритму. 17. Лінгвістичний алгоритм та лінгвістичний процесор. 18. Поняття бази даних. База даних та база знань (інтелектуальна база даних). 19. Етапи побудови (проектування) бази даних, їхні складники. 20. Спосіб представлення даних за зонами. Пояснити на прикладі запису даних у базі українських слів Інституту мовознавства ім. О. О. Потебні НАН України. 21. Символьна модель морфемної будови слова. Принципи її побудови в базі даних морфемно-словотвірного фонду Інституту мовознавства ім. О. О. Потебні НАН України. 22. Типи моделей будови українського слова. Активні та унікальні моделі. 23. Лінгвістичні бази даних, їхня специфіка та призначення. Типи лінгвістичних баз даних. 24. Коротка характеристика принципів побудови та призначення лінгвістичних баз даних. Функції бази даних. 25. Словниково-зорієнтовані бази даних і текстозорієнтовані бази даних. 26. Поняття продукту опрацювання бази даних. Продукти опрацювання словниковозорієнтованої бази даних. Продукти опрацювання текстозорієнтованої бази даних. 27. Традиційний словник у комп’ютерній формі та комп’ютерний словник. Зонний принцип запису тексту традиційного словника (на прикладі граматики Л. І. Колодяжної). 28. Комп’ютерна копія і комп’ютерна версія традиційного словника. 29. Поняття комп’ютерної лінгвістичної системи. Типи комп’ютерних лінгвістичних систем. 30. Комп’ютерні лексикографічні системи (на прикладі «Інтегрованої лексикографічної системи» Мовно-інформаційного фонду НАН України). 31. Комп’ютерні системи опрацювання тексту (на прикладі систем РУТА, ПЛАЙ, Pragma). 32. Системи машинного перекладу, їх типи. 17
33. Загальна характеристика лексикографічної системи «Словники України»: авторський колектив, загальна концепція, мінімальні системні вимоги. 34. Структура і можливості лексикографічної системи «Словники України» (версія 1.03): основний реєстр слів, правопис, транскрипція, парадигма, частиномовний статус, синоніми, антоніми, фразеологізми, можливості щодо додавання нових слів та їх характеристик. 35. Загальна характеристика ПроЛінг Офіс для WINDOWS: авторський колектив, загальна концепція, мінімальні системні вимоги. 36. Можливості програми РУТА: перевірка орфографії та граматики, основний словник, пошук синонімів, парадигма слова, розставлення переносів, додавання нових слів до словника, пошук та заміна слів. 37. Переклад слів і текстів за допомогою програми ПЛАЙ. Типові помилки при автоматичному перекладі та її причини. 38. Можливості програмного продукту Lingvo 9.0: переклад слів, словосполучень, пошук парадигми слова, підказка шодо правильного написання слова, прослуховування вимови слова, синоніми, антоніми і под. 39. Структура програмного продукту Lingvo 9.0: словники, з яких складається Lingvo 9.0. Створення і поповнення словника користувача у Lingvo 9.0. 40. Загальна характеристика програмного продукту Pragma: фірма-виробник, словники, мінімальні системні вимоги. Можливості Pragma: переклад слів і словосполучень. 41. Типові помилки автоматичного перекладача Pragma та їхні причини. 42. База даних морфемно-словотвірного фонду Інституту мовознавства імені О. О. Потебні НАН України: авторський колектив, принципи укладання, структура, типи мовної інформації. 43. Можливості одержання і поповнення лінгвістичної інформації у базі даних морфемно-словотвірного фонду Інституту мовознавства імені О. О. Потебні НАН України. 44. Нові типи словників української мови – продуктів використання морфемнословотвірного фонду Інституту мовознавства імені О. О. Потебні НАН України: «Словник афіксальних морфем української мови» (автори: Н. Ф. Клименко, Є. А. Карпіловська, В. С. Карпіловський, Т. І. Недозим) та «Кореневий гніздовий словник української мови» Є. А. Карпіловської. 45. Можливості бази українських прийменників кафедри української мови Донецького національного університету, принципи і джерела укладання. 46. Структура словникової статті у базі українських прийменників. 47. Створення запитів у базі українських прийменників. Можливості редагування бази. 48. Корпусна лінгвістика як галузь комп’ютерної лінгвістики. Предмет і завдання корпусної лінгвістики. 49. Типи корпусів текстів, їх можливості та використання в лінгвістичних дослідженнях. 50. Українські корпуси текстів. Проблеми формування національного корпусу текстів української мови в Інституті української мови НАН України, його концепція. 51. Лінгвістичні ресурси в мережі Internet.
18
52. Робота в мережі Internet як спосіб роботи лінгвіста з мовним матеріалом: принципи пошуку мовних одиниць, встановлення контексту, стильової належності, частотності слів або їхніх складників чи комбінацій і под. 53. Реляційні моделі представлення знань про навколишній світ та їх застосування в системах обробки текстів. 54. Семантичні мережі представлення знань про навколишній світ та їх застосування в системах обробки текстів. 55. Можливості фреймів для представлення знань про навколишній світ та їх застосування в системах обробки текстів. 56. Предикатні моделі представлення знань про навколишній світ та їх застосування в системах обробки текстів. 57. Метод резолюцій та його застосування для отримання нових знань. 58. Характеристика продукційних моделей. 59. Модель УСК та можливості її щодо застосування в системах обробки текстів. 60. Завдання, які вирішуються на етапі морфологічного аналізу. 61. Завдання, які вирішуються на етапі морфологічного синтезу. 62. Завдання, які вирішуються на етапі синтаксичного аналізу. 63. Завдання, які вирішуються на етапі синтаксичного синтезу. 64. Завдання, які вирішуються на етапі семантичного аналізу. 65. Завдання, які вирішуються на етапі семантичного синтезу. 66. Структура і зміст лінгвістичного процесора. 67. Завдання, які вирішуються інтерпретатором лінгвістичного процесора. 68. Інформаційно-пошукові системи, види інформаційно-пошукових систем. 69. Фактографічні інформаційно-пошукові системи. 70. Документальні інформаційно-пошукові системи. 71. Інформаційно-пошукові системи Інтернет та гіпертекстові системи. 72. Підходи до розробки систем машинного перекладу. 73. Системи машинного перекладу: RETRANS, PRAGMA, ЕТАП. 74. Підсистемі ведення перекладних електронних словників в перелічених вище системах. 75. Системи автоматичного реферування. 76. Завдання, які вирішує інтерфейс в системах автоматичної обробки текстової інформації. 77. Систем управління базами даних і базами знань. 78. Лінгвістичні і технологічні аспекти створення корпусів. 79. Клас, до якого відносяться системи виводу знань, доказів, гіпотез. 80. Експертні системи. 81. Об’єкт і предмет комп’ютерної лінгвістики. 82. Основні напрямки комп’ютерної лінгвістики. 83. Особливості природної мови як системи. 84. Метод аналогії, який застосовується в семантиці. 85. Дедуктивний та індуктивний методи в комп’ютерній лінгвістиці. 86. Логічні системи як інструментарій комп’ютерної лінгвістики. 87. Загальна характеристика формальних граматик. 19
88. Граматична структура речення: «Деталь переміщується по конвеєру до кінцевого бункера» в термінах формальної граматики. 89. Граматична структура речення: «Деталь переміщується по конвеєру до кінцевого бункера» в термінах безпосередніх складників. 90. Семантична модель. ПРАКТИЧНІ ЗАВДАННЯ ДО ІСПИТУ Завдання 1 Описати графемну структуру тексту США Начато переоборудование 232 боевых вертолетов AH-64A армейской авиации с целью превращения их в вертолеты радиолокационной разведки, которые получат название AH-64D «Лонгбоу». Работы ведутся под руководством фирмы «Макдоннел гелекоптер». В рамках пятилетней программы планируется переоснастить 750 таких машин. Графемна структура наведеного тексту має такий вигляд: Т(текст) = З (фрагмент-заголовок) А (фрагмент-абзац); З = Л21 ; Л21 = НД (назва держави); А = МР1 (мовне речення) МР2 МР3; МР1 = МС1 (мовна синтагма) Л16 МС2; МС11 = {Л1}1-2 Л9 {Л1}4-5 Л7 {Л1}7-17 ; МС21 = {Л1}1-3 Л24 КР (кінець речення); МР2 = МС; МС2 = {Л1}1-5 Л13 КР; МР3 = МС; МС3 = {Л1}1-6 Л9 {Л1}8-9 КР. Знак «» вказує на відношення підпорядкування, «» - на відношення порядку слідування. Класи лексем взяті з табл. 3.3. (навчальний посiбник «Основи комп’ютерної лінгвістики»). На основі прагматичної інтерпретації (див. рис 3.2 навчальний посiбник «Основи комп’ютерної лінгвістики») заголовок віднесено до класу географічних назв (розділу: назва держави). Графемна структура визначає мову вхідного тексту, його одиниці, типи та відношення між ними. Результат графемного аналізу є вхідною інформацією як для лінгвістичного рівня організації тексту (мовні лексеми, мовні речення), так і для прагматичного інтерпретатора. Завдання 2 Виконати дії з наступними реченнями 1. Побудувати фрейм по відношенню r = рухатися для наступних речень: Деталь переміщується по конвеєру до кінцевого бункера. Робот пересувається до складу № 4. Автомобіль наближається до перехрестя. 2. Побудувати УСК модель для наступного речення: Робот пересувається до складу № 4. 20
3. Побудувати семантичну мережу для наступних речень: Пасажирський потяг прибуває на Південний вокзал. Баржа з піском наближається до причалу. 4. Представити наступне речення засобами числення предикатів першого порядку: Автомобіль наближається до перехрестя. 5. Представити наступне речення у формі УСК: Баржа з піском наближається до причалу.
21
МЕТОДИЧНІ РЕКОМЕНДАЦІЇ ДО ПІДГОТОВКИ ЛАБОРАТОРНОГО ЗАНЯТТЯ Лабораторні заняття як одна із форм навчальних занять, розрахована на виконання студентами в електронному вигляді певної задачі з використанням ПК. На лабораторному занятті вони глибше опановують складні питання, беруть участь в їх колективному творчому обговоренні, оволодівають науковими методами аналізу певних явищ і проблем. Під час виконання лабораторної роботи створюються умови для перевірки та виявлення інтелектуального рівня студентів. Навчальні програми з переліком тем та питань дисципліни «Комп’ютерна лінгвістика» студенти отримують на першому лабораторному занятті. Для самостійного опанування тем предмета студенти можуть використовувати не тільки зазначений список основної літератури, а також інші джерела інформації, можливості Internet та додаткову літературу. На першому лабораторному занятті викладач вказує на основні теми предмета для практичного засвоєння, роз’яснює загальні положення, надає рекомендації по вивченню та опануванню всіх розділів, загострює увагу на найбільш важливих «вузлових» питаннях. На заключному лабораторному занятті розглядаються теми, які стали найбільш важкими для самостійного опанування. МЕТОДИЧНІ РЕКОМЕНДАЦІЇ ДО ВИКОНАННЯ САМОСТІЙНОЇ РОБОТИ Самостійна робота є однією із складових навчального процесу, на яку припадає значний обсяг навчального часу. При цьому студент є активним учасником навчального процесу, набуває навичок самоорганізації, самостійного пошуку інформації, прийняття рішень і т. ін. Правильна організація самостійної роботи дозволяє максимально індивідуалізувати навчання, підвищити ефективність навчального процесу в цілому. Самостійна робота студентів складається з роботи з літературою (доповнення конспектів лекцій, написання рефератів, ознайомлення з додатковою інформацією в мережі Інтернет) та роботи на персональному комп’ютері з певними програмними продуктами. Кожен студент повинен написати реферат або виконати індивідуальне завдання за погодженням із викладачем. Теми для самостійної роботи студентів (у тому числі, рефератів) та їх обсяг визначаються даною робочою програмою. Одним із видів самостійної роботи є опрацювання лекційного матеріалу, визначення головного у змісті лекції, засвоєння її основних моментів. Щоб зрозуміти і добре засвоїти лекційний матеріал, до кожної наступної теми слід ретельно готуватись: систематично опрацьовувати матеріал попередньої лекції, і, якщо це необхідно, опрацювати рекомендовану літературу, повторювати пройдений матеріал, на який лектор посилається при викладанні нового, якщо з певних причин лекція пропущена, її необхідно законспектувати і опрацювати самостійно, незрозумілі питання з’ясувати на консультації. Для ґрунтовного засвоєння першоджерел необхідно вдумливо конспектувати їх, вдаючись до різних видів запису (витяги, тези, цитати і т.д.). Готуючись до відповіді, 22
важливо, в першу чергу, визначити напрями наукових досліджень з певної проблеми та впровадження їх результатів у практику. Доцільно підготувати власні спостереження та висновки, обґрунтовуючи їх теоретичними положеннями та рекомендаціями. Особлива увага під час самостійної роботи повинна приділятись набуттю навичок практичної роботи на комп’ютерах з тими програмними продуктами, що вивчаються. Потрібно ознайомитись із основними теоретичними відомостями про програмний продукт за допомогою спеціальної літератури, лекційного та методичного матеріалу або довідкової системи програми. Після цього можна виконувати конкретні практичні завдання. Викладач систематично контролює самостійну роботу студентів: перевіряє конспекти першоджерел, виконання завдань практичних завдань, надає необхідну допомогу для активізації навчальної діяльності студентів. При вивченні дисципліни студенти можуть застосовувати наступні форми самостійної роботи: - самостійне поглиблене вивчення матеріалу на основі конспекту лекцій, їхніх презентацій, рекомендованої й учбово-методичної літератури, періодичних видань по темах лекцій; - написання рефератів за переліком тем, запропонованих викладачем; - самостійна підготовка до практичних занять з використанням навчальних комп’ютерних програм; - підготовка до виконання тестів; - самостійна підготовка до іспиту, у тому числі з використанням навчальних комп’ютерних програм. Методи контролю: - тестування студентів перед виконанням практичних і лабораторних робіт; - опитування студентів під час захисту звітів по лабораторних роботах і на консультаціях; - проведення атестаційного контролю знань студентів під час іспиту. Необхідним елементом для самостійної роботи студентів є користування електронною бібліотекою університету на сайті КНУКіМ www.knukim.edu.ua. Окремою формою самостійної роботи студента є написання реферату. МЕТОДИЧНІ РЕКОМЕНДАЦІЇ ДО НАПИСАННЯ РЕФЕРАТУ Реферат (лат. referre - доповідати, повідомляти) підводить підсумок вивчення студентами як окремої теми, так і дисципліни в цілому. Обсяг реферату визначається специфікою досліджуваного питання і змістом матеріалів (документів), їх науковою цінністю та практичним значенням. Оптимальний обсяг реферату складає 10 -15 сторінок. Реферат має відповідати вимогам до оформлення рукопису кваліфікаційної роботи: вступ і висновки в сумі не повинні перевищувати 20% від її загального обсягу; текст друкується через 1,5 інтервали на одній сторінці стандартного аркуша з такими полями: ліве - 30 мм, праве - 15 мм, верхнє - 20 мм, нижнє - 20 мм; всі сторінки нумеруються: загальна нумерація починається з титульного листа, проте порядковий номер на ньому не ставиться. 23
На титульному листі реферату вказуються: офіційна назва навчального закладу, факультету і кафедри; прізвище та ініціали автора реферату (абревіатура навчальної групи); повна назва теми; прізвище та ініціали наукового керівника, його науковий ступінь і вчене звання; місто, де знаходиться навчальний заклад та рік написання реферату. Після титульного листа подається зміст реферату з точною назвою кожного розділу (параграфу) і вказуванням його сторінок. Список використаних джерел складається з дотриманням загальновизнаних вимог до робіт, що готуються до друку. До списку використаних джерел мають бути включені лише безпосередньо використані в рефераті праці в алфавітному порядку авторів. Монографії і збірники, що не мають на титульному аркуші прізвища автора (авторів), включаються до загального списку за алфавітним розміщенням заголовку. Тема реферату - це не просто повторення засвоєного матеріалу лекції або семінарського заняття. Вона повинна являти собою самостійне розроблення проблеми, достатньо чітко окресленої від інших. Неприпустиме поєднання декількох проблем або, навпаки, штучне виокремлення певної частини єдиного питання. Важливими критеріями при доборі теми реферату, є її актуальність, широка джерельна база, наявність необхідного фактичного матеріалу, а також достатнє її висвітлення в науково-методичній літературі, що передбачає, в першу чергу, ознайомлення із загальною концепцією автора праці та його висновками. Структура реферату: - титульний аркуш; - зміст (план); - вступ; - розділи (вони часто поділяються на параграфи); - висновки; - список використаних джерел; - додатки (у яких наводяться таблиці, схеми, діаграми тощо); - перелік умовних позначень. У вступі реферату обґрунтовується актуальність теми, її особливості, значущість з огляду на розвиток науки та практики або науково-методичної діяльності у сфері освіти. У вступі необхідно подати аналіз використаних джерел, назвавши при цьому авторів, які вивчали дану тематику, визначити сутність основних чинників, що вплинули та розвиток явища або процесу, що досліджується, на недостатньо досліджені питання, з’ясувавши причини їх слабкої аргументації. Основну частину реферату складають кілька розділів (що можуть бути розбиті на параграфи), логічно поєднані між собою. Виклад матеріалу в рефераті має бути логічним, послідовним, без повторень. Слід використовувати синтаксичні конструкції, характерні для стилю наукових документів, уникати складних граматичних зворотів, незвичних термінів і символів або пояснювати їх відразу, при першому згадуванні в тексті реферату. Терміни, окремі слова і словосполучення можна замінювати абревіатурами і сприйнятливими текстовими скороченнями, значення яких зрозуміле з контексту реферату. Неприпустимо використовувати цитати без посилання на автора. При цитуванні будь-якого фрагменту джерела недопустимі неточності. Взагалі, цитатами не слід 24
зловживати. Якщо якийсь важливий документ потребує наведення його в тексті реферату в повному обсязі, то краще винести його в додатки. У рефераті необхідно визначити і викласти основні тенденції дослідження, підтвердити їх найтиповішими прикладами, відобразити сучасні ідеї та гіпотези, методики та методичні підходи до вивчення проблеми. Доцільно зупинитися на якомусь дискусійному моменті і спробувати проаналізувати позиції сторін, приєднавшись до однієї з них, чи висловити власну думку на певну проблему та визначити перспективи її вирішення. Кожен розділ реферату повинен завершуватись короткими висновками, чіткими і лаконічними, де узагальнено оцінки та практичні рекомендації. Можна стисло вказати на перспективи подальшого дослідження даної проблеми. Реферат оцінюється за такими критеріями: актуальність; наукова та практична цінність; глибина розкриття теми, вирішення поставлених завдань; повнота використання рекомендованої літератури; обґрунтування висновків; грамотність; стиль викладу; оформлення реферату; обсяг виконаної роботи; завершеність дослідження.
25
ЛІТЕРАТУРА Основна 1. Баранов А. Н. Введение в прикладную лингвистику / А. Н. Баранов. – М.: Едиториал УРСС, 2003. – С. 168 – 179. 2. Баранов А. Н. Введение в прикладную лингвистику / А. Н. Баранов. – М.: Едиториал УРСС, 2003. – 360 с. 3. Височанський В. С. Елементи інформатики / В. С. Височанський, А. І. Кардаш, О. В. Костів, В. В. Черняхівський. – Львів, 1990. 4. Волошин В. Г. Комп’ютерна лінгвістика: навчальний посібник / В. Г. Волошин. – Суми: ВТД «Університетська книга», 2004. – 382 с. 5. Волошин В. Г. Комп’ютерна лінгвістика: навчальний посібник / В. Г. Волошин. – Суми: ВТД «Університетська книга», 2004. – 382 с. 6. Волошин В. Г. Машинний переклад і комп’ютерна лексикографія. Комп’ютерна лінгвістика: навчальний посібник / В. Г. Волошин – Суми: ВТД «Університетська книга», 2004. – С. 286–331. 7. Герд А. С. Автоматизация в лексикографии и словари-конкордансы / А. С. Герд, В. В. Богданов, И. С. Азарова, С. А. Аверина, Л. В. Зубова / / Филологические науки. – 1981. – № 1. – С. 72–78. 8. Грязнухіна Т. О. Сиситема багатомовного машинного перекладу / Т. О. Грязнухіна // Мовознавство. – 2001. – № 5. 9. Дериева Е. Pragma переводчик / Е. Дериева / / Компьютерное обозрение. – 2004. – № 23. 10. Загнітко А. Українські прийменники: інвентар і структура / А. Загнітко, І. Данилюк, Г. Ситар / / Лінгвістичні студії: зб. наук. праць. – Донецьк: ДонНУ, 2004. – № 12. – С. 41–47. 11. Карпіловська Є. А. Бази даних і бази знань. Вступ до комп’ютерної лінгвістики / Є. А. Карпіловська – Донецьк: ТОВ «Юго-Восток, Лтд», 2003. – С. 33–48. 12. Карпіловська Є. А. Вступ до прикладної лінгвістики: підручник / Є. А. Карпіловська. – Донецьк: ТОВ «Юго-Восток, Лтд», 2006. – 188 с. 13. Карпіловська Є. А. Машинні версії традиційних словників як основа для укладання комп’ютерних словників і тезаурусів / Є. А. Карпіловська / / Мовознавство. – 1996. – № 4–5. – C. 21 – 30. 14. Карпіловська Є. А. Системи машинного перекладу. Вступ до комп’ютерної лінгвістики / Є. А. Карпіловська. – Донецьк: ТОВ «Юго-Восток, Лтд», 2003. – С. 150 – 161. 15. Клименко Н. Ф. Морфемні структури слів у сучасній українській мові / Н. Ф. Клименко, В. С. Карпіловська / / Мовознавство. – 1991. – № 4. – С. 10 – 21. 16. Клименко Н. Ф. Морфемно-словотвірний фонд української мови як дослідницька та інформаційно-довідкова система / Н. Ф. Клименко, Є. А. Карпіловська, Л. І. Комарова / / Мовознавство. – 1990. – № 6. – С. 41–50. 17. Клименко Н. Ф. Передмова Словник афіксальних морфем української мови / Н. Ф. Клименко, Є. А. Карпіловська, В. С. Карпіловський, Т. І. Недозим. – К., 1998. 18. Ковтуненко Л. С. Комп’ютерні аспекти лексикографічних систем / Л. С Ковтуненко / / Мовознавство. – 1996. – № 4–5. 26
19. Лавошникова Э. К. Компьютерная проверка орфографии: вчера, сегодня, завтра / Э. К. Лавошникова / / Вестник МГУ. – 2003. – № 5. 20. Лавошникова Э. К. О «подводных камнях» в компьютерных системах проверки правописания / Э. К. Лавошникова / / Вестник МГУ. – 2002. – № 6. 21. Марчук Ю. Н. Машинный перевод как центральная проблема искусственного интелекта / Ю. Н. Марчук / / Основы компьютерной лингвистики. – М.: Народный учитель, 2000. – С. 175–212. 22. Пещак М. М. Нариси з комп’ютерної лінгвістики / М. М. Пещак. – Ужгород, 1999. – С. 111–166. 23. Пещак М. М. Стан і перспективи комп’ютерної лексикографії в Україні / М. М. Пещак // Мовознавство. – 1996. – № 4–5. – C. 4–15. 24. Рахилина Е. В. О лексических базах данных / Е. В Рахилина / / Вопросы языкознания. – 1994. – № 4. 25. Розенцвейг В. Ю. Опыт создания национальных лексикографических служб за рубежом / В. Ю. Розенцвейг / / Машинний фонд русского языка: идеи й суждения. – М.: Наука, 1986. – С.75–84. 26. Русанівський В. М. Інформаційно-лінгвістичні основи сучасної тлумачної лексикографії / В. М Русанівський, В. А. Широков / / Мовознавство. – 2002. – № 6. – С. 7–48. 27. Русанівський В. М. Теоретико-лінгвістичні засади та інформаційно-комп'ютерне забезпечення україномовних лінгвістичних інтелектуальних систем / В. М. Русанівський, О. О. Тараненко, В. А. Широков / / Мовознавство. – 1996. – № 4–5. – C. 8–16. 28. Слокум Дж. Обзор разработок по машинному переводу: история вопроса, современное состояние и перспективы развития / Дж. Слокум // Новое в зарубежной лингвистике. – М., 1989. – Вып. 24. – С. 357–406. 29. Українські прийменники: Синхронія і діахронія: пробний зошит / За ред. А. П. Загнітка. – Донецьк: ДонНУ, 2003. – С. 6–17. 30. Чаповська Р. Робота з базами даних Mіcrosoft Access 2000: навч. посібник для вузів / Р. Чаповська, А. Жмуркевич. – К.: Центр навч. л-ри, 2004. 31. Широков В. А. Горизонти прикладної лінгвістики та лінгвістичні технології / В. А. Широков, Ю. Д. Апресян, О. В. Палагін, С. С. Дикарева / / Зб. наук. праць ТНУ ім. Вернадського. – 2007. – № 4. – 322 с. 32. Широков В. А. Технологічні основи сучасної тлумачної лексикографії / В. А. Широков, О. Г. Рабулець, І. В. Шевченко, О. М. Костишин, К. М. Якименко / / Мовознавство. – 2002. – № 6. – С. 49–86. Додаткова 33. Дедова О. В. Лингвистичеcкая концепция гипертекста: основные понятия и терминологическая парадигма / О. В. Дедова // Вестник МГУ. – 2001. – № 2. 34. Демська-Кульчицька О. Корпуси мов і один із можливих підходів до проектування корпусу текстів української мови / О. Демська-Кульчицька / / Лінгвістичні студії. – Донецьк, 2005. – № 13. – С. 8–16. 35. Дериева Е. Pragmaтичный переводчик / Е. Дериева / / Компьютерное обозрение. – 2004. – № 23. 36. Загнітко А. Українські прийменники: інвентар і структура / А. Загнітко, І. 27
Данилюк, Г. Ситар / / Лінгвістичні студії: зб. наук. праць. – Донецьк: ДонНУ, 2004. – Вип. 12. – С. 41–47. 37. Зубов А. В. Информационные технологии в лингвистике / А. В. Зубов, И. И. Зубова. – М.: Академия, 2004. – 206 с. 38. Клименко Н. Ф. Морфемно-словотвірний фонд української мови як дослідницька та інформаційно-довідкова система / Н. Ф. Клименко, Є. А. Карпіловська, Л. І. Комарова // Мовознавство. – 1990. – № 6. – С. 41–50. 39. Клименко Н. Ф. Нові підходи до укладання комп’ютерних словників / Н. Ф. Клименко // Мовознавство. – 1996. – № 4–5. 40. Ковтуненко Л. С. Комп’ютерні аспекти лексикографічних систем / Л. С. Ковтуненко // Мовознавство. – 1996. – № 4–5. 41. Колодяжная Л. И. Структура словарного текста в аспекте машинной лексикографии: автореф. дис. канд. філол. наук / Л. И. Колодяжная. – М., 1986. 42. Лавошникова Э. К. Компьютерная проверка орфографии: вчера, сегодня, завтра / Э. К. Лавошникова // Вестник МГУ. – 2003. – № 5. 43. Лосев А. Ф. Введение в общую теорию языковых моделей / А. Ф. Лосев. – 2-е. изд. – М.: Едиториал УРСС, 2004. – 296 с. 44. Пещак М. М. Стан і перспективи комп’ютерної лексикографії в Україні / М. М. Пещак // Мовознавство. – 1996. – № 4–5. 45. Пиотровский Р. Г. Лингвистический автомат и его речемыслительное обоснование / Р. Г. Пиотровский. – Минск, 1999. 46. Пиотровский Р. Г. Моделирование фонологических систем и методы их сравнения / Р. Г. Пиотровский. – М., 1966.
28