Економіко-математичне моделювання
Хмельницький національний університет
01.01.2011
Ніколайчук Микола Володимирович
Міністерство освіти, науки, молоді і спорту Хмельницький національний університет
Економіко-математичне моделювання Теоретичні положення та методичні вказівки для виконання спеціальних частин дипломних робіт магістрів за професійним спрямуванням 2441.2 – "Магістр міжнародних економічних відносин"
Затверджено на засіданні кафедри міжнародних економічних відносин. Протокол № 7 від 15.09.2006 р.
Хмельницький 2011 1
Економіко-математичне моделювання. Теоретичні положення та методичні вказівки для виконання спеціальних частин дипломних робіт для магістрів за професійним спрямуванням "Магістр міжнародних економічних відносин" / М.В. Ніколайчук. – Хмельницький: ХНУ, 2006. – 42 с.
Укладачі: Ніколайчук М.В., к.е.н.
Відповідальний за випуск: Нижник В.М., д.е.н., проф.
Редактор-коректор: Соколова Г.Н. Комп’ютерна верстка: Попенко О.В. Макетування та друк здійснено редакційно-видавничим центром Хмельницького національного університету (м. Хмельницький, вул. Інститутська, 7/1). Підписано до друку __.11.2006 р. Зам. №__, тир. 100 прим., 2006. © ХНУ, 2006 2
ВСТУП
Метою виконання спеціальної частини у дипломному проектуванні є отримання достовірних результатів аналізу обраної магістром для дослідження наукової проблеми, побудова моделі зародження, функціонування та розвитку об’єкта чи предмета дослідження на основі застосування принципів, теоретичних положень та методів економіко-математичного моделювання. Завдання спеціальної частини полягає у застосуванні правил, методів та принципів економіко-математичного моделювання у випадках неможливості отримати достовірних результатів чи висновків за рахунок аналізу технікоекономічних показників, статистичних даних чи інших традиційних способів отримання аналітичних висновків для прийняття рішень у міжнародних економічних відносинах. В результаті застосування методів економіко-математичного моделювання магістри повинні: провести теоретико-методологічне обґрунтування обраних економіко-математичних методів дослідження; у експериментальному порядку застосувати запропоновані методи в ході оцінки та аналізу поставленої наукової проблеми; побудувати економіко-математичну модель функціонування об’єкта дослідження; здійснити прогноз перспективних змін у поставленій науковій проблемі чи об’єкта дослідження. 3
ГРАФІК ВИКОНАННЯ СПЕЦІАЛЬНОЇ ЧАСТИНИ
1
Графік виконання економіко-математичної частини магістерської роботи наведений у таблиці 1.1. Таблиця 1.1 Назва етапу 1. Отримання завдання 2. Опрацювання літературних джерел 3. Аналіз досліджуваної проблеми 4. Побудова економіко-математичної моделі 5. Перспективний прогноз
6. Захист результатів моделювання
Дата виконання етапу 20.10-5.11
Результат
Перелік прийнятних до застосування з досліджуваної наукової проблеми економіко-математичних методів 5.11-20.11 Теоретичне обґрунтування та включення до першого розділу принципів, теоретичних положень та методів застосування економіко-математичного моделювання 20.11-5.01 Аналітичні висновки та включення у другий розділ результатів та ходу виконання економіко-математичного аналізу 5.01-10.01 Створення математичної інтерпретації економічної моделі досліджуваної проблеми з її включенням у другий чи третій розділ 10.01-15.01 Прогноз перспективних тенденцій розвитку досліджуваної проблеми чи змін у функціонуванні об’єкта дослідження на основі запропонованої економіко-математичної моделі 15.01-20.01 Допуск результатів спеціальної частини до захисту
Допуск результатів спеціальної частини до захисту магістри отримують одночасно з завершенням проектування та отриманням відгуку керівника.
4
2
ТЕОРЕТИЧНІ ПОЛОЖЕННЯ ЕКОНОМІКО-МАТЕМАТИЧНОГО МОДЕЛЮВАННЯ 2.1. Суть математичного моделювання
Моделювання як науковий метод, заснований на розробці і дослідженні моделей явищ різної природи, в даний час широко використовується для вирішення багатьох наукових завдань. Загалом модель – це уявний об'єкт, що в процесі дослідження заміщає об'єкт-оригінал і використовується для його вивчення. Модель як інструмент наукового пізнання повинна відтворювати найхарактерніші ознаки системи, що вивчається. Відображатися можуть як самі об'єкти (реальні або абстрактні), так і зв'язки між ними. Моделі представляються у вигляді графіків, малюнків, формул тощо. Для вивчення економічних систем використовуються в основному математичні моделі – системи математичних співвідношень, які описують процес, що вивчається, або явище. Такі моделі прийнято називати економіко-математичними, а складання і вивчення їх – економіко-математичним моделюванням. В ході економіко-математичного моделювання конкретного економічного об'єкту можна виділити наступні етапи: - вивчення і опис економіко-організаційної суті задачі; - розробка математичної моделі і отримання на її основі відповідного рішення; - перевірка адекватності (верифікація) моделі реальної дійсності і аналіз у зв'язку з цим якості рішення; - корегування моделі і рішення у разі недостатньої відповідності моделі реальному процесу; - реалізація ухваленого рішення. Найвідповідальніший етап – вивчення і опис економіко-організаційної суті задачі. Від розуміння суті процесу і виділення його характерних рис, а також від того, як буде сформульована мета рішення задачі, залежить зрештою результат всієї роботи. Далі здійснюється перехід від якісного опису об'єкту, що вивчається, або процесу до формалізованої побудови моделі. Проте часто рішення, одержане за допомогою економіко-математичної моделі, не може бути негайно використане на практиці. Тільки після аналізу перевірки адекватності передумов моделі досліджуваної дійсності можна виробити рекомендації, пов'язані з ухваленням остаточного рішення. Таким чином, в результаті виконання цих процедур одержують скорегований варіант моделі, характер об'єкту, що вивчається, що точніше його відображає. Економіко-математичні моделі призначені для отримання якого-небудь результату у вигляді конкретного числа, точного значення показника. Вони у багатьох випадках використовуються для встановлення загальних і окремих закономірностей економічних процесів і явищ, тобто є аналітичним інструментом аналізу дійсності. Методи економіко-математичного моделювання допомагають уникнути помилок при реалізації тих або інших припущень і рішень, спрямованих на 5
вдосконалення функціонування економічної системи. Відмінною рисою методу є те, що експерименти проводяться на ЕОМ, а не в реальній обстановці, де проведення експериментів часто пов'язане з великими втратами або взагалі неможливе. Тому остаточне рішення, вибране за допомогою економікоматематичного моделювання, є найбільш обґрунтованим, оскільки вибирається як краще з безлічі допустимих рішень. В даний час за допомогою економіко-математичного моделювання вдається вирішувати безліч найрізноманітніших задач: від вибору якнайкращих способів перевезення вантажів, найраціональніших шляхів організації виробничих процесів до задач розвитку окремих регіонів країни і складання оптимальних планів розвитку економіки. Економіко-математичне моделювання дозволяє упорядкувати систему економічної інформації, виявити недоліки (неповноту, невірогідність) наявної інформації і виробити вимоги для підготовки нової інформації і її корегування. Розробка і застосування економіко-математичних моделей (ЕММ) визначають шляхи вдосконалення економічної інформації, орієнтованої на рішення певних комплексів задач планування і управління. Формалізація економічних задач і застосування ЕОМ приводять до прискорення традиційних розрахунків, підвищення їх надійності і скорочення трудомісткості, дозволяють проводити багатоваріантні обґрунтування складних економічних заходів. Завдяки застосуванню економіко-математичного моделювання значно посилюються можливості конкретного кількісного аналізу досліджуваних систем: вивчаються взаємодії багатьох чинників, що роблять істотний вплив на економічні процеси, прогнозуються наслідки змін умов розвитку економічних об'єктів тощо. Моделювання дозволило вирішувати такі економічні задачі, які традиційними способами не могли бути вирішені, наприклад: визначення оптимальних економічних планів, встановлення закономірностей розвитку великих економічних систем на імітаційних моделях, реалізовуваних на ЕОМ тощо. Ефективність використання ЕММ значною мірою залежить від адекватності їх реальним процесам, від того, наскільки вдало вони вписуються в істотну систему планування і управління виробництвом. Історично першими були моделі, що дозволяють ізольовано вирішувати економічні задачі. Останнім часом все більше уваги надається розробці комплексних економікоматематичних моделей, в рамках яких здійснюється формалізація процесу планування і управління соціально-економічних систем. 2.2. Системний підхід в економіко-математичному моделюванні Об'єктами економіко-математичних досліджень є виробничі, господарські і економіко-соціальні системи, в яких протікають процеси перетворення матеріальних і інформаційних потоків. Ефективне дослідження і управління такими системами в сучасних умовах можливе тільки за умови використання новітніх напрямів методології наукового пізнання, серед яких особливе місце 6
займає системний підхід. Суть системного підходу можна зрозуміти і визначити за допомогою загальнішого поняття – система. Система – сукупність (комбінація, набір) взаємозв'язаних елементів або частин, що утворюють єдине ціле (єдиний комплекс), направлене на досягнення єдиної мети. Поняття економіко-виробничої системи базується на трьох положеннях: 1) є безліч взаємозв'язаних елементів або частин; 2) множина утворює єдине ціле, тобто вилучення якої-небудь підмножини елементів порушить властивість цілісності (єдність); 3) єдине ціле має деяку мету або призначення, характерне для всієї сукупності елементів, а не для якої-небудь комбінації з них. Будь-яка система існує у навколишньому середовищі. У реальній дійсності немає абсолютно ізольованих або відособлених систем. Дія середовища на систему виявляється за допомогою факторів, що певним чином впливають на внутрішній стан системи. Дії факторів зовнішнього середовища на систему називаються вхідними діями (екзогенними величинами), а елементи системи, до яких ці дії прикладені, входами системи. У свою чергу, система не є нейтральною по відношенню до зовнішнього середовища. Її дія на зовнішнє середовище характеризується значенням вихідних (ендогенних) величин. Дослідження кожної системи зручно проводити за допомогою декомпозиції (розбиття) системи на підсистеми, які в свою чергу є системами нижчого рівня. Таким чином, декомпозиція зумовлює створення ієрархії системи. Дія системи вищого рівня визначається вхідними величинами, що впливають на дану систему, а вплив останньої системи на системи нижчого рівня виявляється за рахунок дії, визначуваної вихідними параметрами системи. При вивченні будь-якої системи перш за все необхідно з'ясувати найважливіші її характеристики – функцію, мету (призначення) і структуру. Описати функцію системи необхідно для того, щоб усвідомити її важливість, визначити місце, оцінити відношення до інших систем. Під функцією системи звичайно розуміють ті дії системи, які виражаються зміною її можливих станів. Система може просто існувати, служити областю, де знаходяться інші системи, забезпечувати систему вищого порядку тощо. Виконання системою своїх функцій називають функціонуванням системи. Функціонування системи є еволюційний перехід її з одного стану в інші можливі стани. Безліч всіх можливих станів системи визначається числом її елементів, їх властивостями і різноманітністю зв'язків між ними. Тому функція системи характеризує її як єдине ціле, як результат взаємодій її елементів між собою і з вхідними параметрами. Для економічної системи її функція характеризує значення існування самої системи. Метою (призначенням) системи називається визначений, "бажаний" (задане ззовні або встановлене самою системою) стан її виходів, тобто деяке значення або підмножина значень функції системи. Структура системи визначається розміщенням і взаємозв'язками елемен7
тів системи при виконанні нею своїх функцій і залежить від величини і складності системи. Величина системи характеризується числом її елементів і зв'язків між ними, а складність – різноманіттям, неоднорідністю властивостей елементів і різною якістю зв'язків (прямі, зворотні, нейтральні тощо). Таким чином, структура великих і складних систем відрізняється від звичних систем не тільки кількістю елементів, але і вищим рівнем їх організації, глибшими взаємозв'язками елементів. Зміна характеристик однієї змінної впливає, як правило, на багато інших змінних систем. Великим і складним системам характерні властивості цілісності і емерджементності. Цілісність системи означає, що всі її частини слугують загальній меті і сприяють формуванню якнайкращих результатів стосовно певного критерію (сукупності критеріїв) ефективності. Емерджементність виражається у тому, що великі і складні системи володіють властивостями, не властивими жодному з формуючих ці системи елементів. З розвитком подібних систем взаємозв'язок елементів посилюється і на певному етапі емерджементність досягає такого рівня, при якому цілісні характеристики системи не тільки неможливо спостерігати по властивостях окремих елементів, але і виявити статистичним узагальненням властивостей окремих елементів. При дослідженні економічних систем важливо встановити загальні зв'язки між елементами. Науковою основою для раціонального дослідження і ефективного управління різними системами слугує системний підхід. Системний підхід є сукупністю методологічних принципів і положень, що дозволяють розглядати систему як єдине ціле. Він припускає вивчення кожного елементу системи у його зв'язку і взаємодії з іншими елементами, дозволяє спостерігати зміни, що відбуваються в системі в результаті зміни окремих її ланок, виявляти специфічні системні (емерджементні) властивості, робити обґрунтовані припущення щодо закономірностей розвитку системи і визначати оптимальний режим її функціонування. Іншими словами, системний підхід стосовно економічних процесів - це визнання того, що будь-яка наукова проблема є системою, що складається з частин, кожна з яких володіє своїми власними цілями. Тому досягти загальних цілей можна тільки в тому випадку, якщо розглядати її як єдину систему, прагнучи зрозуміти і оцінити взаємодію усіх її частин і об'єднати їх на такій основі, яка дозволить в цілому ефективно добитися наміченої мети. Дослідження економічних процесів з позицій системного підходу вимагає виконання наступних робіт; 1) вивчення взаємозв'язаних вимог об'єктивних економічних законів, що визначають характер і основи планування; 2) визначення мети розвитку даної системи з позицій більш загальної системи, частиною якої вона є, для правильного формулювання критеріїв оптимального планування і функціонування системи; 3) проведення структурного аналізу системи, що розкриває характер 8
взаємозв'язків і призначення кожної підсистеми; 4) дослідження особливостей управління і механізму зворотних зв’язків для ефективної реалізації планів; 5) визначення характеру і ступеня впливу на систему умов функціонування (середовища) для підвищення надійності перспективних рішень; 6) дослідження процесів ухвалення рішень в кожному блоці системи з урахуванням його взаємодії з іншими підсистемами і його місця в системі в цілому. Використання системного підходу при проведенні будь-яких наукових досліджень, у тому числі і за допомогою моделювання (економікоматематичного, імітаційного), зумовлює послідовне виконання конкретних етапів робіт. Число цих етапів, їх найменування і специфіка використання можуть бути різними залежно від вибраного об'єкту і цілей, поставлених перед дослідниками. Розглянемо найзагальніші (укрупнені) етапи робіт: діагностичне (передсистемне) дослідження; формулювання задачі; побудова моделі; отримання рішення і проведення аналізу; апробація результатів дослідження і вдосконалення моделі; впровадження одержаних результатів. Діагностичне (передсистемне) дослідження полягає в якісному аналізі економічної системи. Мета цього етапу полягає у виявленні найважливіших чинників (не виключено, що вибрані на даному етапі чинники в результаті подальших досліджень виявляться неістотними). Зокрема, необхідно скласти попереднє уявлення про змістовну сторону основних управляючих рішень, про критерії ефективності різних варіантів рішень, про ту схему оцінки і порівняння різних критеріїв, яка може бути використана при порівнянні можливих альтернатив. Формулювання задачі. В результаті попереднього діагностичного аналізу визначають основні елементи проблеми, що становлять суть формулювання задачі; керовані змінні, тобто змінні, які задаються управляючими рішеннями; некеровані змінні і можливі рівні їх зміни; різного роду обмеження, яким підкоряються змінні по умові задачі; цільова постановка проблеми. Побудова моделі включає: визначення вхідних даних; встановлення змісту і форми вихідної інформації; запис в математичній формі, якщо це можливо, взаємозв'язки між динамічними і статистичними структурними елементами; встановлення планового періоду, тобто інтервалу часу, протягом якого повинні виявитися результати організаційно-управлінського рішення. Отримання рішення і проведення аналізу. Коли початкова модель побудована, переходять до знаходження математичного рішення. Пошук рішення найчастіше припускає визначення таких значень керованих змінних, які забезпечують раціональність по одній з цілей (або комбінації їх) і допустимі рівні якості функціонування системи з погляду інших цілей. Надмірне ускладнення і дуже великий ступінь деталізації моделі можуть привести до того, що можливості сучасних обчислювальних машин виявляться недостатніми для вирішення відповідних обчислювальних задач. Якщо ж модель дуже спрощена, рішення може виявитися нереальним. Так, щоб у результаті досягти задовільних результатів, не слід виключати Необхідність повтор9
ного розгляду деяких елементів на етапах формування проблеми, побудови моделі і її аналізу. При аналізі рішень серйозну увагу необхідна приділяти визначенню стійкості рішень до варіації різних характеристик моделі. Апробація результатів дослідження і вдосконалення моделі – безперервний процес, який може здійснюватися не тільки після проведення аналізу розрахунків по моделі, але і в ході складання самої моделі. Будь-яка складна математична модель може бути представлена у вигляді укрупненої схеми, кожен блок якої включає велику кількість операцій і тому може удосконалюватися ізольовано від інших. Тому апробація окремих блоків моделі може здійснюватись паралельно з складанням інших алгоритмів і уточненням самої структури моделі. Апробацію кінцевих результатів дослідження слід здійснювати на реальних даних. Строгий аналіз результатів апробації дозволяє виявити недоліки моделі і намітити шляхи її вдосконалення. Впровадження одержаних результатів здійснюється залежно від специфіки вирішуваної задачі і об'єкту. На етапі впровадження важливим є визначення розрахункової економічної ефективності від впровадження результатів дослідження. 2.3. Моделювання і його використання в розвитку і формалізації економічної теорії Сучасна економічна теорія, як на мікро-, так і на макрорівні, включає як природний, необхідний елемент математичні моделі і методи. Використовування математики в економіці дозволяє, по-перше, виділити і формально описати найважливіші, істотні зв'язки економічних змінних і об'єктів, вивчення такого складного об'єкту припускає високий ступінь абстракції. По-друге, з чітко сформульованих початкових даних і співвідношень методами дедукції можна одержувати висновки, адекватні об'єкту, що вивчається, в тій же мірі, що і зроблені передумови. По-третє, методи математики і статистики дозволяють індуктивним шляхом одержувати нові знання про об'єкт, оцінювати форму і параметри залежностей його змінних, найбільшою мірою відповідні наявним спостереженням. Нарешті, по-четверте, використання мови математики дозволяє точно і компактно висловлювати положення економічної теорії, формулювати її поняття і висновки. Будь-яке економічне дослідження завжди припускає об'єднання теорії (економічної моделі) і практики (статистичних даних). У нашому випадку доцільно використати теоретичні моделі для опису і пояснення досліджуваних процесів і зібрати статистичні дані з метою емпіричної побудови і обґрунтування моделей. Будуючи моделі, економісти виявляють істотні чинники, що визначають досліджуване явище і відкидають деталі, неістотні для вирішення поставленої проблеми. Формалізація основних особливостей функціонування економічних об'єктів дозволяє оцінити можливі наслідки дії на них і використати такі оцінки у прийнятті управлінських рішень. 10
Як завжди будується економічна модель? 1. Формулюються предмет і цілі дослідження. 2. Виділяються структурні або функціональні елементи, відповідні поставленої мети, виявляються найважливіші якісні характеристики цих елементів. 3. Словесно, якісно описуються взаємозв'язки між елементами моделі. 4. Вводяться символічні позначення для характеристик економічного об'єкту, що враховуються, і формалізуються, наскільки можливо, взаємозв'язки між ними. Тим самим, формалізується математична модель. 5. Проводяться розрахунки по математичній моделі і аналіз одержаних результатів. При застосування процедури формалізації економічні моделі дозволяють виявити особливості функціонування економічного об'єкта і на основі цього передбачати його майбутню поведінку при зміні яких-небудь параметрів. Прогноз майбутніх змін, наприклад, підвищення обмінного курсу, погіршення економічної кон'юнктури, падіння прибутку може спиратися лише на інтуїцію. Проте при цьому можуть бути упущені, неправильно визначені або невірно оцінені важливі взаємозв'язки економічних показників, що впливають на дану ситуацію. У моделі всі взаємозв'язки змінних можуть бути оцінені кількісно, що дозволяє одержати якісніший і надійніший прогноз. Для будь-якого економічного суб'єкта можливість прогнозування ситуації означає, перш за все, отримання кращих результатів або уникнення втрат. За своїм визначенням будь-яка економічна модель абстрактна і тому неповна, оскільки виділяючи найістотніші чинники, що визначають закономірності функціонування даного економічного об'єкту, вона абстрагується від інших чинників, які, не дивлячись на свою відносну дрібність, все ж таки в сукупності можуть визначати не тільки відхилення в поведінці об'єкту, але і саму його поведінку. Звичайно припускають, що всі чинники, не враховані явно в економічній моделі, здійснюють на об'єкт відносно малу результуючу дію у досліджуваному аспекті. 2.4. Основні типи моделей Математичні моделі, використовувані в економіці, можна підрозділяти на класи по ряду ознак, що відносяться до особливостей модельованого об'єкта, мети моделювання і використовуваного інструментарію: моделі макро- і мікроекономічні, теоретичні і прикладні, оптимізаційні і рівноважні, статичні і динамічні. Макроекономічні моделі описують економіку як єдине ціле, зв'язуючи між собою укрупнені матеріальні і фінансові показники: ВНП, споживання, інвестиції, зайнятість, процентну ставку, кількість грошей тощо. Мікроекономічні моделі описують взаємодію структурних і функціональних складових економіки, або поведінка окремої складової у ринковому середовищі. Внаслідок різноманітності типів економічних елементів і форм їх взаємодії на ринку, мікроекономічне моделювання займає основну частину економіко11
математичної теорії. Теоретичні моделі дозволяють дослідити загальні властивості економіки і її характерних елементів дедукцією висновків з формальних передумов. Прикладні моделі дають можливість оцінити параметри функціонування конкретного економічного об'єкту і сформулювати рекомендації для ухвалення практичних рішень. До прикладних відносяться перш за все економетричні моделі, що оперують числовими значеннями економічних змінних і дозволяють статистично значущо оцінювати їх на основі наявних спостережень. У моделюванні ринкової економіки особливе місце займають рівноважні моделі. Вони описують такі стани економіки, коли результуюча всіх сил, прагнучих вивести її з даного стану, рівна нулю. У неринковій економіці нерівновага по одних параметрах (наприклад, дефіцит) компенсується іншими чинниками (чорний ринок, черги і т.п.). Рівноважні моделі дескриптивні, описові. У нашій країні довгий час переважав нормативний підхід в моделюванні, заснований на оптимізації. Оптимізація в теорії ринкової економіки присутня в основному на мікрорівні (максимізація корисності споживачем або прибули фірмою); на макрорівні результатом раціонального вибору поведінки економічними суб'єктами проявляється у деякому стані рівноваги. У моделях статичних описується стан економічного об'єкту в конкретний момент або період часу; динамічні моделі включають взаємозв'язки змінних в часі. У статичних моделях звичайно зафіксовані значення ряду величин, що є змінними в динаміці, наприклад, капітальних ресурсів, цін і т.п. Динамічна модель не зводиться до простої суми ряду статичних, а описує сили і взаємодії в економіці, визначаючі хід процесів в ній. Динамічні моделі звичайно використовують апарат диференціальних і різницевих рівнянь, варіаційного числення. Детерміновані моделі припускають жорсткі функціональні зв'язки між змінними моделі. Стохастичні моделі допускають наявність випадкових дій на досліджувані показники і використовують інструментарій теорії вірогідності і математичної статистики для їх опису.
12
3
РЕКОМЕНДАЦІЇ ДО ЗАСТОСУВАННЯ МЕТОДІВ ЕКОНОМІКОМАТЕМАТИЧНОГО МОДЕЛЮВАННЯ
Сучасна практика відмічає застосування великого переліку спеціалізованих методів, застосування яких відповідає чітко встановленому етапу досягнення мети економіко-математичного моделювання. Розглянемо окремі з них. 3.1. Основні статистичні поняття Що таке змінні? Змінні – це те, що можна вимірювати, контролювати або змінювати в дослідженнях. Змінні відрізняються багатьма аспектами, особливо роллю, яку відіграють в дослідженнях. Залежні і незалежні змінні. Незалежними змінними називаються змінні, які варіюються дослідником, тоді як залежні змінні – це змінні, які вимірюються або реєструються. Шкали вимірювань. Змінні розрізняються також можливостями вимірювання. Розрізняють наступні типи шкал: (a) номінальна, (b) порядкова (ординальна), (c) інтервальна, (d) відносна. Відповідно, існує чотири типи змінних: (a) номінальна, (b) порядкова, (c) інтервальна і (d) відносна. a. Номінальні змінні використовуються тільки для якісної класифікації. Дані змінні можуть бути виміряні в термінах приналежності до деяких, істотно різних класів; при цьому не можливо визначити кількість або упорядкувати класи. b. Порядкові змінні дозволяють ранжувати (упорядкувати) об'єкти, вказавши які з них більшою чи меншою мірою відповідають якості, вираженій у змінній. Проте вони не дозволяють сказати "на скільки більше" або "на скільки менше". Порядкові змінні іноді також називають ординальними. c. Інтервальні змінні дозволяють упорядковувати об'єкти вимірювання, і чисельно виразити і порівняти відмінності між ними. d. Відносні змінні схожі на інтервальні змінні. На додаток до всіх властивостей змінних, зміряних в інтервальній шкалі, їх характерною межею є наявність певної точки абсолютного нуля. Зв'язки між змінними. Незалежно від типу, дві або більш змінних зв'язані між собою, якщо спостережувані значення цих змінних розподілені узгодженим чином. Змінні залежні, якщо їх значення систематичним чином узгоджені один з одним в спостереженнях. Можна відзначити дві найпростіші властивості залежності між змінними: величина залежності і надійність залежності. Надійність говорить про те, наскільки вірогідно, що залежність, подібна до знайденої, буде знов знайдена (підтвердиться) на даних іншої вибірки, отриманої з тієї ж самої сукупності. 3.2. Показники статистичної оцінки економічних процесів Середнє і довірчий інтервал. Середнє - інформативна міра "центрального положення" досліджуваної змінної, якщо повідомляється її довірчий інте13
рвал. Досліднику потрібні такі статистики, які дозволяють зробити висновок щодо вибірки у цілому. Однієї з таких статистик є середнє. Довірчий інтервал для середнього представляє інтервал значень навколо оцінки, де з даним рівнем достовірності, знаходиться "істинне" (невідоме) середнє сукупності. Невизначений прогноз (тобто широкий довірчий інтервал), найвірогідніше він буде вірним. Ширина довірчого інтервалу залежить від об'єму вибірки, а також від мінливості даних. Збільшення розміру вибірки робить оцінку середнього надійнішою. Збільшення мінливості спостережуваних значень зменшує надійність оцінки. Обчислення довірчих інтервалів ґрунтується на припущенні нормальності спостережуваних величин. Якщо це припущення не виконано, то оцінка може виявитися помилковою, особливо для малих вибірок. При збільшенні обсягу вибірки, скажімо, до 100 або більш, якість оцінки поліпшується і без припущення нормальності вибірки. Форма розподілу, нормальність. Важливим способом "опису" змінної є форма її розподілу, яка показує, з якою частотою значення змінної потрапляють в певні інтервали. Ці інтервали, називають інтервалами сукупності і обираються дослідником. Звичайно дослідника цікавить, наскільки точно розподіл можна апроксимувати (нормалізувати). Прості описові статистики дають про це деяку інформацію. Наприклад, якщо асиметрія (показує відхилення розподілу від симетричного) істотно відрізняється від 0, то розподіл несиметричний, тоді як нормальний розподіл абсолютно симетричний. Асиметрія розподілу з довгим правим хвостом позитивна. Якщо розподіл має довгий лівий хвіст, то його асиметрія негативна. Якщо ексцес (показує "гостроту піку" розподілу) істотно відмінний від 0, то розподіл має або більш закруглений пік, ніж нормальне, або, навпаки, має гостріший пік (можливо, є декілька піків). Звичайно, якщо ексцес позитивний, то пік загострений, якщо негативний, то пік закруглений. Ексцес нормального розподілу рівний 0. Точнішу інформацію про форму розподілу можна одержати за допомогою критеріїв нормальності (наприклад, критерію Колмогорова-Смірнова або W критерію Шапіро-Уїлка). Проте жоден з цих критеріїв не може замінити візуальну перевірку з допомогою гістограми. Гістограма дозволяє "на око" оцінити нормальність емпіричного розподілу. На гістограму накладається крива нормального розподілу. Гістограма дозволяє якісно оцінити різні характеристики розподілу. Наприклад, на ній можна побачити, що розподіл бімодальний (має 2 піки). Це може бути викликано тим, що вибірка неоднорідна, можливо, витягнута з двох різних груп, кожна з яких більш менш нормальна. У таких ситуаціях, щоб зрозуміти природу спостережуваних змінних, можна спробувати знайти якісний спосіб розділення вибірки на дві частини. Визначення кореляції. Кореляція є мірою залежності змінних. Найбільш відома кореляція Пірсона. При обчисленні кореляції Пірсона передбачається, що змінні виміряні, як мінімум, в інтервальній шкалі. Деякі інші коефіцієнти кореляції можуть бути обчислені для менш інформативних шкал. Коефіцієнти кореляції змінюються в межах від –1,00 до +1,00 (рис. 1). Значення -1,00 означає, що 14
змінні мають строгу негативну кореляцію. Значення +1,00 означає, що змінні мають строгу позитивну кореляцію. Значення 0,00 означає відсутність кореляції. Найчастіше використовуr=0,90 r=-0,90 ваний коефіцієнт кореляції Пірсона r називається також лінійною кореляцією, оскільки вимірює ступінь лінійних зв'язків між змінними. Проста лінійна кореляr=0,00 r=0,40 ція (Пірсона r). Проста кореляція припускає, що дві дані змінні вимірянні, принаймні, в інтервальній шкалі. Вона визначає ступінь, з якою значення двох змінних "пропорційні" один Рис. 1. Розподіл даних за рівнем кореляційного зв’язку одному. Значення коефіцієнта кореляції не залежить від масштабу вимірювання. Тобто, кореляція між зростанням і вагою буде однією і тією ж, незалежно від того, проводилися вимірювання в дюймах і фунтах або в сантиметрах і кілограмах. Пропорційність означає просту лінійну залежність. Кореляція висока, якщо на гра- r=0,00 r=0,30 фіку залежність "можна відобразити" прямою лінією (з позитивним або негативним кутом нахилу) (рис. 2). Проведена пряма називається прямою регресії або пряr=0,90 мою, побудованою методом r=0,60 найменших квадратів. Останній термін пов'язаний з тим, що сума квадратів відстаней (обчислених по осі У) від спостережуваних крапок до прямої є мінімальною. Рис. 2. Пряма регресії Помітимо, що використовування квадратів відстаней призводить до того, що оцінки параметрів прямої сильно реагують на викиди. Як інтерпретувати значення кореляцій. Коефіцієнт кореляції Пірсона (r) є мірою лінійної залежності двох змінних. Якщо його піднести до квадрату, то отримуємо значення коефіцієнта детермінації r2, що визначає частку варіації, загальну для двох змінних (іншими словами, "міра" залежності двох змінних). Щоб оцінити залежність між змінними, потрібно знати як "величину" кореляції, так і її значущість. Значущість коефіцієнта кореляції залежить від розміру вибірки. Критерій значущості ґрунтується на припущенні, що розподіл залишків (відхилень спостережень від регресійної прямої) для залежної змінної є нормальним (з 15
постійною дисперсією для всіх значень незалежної змінної). Нелінійні залежності між змінними. Можливим джерелом труднощів, пов'язаним з лінійною кореляцією Пірсона r, є форма залежності. Кореляція Пірсона r добре підходить для опису лінійної залежності. Відхилення від лінійності збільшують загальну суму квадратів відстаней від регресійної прямої, навіть якщо вона представляє "істинні" і дуже тісні зв'язки між змінними. Вимірювання нелінійних залежностей. Що робити, якщо кореляція сильна, проте залежність явно нелінійна? Не існує простого відповіді на дане питання, оскільки не має узагальнення коефіцієнта кореляції Пірсона r на випадок нелінійних залежностей. Проте, якщо крива монотонна (монотонно зростає або, навпаки, монотонно спадає), то можна перетворити одну або обидві змінні, щоб зробити залежність лінійною, а потім вже обчислити кореляцію між перетвореними величинами. Для цього у магістерських роботах доцільно використати логарифмічне перетворення. Здійснення статистичних оцінок відбувається з допомогою таких усереднених показників: - середнє арифметичне; - середнє квадратичне; - середнє геометричне; - середнє гармонічне; - середнє кубічне. Відхилення даних відносно середнього значення визначаються: - дисперсією; - середньоквадратичним відхиленням – квадратним коренем із дисперсії, менше значення величини відносно її середнього значення, свідчить про рівномірний розподіл ряду даних; - середнім модулем відхилень; - ексцесом (крутістю ряду або щільністю розподілу ймовірності). Для нормального розподілу ексцес дорівнює нулю, для крутих кривих розподілу він додатний, а для плоских – від'ємний порівняно з нормальною щільністю розподілу кривих; - асиметричністю (ступенем асиметричності ряду або щільності розподілу ймовірності випадкової величини відносно її середнього значення). При симетричному розподілі коефіцієнт асиметрії дорівнює нулю; - максимумом; - мінімумом; - найбільшим К-м (К – порядок значення, меншого за максимум); - найменшим К-м (К – порядок значення, більшого за мінімум); - інтервалом (максимум – мінімум); - модою (значенням, що найчастіше зустрічається уряду даних); - медіаною (значенням, розміщеним посередині ряду даних); - квартилями розподілу (підмножинами даних з однаковим числом елементів); - довірчим інтервалом тощо.
16
3.3. Надійність і позиційний аналіз У багатьох областях досліджень точне вимірювання змінних саме по собі представляє складну задачу. Наприклад, в економіці точне вимірювання характеристик або відносин до чого-небудь – необхідний перший крок, що передує всякій теорії. В цілому, очевидно, що у всіх гуманітарних дисциплінах ненадійні вимірювання перешкоджатимуть спробі передбачити чиюсь поведінку. Оцінювання надійності шкали засноване на кореляціях між індивідуальними позиціями або вимірюваннями, що становлять шкалу, і дисперсіями цих позицій. Перевірка гіпотез про залежність позицій, перевірка гіпотез про залежність між позиціями і критеріями. Кожне вимірювання (відповідь на питання) включає як істинне значення, так і частково неконтрольовану, випадкову погрішність. У цьому контексті надійність розуміється безпосередньо: вимірювання є надійним, якщо його основну частину, по відношенню до погрішності, складає істинне значення. Ймовірно, у людей існують значні відмінності, що стосуються симпатій і антипатій, які закладаються у відповідях на запитання анкети. Заходи надійності. Звідси неважко вивести критерій або статистику для опису надійності позиції або шкали. Саме, можна ввести індекс надійності, як відношення варіації істинної мітки (істинного значення), властивої суб'єктам або респондентам, до загальної варіації. Що відбудеться, якщо підсумувати декілька більш менш надійних позицій, побудованих з метою оцінки упередження? Припустимо, що питання були сформульовані так, щоб охопити можливо ширший спектр різних упереджень. Якщо помилкова компонента у відповідях респондентів на кожне питання дійсно випадкова, то можна чекати, що у відповідях на різні питання випадкові компоненти взаємно пригнічуватимуть один одного. Математичне очікування сумарної погрішності по сукупності всіх питань (позицій шкали) буде рівне нулю. Компонента істинної мітки залишається незмінною при підсумовуванні по всіх позиціях. Чим більше буде додано питань, тим точніше істинна мітка (по відношенню до погрішності) буде відображена на сумарній шкалі. Кількість позицій і надійність. Цей висновок описує важливий принцип побудови критерію, а саме: чим більше позицій беруть участь в побудові шкали для вимірювання даної концепції, тим більше надійним буде вимірювання (сумарна шкала). 3.4. Аналіз відповідностей Аналіз відповідностей містить описові і розвідувальні методи аналізу двокрокових і багатокрокових таблиць. Ці методи дозволяють досліджувати структуру групуючих змінних, включених в таблицю. Одним з найзагальніших різновидів багатокрокових таблиць є частотні таблиці зв'язаності. У аналізі відповідностей частоти в таблиці зв'язаності стандартизуются так, щоб сума спостережень у всіх осередках була рівна 1. Однією з цілей ана17
лізу відповідностей є представлення вмісту таблиці відносних частот у вигляді відстаней між окремими рядками і/чи стовпцями таблиці в просторі можливо нижчій розмірності. Маса. Нормована таблиця показує, як розподілена одинична маса по осередках. У термінології аналізу відповідностей, суми по рядках і стовпцях в матриці відносних частот називаються масою рядка і стовпця, відповідно. Інерція. Термін інерція у аналізі відповідностей використовується по аналогії з прикладною математикою, де поняття "момент інерції" визначається як інтеграл елементу маси помноженої на квадрат відстані до центру мас. 3.5. Прогнозування економічних процесів на основі часових рядів Часовим чи динамічним рядом називають набір розміщених у хронологічній послідовності значень статистичних показників. Часові ряди включають: - періоди часу, яких стосуються статистичні дані; - статистичні показники, які характеризують явище за представлений період. Часові ряди відображають розвиток світо-економічних процесів. Для них властиві дві взаємопов'язані риси: динамічність та інерційність. Динамічність проявляється варіацією показників, що характеризують процес; інерційність – сталістю механізму формування процесу, напрямом та інтенсивністю розвитку протягом певного часу. Від поєднання цих рис динамічний ряд включає залишки минулого, основи сучасного і зародки майбутнього. Єдність мінливості та сталості, динамічності й інерційності формує закономірності розвитку статистичних показників. Крім закономірних коливань значень показників, у динамічних рядах спостерігаються також випадкові коливання. За моделювання динамічних процесів причинний механізм формування властивих їм особливостей в явному вигляді не враховується. Будь-який процес розглядається як функція часу. Час не є чинником конкретного соціальноекономічного процесу, проте зміна показників у часі, як правило, акумулює комплекс постійно діючих умов і причин, що визначають цей процес. Визначення тенденції розвитку процесу називається вирівнюванням динамічного ряду, а методи її виявлення – методами вирівнювання. Останнє дає змогу характеризувати особливості змін у часі динамічного ряду в найзагальнішому вигляді як функцію часу. При цьому вважається, що через час можна виразити вплив усіх основних чинників. Поширеним методом аналізу динамічного ряду є його згладжування. Фактичні значення показників замінюються середніми за певний інтервал. Варіація середніх значень порівняно з варіацією емпіричного ряду значно менша. Тому характер динаміки процесу проявляється чіткіше. Лінійне згладжування динамічного ряду можна здійснювати методом ковзаючих середніх. Цей метод застосовується для прогнозування процесів з незначною варіацією середніх протягом коротких періодів часу. Всі спостереження часового ряду мають однакову значущість 1/п незалежно від їхнього місця у вхідних 18
даних. При досить великих п>25 додання нових даних майже не змінює їх середнє значення для попереднього моменту часу. Для визначення ковзаючого середнього формують збільшені інтервали, що складаються з однакової кількості періодів. Кожний наступний інтервал одержують, послідовно просуваючись від початкового значення динамічного ряду на один крок уперед. Ковзаюче середнє використовують для розрахунку їхніх значень у прогнозованому періоді на основі середнього значення показників для зазначеного числа попередніх періодів. Кожне прогнозоване значення показників визначається формулою t
y( t )
it m1
y( i )
,
(3.1)
m
де т – число попередніх періодів; у(і) – фактичне значення показників у момент часу і; yt – прогнозоване значення показників у момент часу t. Перший інтервал включатиме значення у1, у2, ..., ут; другий – значення у2, у3, ..., ут+1 і т.д. Таким чином, інтервал згладжування ніби ковзає по динамічному ряду з кроком, що дорівнює одиниці. Одержані середні значення показників належать до середини інтервалу, і технічно зручніше формувати збільшений інтервал з непарної кількості періодів (3, 5 тощо). При парному т середина інтервалу лежатиме між двома часовими точками, і тоді виконують додаткову процедуру центрування (усереднення) кожної пари значень. Оцінка тенденції розвитку процесів методом ковзаючих середніх є емпіричним способом їх попереднього аналізу. Даний метод виступає допоміжним для спрощення використання інших методів. Його основна перевага – наочність і простота визначення тенденції. Ковзаючі середні значення показників залежать від даних за попередні періоди, а при значних інтервалах згладжування може бути виявлена циклічність процесу навіть за відсутності циклів у динамічному ряду. Експоненціальні середні значення показників мають більшу часову стійкість порівняно з ковзаючими середніми. В їх визначенні враховуються всі спостереження вхідного ряду даних, однак з різними ваговими коефіцієнтами. При цьому залежність чергових прогнозованих значень показників від попередніх більш сильна, ніж від значень у початковий період. Емпіричний часовий ряд даних визначається виразом y't = (1 - α)y't-i + αyt, (3.2) де y't – прогнозоване значення показників для періоду t; y't-i – те саме, але для періоду (t-і); уt – фактичне значення показників для періоду t; 0<α<1 – коефіцієнт експоненціального згладжування, що визначає вагу t-то періоду. Чим більше значення α, тим сильніший вплив коливань ряду даних. При невеликих значеннях α процес є більш інерційним до фактичних значень показників і більше враховуються їх прогнозовані значення за попередній період. 19
3.6. Оцінка тимчасових рядів Аналіз тимчасових рядів ґрунтується на припущенні, що послідовні значення спостерігаються через рівні проміжки часу (тоді як в інших методах не важлива і часто не цікава прив'язка спостережень до часу). Існують дві основні цілі аналізу тимчасових рядів: (1) визначення природи ряду і (2) прогнозування (прогноз майбутніх значень тимчасового ряду по справжніх і минулих значеннях). Обидві цілі вимагають, щоб модель ряду була ідентифікована і, більш менш, формально описана. Як тільки модель визначена, з її допомогою можна інтерпретувати дані (наприклад, використовувати для розуміння сезонної зміни цін на товари). Не звертаючи уваги на глибину розуміння і справедливість теорії, можна екстраполювати ряд на основі знайденої моделі, тобто передбачити його майбутні значення. Систематична складова і випадковий шум. Аналіз тимчасових рядів припускає, що дані містять систематичну складову (включає декілька компонент) і випадковий шум (помилку), який утрудняє виявлення регулярних компонент. Більшість методів дослідження тимчасових рядів включає різні способи фільтрації шуму, що дозволяють побачити регулярну складову виразніше. Загальні типи компонент тимчасових рядів. Більшість регулярних складових тимчасових рядів належить до двох класів: тренд, або сезонна складова. Тренд є загальною систематичною лінійною або нелінійною компоненту, яка може змінюватися в часі. Сезонна складова – це компонента що періодично повторюється. Обидва ці види регулярних компонент часто присутні в ряду одночасно. Аналіз тренду. Не існує "автоматичного" способу виявлення тренду в тимчасовому ряду. Проте якщо тренд є монотонним (стійко зростає або стійко знижується), аналізувати такий ряд звичайно неважко. Якщо тимчасові ряди містять значну помилку, то першим кроком виділення тренду є згладжування. Згладжування. Згладжування завжди включає деякий спосіб локального усереднювання даних, при якому несистематичні компоненти взаємно погашають один одного. Найзагальніший метод згладжування – ковзаюче середнє, в якому кожен член ряду замінюється простим або зваженим середнім сусідніх членів. Підгонка функції. Багато монотонних тимчасових рядів можна добре наблизити лінійною функцією. Якщо є явна монотонна нелінійна компоненту, то спочатку слід усунути нелінійність. Звичайно для цього використовують логарифмічне, експоненціальне або (менш часто) поліноміальноє перетворення даних. Аналіз сезонності. У випадку коли кожне спостереження схоже на сусіднє, і додатково, є сезонна складова, що повторюється, це означає, що кожне спостереження також схоже на спостереження, що було в тому ж самому періоді рік тому. Загалом, періодична залежність може бути формально визначена як кореляційна залежність між кожним елементом ряду і попереднім елементом. Її можна зміряти за допомогою автокореляції (тобто кореляції між самими членами ряду), що звичайно називають лагом. Якщо помилка вимірювання не 20
дуже велика, то сезонність можна визначити візуально, розглядаючи поведінку елементів ряду через кожні кілька тимчасових одиниць. Аналіз розподілених лагів – це спеціальний метод оцінки залежності, що запізнюється, між рядами. Такого роду залежності особливо часто виникають в економетриці. У цих випадках, є незалежна змінна, яка впливає на залежні змінні з деяким запізнюванням (лагом). Метод розподілених лагів дозволяє досліджувати такого роду залежність. 3.7. Графічні методи аналізу даних Одним з наймогутніших аналітичних методів дослідження є розділення даних на групи для порівняння структури підмножин. Ці методи широко застосовуються як в апріорному аналізі, так і при перевірці гіпотез і відомі під різними назвами (класифікація, угрупування, категоризація, розбиття, розшарування тощо). Графічні засоби дають переваги і дозволяють виявити закономірності, які важко піддаються кількісному опису і які складно знайти за допомогою обчислювальних процедур. Графічні методи надають унікальні можливості багатовимірного аналітичного дослідження. Гістограми використовуються для вивчення розподілів частот значень змінних. Частотний розподіл показує, які саме значення або діапазони значень досліджуваної змінної зустрічаються найчастіше, наскільки розрізняються ці значення, чи розташовано більшість спостережень біля середнього значення, є розподіл симетричним або асиметричним багатомодальним (тобто має дві або більш вершини) або одномодальним тощо. Гістограми також використовуються для порівняння спостережуваних і теоретичних або очікуваних розподілів. Двовимірні діаграми розсіювання використовуються для візуалізації взаємозв'язків між двома змінними X і У (наприклад, вагою і зростанням). На цих діаграмах окремі точки даних представлені маркерами на площині, де осі відповідають змінним. Дві координати (X і У), визначаючі положення крапки, відповідають значенням змінних. Якщо між змінними існує сильний взаємозв'язок, то крапки на графіку утворюють впорядковану структуру (наприклад, пряму лінію або характерну криву). Якщо змінні не взаємозв'язані, то крапки утворюють "хмару". Існує три типи графіків вірогідності: нормальні, напівнормальні з виключним трендом. Нормальні графіки вірогідності - це швидкий спосіб візуальної перевірки ступеня відповідності даних нормальному розподілу. Графіки вірогідності дають можливість досліджувати близькість до нормального розподілу різних підгруп даних. Нормальні графіки вірогідності є ефективним інструментом для дослідження однорідності групи спостережень з погляду відповідності нормальному розподілу. На лінійних графіках окремі точки даних з'єднуються лініями. Це простий спосіб візуального представлення послідовності значень. Лінійні графіки будуються в тому випадку, якщо необхідно розбити дані на декілька груп з допомогою змінної, або за допомогою логічних умов, складених по декількох 21
змінних. На діаграмах розмаху представлені діапазони значень вибраної змінної для окремих груп спостережень. Для виділення цих груп використовуються від однієї до трьох змінних, що групують, або набір логічних умов вибору підгруп. Для кожної групи спостережень обчислюється центральна тенденція (медіана або середнє), а також розмах або мінливість (квартилі, стандартні похибки або стандартні відхилення). Вибрані параметри відображаються на графіку одним з п'яти способів (прямокутники-відрізки, відрізки, прямокутники, стовбці або верхні-нижні зарубки). На цьому графіку можна показати і викиди. Одним з найбільш широко використовуваних типів графічного представлення даних є кругові діаграми, на яких показані пропорції або самі значення змінних. Графіки цього типу складаються з декількох кругових діаграм, де дані розділені по групах за допомогою однієї або декількох змінних, що групують. Всі значення вибраної змінної групуються за допомогою заданого методу, а потім відносні значення частот відображаються у вигляді сегментів кругової діаграми пропорційного розміру. Таким чином, ці графіки є альтернативним представленням гістограми частот. Графіки пропущених значень і даних поза діапазоном. На цих графіках можна наочно представити структуру розподілу точок даних, що містять пропущені значення діапазонів, що знаходяться зовні, заданих користувачем критеріїв. При цьому будується по одній двовимірній діаграмі для кожної групи спостережень, виділеної з допомогою змінних або за допомогою умов вибору складних підгруп. Ці типи графіків використовуються в апріорному аналізі даних, щоб визначити, чи є випадковим розподіл точок з пропущеними значеннями, а також для оцінки їх діапазону. Тривимірні графіки доцільно будувати для підгруп спостережень, заданих за допомогою вибраної змінної або логічних умов вибору. Основна задача цих графіків – спростити порівняння взаємозв'язків між трьома і більш змінними для різних груп або категорій спостережень. Тривимірні графіки в координатах XYZ відображають взаємозв'язки між трьома змінними. За допомогою різних способів групування можна досліджувати ці залежності за різних умов. 3.8. Трендовий аналіз Показники окремих економічних процесів, що мають випадковий характер, застосовуються для побудови часових рядів здобутих у певні моменти часу. Вказані часові ряди визначаються тенденцією розвитку в часі, яка називається трендом. Трендові моделі забезпечують прогнози на коротко- та середньостроковий періоди. При застосуванні трендових моделей слід дотримуватись наступних умов: - період часу має бути достатнім для виявлення закономірностей; - трендова модель в аналізований період має розвиватись еволюційно; - процес повинен мати певну інерційність, для великих змін у поведінці 22
процесу потрібний значний час; - вплив більш пізньої інформації має сильніше відображатись на прогнозованій оцінці. Лінія тренду застосовується для розв'язання задач прогнозування за допомогою методів регресійного аналізу. Визначення функції тренду відбувається з допомогою методу найменших квадратів. Оцінка точності моделі здійснюється з допомогою коефіцієнта детермінації, на основі дисперсії емпіричних даних та значень трендової моделі. Розвиток процесу відображається шуканою моделлю, якщо коефіцієнт детермінації прямує до 1. Може існувати наступний розвиток явища: - рівномірно при сталому абсолютному прирості чергового рівня часового ряду даних за лінійним законом у = а0 + a1×t, (3.3) де а0 – стала; а1 – коефіцієнт регресії, що визначає швидкість і напрямок (<0 - спадання; >0 – зростання) розвитку; t – час появи чергової події. - рівноприскорено при сталому в часі збільшенні/зниженні темпу приросту рівнів (парабола другого порядку) у = a0 + a1×t+ a2×t2, (3.4) де а2 – коефіцієнт, що характеризує сталу зміну швидкості (темпу) розвитку (а2>0 – прискорення розвитку, а2<0 – його сповільнення); - із змінним прискоренням (сповільненням) при змінному в часі збільшенні (зменшенні) розвитку за законом (парабола третього – шостого порядків) у = а0 + a1×t + a2×t2 + a3×t3 + ...+ a6×t6, (3.5) - зі сповільненням зростання в кінці періоду, коли приріст у кінцевих значеннях ряду даних прямує до нуля (логарифмічна функція) у =а1lnt + а0, (3.6) - зі зростанням за експоненціальним законом у = а0еа1t, (3.7) - зі сталим відносним приростом за законом степеневої функції (гіпербола) y = a0×ta1, y = a0 + a1/t. (3.8) Графічним способом трендові моделі будуються на основі двовимірних діаграм: лінійних, графіків, гістограм, точкових, що відображають динамічні зміни. 3.9. Дерева класифікації Дерева класифікації – це метод, що дозволяє передбачати приналежність спостережень або об'єктів до того або іншого класу категоріальної залежної змінної залежно від відповідних значень однієї або декількох змінних. Побудова дерев класифікації – один з найважливіших методів, використовуваних при проведенні отримання даних. Мета побудови дерев класифікації полягає в прогнозі (або поясненні) 23
значень залежної змінної, і тому використовувані методи тісно пов'язані з більш традиційними методами дискримінантного аналізу, кластерного аналізу, непараметричної статистики, нелінійного оцінювання. Широка сфера застосування дерев класифікації робить їх привабливим інструментом аналізу даних, але не слід його використовувати замість традиційних методів статистики. Якщо виконані строгіші теоретичні припущення, що накладаються традиційними методами, і вибірковий розподіл володіє деякими спеціальними властивостями, то результативним буде використання саме традиційних методів. Як метод розвідувального аналізу, або як останній засіб, коли недієві всі традиційні методи, дерева класифікації, на думку дослідників, не знають собі рівних. Дерева класифікації ідеально пристосовані для графічного уявлення, і тому зроблені на їх основі висновки набагато легше інтерпретувати, ніж якби вони досліджувались тільки в числовій формі. Процес побудови дерева класифікації складається з чотирьох основних кроків: 1. Вибір критерію точності прогнозу. Мета аналізу за допомогою дерев класифікації полягає в тому, щоб одержати максимально точний прогноз. Найкращий прогноз дає найменший відсоток неправильних класифікацій. 2. Вибір типу галуження. Другий крок аналізу за допомогою дерев класифікації полягає в тому, щоб вибрати спосіб галуження по значеннях змінних, які використовуються для прогнозу приналежності аналізованих об'єктів до певних класів значень залежної змінної. Відповідно до ієрархічної природи дерев класифікації, такі галуження виробляються послідовно, починаючи з кореневої вершини, переходячи до вершин-наступників, поки подальше галуження не припиниться і "нерозгалужені" вершини-наступники виявляться термінальними. 3. Визначення моменту припинення галужень. Третій етап аналізу з допомогою дерев класифікації полягає у виборі моменту, коли слід припинити подальші галуження. Дерева класифікації володіють властивістю: якщо не встановлене обмеження на число галужень, то можна дійти "чистої" класифікації, коли кожна термінальна вершина містить тільки один клас об'єктів. 4. Визначення розмірів дерева. Можна визначити ряд загальних міркувань про те, що слід вважати "відповідними розмірами" для дерев класифікації. Воно повинне бути достатньо складним, щоб враховувати наявну інформацію, і в той же час бути якомога простішим. Дерево повинне уміти використовувати ту інформацію, яка покращує точність прогнозу, і ігнорувати інформацію, яка прогнозу не покращує. По можливості воно повинне поглиблювати розуміння явища, яке необхідно описати. 3.10. Дискримінантний аналіз Дискримінантний аналіз використовується для ухвалення рішення про те, які змінні розрізняють (дискримінують) дві або більш сукупностей. Основна ідея дискримінантного аналізу полягає у визначенні, чи відрізняються сукупності по середньому якою-небудь змінною (або лінійної комбінації змінних), і використанні цієї змінної, у передбачені приналежності нових членів до групи. 24
При застосуванні дискримінантного аналізу існує декілька змінних. Задача полягає у встановленні змінних, які здійснюють внесок в дискримінацію між сукупностями. В цьому випадку використовують матриці загальних дисперсій і коваріацій, а також матриці внутрішньогрупових дисперсій і коваріацій. Порівнюють матриці за допомогою багатовимірного F-критерію для визначення значущої відмінності між групами. Найзагальнішим застосуванням дискримінантного аналізу є включення в дослідження багатьох змінних з метою визначення тих, що найкращим чином розділяють сукупності між собою. У покроковому аналізі дискримінантних функцій на кожному кроці є видимі всі змінні і знаходиться та, що здійснює найбільший внесок у відмінність між сукупностями. Можна рухатись у зворотному напрямі. У цьому випадку всі змінні спочатку включені в модель, а потім на кожному кроці усуватимуться змінні, що вносять малий внесок у прогнози. Тоді як результат успішного аналізу можна зберегти "важливі" змінні в моделі, чий внесок в дискримінацію більший за інших. При інтерпретації дискримінантної функції для декількох сукупностей і змінних, спочатку слід перевірити значущість функцій і надалі використовувати тільки значущі функції. У кожній значущій функції необхідно розглянути для кожної змінної стандартизовані коефіцієнти бета. Чим більший стандартизований коефіцієнт бета, тим більшим є внесок змінної в дискримінацію. У порядку отримання осмислених значень дискримінантних функцій можна досліджувати матрицю структури чинника з кореляціями між змінними і дискримінантною функцією. На закінчення, необхідно подивитися на середні значущих дискримінантних функцій для визначення з якими сукупностями проводять дискримінацію. Іншою метою застосування дискримінантного аналізу є проведення класифікації. Як тільки модель встановлена і одержані дискримінантні функції, виникає питання про прогнозні можливості та до якої сукупності належить конкретний зразок? Перш ніж приступити до вивчення деталей різних процедур оцінювання, важливо з'ясувати, що ця різниця ясна. Класифікація діє кращим чином для вибірки, по якій була проведена оцінка дискримінантної функції (апостеріорна класифікація), ніж для нової вибірки (апріорна класифікація). Труднощі з класифікацією полягають у тому, що ніхто не знає, що може з’явитись у майбутньому. Набагато легше класифікувати вже наявні зразки. Тому оцінювання якості процедури класифікації ніколи не виробляють по тій же самій вибірці, по якій була оцінена дискримінантна функція. Якщо бажають використовувати процедуру для класифікації майбутніх зразків, то її слід випробувати на нових об'єктах. Функції класифікації призначені для визначення, до якої групи найімовірніше може бути віднесений об'єкт. Функцій класифікації є стільки ж, скільки груп. Дискримінантний аналіз – корисний інструмент (1) - для пошуку змінних, що дозволяють відносити спостережувані об'єкти в одну або кілька реально спостережуваних груп, (2) - для класифікації спостережень в різні групи. 25
3.11. Дисперсний аналіз Основною метою дисперсного аналізу є дослідження значущості відмінності між середніми. Для вибірки об'єму n вибіркова дисперсія обчислюється як сума квадратів відхилень від вибіркового середнього, ділена на n-1. При фіксованому об'ємі вибірки n дисперсія є функцією суми квадратів (відхилень), що позначається, скорочено, SS (від англійського Sum of Squares - Сума квадратів). У основі дисперсного аналізу лежить розділення дисперсії на компоненти. Метою дисперсного аналізу є перевірка статистичної значущості відмінності між середніми. Перевірка проводиться за допомогою розбиття суми квадратів на компоненти, тобто за допомогою розбиття загальної дисперсії на частини, одна з яких обумовлена випадковою помилкою, а друга пов'язана з відмінністю середніх значень. Остання компонента використовується для аналізу статистичної значущості відмінності між середніми значеннями. Якщо відмінність значуща, нульова гіпотеза відкидається і приймається альтернативна про існування відмінності між середніми. У загальному випадку взаємодія між чинниками описується у вигляді зміни одного ефекту під впливом іншого. Передбачається, що дисперсії в різних групах однакові. Це припущення називається припущенням про однорідність дисперсії. У багатовимірних планах застосовуються припущення про однорідність дисперсії. Оскільки існують багатовимірні залежні змінні, то необхідно щоб їх взаємні кореляції були однорідні по всіх підгрупах. Порушення однорідності дисперсії можуть з’явитись коли кореляція між коваріантами і залежними вимірюваннями різна. Тоді, в різних підгрупах, можна отримати невірне тлумачення результатів. В коваріаційному аналізі проводиться регресійний аналіз усередині підгрупи для виділення частини дисперсії, яка відповідає коваріанті. Однорідність дисперсії припускає, що регресійний аналіз проводиться при наступному обмеженні: всі регресійні рівняння для підгруп однакові. Якщо це не виконується, можуть з'явитися помилки. 3.12. Канонічний аналіз При обчисленні канонічного кореня підраховуються власні значення матриці кореляцій. Ці значення довші дисперсії, з'ясовної кореляцією між відповідними канонічними змінними. При цьому одержана частка обчислюється щодо дисперсії канонічних змінних, тобто зважених сум по двох змінних. Таким чином, власні значення не показують абсолютного рівня, з'ясовного у відповідних канонічних змінних. При проведенні аналізу обчислюється стільки власних значень, скільки є канонічних коренів, тобто скільки змінних є в найменшій множині. На першому кроці обчислюється вага, що максимізує кореляцію між зваженими сумами по двох множинах і визначає відповідне значення першого кореня. Далі, на кожному кроці знаходиться наступна пара канонічних змін26
них, що має максимальну кореляцію і некорельованих з попередніми парами та обчислюється відповідне їй значення канонічного кореня. Якщо визначити квадратний корінь з набутих власних значень, можна одержати набір чисел, який можна інтерпретувати як коефіцієнти кореляції. Оскільки вони відносяться до канонічних змінних, їх також називають канонічними кореляціями. Канонічні кореляції оцінюються у порядку убування. Тільки корінь, який виявився статистично значущими, залишається для подальшого аналізу. Після визначення канонічного кореня виникає питання про його інтерпретацію. Корінь насправді представляє дві зважені суми, по одній на кожну сукупність змінних. Одним із способів тлумачення канонічного кореня є розгляд ваг, зіставлених безлічі змінних. Ця вага називається канонічною вагою. Більше абсолютне значення ваги, здійснює більший внесок в значення канонічної змінної. Канонічна вага також може використовуватися для обчислення значень канонічних змінних. Для цього достатньо додати початкові змінні з відповідними ваговими коефіцієнтами. Ще одним способом інтерпретації канонічного коріння є розгляд звичних кореляцій між канонічними змінними кожної множини. Ці кореляції називаються канонічними навантаженнями чинників. Вважається, що змінні, сильно корельовані з канонічною змінною, мають з нею багато загального. При описі значення канонічної змінної слід виходити в основному з реального значення сильно корельованих змінних. 3.13. Кластерний аналіз Термін кластерний аналіз включає набір різних алгоритмів класифікації. Загальне питання, що задається дослідниками в багатьох областях, полягає у тому, як організувати спостережувані дані в наочні структури, тобто розвернути таксономії. На відміну від багатьох інших статистичних процедур, методи кластерного аналізу використовуються в більшості випадків, коли не має яких-небудь апріорних гіпотез щодо класів на описовій стадії дослідження. Слід розуміти, що кластерний аналіз визначає найбільш значуще рішення. Тому перевірка статистичної значущості насправді тут непридатна. Призначення цього методу полягає в об'єднанні об'єктів в достатньо великі кластери, використовуючи міру схожості або відстань між об'єктами. Типовим результатом такої кластеризації є ієрархічне дерево. Розглянемо горизонтальну деревовидну діаграму (рис. 3). Діаграма починається з кожного об'єкту в класі (у лівій частині Рис. 3. Дерево кластеризації діаграми). Поступово послаблю27
ється критерій про унікальність об'єктів. Іншими словами, знижується поріг об'єднання двох або більш об'єктів в один кластер. В результаті можна отримати більше число об'єктів і агрегувати більше кластерів з елементів, що сильніше розрізняються. На останньому кроці всі об'єкти об'єднуються. В результаті успішного аналізу методом об'єднання з'являється можливість знайти кластери та інтерпретувати їх. 3.14. Карти контролю якості В процесі аналізу проводяться вибірки елементів заданого об'єму. Після цього на спеціально розкресленому папері будуються діаграми мінливості вибіркових значень планових специфікацій в цих вибірках і розглядається ступінь їх близькості до заданих значень. Якщо діаграми знаходять наявність тренду вибіркових значень або виявляється, що вибіркові значення знаходяться поза заданими межами, то вважається, що процес вийшов з-під контролю, і робляться необхідні дії для того, щоб знайти причину. У комп'ютерному варіанті контрольних карт найчастіше зустрічається ситуація, коли на екрані знаходяться дві карти (і дві гістограми), одна з них називається Х-картою, а інша - R-картою. У обох контрольних картах по горизонтальній осі відкладаються номери відповідних вибірок; по вертикальній осі у разі X-карти відкладені вибіркові середні досліджуваних характеристик, а у разі R-карти – розмахи відповідних вибірок. Центральна лінія на X-карті відповідатиме розміру, використовуваному як стандарт, тоді як центральна лінія R-карти відповідатиме фактичному розмаху. Остання контрольна карта є картою мінливості процесу. Окрім центральної лінії, на карті звичайно присутні дві додаткові горизонтальні прямі, що позначають верхню і нижню контрольні межі. Звичайно нанесені на карти окремі точки відповідають вибірковим значенням і з'єднуються прямими лініями. Якщо результуюча крива на графіку виходить за верхню або нижню контрольну межу або її конфігурація виражає певну тенденцію поведінки для наступних один за одним вибірок, то це розглядається як вказівка на існування проблем з якістю управлінських рішень, роботи тощо. 3.15. Логлінійний аналіз в таблицях частот Одним з основних методів розвідувального аналізу даних є кростабуляція. Логлінійний аналіз пропонує глибші методи дослідження таблиць. А саме, він дозволяє перевірити статистичну значущість різних чинників і взаємодій, присутніх в таблиці зв'язаності. Аналіз відповідностей є описовим/розвідувальним методом, створеним для аналізу складних таблиць, що містять відповідності між змінними – стовпцями і змінними – рядками. Одержувані результати дозволяють вивчити структуру категоріальних змінних, включених в таблицю.
28
3.16. Багатовимірне шкалування Багатовимірне шкалування можна розглядати як альтернативу аналізу факторів. Його метою є пошук та інтерпретація "латентних (безпосередньо не проявляються) змінних", що дають можливість користувачу пояснити схожість між об'єктами, заданими точками у початковому просторі ознак. Для визначеності і стислості (схожості об'єктів). Даний метод дозволяє розташувати "об'єкти" в просторі деякої невеликої розмірності, щоб достатньо адекватно відтворити спостережувані відстані між ними. В результаті можна виміряти ці відстані в термінах знайдених латентних змінних. 3.17. Регресія Взаємозв'язок випадкових величин і функції дістав назву регресії. Виділяють парну та множинну регресії лінійного і нелінійного типів. Вид та параметри рівняння регресії знаходять за допомогою методу найменших квадратів. За наявності кореляційної залежності визначають тенденцію зміни результативного показника при змінах факторів-ознак. Найчастіше застосовуються такі математичні залежності для оцінювання кореляційного зв'язку між факторами: - прямолінійна у = а0 + a1×х, (3.9) де а0 – стала (область існування моделі); а1 – коефіцієнт регресії, що характеризує середню зміну результативного показника при змінах фактора-ознаки. - параболічна у = a0 + a1×x+ a2×х2, (3.10) - показникова у = а0 + a1х, (3.11) - степенева у = a0×xa1, (3.12) - гіперболічна y = a0 + a1/х, (3.13) - напівлогарифмічна у = а0 + а1lgx, (3.14) Оцінювання тісноти зв'язку ґрунтується на показниках варіації: - загальній дисперсії результативного показника усіх факторів сукупності; - факторній дисперсії результативного показника, що показує його варіацію під впливом окремих факторів; - залишковій дисперсії результативного показника, яка показує його варіацію під впливом усіх факторів, крім виділеного. Якісною оцінкою ступеня зв'язку випадкових величин виступає коефіцієнт детермінації, що визначається відношенням факторної та загальної дисперсій. Індекс кореляції розраховується як квадратний корінь із коефіцієнта детермінації, причому його значення лежать у межах від - 1 до +1. Знак "-" свідчить 29
про наявність зворотного зв'язку між факторами. Для оцінювання значущості індексу кореляції використовують F - критерій Фішера. Фактичне значення цього критерію порівнюють із критичним значенням, яке визначають з урахуванням рівня значущості та кількості ступенів свободи. Якщо фактичне значення F - критерію Фішера більше від критичного, то індекс кореляції вважається істотним. Оцінювання ступеня зв'язку випадкових величин здійснюється з використанням коефіцієнта детермінації за шкалою Чеддона: 0,1...0,3 – незначний; 0,7...0,9 – високий; 0,3...0,5 – помірний; 0,9...0,99 – дуже високий; 0,5...0,7 – істотний; 1,0 – функціональний. За коефіцієнта детермінації R2>0,7 варіація залежної змінної в основному обумовлена впливом факторів, і для прогнозування можна використовувати одержані регресійні моделі. Якщо аналізується невелика сукупність даних (<30), для визначення їх довірчого інтервалу використовується t-критерій Стьюдента. Розраховане значення t-критерію для коефіцієнта кореляції порівнюється з критичним з урахуванням прийнятого рівня значущості, а також кількості ступенів свободи та вважається типовим, якщо tp>tк. Аналогічно оцінюється значущість факторів на основі t-критерію. При проведенні кореляційно-регресійного аналізу слід ураховувати такі вимоги до вхідних даних для отримання вірогідних результатів: - статистична сукупність даних має включати достатню кількість спостережень або однорідних об'єктів (не менш як п'ять); - статистичні дані мають бути відібрані за однакові періоди часу або для однорідних об'єктів; - при проведенні множинної регресії кількість факторів має бути меншою (хоча б на два), ніж кількість спостережень. Загальне призначення множинної регресії полягає в аналізі зв'язку між декількома незалежними змінними (званими також регресорами або предикторами) і залежною змінною. Загальна обчислювальна задача, яку необхідно вирішувати при аналізі методом множинної регресії, полягає в підгонці прямої лінії до деякого набору точок. У простому випадку, коли є одна залежна і одна незалежна змінна, це можна побачити на діаграмі розсіювання. Перш за все, передбачається, що зв'язок між змінними є лінійним. На практиці це припущення, по суті, ніколи не може бути підтверджене; процедури множинного регресійного аналізу в незначному ступені схильні до дії малих відхилень від цього припущення. Проте завжди є сенс подивитися на двовимірні діаграми розсіювання змінних, що представляють інтерес. Якщо нелінійність зв'язку очевидна, то можна розглянути або перетворення змінних, або допустити включення нелінійних елементів. У множинній регресії передбачається, що залишки підкоряються закону нормального розподілу. Хоча більшість тестів досить стійкі по відношенню до 30
відхилень від цього припущення, завжди, перш ніж зробити остаточні висновки, варто розглянути розподіли змінних. Основне концептуальне обмеження всіх методів регресійного аналізу полягає у тому, що вони дозволяють знайти тільки числові залежності, а не лежачі в їх основі причинні зв'язки. Множинна регресія – надає користувачу "спокусу" включити як предикатором всі змінні в надії, що деякі з них виявляться значущими. Це відбувається через вигоду з випадковості при простому включенні можливо більшого числа змінних, предикторів іншої, що представляє інтерес змінної. Ця проблема виникає, коли до того ж і число спостережень відносно мале. Наступною проблемою є мультиколінеарність, коли предикатори відображають одне і те саме явище, проте підраховуються як адитивні. Якщо в аналіз включено багато змінних, то не відразу очевидне існування цієї проблеми, і вона може виникнути тільки після включення змінних в регресійне рівняння. Якщо така проблема виникає, одна із залежних змінних є зайвою за наявності інших предикаторів. Хоча більшість припущень множинної регресії не можна в точності перевірити, можна знайти відхилення від цих припущень. Зокрема, викиди можуть викликати серйозний зсув оцінок, "зсовуючи" лінію регресії в певному напрямі і тим самим, викликаючи зсув регресійних коефіцієнтів. Часто виключення всього одного екстремального спостереження приводить до абсолютно іншого результату. 3.18. Мультиколінеарність Мультиколінеарність характеризується існуванням тісної лінійної залежності, або сильної кореляції, між: двома чи більше пояснювальними змінними. Вона негативно впливає на кількісні характеристики моделі або робить її побудову взагалі неможливою. Мультиколінеарність пояснювальних змінних призводить до зміщення оцінок параметрів моделі, через що з їх допомогою не можна зробити коректні висновки про результати взаємозв'язку залежної і пояснювальних змінних. У крайньому разі, коли між пояснювальними змінними існує функціональний зв'язок, оцінити вплив цих змінних на залежну взагалі неможливо. Тоді для оцінювання параметрів моделі метод найменших квадратів не придатний, оскільки матриця буде виродженою. Якщо зв'язок між пояснювальними змінними не функціональний, проте статистично істотний. Тоді попри те, що оцінити параметри методом найменших квадратів теоретично можливо, знайдена оцінка може призвести до помилкових значень параметрів, і сама модель стане беззмістовною. Основні наслідки мультиколінеарності. 1. Падає точність оцінювання, яка виявляється так: а) помилки деяких конкретних оцінок стають занадто великими; б) ці помилки досить корельовані одна з одною; в) дисперсії оцінок параметрів різко збільшуються. 31
2. Оцінки параметрів деяких змінних моделі можуть бути незначущими через наявність їх взаємозв'язку з іншими змінними, а не тому, що вони не впливають на залежну змінну. У такому разі множина вибіркових даних не дає змоги цей вплив виявити. 3. Оцінки параметрів стають досить чутливими до обсягів сукупності спостережень. Збільшення сукупності спостережень іноді може спричинитися до істотних змін в оцінках параметрів. З огляду на перелічені наслідки мультиколінеарності при побудові моделі потрібно мати інформацію про те, що між пояснювальними змінними не існує мультиколінеарністі. Перевірка на мультиколінеарність передбачає оцінювання взаємозв'язку між окремими факторами-ознаками. За наявності лінійної залежності між факторами система нормальних рівнянь не матиме однозначного розв'язку, внаслідок чого коефіцієнти регресії та інші оцінки будуть нестійкими. Крім того, наявність взаємозв'язку факторів утруднює економічну інтерпретацію рівняння зв'язку, оскільки зміна одного фактора спричиняє, як правило, зміну іншого, який з ним пов'язаний. Існує кілька методів виключення мультиколінеарності, проте найчастіше застосовується метод оцінювання парних коефіцієнтів кореляції. Критерієм мультиколінеарності вважається виконання двох нерівностей: rxjy>rxjxk; rxky>rxjxk. (3.15) Якщо ці нерівності або хоча б одна з них не виконуються, то виключається той фактор х, зв'язок якого з результативним показником у буде менш тісним. 3.19. Методи здобуття даних "Здобуття даних" – процес аналітичного дослідження великих масивів інформації з метою виявлення певних закономірностей і систематичних взаємозв'язків між змінними, які потім можна застосувати до нових сукупностей. Цей процес включає три основні етапи: дослідження, побудова моделі або структури і її перевірку. У ідеальному випадку, при достатній кількості даних можна здійснити ітеративну процедуру для побудови стійкої моделі. В той же час, в реальній ситуації практично неможливо перевірити економічну модель на стадії аналізу і тому початкові результати мають характер евристики, які можна використовувати в процесі ухвалення рішення. Методи здобуття даних набувають популярність як інструмент для аналізу економічної інформації, у випадках ухвалення рішень в умовах невизначеності. 3.20. Моделювання структурними рівняннями Прогрес у області багатовимірного статистичного аналізу і аналізу кореляційних структур, об'єднаний з новітніми обчислювальними алгоритмами, став відправною точкою для створення техніки Моделювання структурними рівняннями, яка включає велику кількість методів з різних областей статистики. 32
Основні задачі використання структурних рівнянь наступні: 1. Причинне моделювання або аналіз напрямків, при проведенні якого передбачається, що між змінними є причинні взаємозв'язки. Можлива перевірка гіпотез і підгонка параметрів причинної моделі, описуваної лінійними рівняннями. Причинні моделі можуть включати явні або латентні змінні. 2. Підтверджуючий аналіз чинника, використовуваний як розвиток звичного факторного аналізу для перевірки гіпотез про структуру навантажень чинників і кореляцій між ними. 3. Аналіз чинника другого порядку, що є модифікацією факторного аналізу, при проведенні якого аналізується кореляційна матриця загальних чинників. 4. Регресійні моделі, в яких коефіцієнти регресії можуть бути зафіксовані рівними заданим значенням. 5. Моделювання коваріаційної структури, яке дозволяє перевірити гіпотезу про вигляд матриці коваріації. 6. Моделі кореляційної структури, що дозволяє перевірити гіпотезу про вигляд матриці. 7. Моделі які дозволяють досліджувати структуру середніх одночасно з аналізом дисперсій і коваріацій. 3.21. Нелінійне оцінювання При проведенні аналізу лінійної моделі іноді отримуються дані про її неадекватність. В цьому випадку цікавою є залежність між предикаторними змінними і відгуком, але для уточнення моделі в її рівняння додаються деякі нелінійні члени. Найзручнішим способом оцінювання параметрів одержаної регресії є Нелінійне оцінювання. Якщо погодитись на розгляд будь-якого типу залежності між предикаторами і змінною відгуку, виникають два питання. По-перше, як тлумачити знайдену залежність у вигляді простих практичних рекомендацій. З цієї точки зору лінійна залежність дозволяє дати просте пояснення: "чим більше x, тим більше у; і, задаючи конкретні прирости x, можна чекати пропорційний приріст у". Нелінійні співвідношення звичайно не можна просто інтерпретувати і висловити. Друге питання – як перевірити, чи є насправді передбачена нелінійна залежність. Нелінійне оцінювання є універсальною апроксимуючою процедурою, що оцінює будь-який вид залежності між змінною відгуку і набором незалежних змінних. Воно дозволяє задати практично будь-який тип безперервної або розривної регресійної моделі. У загальному випадку, завжди, коли регресійна модель може бути зведена до лінійної моделі, цьому способу віддається перевага. 3.22. Непараметрична статистика і підгонка розподілу Чинником, що часто обмежує застосування критеріїв, заснованих на припущенні нормальності, є об'єм або розмір вибірки, доступної для аналізу. Поки 33
вибірка достатньо велика (наприклад, 100 або більше спостережень), можна вважати, що вибірковий розподіл нормальний. Проте, якщо вибірка дуже мала, то критерії, засновані на нормальності, слід використовувати тільки за наявності упевненості, що змінна дійсно має нормальний розподіл. Немає способу перевірити це припущення на малій вибірці. Використання критеріїв, заснованих на припущенні нормальності також обмежене точністю вимірювань. Стає необхідною застосування статистичних процедур, що дозволяють обробляти дані "низької якості" з вибірок малого об'єму із змінними, про розподіл яких мало що або взагалі нічого не відомо. Непараметричні методи якраз і розроблені для таких ситуацій. Вони не ґрунтуються на оцінці параметрів (таких як середнє або стандартне відхилення) при описі вибіркового розподілу величини. Для кожного параметричного критерію є, принаймні, один непараметричний аналог. Ці критерії можна віднести до однієї з наступних груп: критерії відмінності між групами (незалежні вибірки); критерії відмінності між групами (залежні вибірки); критерії залежності між змінними. У деяких проектах можна сформулювати гіпотези щодо розподілу змінної. Наприклад, змінні, значення яких визначаються нескінченним числом незалежних чинників, розподілені по нормальному закону: можна припустити, що зростання є результатом дії багатьох незалежних чинників. Як наслідок, зростання має тенденцію до нормального розподілу в сукупності. З іншого боку, якщо спостережувані значення змінної є результатом дуже рідкісних подій, то змінна матиме розподіл Пуассона. Іншим звичним додатком процедури підгонки розподілу є перевірка гіпотези нормальності до того, як використовувати який-небудь параметричний тест. 3.23. Головні компоненти і аналіз чинника Головними цілями аналізу чинника є: (1) скорочення числа змінних (редукція даних) і (2) визначення структури взаємозв'язків між змінними, тобто класифікація змінних. Тому аналіз чинника використовується або як метод скорочення даних або як метод класифікації. Залежність між змінними можна знайти з допомогою діаграми розсіювання. Одержана шляхом підгонки лінія регресії дає графічне уявлення залежності. Якщо визначити нову змінну на основі лінії регресії, зображеної на цій діаграмі, то така змінна буде включити найістотніші риси обох змінних. Отже, фактично відбувається скорочення числа змінних і заміна двох однією. Новий чинник (змінна) насправді є лінійною комбінацією двох початкових.
34
4
ВИМОГИ ДО ВИКОНАННЯ СПЕЦІАЛЬНОЇ ЧАСТИНИ У МАГІСТЕРСЬКИХ РОБОТАХ 4.1. Загальні положення
Здійснення економіко-математичного моделювання у магістерських роботах повинне відображати авторське бачення досліджуваної проблеми, відповідати обраній темі та застосовуватись на усіх етапах проектування. Методика дослідження обирається автором і узгоджується керівником та консультантом зі спеціальної частини. 4.2. Структура спеціальної частини Викладення результатів економіко-математичного моделювання здійснюється у трьох частинах: 1) теоретична – викладення теоретичних положень застосування пропонованих методологічних принципів, методологічного апарату та підходів до моделювання обраної для дослідження проблеми; 2) аналітична – застосування дослідно-аналітичного апарату для оцінки економічної проблеми, підтвердження висловлених гіпотез, математичної інтерпретації моделі формування об’єкта та предмета дослідження тощо; 3) проектна – прогнозування перспективних показників, підтвердження результативності запропонованих заходів тощо. Окремі частини роботи виконуються згідно єдиної мети, другий та третій етап є логічним продовженням попередніх. Основна мета – економікоматематична модель досягається на другому етапі; прогноз, експеримент чи підтвердження результативності запропонованих заходів досягається на третьому етапі. Другий та третій етап передбачає обов’язкове застосування комп’ютерної техніки та виконується з допомогою спеціалізованих прикладних програм статистичного аналізу даних. 4.3. Теоретична частина Теоретичне обґрунтування застосування економіко-математичної моделі магістри проводять у першому розділі разом з розкриттям методологічних засад дослідження обраної наукової проблеми. Обов’язковим є визначення мети, постановка задачі та доведення раціональності виключно запропонованих методологічних підходів до аналізу та моделювання. 4.4. Аналітична частина Обов’язковими складовими спеціальної частини у аналітичному розділі є: 1. У другому розділі дипломного проектування недоліки у методологічному забезпеченні долаються за рахунок застосування економікоматематичних методів аналізу. 35
2. Для повноцінного виконання завдання спеціальної частини, аналіз досліджуваної проблеми рекомендується завершувати "системою" чи "механізмом" і на його основі запропонувати економіко-математичну модель, з обов’язковою її інтерпретацією. 4.5. Проектна частина У проектному розділі магістерської роботи необхідно на практиці застосувати запропоновану економіко-математичну модель для прогнозування перспектив розвитку та тенденцій розвитку у обраній області дослідження з метою підтвердження запропонованих заходів поліпшення. Іншим прийнятним варіантом є проведення експерименту за представленою моделлю. 4.6. Вимоги до оформлення Результати виконання спеціальної частини розкриваються у основному змісті дослідження. Загальне оформлення відповідає вимогам поставленим у методичних вказівках до написання магістерських робіт. Відобразити необхідно усі складові спеціальної частини. Основні висновки та результати викладаються по тексту, з обов’язковим посиланням на процедуру розрахунку та обраний метод. Накопичувальні таблиці, первинні статистичні дані, результати розрахунків та інші проміжні матеріали виносяться у додатки з обов’язковим посиланням на них. Для статистичних матеріалів опублікованих у відкритій пресі достатньо посилання на літературне джерело. 4.7. Захист результатів економіко-математичного моделювання Для захисту результатів спеціальної частини, основні висновки по ній графічно оформляються та відображаються у доповіді магістра в загальному контексті викладення результатів магістерської роботи. 4.8. Критерії отримання допуску до захисту За результатами виконання спеціальної частини магістр може бути допущеним чи недопущеним до захисту. Вимогою для отримання допуску є виконання усіх трьох складових дослідження: теоретичного обґрунтування; застосування у якості інструменту аналізу та побудови економіко-математичної моделі; прогнозування, підтвердження результативності запропонованих заходів чи експерименту. Результати дослідження повинні бути логічно викладені, висновки аргументовані, процедури та методи розрахунків відповідати принципам та критеріям застосування економіко-математичних методів. Недопущення до захисту аргументується консультантом із спеціальної частини. Після виправлення вказаних недоліків робота допускається до захисту.
36
5
ПЕРЕЛІК РЕКОМЕНДОВАНИХ РЕСУРСІВ СТАТИСТИЧНИХ ДАНИХ МЕРЕЖІ INTERNET
Дипломне проектування магістерських робіт у сфері міжнародних економічних відносин часто вимагає порівняльного аналізу розвитку поставленої наукової проблеми в Україні та закордоном. При цьому відсутність статистичних даних робить процес аналізу неможливим. Для подолання цієї прогалини нижче приведений список ресурсів офіційних статистичних даних для економіко-математичного моделювання у магістерських роботах. www.bank.gov.ua europa.eu.int infoline.ine.pt stats.bls.gov strategis.ic.gc.ca www.acad.bg www.admin.ch www.bps.go.id www.bts.gov www.cbs.nl www.cdc.gov www.census.gov www.conicyt.cl www.cso.ie www.die.gov.tr www.doc.gov www.dol.gov www.dot.gov www.dst.dk www.dzs.hr www.econ.ag.gov www.europa.eu.ni www.finance.com.ua www.gks.ru www.govt.nz www.ibge.gov.br www.imf.org www.indec.mecon.ar
Національний банк України Статистичне відомство європейського співтовариства (EUROSTAT) Національний інститут статистики Португалії Бюро статистики праці США (BLS) Статистика промисловості Канади (CIS) Національний інститут статистики Республіки Болгарія (NS1) Федеральний статистичний офіс Швейцарії Бюро статистики Республіки Індонезії (BPS) Бюро транспортної статистики США (BTS) Статистика Нідерландів Національний центр США статистики охорони здоров’я (NCHS) Бюро преси США Національний інститут статистики Чілі Центральний статистичний офіс Ірландії Державний інститут статистики Туреччини (S1S) Департамент комерції США Департамент праці США (DOL) Департамент транспорту США (DOT) Статистика Данії Бюро статистики Хорватії Економічна дослідна служба (ERS) Статистичне відомство європейського співтовариства Курси валют Держкомстат Росії Статистика Нової Зеландії Бразильський інститут географії та статистики (IBGE) Міжнародний валютний фонд (IWF) Національний інститут статистики Республіки Аргентина (INDEC) 37
Національний інститут статистики Іспанії Національний інститут статистики Республіки Болівія (INDEC) www.inegi.gob.mx Мексиканський національний інститут статистики, географії і інформатики (INEGI) www.inei.gob.pe Національний інститут статистики і інформації Перу www.insee.fr Національний інститут статистики і економічних досліджень. Франція (INSEE) www.istat.it Національний інститут статистики Італії (ІSTAT) www.jetro.go.jp Зовнішньоторговельна організація Японії (JETRO) www.ksh.hu Центральний статистичний офіс Угорщини (HCSO) www.lainet.lv Центральне статистичне бюро Латвії (CSB) www.magnet.mt Центральний офіс статистики Мальти www.mckinseyquarterly.com Економічний огляд МакКінсі www.nbs.gov Національна біологічна служба США (NBS) www.ngdc.ncaa.gov Національний центр геофізичних даних США (NGDC) www.nodc.noaa.gov Національний центр океанографічних даних США (NODC) www.nsf.gov Національна наукова фундація США (NSF) www.nsf.gov Дивізіон вивчення ресурсів науки США (SRS) www.oecd.org Організація економічного співробітництва і розвитку (OECD) www.oestat.gv.at Центральний статистичний офіс Австрії www.ons.gov.uk Офіс національної статистики Великобританії (ONS) www.os.dhhs.gov Міністерство охорони здоров’я та сфери послуг США (HHS) www.pcbs.org Центральне бюро статистики Палестини www.pio.gov.cy Відділення статистики і досліджень Республіки Кіпр www.scb.se Статистика Швеції (SCB) www.sigov.si:90 Статистичний офіс Республіки Словенія www.singstat.gov.sg Статистика Сінгапура www.ssb.no Статистика Норвегії (SSB) www.stat.ee Комітет статистики Естонії (StD) www.stat.fi Статистика Фінляндії www.stat.go.jp Статистичний центр та статистичне бюро Японії www.stat.gouv.qc.ca Інститут статистики Квебеку www.stat.gov.pl Головне управління статистики Польщі www.statcan.ca Статистика Канади www.statistics.gov.au Бюро статистики Австралії (ABS) www.ine.es www.ine.gov.bo
38
www.statistics.gr www.statistics.sk www.statistik-bund.de www.stat-usa.gov www.std.lt www.stjr.is www.ueplac.kiev.ua www.ukrstat.gov.ua www.unicc.org www.unicc.org www.unog.ch www.usda.gov www.usdoj.gov www.usgs.gov www.usgs.gov www4.inec.gov.ec www.world-bank.org www.ita.doc.gov www.bis.org www.ilo.org www.wto.org www.unicc.org/unctad www.iccwbo.org www.evropa.ev.int www.sammit8.gov www.iie.com www.stat.km.ua rada.gov.ua www.nbuv.gov.ua www.standardandpoors.com www.moodys.com
Національна статистика Греції Статистичний офіс Республіки Словаччина Офіс федеральної статистики Німеччини Статистика США Статистика Литви (StD) Статистика Ісландії TACIS. Тенденції української економіки Держкомстат України Міждержавний статистичний комітет Співдружності націй незалежних держав (CISSTAT) Європейська економічна комісія ООН (UN/ЕСЕ) Відділ статистики Женевська штаб-квартира ООН Департамент сільського господарства США (USDA) Департамент юстиції США (DOJ) Департамент внутрішніх справ США (DOI) Геологічні огляди США (USGS) Національний інститут статистики Еквадору Світовий банк Департамент торгівлі США Банк міжнародних розрахунків Міжнародна організація праці Світова організація торгівлі Конференція ООН з торгівлі та розвитку Міжнародна торгова палата Європейський Союз Зустрічі "вісімки" Інститут міжнародної економіки (Вашингтон) Управління статистики у Хмельницькій області Верховна Рада України Національна бібліотека України ім. Вернадського Рейтингове агентство Stand&Poors Рейтингове агентство Moody’s
39
ЛІТЕРАТУРА
1. 2. 3.
4.
5. 6. 7. 8. 9. 10. 11.
12.
13.
14.
15.
16. 17.
Бугір М.К., Математика для економістів. Лінійна алгебра, лінійні моделі: Посібник. – К.: Академія, 1998. – 272 с. Кігель В.Р., Методи і моделі підтримки прийняття рішень у ринковій економіці: Монографія. – К.: ЦУЛ, 2003. – 202 с. Медведєв М.Г., Ігрові методи моделювання економічних систем: Навчальний посібник/ М.Г. Медведєв, Л.В. Барановська. – К.: Вид-во Європ. ун-ту, 2002. – 116 с. Корнійчук М., Складні системи з випадковою зв'язністю: ймовірнісне моделювання та оптимізація: Монографія/ М. Корнійчук, І. Совтус. – К.: КНЕУ, 2003. – 374 с. Мікроекономічне моделювання і інформаційні технології/ О.О. Бакаєв, В.І. Гриценко, Л.І. Бажан, Л.О. Бакаєв. – К.: Наукова думка, 2003. – 181 с. Наконечний С.І., Економетрія: Підручник/ С.І. Наконечний, Т.О. Терещенко, Т.П. Романюк. – К.: КНЕУ, 2000. – 296 с. Шарапов О.Д., Системний аналіз: Навчальний посібник/ О.Д. Шарапов, Л.Л. Терехов, С.П. Сіднєв. – К.: Вища школа, 1993. – 303 с. Hughes R., Business mathematics. – USA: IRWIN, 1995. – 498 p. http://www.statsoft.com Галасюк В., Фундаментально новий метод чисельного порівняння рішень// Ринок цінних паперів України. – К. – 2005. - №1-2. – С. 55-70. Малигін О.В., Про деякі проблеми математизації міжнародних відносин// Соціально-гуманітарні та психолого-педагогічні науки. - Хмельницький: ХНУ. – 2004. – С. 67-69. Мороз С.В., Стохастичні моделі оцінки фінансового стану// Вісник Технологічного університету Поділля. (Хмельницький національний університет). Економічні науки. – Хмельницький. – 2004. - №6. – С. 148-152. Никонович М., Методи оцінки точності прогнозних показників/ М. Никонович, О. Юр'єва/ Вісник Київського національного торговельноекономічного університету. – К. – 2003. - №2. – С. 50-56. Притула М., Динамічна економіко-математична модель сучасної економіки/ М. Притула, Х. Притула;/ Регіональна економіка. – К. – 2001. - №3. – С. 47-56. Прогнозування економічних і фінансових процесів на основі нейронечітких технологій/ Н.Є. Бойцун, О.М. Кісельова, О.М. Кисельова, О.М. Притоманова;/ Фінанси України. – К. – 2005. - №5. – С. 79-93. Секторальні моделі прогнозування економіки України: Монографія/ За ред. Гейця В.М. – К.: Фенікс, 1999. – 304 с. Сергієчко І.В., Застосування методів стохастичної оптимізації для дослідження трансформаційних процесів в економіці/ І.В. Сергієнко, М.В. Михалевич/ Системні дослідження та інформаційні технології. – К. – 2004. - №4. – С. 7-29.
40
ЗМІСТ Вступ……………………………………………………………………………...….3 1. Графік виконання спеціальної частини….……………………………………...4 2. Теоретичні положення економіко-математичного моделювання.……………5 3. Рекомендації до застосування методів економіко-математичного моделювання.…………………………………………………………………..…..………..13 4. Вимоги до виконання спеціальної частини у магістерських роботах...……..35 5. Перелік рекомендованих ресурсів статистичних даних мережі Internet…….37 Література…………………………………………………………………………..40 Зміст………………………………………………………………………………...41
41