Главная Обратная связь Поможем написать вашу работу!

Дисциплины:

Архитектура (936)
Биология (6393)
География (744)
История (25)
Компьютеры (1497)
Кулинария (2184)
Культура (3938)
Литература (5778)
Математика (5918)
Медицина (9278)
Механика (2776)
Образование (13883)
Политика (26404)
Правоведение (321)
Психология (56518)
Религия (1833)
Социология (23400)
Спорт (2350)
Строительство (17942)
Технология (5741)
Транспорт (14634)
Физика (1043)
Философия (440)
Финансы (17336)
Химия (4931)
Экология (6055)
Экономика (9200)
Электроника (7621)






Дослідження множинної лінійної регресії



Дослідження парної лінійної регресії

В економічних розрахунках

1.1 Мета роботи

 

Користуючись пакетом EXCEL знайти оцінки парної лінійної регресії за методом найменших квадратів.

 

1.2 Методичні вказівки щодо організації самостійної роботи студентів

 

Під час підготовки до виконання даної лабораторної роботи слід вивчити теоретичний матеріал за лекційним матеріалом та Додаток А.

Об'єктами дослідження стохастичної залежності соціально-економічних процесів можуть бути різні статистичні показники. Статистичний показник – це узагальнена характеристика певної властивості сукупності, групи. До статистичних показників в економіці можна віднести: обсяг реалізованої продукції, собівартість продукції, прибуток підприємства, галузі та ін. На макроекономічному рівні показниками можуть виступати: валовий внутрішній продукт, суспільний продукт та ін.

Зв'язок між різними явищами в економіці складний і різноманітний. На рівень розвитку одного показника можуть впливати багато факторів, рівень впливу яких різний. Ці закономірності потрібно враховувати під час планування, прогнозування і проведення економічного аналізу. Для вивчення форми зв'язку між показником і факторами на основі статистичних даних використовується регресійний аналіз.

Серед парних регресій найбільш поширеною, вивченою й простою в практиці моделювання є парна лінійна регресія. Парною лінійною регресією Y на Х називається односто­роння стохастична лінійна залежність між випадковими величинами показника Y і фактора X, які знаходяться в причинно-наслідкових відношеннях, причому зміна фактора викликає зміну показника. Слід відрізняти стохастичну залежність від функціональної. При стохастичній залежності одному значенню фактора може відповідати декілька значень показника. При функціональній залежності одному значенню аргументу відповідає лише одне значення функції. Між аргументом і функцією існує взаємооднозначна відповідність.

Розглянемо модель лінійної регресії. Припустимо, що маємо результати п пар незалежних спостережень, зображених у вигляді множини точок у декартовій системі координат. Припустимо гіпотезу, що між показником Y і фактором Х існує стохастична лінійна залежність. Суть задачі полягає в тому, щоб у декартовій системі координат знайти згладжувальну лінію, яка “найкращим” чином проходить через задану множину точок.



Найпоширенішим методом під час розв'язання подібних задач є метод найменших квадратів (МНК). Основоположниками методу найменших квадратів є К. Гаусс і П. Лаплас.

Зв'язок між показником (регресантом, відгуком) Y і фактором (регресором, факторною ознакою) Х з урахуванням можливих відхилень запишемо у вигляді

Y = αХ +β+l,

де α іβ – невідомі параметри регресії;

l – випадкова змінна, що характеризує відхилення паралельно осі OY спостережуваних точок від лінії регресії.

Таким чином, показник Y зображується у вигляді систематичної складової αХ +β і випадкової величини l. Залежність , яка характеризує середнє значення показника Y для даного значення фактора X, називається регресією. Можемо сказати інакше. Регресія характеризує тенденцію зміни показника, зумовлену впливом зміни фактора. Залежність Y=αХ+β+l характеризує індивідуальне значення показника Y з урахуванням можливих відхилень від середніх значень.

Справжні значення параметрів обчислити не можна, оскільки ми маємо обмежене число спостережень, тому здобуті розрахункові значення параметрів α і β є статистичними оцінками справжніх параметрів α і β. Позначимо оцінки параметрів відповідно через а і b. Тоді рівняння парної регресії (рис.1.1) буде оцінкою моделіY = αХ +β+l.



 

Рисунок 1.1 – Парна лінійна регресія

 

Розглянемо різницю

, (і=1,n),

де yі – фактичні,

– розрахункові значення показника;

l – відхилення спостережуваної точки і,;уі) від точки і,; ) згладжуваної кривої.

МНК для парної лінійної регресії полягає в підборі таких оцінок параметрів регресії а і b,для яких сума квадратів відхилень спостережуваних значень показника від згладжувальних буде мінімальною. Сума квадратів відхилень має вигляд

. (1.1)

Оцінки параметрів а і b лінії регресії Y=аХ+b мають бути підібрані методом найменших квадратів так, щоб функціонал Q(a,b) був мінімальним, тобто

. (1.2)

Необхідною умовою мінімуму цього функціонала є рівність нулю частинних похідних цього функціонала за a і b.

. (1.3)

Розкриємо дужки і отримаємо нормальну форму рівняння

. (1.4)

Система нормальних рівнянь має єдиний розв’язок (єдину критичну точку)

(1.5)

Кореляційний момент (коваріація) – це статистична характеристика системи випадкових величин, яка описує не лише зв'язок між випадковими величинами Х і Y, а й їх розсіяння.

. (1.6)

 

Для визначення лише зв'язку між величинами вводиться коефіцієнт кореляції

. (1.7)

Коефіцієнт кореляції характеризує ступінь щільності лінійної залежності між випадковими величинами (X, У) і змінюється в межах від -1 до 1, причому: якщо r(х, у)>0, то між випадковими величинами Х і Y існує пряма залежність, якщо r(х, у) < 0, то між цими випадковими величинам існує обернена залежність.

Параметр а має такий самий знак, що й коефіцієнт кореляції. З математики відомо, якщо а>0, то між величинами Х та У існує прямий зв'язок, тобто якщо зростає (спадає) чинник X, то відповідно зростає (спадає) показник Y. Якщо a<0 (r[X,Y]<0), то між і величинами Х та У існує зворотний зв'язок, тобто якщо зростає (спадає) чинник X, то спадає (зростає) показник Y, що потрібно було довести.



Вибірковий коефіцієнт кореляції, здобутий за вибірковими даними, є точковою оцінкою коефіцієнта кореляції і, в свою чергу, є випадковою величиною. Тому доцільно зробити перевірку гіпотези про відсутність кореляційного зв'язку. Для цього перевіряється нульова гіпотеза Но r[X,Y]=0 і альтернативна гіпотеза Н1 r[X,Y]=0.

Припускаємо, що двовимірна випадкова величина розподілена за нормальним законом. Для вибірки обчислюється статистика

, (1.8)

яка має розподіл Стьюдента з k = п- 2 ступенями вільності.

Для заданої ймовірності р і k ступенів вільності знаходять табличне значення tp,k-статистики. Якщо tpасч≥tp,k, то із заданою надійністю р гіпотезу про відсутність кореляційного зв'язку між випадковими величинами (X, Y) слід відкинути і прийняти альтернативну їй гіпотезу Н1 про наявність залежності між цими випадковими величинами.

Позначимо .

Знайдемо відношення суми квадратів теоретичних відхилень , від середнього значення до суми квадратів відхилень спостережуваних значень уi, від середнього значення для лінійної регресії. Після перетворень отримаємо

. (1.9)

Величину R2 називають вибірковим коефіцієнтом детермінації. Для парної лінійної регресії коефіцієнт детермінації дорівнює квадрату коефіцієнта кореляції. Чим ближче R2 наближується до одиниці, тим більше експериментальні значення наближуються до лінії регресії. Значущість коефіцієнта детермінації перевіряється за допомогою F-статистики

, (1.10)

де n – кількість вимірів;

m – кількість параметрів рівняння регресії.

Для заданої надійності р, ступенів вільності k1=m, k2=n-m-1 знаходять за таблицями -статистику.

Якщо з надійністю, то р коефіцієнт детермінації статистично значущий.

В економічних задачах для оцінки впливу на показники будь-якого фактора часто використовують коефіцієнт еластичності. В загальній статистиці коефіцієнт еластичності одержують на основі статистичного ряду.

Коефіцієнт еластичності для значення фактора знаходять за формулою

. (1.11)

Якщо зробити граничний перехід при ∆х=>0, то одержимо формулу для точкової оцінки коефіцієнта еластичності

(1.12)

Коефіцієнт еластичності показує, на скільки відсотків зміниться показник, якщо фактор зміниться на один відсоток.

Для парної лінійної регресії Y=аХ+b коефіцієнт еластичності знаходиться за формулою

. (1.13)

 

1.3 Порядок виконання завдання

 

1. Отримати у викладача відомі значення фактора X та показника Y (Додаток Б).

2. Уводиться гіпотеза, що між фактором і показником існує стохастична залежність Y=aX+b.

3. Побудувати електронну таблицю за допомогою пакета EXCEL відповідно до табл.1.1.

4. Визначити оцінки параметрів регресії.

5. Визначити коефіцієнт детермінації R2.

6. Перевірити R2 на значущість за допомогою F критерію.

7. Визначити коефіцієнт кореляції r.

8. Перевірити значущість коефіцієнта кореляції за допомогою критерію Стьюдента.

9. Побудувати графіки залежностей фактичних значень та лінії регресії.

10. Розрахувати коефіцієнт еластичності.

11. Зробити висновки.

 

Таблиця 1.1 – Форма для побудови лінійної регресійної моделі за допомогою електронних таблиць

 

Yi Xi ( )2 ( )2 Yp Kel
Σ Σ Σ Σ Σ Σ Σ Σ    
Рівняння регресії y=ax+b      
r(x,y)=       tрозр=          
R2(x,y)=       Fрозр=          

1.4 Зміст звіту

 

1. Таблиця, побудована за формою.

2. Оцінки параметрів парної лінійної регресії.

3. Коефіцієнти кореляції та детермінації.

4. Результати перевірки адекватності моделі статистичним даним.

5. Коефіцієнти еластичності.

6. Висновки.

1.5 Контрольні запитання та завдання

1. Наведіть визначення та зміст парної лінійної регресії.

2. За яким методом визначаються оцінки параметрів лінійної регресії? Його сутність.

4. Викладіть методику визначаються оцінки параметрів лінійної регресії за допомогою можливостей електронної таблиці.

5. Що характеризують коефіцієнти кореляції та детермінації? Як вони визначаються та як перевіряється їхня статистична значущість?

6. Як оцінити адекватність прийнятої моделі статистичним даним?

7. Що таке коефіцієнти еластичності та як вони визначаються?

 

Дослідження множинної лінійної регресії

В економічних розрахунках

 

2.1 Мета роботи

 

Користуючись пакетом EXCEL знайти оцінки множинної лінійної регресії за методом найменших квадратів.

 

2.2 Методичні вказівки щодо організації самостійної роботи студентів

 

Під час підготовки до виконання даної лабораторної роботи слід вивчити теоретичний матеріал за лекційним матеріалом та Додаток А.

Економічні процеси залежать від багатьох факторів. Тільки їх комплекс у взаємозв’язку може дати більш-менш повне уявлення про характер явища. Етапи множинного кореляційного аналізу такі:

1. Визначення факторів, що визначають показник та вибір найбільш вагомих з них.

Правила відбору:

- необхідно враховувати причинно-наслідковий зв’язок між показниками, а не аналізувати фактори, які знаходяться тільки у математичних співвідношеннях з результативним показником;

- необхідно відбирати тільки найзначущі фактори. Ті, що мають критерій Стьюдента менше за табличний, не рекомендується вводити у модель;

- не рекомендується включати до моделі взаємопов’язані фактори.

2. Перевірка однорідності інформації.

Критерієм однорідності інформації є середньоквадратичне відхилення та коефіцієнт варіації, які розраховуються для кожного факторного та результативного показника.

Середньоквадратичне відхилення показує абсолютне відхилення індивідуальних значень від середньоарифметичного

. (2.1)

Коефіцієнт варіації показує відносну міру відхилення окремих значень від середньоарифметичної

. (2.2)

Чим більше V, тим більше розкид варіаційного ряду:

- якщо V<10% – мінливість варіаційного ряду незначна;

- якщо 10%<V<20% – середня мінливість варіаційного ряду;

- якщо 20%<V<33% – велика мінливість варіаційного ряду;

- якщо V>33% – інформація неоднорідна та її необхідно виключити або відкинути нетипові спостереження, які звичайно знаходяться у перших та останніх ранжированих рядах вибірки.

На підставі найвищого показника варіації визначається необхідний обсяг вибірки даних

, (2.3)

де V – варіація, %;

t – показник надійності зв’язку, який при рівні ймовірності Р=0,05 дорівнює 1,96;

m – показник точності розрахунків, %. Для економічних розрахунків припустима помилка 58%.

4. Перевірка відповідності даних нормальному закону розподілення здійснюється розрахунком асиметрії А, ексцесу Е та їх помилок εa, εe.

; ; (2.4)

; . (2.5)

Межа припустимості відхилення від нормального закону розподілення визначається умовами

. (2.6)

5. Визначення та аналіз коефіцієнтів парної кореляції.

Для цього розраховується вибіркова кореляційна матриця

, (2.7)

де rij – вибірковий коефіцієнт кореляції

(2.8)

де Si, Sj – вибіркові дисперсії факторів Xi та Xj.

 

6. Визначення та аналіз коефіцієнтів частинної кореляції.

Частинною кореляцією між Xi та Xj називається кореляційна залежність між ними при фіксованих значеннях інших показників. Вони визначаються через елементи матриці, зворотної до кореляційної

, (2.9)

де , , – елементи матриці .

Значущість коефіцієнтів кореляції перевіряється розрахунком t-критерію

, (2.10)

який має розподілення Стьюдента з k=n-m-1 ступенями вільності, де n – кількість спостережень, m – порядок кореляційної матриці. Якщо із заданою надійністю Р, то кореляційний зв’язок існує.

Парні коефіцієнти кореляції отримуються при умові діяння інших факторів на результат, а частинні – із виключенням впливу інших факторів. Якщо парні більше за частинні, тоді вплив інших факторів на тісноту зв’язку між результативним показником та факторами дуже значний, тобто фактори, що входять у модель впливають на показник не тільки прямо, але й посередньо.

Дослідження тісноти зв’язку між факторами дозволяє обрати незалежні між собою фактори.

7. Побудова моделі множинної регресії.

Лінійна модель з m незалежними змінними має вигляд

. (2.11)

У матричному вигляді регресія запишеться у вигляді

(2.12)

або у матричному вигляді

.

Вектор коефіцієнтів знаходиться вирішенням матричного рівняння

. (2.13)

8. Оцінка значущості параметрів регресії здійснюється за допомогою T-статистики

, (2.14)

де Sai – квадратична похибка (середньоквадратичне відхилення) параметрів. У свою чергу вона розраховується за виразом

, (2.15)

де bij – діагональний елемент оберненої матриці ;

S – оцінка середньоквадратичного відхилення похибок апроксимації

. (2.16)

Коли для ступеня вільності k=n-m-1 та ймовірності Р=0.95, тоді гіпотеза про значущість параметрів регресії приймається. В протилежному випадку і-й параметр та фактор виключаються із регресії та необхідно виконати оцінку для іншого набору факторів.

9. Визначення коефіцієнтів множинної кореляції та детермінації.

Вибірковий коефіцієнт множинної кореляції характеризує ступінь зв’язку між факторами та показником, що розраховується за формулою

, (2.17)

де yi – експериментальні значення показника;

– передбачені відповідно із рівнянням регресії значення показника;

yi – середньоарифметичне значення показника.

Множинний коефіцієнт детермінації дорівнює R2, знаходиться у межах від 0 до 1 та характеризує наближення експериментальної кривої до лінії регресії: чим більше до 1, тим ближче наближуються лінія регресії та експериментальна крива.

Перевірка значущості коефіцієнтів здійснюється розрахунком F-статистики

, (2.18)

де – дисперсія відтворності;

– остаточна дисперсія.

Якщо відомий коефіцієнт детермінації, то F-критерій також можна знайти за виразом

. (2.19)

Коли для надійності р=0,95, ступенів вільності k1=m, k2=n-m-1, тоді гіпотеза про значущість коефіцієнта детермінації приймається.

 

2.3 Порядок виконання завдання

 

1. Отримати у викладача вибірку факторів X1, X2, ... , Xn та показника Y (Додаток Б).

2. Вводиться гіпотеза, що між факторами та показником існує стохастична залежність виду (2.11).

3. Виконати аналіз однорідності вихідних даних та їх відповідності нормальному закону розподілення. Заповнити таблицю 2.1 та зробити висновки. Використати вбудовані функції СКОС та ЕКСЦЕСС.

4. Сформувати матриці показника та факторів виробничої регресії.

5. Виконати розрахунки частинних та парних коефіцієнтів кореляції, та перевірити їхню статистичну значущість. Зробити висновки.

6. Вирішити матричне рівняння (2.13) та знайти вектор оцінок параметрів множинної регресії, користуючись вбудованими у EXCEL функціями МОПРЕД, ТРАНСП, МОБР, МУМНОЖ.

7. Виконати перевірку статистичної значущості параметрів регресії за допомогою t-критерію. Для цього розрахувати передбачені значення показника Y та похибку апроксимації е, склавши таблицю 2.2.

 

Таблиця 2.1

Показ-ник Середн. арифм. знач. Середн. квадр. відхил. Варіація, % Асиметрія, А Ексцес, Е Помилка
εа εе
Y              
x1              
x2              
               
xn              

 

Таблиця 2.2 – Форма для аналізу значущості параметрів регресії

N yi
           
           
....            
n            
       

8. Визначити множинний коефіцієнт кореляції та коефіцієнт детермінації. Виконати оцінку значущості коефіцієнта детермінації з надійністю Р=0.95. Використати статистичні функції FРАСП, ДИСП, СРЗНАЧ.

9. Аналізуючи результати розрахунків, зробити висновки.

 

2.4 Зміст звіту

 

1. Вихідні дані.

2. Таблиця оцінки вихідних даних.

3. Кореляційна матриця та обернена до неї матриця, розрахунки частинних та парних коефіцієнтів кореляції. Оцінка статистичної значущості коефіцієнтів кореляції. Висновки за результатами.

4. Проміжні результати вирішення матричного рівняння (3.13): вихідна, транспонована, обернена матриці та результати множення матриць.

5. Вектор оцінок параметрів множинної регресії.

6. Оцінка значущості параметрів регресії.

7. Розрахунок коефіцієнта множинної кореляції та коефіцієнта детермінації. Результати перевірки їх значущості за F-критерієм.

8. Висновки.

 

2.5 Контрольні запитання та завдання

 

1. Наведіть визначення та зміст множинної регресії.

2. Для чого та як виконується аналіз вихідних даних?

3. Що таке частинні та парні коефіцієнти кореляції? В чому полягає їх різниця?

4. Як перевіряється значущість коефіцієнтів кореляції?

5. Як вирішується система нормальних рівнянь множинної регресії у матричному вигляді?

4. Викладіть методику розв’язання системи лінійних рівнянь за допомогою можливостей пакета EXCEL.

5. Як оцінити адекватність параметрів множинної регресії?

6. Що таке коефіцієнти множинної кореляції та детермінації? Як виконується перевірка їх статистичної значущості?


Просмотров 965

Эта страница нарушает авторские права




allrefrs.ru - 2021 год. Все права принадлежат их авторам!