Скупка катализаторов в ростове +на дону катализатор-ростов.рф.

Тема 6: Статистичне вимірювання зв'язку
1. Види взаємозв’язків.
2. Модель аналітичного групування.
а) теоретичне обгрунтування моделі;
б) оцінка лінії регрессії;
в) вимірювання тісноти зв’язку;
г) перевірка суттєвості зв’язку.
3. Регресійна модель.
а) теоретичне обгрунтування однофакторної регресійної моделі;
б) оцінка лінії регрессії;
в) вимірювання тісноти зв’язку;
г) перевірка суттєвості зв’язку.
1. Види взаємозв’язків
Всі явища в природі і суспільстві взаємопов’язані і взаємообумовлені.
Важливішою особливістю такого всебічного зв'язку є причина залежність. Всі явища соціально-економічного життя є результатом впливу ряду причин, які в свою чергу є результатом інших причин.
При статистичному вивченні взаємозв’язків розрізняють факторні ознаки (причини) і результативні ознаки (наслідки).
Індивідуальні значення факторних ознак приянято позначати через х1, х2, хn; індивідуальні значення результативної – y1, y2, yn.
Розглянемо приклад взаємозв’язків окремих статистичних показників.
Фондоозброєність праці (причина) – продуктивність праці (наслідок);
продуктивність праці (причина) – собівартість продукції (наслідок);
собівартість одиниці продукції (причина) – прибуток (наслідок) тощо.
Важливим завданням статистики є виявлення і вимірювання причинних залежностей.
Розрізняють такі види залежностей:
1) функіональна
2) стохастична ("ймовірний").
Функіональна – така залежність між ознакою "y" і ознакою "x", коли кожному індивідуальному значенню ознаки x відповідає строго визначене значення ознаки y.
Так, наприклад, за виготовлення одиниці вироба незалежно від інших умов виплачується 3грн. Тоді залежність оплати від кількості виробленої продукції можна записати так
y = 3 x
y 3 = 9 грн.
Функціональна залежність однозначна, тобто знаючи індивідуальне значення x, можна чітко вказати на значення y.
Проте така залежність в суспільно-економічному житті зустрічається дуже рідко.
Стохастична залежність проявляється в тому, що при зміні значень факторної ознаки, змінюється розподіл одиниць сукупності за результативною ознакою.
Таким чином, умовні розподіли при різних значеннях факторної ознаки неоднакові.
Умовним називається розподіл одиниць сукупності за однією ознакою при фіксованому значенні іншої ознаки.
Приклад стохастичної залежності.
Розподіл робітників за системами оплати праці та змінним вироботком.
Система
Число робітників з виробітником деталей (шт.)

оплати праці
13
14
15
16
17
разом

почасова
3
5
1
1

10

відрядна

2
4
16
8
30

разом
3
7
5
17
8
40

Як бачимо з таблиці, при відрядній оплаті праці частіше зустрічається робітникі з більш високим рівнем виробітку.
Саме цей фактор дозволяє висунути гіпотезу про наявність зв’язку між системою оплати праці і кількістю виготовлення деталей одним робітником
Окремим випадком стохастичної залежності є кореляційна залежність. При кореляційній залежності середні значення результуючої ознаки по кожному з умовних розподілів різні. Зі зміною значень факторної ознаки при наявності кореляційної залежності спостерігається закономірна зміна середніх значень результивної ознаки.
Визначемо, наприклад, середній виробіток деталей за даними таблиці, що наведена вище.
дет.
дет.
Середній виробіток при відрядній більший.
В подібних випадках мова йде про кореляційну залежність. Ця залежність неоднозначна, бо крім обраного фактору x на результативну ознаку мають вплив інші причини. Тому говоримо, що кореляційна залежність проявляється лише в середньому і проявитись вона може лише при умові значної чисельності елементів сукупності, тобто на масових даних.
Суть кореляційної залежності полягає в тому, що зі зміною індивідуальних значень ознаки «x» закономірно, систематично змінюється середнє значення ознаки «y».
2. Модель аналітичного групування (МАГ)
Важливішою кількісною характеристикою кореляційного зв’язку є так звана лінія регресії. Лінією регресії ”y” на ”x” називається функція, що зв’язує умовні середні значення результативної ознаки з індивідуаль-ними значеннями факторної ознаки.
Лінія регресії як і функція може мати 3 зображення:
1) графічне;
2) таблиичне;
3) аналітичне.
Графічне зображення самостійної ролі у вивченні взаємозв’язків немає.
На табличному зображенні базується метод аналітичного групування або модель аналітичного групування.
Побудова і аналіз МАГ передбачає вирішення таких завдань:
а) теоретичне обгрунтування моделі;
б) оцінка лінії регресії;
в) вимірювання тісноти зв’язку;
г) перевірка зв’язку.
Обгрунтувати модель – це значить здійснити глибокий теоретичний аналіз суті явища, що вивчається і визначити таким чином основні факторні ознаки, що можуть впливати на певну результативну ознаку, яка цікавить дослідника.
На цьому етапі визначається кількість груп та розмір інтервалу.
Слід мати на увазі, що аналітичне групування здійснюється завжди за факторною ознакою.
Оцінити лінію регресії – це значить обчислити середнє значення результативної ознаки по кожній з відокремлених груп за факторною ознакою.
МАГ може бути одно-, дво-, три-факторною.
Уявімо собі, що метою нашого дослідження є вивчення залежності середнього доходу на кожного члена сім’ї в сім’ях службовців в залежності від їх розміру
Цілком очевидно, що середньодушовий доход в певній мірі залежить від числа членів сім’ї.
Таким чином перша з названих ознак результативна, друга – факторна. Засобом, що дозволить довести це припущення про наявність залежності є модель аналітичного групування. Розглянемо схему вивчення ціє залежності на прикладі даних, що отримані в результаті вибіркового опитування 50-ти сімей службовців одного з регіонів (січень 1997 р.).
N сім’ї
Число членів сім’ї (x)
Середньодушовий доход, грн. (у)

1
3
102

2
1
130

3
3
98

4
5
75

5
2
1 15

:
:
:

:
:
:

50
4
72


Дле того, щоб виявити чи існює залежність між обраними ознаками, слід побудувати аналітичні групування.
Як бачимо, значення факторної ознаки x1=1, x2=2, ..., x5=5. В цьому випадку беззаперечно є розподіл (об’єднання) елементів сукупності за факторною ознакою на 5 груп. Виділивши 5 груп також обчислити середні значення рівні результативні ознаки по кожній з виділених груп:

Результати занесемо в таблицю.
Таблиця
Залежність середньодушового доходу від розміру сім’ї.
Розмір сім’ї (x)
Кількість сімей (fI)
Середньодушовий доход по групах тис. грн. ()

1
8
124

2
10
113

3
14
90

4
11
68

5
7
52

Разом
50
Х


Як бачимо, дані цього аналітичного групування підтверджують гіпотезу про наявність зв’язку між досліджуваними ознаками: чим більша сім’я, тим нищий середньодушовий доход на 1 члена сім’ї.
Зобразимо цю залежність графічно.

Лінія регресії в цьому конкретному випадку характеризує залежність середніх значень доходу в розрахунку на члена сім’ї від кількості членів сім’ї в окремих точках.
Вона не описує в повній мірі об’єктивний зв’язок, але чим більше ”n”, тим точніша ця оцінка.
Третім етапом вимірювання зв’язку є оцінка тісноти зв’язку.
Обчислення характеристики, що дозволяє оцінити тісноту зв’язку базується на математичному правилі складання дисперсій або варіацій.
Це правило можна записати так:
Розглянемо економічний зміст кожної з цих дисперсій
Загальна дисперсія () характеризує міру варіації (відхилень індивідуальних значень результативної ознаки від середнього значення по сукупності) результативної ознаки “y”, що пов’язана (зпричинена) усіма без винятку факторами, що могли вплинути на, варіацію результативної ознаки. Обчислюється за формулами
;
Для нашого прикладу ця дисперсія становить =1875.
Загальна середня результативної ознаки, тобто середньодушовий доход за 50 сім’ях вцілому становить =90 грн. Загальна дисперсія 1875 характеризує міру варіації середньодушового доходу, спричинену впливом таких факторів, як розмір сім’ї, кількість працюючих, посади працюючих, освіта тощо.
Якщож обчислити дисперсію по кожній з груп, то отримаємо характеристики міри варіації результативної ознаки на яку не впливає групувальна ознака або обраний для вивчення фактор (розмір сім’ї).
Групові дисперсії обчислюються за формулою

де yi – індивідуальні значення результуючої ознаки по кожній з груп;
– середні значення результуючої ознаки по кожній з груп.
Узагальнюючою характеристикою цих дисперсій є середнє з них
середня з групових:

Випадкова або залишкова дисперсія, бо вона характеризує міру варіації результуючої ознаки, спричинену рештою факторів, крім головного фактору, покладеного в основу груповань.
Міру варіації результуючої ознаки, спричинену головним фактором ”x” характеризує так звана міжгрупова дисперсія:

– середня по сукупності в цілому (=90 грн.)
Варіацію результивної ознаки, обумовлену виявом головного фактора часто називають систематичною або факторною.
Обчилимо міжгрупову дисперсію за даними наведеного вище аналітичного груповання

Співвідношення міжгрупової і загальної дисперсією харакрактеризує тісноту кореляяційного зв’язку і називається кореляційним відношенням.


.
Висновок: Таким чином варіація середньодушового доходу по обстежених 50-ти сім’ях на 32 % спричинена варіацією числа членв сім’ї
кореляційний зв’язок відсутній функціональний зв’язок
Важливим етапом вивчення кореляціного зв’язку є перевірка суттєвості (істотності) зв’язку. Перевірити істотність зв’язку – це значить переконатись, що кореляційна залежність виявлена на основі аналітичного групування не є випадковою фактичне значення кореляційного відношення з критичним цього показника.
Критичне значення це таке його максимально можливе значення, яке могло виникнути при випадковому зв’язку між ознаками y і x або при такому незначному зв’язку, яким можна знехтувати.
Критичні значення , що є в спеціальних таблицях обчислені для заданих рівнів істотності і відповідних чисел ступенів свободи (k)
Рівень істотності – ймовірність отримання значення більшого за критичне при умові відсутності зв’язку між ознаками.
Якщо , то це значить, що дане табличне значення не з’явиться в п’яти випадках із ста, і якщо , то в одному випадку із ста.
Числом ступені свободи називається число незалежних змінних необхідних для обчислення того чи іншого показника.
Так для обчислення k=n–1 для
x1=10; x2=12; x3=8 =10
n – число елементів сукупності.
Число ступенів свободи для дисперсій обчислюється так
k1=m–1 для (при відсутності зв’язку між признаками тільки в 5 випадках з 100  більше критичного значення )
k2=n–m для m – число груп аналітичного групування.
Якщо критичне < фактичне, то кореляційний зв’язок признається істотним.
Перевіримо істотність зв’язку для наведеного вище прикладу. Перевіримо його для рівня істотності 0,05. Обчислимо число ступенів свободи
k1=m–1 =5–1=4
k2=n–m =50–5=45.
Знаходимо по таблиці критичне значення при заданих умовах
критичне=0,207
Фактичне значення , тобто обчислення коли на основі складення дисперсій становило 0,335. Порівнявши критичне з фактичне робимо висновок, що зв’язок між середньодушовим доходом і розміром сім’ї є істотним.
Перевірку істотності зв’язку можна здійснити також скориставшись іншим показником, що що називається критерієм Фішера
Fкритерій=
F=.
Значення Fкритич. також є в спеціальних таблицях. Перевірка суттєвості за цим критерієм аналогічна перевірці, що здійснюється з допомогою .
Модель кореляційно-регресивного аналізу
На аналітичному зображенні лінії регресії базується метод кореляційного регресійного аналізу (КРА). Лінія регресії описується з допомогою рівняння регресії такого виду:
Y=P(x), де Y – теоретичне значення результуючоъ ознаки “y”, що обчислюється за рівнянням регресії.
Таким чином, завдання регресії полягає в тому, щоб наявну залежність між ознаками y і x відобразити кількісно, тобто визначити наскільки в середньому зміниться значення результативної ознаки зі зміною на певну величину значення факторної ознаки.
Взалежності від конкретних умов і сум досліджуваних явищ при вивченні кореляційних зв’язків частіше інших використовуються такі функції
1) (лінійна)
2) (степенева)
3) (гіпербола)
4) (парабола) і т.д.
3а) Першим етапом КРА є відображення факторних ознак та вибір форми рівняння регресії. Фактори обираються на основі глибокого теоретичного аналізу суті явищ що вивчаються. Аналізуючи явища можна також вибрати і вид рівняння регресії. Проте більш надійним засобом, що дозволяє вибрати рівняння регресії є графічний, тобто побудова так званого кореляційного поля.
Після того, як вибрано рівняння регресії, що на думку дослідника може відобразити залежність ознаки y від ознаки x слід оцінити лінію регресії. Оцінити лінію регресії в КРА – це значить обчислити теоретичні значення результативної ознаки Y для кожного з значень факторної ознаки за даними рівняння.
Для цього необхідно перш за все обчислити параметри рівняння.
Уявимо собі, що залежність описується рівнянням прямої: .
Параметри a і b обчислюються за способом найменших квадратів, тобто при щоб . Цьому способу відповідає система таких двох нормальних рівнянь:

Відшукавши параметри можна обчислити теоретичні рівні X.
Після оцінки лінії регресії слід оцінити тісноту зв’язку. Це завдання вірішується таким же чином, як і при дослідженні зв’язку на основі аналітичного групування. (універсальним) тісноти зв’язку в КРА є так званий коефіцієнт детермінації, обчислення якого базується на правилі складання дисперсій
залишкова
– загальна дисперсія
– факторна дисперсія, що характеризує систематичну варіацію
залишкова – варіацію, обумовлену рештою факторів.
Коефіцієнт детермінації обчислюється так

– зв’язок між ознаками x і y відсутній.
– функціональний зв’язок.
Часом використовується для оцінки тісноти зв’язку так званий індекс кореляції . Коефіцієнт детермінації як показник тісноти зв’язку використовується при залежності (лінійна чи нелінійна). Дисперсії в КРА обчислюються за формулами:

Ця дисперсія характеризує міру варіації ознаки y, обумовлену впливом всіх без вийнятку факторів

Ця дисперсія характеризує міру варіації ознаки y, обумовлену впливом саме ознаки x
залишкова=.
Характеризує міру варіації ознаки y, обумовлену впливом решти ознак, тобто за вийнятком впливу ознаки x.
При вивченні лінійної залежності в окремих випадках користуються таким показником тісноти зв’язку, як лінійний коефіціент кореляції r

Чим блищий цей показник до одиниці, тим тісніше вважається зв’язок.
Цей зв’язок находиться в межах:

Якщо значення r від’ємне, це свідчить про те, що зв’язок між ознаками y і x обернений. При умові лінійного зв’язку |r|=R
Перевірка істотності зв‘язку в КРА аналогічна перевірці в МАГ, проте число ступенів свободив КРА залежить не від числа груп як в МАГ, а від числа параметрів обраного рівняння. В КРА m – число параметрів.
Для перевірки істотності фактичне чи Fфактичне співставити з критичним (табличним) значеннями цих показників
фактичне криитчне
Fфактичне > F криитчне, то зв’язок визнається істотним.