Всероссийский заочный финансово-экономический институт(ВЗФЭИ)

КУРСОВАЯ РАБОТА
по статистике
«Статистические методы выявления взаимосвязей общественных явлений»

Выполнила:
Факультет ФиК
Группа
л/д №
Проверила: Литвиненко Л.Т.

Москва, 2005г.
Содержание:
TOC \o "1-3" \h \z \u HYPERLINK \l "_Toc99891332" Введение. PAGEREF _Toc99891332 \h 3
HYPERLINK \l "_Toc99891333" Виды и методы взаимосвязи. PAGEREF _Toc99891333 \h 4
HYPERLINK \l "_Toc99891334" Виды взаимосвязи PAGEREF _Toc99891334 \h 4
HYPERLINK \l "_Toc99891335" Методы взаимосвязи PAGEREF _Toc99891335 \h 5
HYPERLINK \l "_Toc99891336" 1. Аналитические группировки PAGEREF _Toc99891336 \h 5
HYPERLINK \l "_Toc99891337" 2. Метод параллельных рядов PAGEREF _Toc99891337 \h 6
HYPERLINK \l "_Toc99891338" 3. Балансовый метод PAGEREF _Toc99891338 \h 7
HYPERLINK \l "_Toc99891339" 4. Корреляционно-регрессионный анализ. PAGEREF _Toc99891339 \h 7
HYPERLINK \l "_Toc99891340" Практическая часть PAGEREF _Toc99891340 \h 16
HYPERLINK \l "_Toc99891341" Аналитическая часть PAGEREF _Toc99891341 \h 24
HYPERLINK \l "_Toc99891342" Заключение PAGEREF _Toc99891342 \h 30
HYPERLINK \l "_Toc99891343" Список литературы PAGEREF _Toc99891343 \h 31

Введение.
Все явления и процессы, протекающие в экономике любой страны взаимосвязаны между собой. Cстатистическое изучение этой взаимосвязи имеет особо важное значение в связи с тем, что оно позволяет выявить закономерности развития и осуществить прогнозирование этих явлений и процессов.
Каждый процесс и явление можно рассматривать с двух сторон. С первой стороны они испытывают влияние других явлений и процессов и выступают как результат этого влияния. С другой стороны каждое явление в свою очередь выступает как фактор, оказывающий влияние на другие явления и процессы. Поэтому признаки, которые испытывают влияние, называются результативными; признаки, которые оказывают влияние - факторные.
Результативные признаки обозначаются через Y, факторные через X. Поэтому в общем виде взаимосвязь между результатом и факторами можно записать формулой:
fy =(x1 ,x2 …)
следовательно Y является функцией от всех X.
Если на результат оказывает влияние первый фактор, то в этом случае изучается корреляция и регрессия, которые носят название парных; если на результат оказывает влияние несколько факторов, то изучается множественная корреляция и множественная регрессия.
Важной задачей статистики является разработка методики статистической оценки социальных явлений, которая осложняется тем, что многие социальные явления не имеют количественной оценки.
Но, исследуя явления в самых различных областях, статистика сталкивается с зависимостями, как между количественными, так и между качественными показателями, признаками. При этом задача статистики – обнаружить (выявить) такие зависимости и дать их количественную характеристику.
Как правило, анализ социальных явлений, их связей и зависимостей должен начинаться с построения графиков связей. В настоящее время используются графики, характеризующие связь социальных явлений (рис.1).

а)

б) в)
Рис.1 Графики, характеризующие связь социальных явлений
С помощью графика (рис.1.а) «цепь» изображаются связи между социальными признаками, которые одинаково существенны и значимы.
График (рис.1.б) «звезда» изображают зависимость социальных явлений, которые тяготеют к одному наиболее значимому. Исключение данного признака нарушает взаимосвязи между оставшимися признаками.
На графике (рис.1.в) «сетка» выделяется несколько значимых признаков, которые тесно зависимы друг от друга.
Виды и методы взаимосвязи.
Виды взаимосвязи
Статистика различает следующие виды взаимосвязи:
Функциональная и статистическая. Первый вид взаимосвязи имеет место тогда, когда первому значению фактора соответствует одно или несколько четко определенных значений результата. Например, S=Vt. Статистическая взаимосвязь имеет место тогда, если каждому значению фактора соответствует неопределенное множество значений результата. Статистика изучает только статистические связи.
Прямая и обратная. Прямая наблюдается в том случае, если движение фактора и результата направлены в одну сторону; обратная связь имеет место, если их движение противоположны.
Прямолинейная и криволинейная взаимосвязи. Прямолинейная выражается формулой уравнения прямой у = а + bx; криволинейная выражается уравнением параболы, гиперболы и других кривых y = x2 + bx + c.
В экономической практике не встречаются взаимосвязи, которые полностью можно описать при помощи формальных уравнений. Поэтому при характере взаимосвязи задачи статистики заключаются в следующем:
определить вид и характер взаимосвязи;
подобрать теоретическую функцию, которая наиболее точно описывает взаимосвязь фактора и результата. Это дает возможность прогнозировать результат показателя на основании прогноза факторов.
Методы взаимосвязи
Статистика изучает взаимосвязи при помощи системы методов, важнейшими среди которых являются:
1. Аналитические группировки, где факторный признак располагается по убыванию или возрастанию, а в соответствии с этим располагается и результативный признак. это дает возможность визуальным путем определить характер и тесноту взаимосвязи. Например, распределение по весу в зависимости от возраста.

2. Метод параллельных рядов. Строятся два ряда признаков, которые находятся в определенной взаимосвязи; затем визуально определяют характер и тесноту взаимосвязи. Например, данные о численности занятых в ВВП.
Для характеристики взаимосвязи факторный признак располагают в монотонно убывающем или возрастающем порядке, а показатели результата перемещаются в соответствии с факторным показателем.
3. Балансовый метод широко применяется в экономике. Основной показатель развития ВВП проходит в своем движении 3 стадии: производство, распределение и перераспределение, конечное использование.
Взаимосвязь между отдельными стадиями движения ВВП и отдельными компонентами ВВП осуществляется при помощи балансового метода. Его суть заключается в том, что величина ВВП на всех трех стадиях должна быть одинакова.
Основными методами изучения взаимосвязи социально-экономических явлений служат равные коэффициенты и корреляционно-регрессионный анализ.
4. Корреляционно-регрессионный анализ. Корреляционная связь – связь, проявляющаяся при достаточно большом числе наблюдений в виде определенной зависимости между средним значением результативного признака и признаками-факторами.
Изучение корреляционных связей сводится в основном к решению следующих задач:
выявление наличия (или отсутствия) корреляционной связи между изучаемыми признаками. Эта задача может быть решена на основе параллельного сопоставления (сравнения) значений х и у у n единиц совокупности; с помощью группировок; построения и анализа специальных корреляционных таблиц; а также построения диаграмм рассеяния;
измерение тесноты связи между двумя (и более) признаками с помощью специальных коэффициентов. Эта часть исследования называется корреляционный анализ;
определение уравнения регрессии – математической модели, в которой среднее значение результативного признака у рассматривается как функция одной или нескольких переменных – факторных признаков. Эта часть исследования называется регрессионный анализ.
Задача корреляционного анализа – измерение тесноты связи между варьируемыми признаками и оценка факторов, оказывающих наибольшее влияние.
Задача регрессионного анализа – выбор типа модели (формы связи), устанавливающих степени влияния независимых переменных.
Связь признаков проявляется в их согласованной вариации, при этом одни признаки выступают как факторные, а другие – как результативные. Причинно-следственная связь факторных и результативных признаков характеризуется по степени:
тесноты;
направлению;
аналитическому выражению.
4.1. Регрессионный анализ. Для оценки параметров уравнений регрессии наиболее часто используется метод наименьших квадратов (МНК), суть которого заключается в следующем требовании: искомые теоретические значения результативного признака EMBED Equation.3 должны быть такими, при которых бы обеспечивалась минимальная сумма квадратов их отклонений от эмпирических (фактических) значений, т.е.
. (6.1)
При изучении связей показателей применяются различного вида уравнения прямолинейной и криволинейной связи. Так, при анализе прямолинейной зависимости применяется уравнение:
EMBED Equation.3 (6.2)
При криволинейной зависимости применяется ряд математических функций:
полулогарифмическая EMBED Equation.3 (6.3)
показательная EMBED Equation.3 (6.4)
степенная EMBED Equation.3 (6.5)
параболическая EMBED Equation.3 (6.6)
гиперболическая EMBED Equation.3 (6.7)
Наиболее часто используемая форма связи между коррелируемыми признаками – линейная, при парной корреляции выражается уравнением (6.2), где а0 – среднее значение в точке x=0, поэтому экономической интерпретации коэффициента нет; а1 – коэффициент регрессии, показывает, на сколько изменяется в среднем значение результативного признака при увеличении факторного на единицу собственного измерения.
Система нормальных уравнений МНК для линейной парной регрессии имеет следующий вид:
EMBED Equation.3 (6.8)
Отсюда можно выразить коэффициенты регрессии:
EMBED Equation.3 ;
EMBED Equation.3 . (6.9)
Для практического использования регрессионных моделей необходима проверка их адекватности. При численности объектов анализа до 30 единиц возникает необходимость проверить, насколько вычисленные параметры характерны для отображаемого комплекса условий, не являются ли полученные значения параметров результатом действия случайных причин. Значимость коэффициентов регрессии применительно к совокупности n<30 определяется с помощью t-критерия Стьюдента. При этом вычисляются фактические значения t-критерия:
для параметра а0: EMBED Equation.3 , (6.10)
для параметра а1: EMBED Equation.3 . (6.11)
В формулах (6.10) и (6.11):
EMBED Equation.3 - среднее квадратическое отклонение результативного признака EMBED Equation.3 от выровненных значений EMBED Equation.3 . (6.12)
EMBED Equation.3 - среднее квадратическое отклонение факторного признака EMBED Equation.3 от общей средней EMBED Equation.3 . (6.13)
Полученные по формулам (6.10) и (6.11) фактические значения EMBED Equation.3 и EMBED Equation.3 сравниваются с критическим EMBED Equation.3 , который получают по таблице Стьюдента с учетом принятого уровня значимости EMBED Equation.3 и числа степеней свободы ? (?=n-k-1, где n – число наблюдений, k – число факторов, включенных в уравнение регрессии). Рассчитанные параметры а0 и а1 уравнения регрессии признаются типичными, если t фактическое больше t критического.
4.2. Корреляционный анализ позволяет установить тесноту связи между факторами и решить следующие задачи:
ответить на вопрос: существует ли связь?
выявить изменение связи в различных ситуациях реальных данных;
определить наиболее значимые факторы в результативном признаке;
Различают:
парную корреляцию – это зависимость между результативным и факторным признаком;
частную корреляцию – это зависимость между результативным и одним факторным признаком при фиксированном значении других факторных признаков;
множественную – многофакторное влияние в статической модели EMBED Equation.3 .
К простейшим показателям тесной связи относятся:
линейный коэффициент корреляции К.Пирсона;
коэффициент детерминации;
коэффициенты корреляции знаков – для оценки тесноты связи качественных признаков (непараметрические методы), Г. Фехнера, К. Спирмэна, М. Кэндэла.
Теснота связи при линейной зависимости измеряется с помощью линейного коэффициента корреляции, который рассчитывается по одной из формул:
EMBED Equation.3 (6.16)
EMBED Equation.3 . (6.17)
а также
EMBED Equation.3 или EMBED Equation.3 .
Корреляционный анализ выполняет оценку адекватности регрессионной модели, но путем установления тесноты связи.
Оценка линейного коэффициента корреляции
Значимость линейного коэффициента корреляции проверяется на основе t-критерия Стьюдента. Для этого определяется фактическое значение критерия EMBED Equation.3 :
EMBED Equation.3 , (6.18)
Вычисленное по формуле (6.18) значение EMBED Equation.3 сравнивается с критическим EMBED Equation.3 , который получают по таблице Стьюдента с учетом принятого уровня значимости EMBED Equation.3 и числа степеней свободы ?.
Коэффициент корреляции считается статистически значимым, если tрасч превышает EMBED Equation.3 ( tрасч > EMBED Equation.3 ).
Универсальным показателем тесноты связи является теоретическое корреляционное отношение:
EMBED Equation.3 , (6.19)
где EMBED Equation.3 – общая дисперсия эмпирических значений y, характеризует вариацию результативного признака за счет всех факторов, включая х;
EMBED Equation.3 – факторная дисперсия теоретических значений результативного признака, отражает влияние фактора х на вариацию у;
EMBED Equation.3 – остаточная дисперсия эмпирических значений результативного признака, отражает влияние на вариацию у всех остальных факторов кроме х.
По правилу сложения дисперсий:
EMBED Equation.3 , т.е. EMBED Equation.3 . (6.19)
Оценка связи на основе теоретического корреляционного отношения (шкала Чеддока)
Для линейной зависимости теоретическое корреляционное отношение тождественно линейному коэффициенту корреляции, т.е. ? = |r|.
Множественный коэффициент корреляции в случае зависимости результативного признака от двух факторов вычисляется по формуле:
EMBED Equation.3 , (6.20)
где EMBED Equation.3 – парные коэффициенты корреляции между признаками.
Множественный коэффициент корреляции изменяется в пределах от 0 до 1 и по определению положителен: EMBED Equation.3 .
Значимость коэффициента множественной детерминации, а соответственно и адекватность всей модели и правильность выбора формы связи можно проверить с помощью критерия Фишера:
EMBED Equation.3 , (6.21)
где R2 – коэффициент множественной детерминации (R2 EMBED Equation.3 );
k – число факторных признаков, включенных в уравнение регрессии.
Связь считается существенной, если Fрасч > Fтабл – табличного значения F-критерия для заданного уровня значимости ? и числе степеней свободы ?1 = k, ?2 = n – k – 1.
Частные коэффициенты корреляции характеризуют степень тесноты связи результативного признака и фактора, при элиминировании его взаимосвязи с остальными факторами, включенными в анализ. В случае зависимости у от двух факторных признаков частные коэффициенты корреляции рассчитываются:
EMBED Equation.3 ; EMBED Equation.3 , (6.22)
где r – парные коэффициенты корреляции между указанными в индексе переменными.
В первом случае исключено влияние факторного признака х2, во втором – х1.
Для оценки сравнительной силы влияния факторов, по каждому фактору рассчитывают частные коэффициенты эластичности:
EMBED Equation.3 , (6.23)
где EMBED Equation.3 – среднее значение соответствующего факторного признака;
EMBED Equation.3 – среднее значение результативного признака;
EMBED Equation.3 – коэффициент регрессии при i-м факторном признаке.
Данный коэффициент показывает, на сколько процентов следует ожидать изменения результативного показателя при изменении фактора на 1% и неизменном значении других факторов.
Частный коэффициент детерминации показывает, на сколько процентов вариация результативного признака объясняется вариацией i-го признака, входящего в множественное уравнение регрессии, рассчитывается по формуле:
EMBED Equation.3 , (6.24)
где EMBED Equation.3 – парный коэффициент корреляции между результативным и i-м факторным признаком;
EMBED Equation.3 – соответствующий стандартизованный коэффициент уравнения множественной регрессии:
EMBED Equation.3 . (6.25)

Практическая часть
Выявить зависимость между нераспределенной прибылью и инвестициями в основные фонды, применяя:
А) метод параллельных рядов
Б) метод группировок
В) графический метод
3.2. Измерить тесноту связи между указанными признаками
Таблица№1
Для изучения капитальных вложений в производство из собственных средств предприятий в регионе проведена 5%-я механическая выборка, в результате которой получены следующие данные:
1. Метод параллельных рядов. Произведем ранжирование капитальных вложений в производство по нераспределенной прибыли
Таблица№2
После проведения ранжирования четко видна взаимосвязь нераспределенной прибыли от инвестиций в основные фонды. При большей прибыли инвестиции в основные фонды больше.
2. Метод группировок. Для образования групп предприятий по нераспределенной прибыли необходимо определить величину интервала по формуле Стерджесса:
I = x max - x min
n ,где
х мах - наибольший показатель нераспределенной прибыли в млн. руб.
х min – наименьший показатель нераспределенной прибыли в млн. руб.
распределим предприятия по величине интервала, следовательно, величина интервала составит 0,8
I =(6-2)/5=0,8
Таблица№3.
Распределение предприятий по нераспределенной прибыли за отчетный период.

Таблица №4
Зависимость между нераспределенной прибылью и инвестициями в основные фонды за отчетный период.

Эту таблицу можно представить в более компактной и более удобной форме для анализа.

Таблица № 4.1
Из таблицы видна зависимость между увеличением размеров предприятий по нераспределенной прибыли и инвестициями в основные фонды, где наблюдается рост фондоотдачи. Наиболее эффективно происходит использование нераспределенной прибыли в четвертой и в пятой группах предприятий. Сравнение данных фондоотдачи по группам предприятий свидетельствует об имеющихся неиспользованных резервах, если предприятия первой, второй и третьей групп достигнут уровня фондоотдачи всех предприятий, то это даст увеличение продукции на 1,29 млн. руб.
Расчет внутренне неиспользованных резервов:
I группа (0,11-0,04) * 9 = 0,63 млн.руб.
II группа (0,11-0,07) * 10,3 = 0,41 млн.руб.
III группа (0,11-0,10) * 24,7 = 0,25 млн.руб.

Итого: 0,63+0,41+0,25 = 1,29 млн.руб.

3. Графический метод.
EMBED Excel.Chart.8 \s

Измерение тесноты связи
Измерим тесноту связи между указанными признаками, возьмем данные из Таблицы № 4.1. Для расчета межгрупповой дисперсии построим вспомогательную таблицу.
Таблица № 5
Расчет дисперсии групповых средних нераспределенной прибыли и инвестиций в основные фонды, млн. руб.
xср = ?(x*f)/?f=11,57/25=0,46
По полученным результатам найдем межгрупповую дисперсию
EMBED Equation.3
EMBED Equation.3 1,31/25=0,05
Для расчета общей дисперсии построим вспомогательную таблицу.
EMBED Equation.3
Общая дисперсия равна:
EMBED Equation.3
Коэффициент детерминации найдем по формуле:
EMBED Equation.3 , следовательно EMBED Equation.3 .
Это значит, что 1,2% выпуска продукции по предприятиям зависят от изменения инвестиций в основные фонды.
EMBED Equation.3 = 0,11
Связь между нераспределенной прибылью и инвестициями в основные фонды очень слабая.

Аналитическая часть
В таблице приведены сведения о валовом региональном продукте, млн. руб. в Центральном Административном округе в 2001 г. и инвестиции в основной капитал млн. руб. – выявить зависимость, измерить тесноту связи между указанными признаками.
1. Метод параллельных рядов.
Таблица №1

Проведем ранжирование:

Из произведенного ранжирования видно, что чем больше были инвестиции в 2001 г. в основной капитал, тем больший валовой региональный продукт получили субъекты Российской федерации.
2. Метод группировок.
Для образования групп необходимо определить величину интервала по формуле Стерджесса:
I = x max - x min
n
I=2870
Таблица №3
Можно эту таблицу представить в сокращенном варианте

Таблица №4

Данные таблицы №4 показывают, что с ростом Валового регионального продукта происходит рост инвестиций, следовательно, между исследуемыми признаками существует прямая зависимость. Теснота связи может быть измерена эмпирическим корреляционным отношением.
3. Графический метод. EMBED Excel.Chart.8 \s
Анализ показывает о существование прямой зависимости.
Измерение тесноты связи.
Измерим тесноту связи между указанными признаками, возьмем данные из таблицы№ 4, и рассчитаем коэффициент детерминации и эмпирическое корреляционное отношение
EMBED Equation.3 - взвешенная дисперсия

EMBED Equation.3 = 77197197,59
Для расчета общей дисперсии построим вспомогательную таблицу.
EMBED Equation.3
Общая дисперсия равна:
EMBED Equation.3
Коэффициент детерминации найдем по формуле:
EMBED Equation.3 , следовательно EMBED Equation.3 .
Коэффициент детерминации показывает, что всего лишь 8,3% вариации инвестиций в основные производственные фонды в Центральном административном округе обусловлено ростом валового регионального продукта
Эмпирическое корреляционное отношение EMBED Equation.3 =0,28 свидетельствует о малом влиянии вложения инвестиций с основные производственные фонды в 2001 г. в Центральном Административном округе на рост валового регионального продукта

Заключение
Итак, в этой работе, мы показали особую значимость изучения социально-экономической статистики, разработки методологии для изучения показателей, характеризующих процессы общественного воспроизводства, масштабы, уровень, темпы и пропорции его развития, структуру народного хозяйства и структуру общества. Основой методологии статистической науки служит всеобщий метод познания – диалектический и исторический материализм. На этой основе строится и выбор применяемых к статистическому изучению общества специальных методов теории статистики, и выработка специфических для социально-экономической статистики методологических приемов.
Путем метода параллельных рядов, метода группировок, а также графическими методами была выявлена зависимость между нераспределенной прибылью и инвестициями в основные фонды предприятий одной из отрасли экономики за отчетный период. Наиболее эффективно происходит использование нераспределенной прибыли в четвертой и в пятой группах предприятий.
В аналитической части при использовании точных статистических данных, а именно, сведения о валовом региональном продукте в Центральном административном округе и инвестиций в основной капитал, была выявлена зависимость между исследуемыми признаками, но связь выявлена слабая ( EMBED Equation.3 ).
Список литературы
«Теория статистики» под ред. Шмойловой Р.А., «Финансы и статистика»,Москва, 2004г
«Общая теория статистики» Елисеева И.И.,«Финансы и статистика»,Москва, 2004г
«Статистика» В.М. Гусаров, «Юнити», Москва, 2001г.
«Экономическая статистика» под ред. Ю.Н. Иванова, Москва, 2000г.
«Социальная статистика» под ред. Елисеевой И.И., «Финансы и статисика», Москва, 1997