Регрессионный анализ
Вторым этапом изучения статистической связи вслед за определением степени тесноты связи с помощью коэффициента корреляции идет этап установления формы связи или вида функции φ (х), объясняющей основную закономерность влияния факторного признака х на результативный признак у.
Под формой статистической связи понимают ту тенденцию, которая проявляется в изменении изучаемого результативного признака в связи с изменением факторного признака. Форму связи можно попытаться установить, построив в прямоугольной системе координат все множество пар значений признаков (хi, уi), . По оси абсцисс откладываются значения факторного признака х, по оси ординат – значения признака у. Такое графическое построение называется полем корреляции или диаграммой рассеяния. По характеру расположения точек на координатной плоскости можно судить о характере статистической связи. Если наблюдается тенденция равномерного возрастания или убывания значений признака, то связь называется прямолинейной. При тенденции неравномерного изменения значений зависимость носит название криволинейной.
Линия на графике, изображающая тенденцию в изменении результативного признака при возрастании факторного, называется линией регрессии. В случае прямолинейной связи линия регрессии ищется в виде уравнения прямой линии:
, (3)
где у – теоретические значения результативного признака, образующие прямую линию; а0, а1 – параметры уравнения; х – значения факторного признака.
|
|
Расчет параметров уравнения производится методом наименьших квадратов. В основу метода положено требование минимальности отклонения теоретических значений у’i от эмпирических (полученных в результате наблюдения) значений признака уi при одном и том же значении хi. Это требование в математических обозначениях записывается следующим образом:
. (4)
Подставляя вместо теоретических значений их запись через параметры а0 и а1, получаем
. (5)
В этом выражении известны все хi и уi, полученные в результате наблюдения, неизвесты лишь а0 и а1. Полученная функция двух переменных а0 и а1 имеет минимум, когда частные производные и одновременно равны 0. Произведя дифференцирование по а0 и а1, получаем систему двух уравнений с двумя неизвестными:
(6)
где n – общее число наблюдений; х, у – значения признаков, полученные в результате наблюдения.
Решая данную систему уравнений, получим выражение для нахождения коэффициентов а0 и а1:
, (7)
, (8)
где n – общее число наблюдений; х, у – значения признаков, полученные в результате наблюдения.
Поля корреляции и уравнения регрессии для четырех цехов представлены на рис. 5-8.
|
|
Рисунок 5 – Поле корреляции для характеристик оборудования первого цеха
Рисунок 6 – Поле корреляции для характеристик оборудования второго цеха
Рисунок 7 – Поле корреляции для характеристик оборудования третьего цеха
Рисунок 8 – Поле корреляции для характеристик оборудования четвертого цеха
Для того, чтобы сделать выводы о том, на каком объекте наблюдения быстрее увеличиваются с возрастом эксплуатационные расходы, необходимо произвести анализ коэффициента в уравнении линейной регрессии (формула 3) по каждому цеху. Максимальное значение данного коэффициента у четвертого цеха (1,1234), следовательно, именно здесь темпы роста эксплуатационных расходов в процессе старения оборудования будут максимальными среди всех цехов.
Выводы
1) Самое изношенное оборудование во втором цехе, наиболее высоки эксплуатационные расходы в третьем цехе.
2) Наиболее тесная связь между возрастом оборудования и эксплуатационными расходами наблюдается в первом цехе, что подтверждается значениями коэффициентов Фехнера (0,943) и коэффициента корреляции (0,945). Наименее тесная связь во втором цехе, что также подтверждается значениями этих коэффициентов (0,6 и 0,9005, соответственно).
|
|
3) В четвертом цехе наблюдаются максимальные темпы роста эксплуатационных расходов в процессе старения оборудования среди всех цехов.
Дата добавления: 2015-12-17; просмотров: 8; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!