Определение коэффициентакорреляции



Термин «корреляция» был введен в науку английским ученым Ф.Гальтоном, а точную формулу для расчета коэффициента корреляции раз- работал его ученик К.Пирсон. Этот коэффициент характеризует наличие только линейной связи между признаками (переменными), обозначаемыми, как правило, символами X и Y. Формула расчета коэффициента корреляции построена таким образом, что, если связь между признаками имеет линейный характер, то коэффициент Пирсона rxy устанавливает тесноту связи. Величи- на rxy не может превышать +1 и быть меньше –1. Это границы для значений коэффициента корреляции. При коэффициенте корреляции равном ±1 имеем не статистическую, а функциональную зависимость.

Основная формула для вычисления коэффициента корреляцииимеет


вид:


 


r = å(xi-x)×(yi-y)


 

 

.                           (2.19)


å
xy

i
(xi


-x)2 × (y


-y)2


Формула (2.19) не совсем удобна для расчета коэффициента корреляции, так как в ней много трудоемких расчетов, связанных с определением суммы разностей (xi – x) и (yi – y ). Поэтому для практических расчетов чаще поль-

зуются разновидностью этой же формулы


r =       N×å(xi×yi)-(åxi×åyi)


.       (2.20)


i
i
i
i
xy       [N×åx2-(åx)2]×[N×åy2-(åy)2]

Воспользуемся данными табл.2.12 для расчета коэффициента корреля- ции статистической зависимости (2.20) (см. пример).


rxy=


12 ×177,28- 2036,6

12×136,4-1568,2)×(12×230,52-2645,0)


= 0,990 .


1,40 ×0,70
Точность расчетов можно проверить по формуле (2.16):


rxy=


= 0,989 .


Расхождение в 0,001 можно записать за счет погрешности округлений при расчетах.

Такое высокое значение коэффициента корреляции свидетельствует о высокой тесноте связи объема снятого материала Q и глубины резания s. Тем не менее, проверим уровень значимости полученного коэффициента путем проверки статистических гипотез.


В качестве нулевой гипотезы Н0 принимаем, что полученный в результа- те обработки данных коэффициент корреляции rxy не значим, т.е. корреляции между Q и s или нет, или она слабая. За гипотезу Н1 принимаем альтернатив- ное событие: – rxy – значим, т.е. имеется тесная корреляция между Q и s.

Воспользуемся математической таблицей «Критические значения коэф- фициента корреляции rxy Пирсона» (см. приложение П3).

Определим вначале число степеней свободы k = n – 2 = 12 – 2 =10. На- ходим по указанной таблице критические пределы уровней значимости ко- эффициента корреляции:


rкр


=ì0,58 для Р £ 0,05

í
î0,71 для Р £ 0,01.


Построим соответствующую «ось» значимости (рис. 2.19). Нанесем на

«оси» критические границы и полученное значение коэффициента корреля- ции. Видно, что значение rxy лежит далеко за верхней критической границей rкр= 0,71 в зоне значимости.

Таким образом, нулевая гипотеза Но отвергается, а принимается гипоте- за Н1 – полученная регрессионная зависимость Q=F(s) статистически значи- ма.

 

 


Зона незначимости
Зона значимости
0,05
0,01
rкр0,58                                           rкр0,71   rфакт0,91


ось значимости


 

Рис. 2.19. Оценка значимости коэффициента корреляцииrху

 

Планирование многофакторного эксперимента

Основные понятия и определения

Эксперимент, в процессе которого исследуется стохастическая зависи- мость одной величины Y от нескольких других Xi, называется многофак- торным экспериментом:

Y = f (X1,X2,…Xn).                                  (2.21)

Независимые переменные X1, X2, …Xn называют факторами , n – число факторов. Зависимая переменная Y называется функцией отклика [10].

Планирование многофакторного эксперимента – это совокупность дей- ствий, позволяющих решить поставленную задачу экспериментальным путем стребуемойточностьюприпроведенииминимальногочислаопытов. При


проведении экспериментальных исследований чаще всего решает две задачи: интерполяционную и задачу оптимизации. Интерполяционной задачей назы- вается задача построения уравнения регрессии (2.21), адекватного результа- там опыта. Задачей оптимизации называется задача отыскания факторов Xi, при которых функция отклика Y достигает экстремума. В настоящей работе рассматривается только первая задача.

Для решения указанной задачи проводят опыты, то есть измерение функции отклика Y при фиксированных значениях X. Опыт может состоять как из однократного измерения (прямого или косвенного), так и из n повтор- ных измерений. Совокупность опытов, необходимых для решения постав- ленной задачи, называется планом эксперимента.

Фиксированное значение фактора будем называть его уровнем. Разность двух ближайших уровней фактора называется интервалом варьирования. Со- вокупность численных значений, которые может принимать фактор, будем называть областью варьирования фактора.

 


Дата добавления: 2018-02-15; просмотров: 171;