Условный пример расчета ранговой корреляции.
Уровень значимости
· Чем больше n, тем меньше максимальная ошибка . Однако, даже при заданном n нельзя абсолютно достоверно указать величину «треугольник», как как расчет этой величины, как и любой статистический вывод, делают на основе результатов эксперимента, а они заведомо содержат ошибки
· Выводы, которые делают на основе неточных данных, принципиально не могут быть абсолютно достоверными. Поэтому говорят о надежности статистического вывода, которую оценивают величиной доверительной вероятности p, где 0 < p < 1.
· Например, статистический вывод, сделанный с доверительной вероятностью p = 0.95, будет справедлив в 95 случаях из 100. Будем пользоваться чаще величиной q = 1-p, называемой уровнем значимости.
· Уровень значимости задается заранее, до проведения расчетов. Типичные значения для q: 0.01, 0.05; и 0.1 или в процентах 1,5,10.
Определение грубых наблюдений
· Грубые наблюдения (промахи) подлежат исключению из выборки.
· Для их обнаружения можно вновь воспользоваться t – критерием Стьюдента.
· В этом случае сомнительный результат yi , временно исключают из выборки, а по ставшимся данным рассчитывают средн ее арифметическое yср и дисперисию.
· Далее вычисляют величину tрасч:
· Из таблиц распределения Стьюдента, по выбранному уровню значимости и числу степеней свободы, связанному с дисперсией, находят табличное значение t – критерия tтабл. Если tрасч > tтабл, то подозреваемый результат является промахом и должен быть исключен и выборки.
|
|
~y – y среднее
yмакс - ~y =
~y – ymin = max = yi
Проверка нормальности распределения случайных величин
· При рассмотрении предыдущих статистических процедур предполагалось, что выходная величина подчиняется нормальному закону распределения.
· Это предположение можно проверить разыми способами. Наиболее строгим из них является применение критерия x2 Пирсона.
· Для этого необходимо иметь выборку достаточно большого объема : Диапазон измерения выходной величины в этой выборке разбивается на I интервалов так, чтобы эти интервалы покрывали всю ось от и в каждый интервал при этом попало не менее пяти значений выходной величины.
· Подсичтывают количество наблюдений, попавших в каждый интервал. Затем вычисляют теориетические вероятности попадани я случайной величины в каждый I интервал
· Для этого используют формулу pi = Ф(z2) – Ф(z1)
Проверка нормальности распределения случайных величин
Следующим этапом является вычисление величины Xрасч2:
Гипотезу о нормальности распределения можно принять, если X2расч < X2табл. Расчет сводится в таблицу.
Проверка статистических гипотез
|
|
· Результаты экспериментальных исследований часто используют, например для сравнения условий функционирования объектов, оценки сравнительной эффективности различных технологий, разных способов измерения и т.д. Во многих случаях соответствующие выводы делают на основе анализа и сравнения нескольких выорок. Одна из простых задач такого типа возникает , когда надо сравнивать точность двух измерительных приборов.
· Пусть имеются две выборки объемом n1 и n2, по которым найдены выборочные дисперсии s21 и s22 . Требуется выяснить, можно ли утверждать, что обе выборки взяты из одной и той же генеральной совокупностью.
1. Проверка однородности двух дисперсий
· Для проверки статистической гипотезы об однородности двух дисперсий используется критерий Фишера F.
· 1. Вначале вычисляется величина Fрасч , равная отношению большей из выборочных дисперсий к меньшей
· 2. Далее задаются уровнем значимости q и вычисляют числа степенй свободы дисперсий числителя и знаменателя по формулам: f1 = n1 – 1 и f2=n2 – 1.
· 3. По трём величинам q, f1 и f2 из таблиц распределения Фишера (таблица) отыскивают величину F = Fтабл.
· 4. Если Fрасч > Fтабл, то выборочные дисперсии считаются неоднородными (различие между ними значимо) для выбранного уровня значимости q. Если Fрасч <= Fтабл, то можно принять гипотезу об однородности дисперсий.
|
|
2. Проверка однородности нескольих дисперсий по выборкам одинакового объема.
Для проверки однородности нескольких дисперсий при равных объемах всех рассматриваемых выборок n1=n2=n3=…=n может быть использовать G – критерий Кохрена.
Пусть m – число выборочных дисперсий, однородность которых проверяется. Обозначим эти дисперсии .
Вычисляется расчетное G – отношение по формуле:
В числителе этой формулы стоит наибольшая из расматриваемых дисперсий, а в знаменателе – сумма всех дисперсий.
3. Далее обращаются к таблицам распределения Кохрена. По выбранному уровню значимости, числу степеней свободы каждой выборки и по количеству выборок из этой таблицы отыскивают величину G = Gрасч. Если Gрасч < Gтабл ……. Жопа
3. Проверка однородности нескольких дисперсий по выборкам разного объема.
· Экспериментаторы часто планируют получение выборок одинакового объема, однако, если в опытах обнаруживаются промахи, то после их исключения объемы выборок оказываются различными.
Критерий Бартлетта.
Из таблиц при уровне значимости и числе степеней свободы k = m-1 отыскивают значение Xтабл2. Гипотеза об однородности дисперсий принимается, если B<= X2табл.
|
|
4. Проверка однородности средних значений
· При проверке однородности средних значений исследуются две выборки, имеющие различные средние арифметические.
· Данная проверка позволяет установить, вызвано или расхождение между средними случайными ошибками измерения или оно связано с влиянием каких-либо неслучайных факторов.
· Проверка проводится с применением t – критерием Стьюдента.
· Пусть n1 и n2 – объемы выборок , y1ср и y2ср – соответствующие средние, s21 и s21 – оценки дисперсий , найденных по этим выборкам.
Коэффициент корреляции
· Во многих случаях целью экспериментальных исследований является установление и изучение зависимости между некоторыми величинами. Если каждая из этих величин является случайной, то при этом используют методы корреляционного анализа.
· Будем говорить, что между двумя случайными величинами имеется статистическая связь, если при изменении одной из них меняется распределение другой.
· Для оценки статистической связи по данным эксперимента широко используется выборочный коэффициент корреляции.
· Пусть проведено n наблюденний и в каждом из них определялись значения двух параметров (признаков) x и y. Следовательно, имеются две одновременно получаемые выборки: x1, x2, …, xn и y1, y2, …, yn.
· По каждой из их найдём среднее арифметическое и дисперсии. Выборочный коэффициент корреляции рассчитывается по формуле:
· Коэффициент корреляции всегда лежит в пределах
· Он характеризует не всякую, а только линейную зависимость между случайными величинами.
· При положительном r можно предполагать, что с возрастанием одной из случайных величин другая в среднем тоже возрастает. При отрицательном r с ростом одной из них другая величина будет в среднем убывать.
· Чем ближе величина r к (+1) или (-1), тем больше степень линейной зависимости между рассматриваемыми случайными величинами.
· Значение r, равное нулю, свидетельствует об отсутствии линейной статистической связи меду ними.
· Такие случайные величины называют некоррелированными.
· Обычно величина оказывается на равной нулю
· Для выяснения того, будут ли некоррелированными в этом случае признаки x и y, вычисляют величину
· Её сравнивают с табличным значением t – критерия Стьюдента, найденным при выбранном уровне значимости q и числе степеней свободы f = n-2
· Если , принимается гипотеза о некоррелированности величин x и y. В противном случае коэффициент корреляции значимо отличается от нуля, т.е между величинами x и y существует линейная статическая связь.
· Если требуется исследовать статистическую связь между тремя и более случайными величинами, то пользуются коэффициентом множественной корреляции.
· Так, для оценки степени статистической связи случайной величины z с величинами x и y рассчитывают выборочный совокупный коэффициент корреляции p по формуле:
· Где rxy, ryz, rxz – коэффициеты корреляции соответственн между величинами x и y, y и z, x и z.
· Величина p лежи в пределах 0 <= p <= 1
· Иногда требуется установить наличие взаимосвязи между двумя качественными признаками, т.е признаками, которые не являются численно измеримыми.
· Исследуемые объекты в этом случае можно поранжировать, т.е. пронумеровать в порядке возрастания или убывания признака. Этот номер, присвоенный объекту, называется рангом.
· Так как исследуются два признака то каждому i-му объекту присваивается два ранга: xi и yi в соответствии с признаками x и y. Таким образом, имеем две последовательности рангов:
· По признаку x: x1, …, xn;
· По признаку y: y1, y2, …, yn.
· Одним из способов оценки связи меду двумя качественными признаками является вычисление коэффициента ранговой корреляции Спирмена.
· Формула имеет вид:
·
Коэффициент ранговой корреляции Спирмена
· Этот коэффициент измеряется в пределах от -1 о +1, а его абсолютная величина пропорциональна степени зависимости между признаками х и у.
· Оценка значимости коэффициента проводится точно так же, как и для обычного коэффициента корреляции.
· Эта проверка корректна в данном случае при n>= 9
Условный пример расчета ранговой корреляции.
· Требуется выяснить, имеется ли взаимосвязь между уровнем специализации предприятия по номенклатуре продукции (единый конструктив или технология) и себестоимостью продукции. Допустим, что для каждого предприятия был рассчитан совокупный показатель специализации, учитывающий номенклатуру выпускаемой продукции, а так же их объемы.
· Ранжирование по уровню специализации:
[1 2 3 4 5 6 7 8 9 10]
· Ранжирование по себестоимости
· [8 6 9 10 7 3 4 2 1 5]
· В первой строке предприятия пронумерованы в порядке возрастания специализации, т.е большему номеру соответствует более высокий уровень специализации.
· Далее для каждого предприятия была вычислена себестоимость производства единицы продукции (шт, т.).
· В соответствии с этой величиной каждому предприятию был присвоен ранг, причем большему значению себестомости соответствует больший ранг.
· Вычислим коэффициент ранговой корреляции спирмена по формуле:
·
·
· Для оценки значимости найденного значения вычисляем величину tрасч
· tрасч =2,93
· tтабл = 2.31 (при уровне значимости q = 0.05 и числе степеней свободы n равной 10-2 = 8)
· tрасч>tтабл => ранговая корреляция между уровнем специализации предприятия и себестомостью продукции существует.
Использование коэффициента конкордации для обработки экспертных оценок при ранжировании.
· Коэффициент конкордации характеризует степень согласованности мнений экспертов. Признаками в данном случае служат мнения экспертов.
· Согласованность мнений экспертов важна при прогнозировании и планировании экспериментов.
· Пусть имеется n факторов x1, x2, …, xn влияющих на функционирование объекта.
· Требуется выявить важнейшее из этих факторов, чтобы подвергнуть их дальнейшему исследованию.
· Каждому из m экспертов предлагается список факторов с указанием диапазона их варьирования.
· Эксперта просят приписать ранги этим факторам – пронумеровать их в порядке убывания степени их влияния на объект.
· Результаты сводятся в таблицу. Здесь aij – ранг, приписанный j – м экспертом i-му фактору.
Коэффициент конкордации рассчитывается по формуле:
· Величина может принимать значения в пределах 0 <= W <= 1. Чем ближе к 1 значение W, тем больше согласие между экспертами. Для оценки значимости коэффициента конкордации используется .
· Вычисляется:
Которое сравнивается с величиной найденной при уровне значимости и числе степенй свободы f = n-1
· Если то фиксируется согласие экспертов при данном уровне значимости
Дата добавления: 2022-01-22; просмотров: 28; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!