Одновыборочный критерий Стьюдента
Постановка задачи.
Двухвыборочный вариант. Имеются две выборки одинакового объема. Известно, что распределения в этих выборках подчинены нормальному закону и, кроме того, каждое -ое наблюдение в 1-ой выборке зависит (в вероятностном смысле) от соответствующего -ого наблюдения во второй выборке. Требуется проверить гипотезу однородности выборок. Точнее, требуется проверить гипотезу о том, что среднее значение разности выборок равно нулю (меньше нуля, больше нуля).
Одновыборочный вариант. Имеется одна выборка из нормального распределения. Требуется проверить гипотезу о том, что среднее значение этого распределения не превосходит заданной величины .
Теоретические основы.
См. стр. 37-40 пособия [4].
Вычисления.
В приложении Excel для работы с распределением Стьюдента имеются встроенные функции
СТЬЮДРАСП, вычисляющая функцию надежности, и
СТЬЮДРАСПОБР, вычисляющая верхние квантили.
Подробнее см. ниже в главе “Встроенные функции Excel”.
Пример.
Измерялось верхнее артериальное давление у 10 пациентов до и после лечения. Требуется проверить эффективность лечения.
Если эти пациенты страдают гипертонической болезнью, то ожидается, что давление после лечения будет понижаться. Поэтому в качестве альтернативы здесь нужно выдвинуть утверждение о том, что среднее значение разности давлений до и после лечения будет больше нуля.
|
|
A | B | C | D | E | F | G | H | |
1 | До | После | Разность | |||||
2 | 162,8 | 139 | 23,8 | Выборочные характеристики | ||||
3 | 186,9 | 189 | -2,1 | |||||
4 | 167,2 | 162 | 5,2 | До | После | Разность | ||
5 | 166,5 | 168,6 | -2,1 | Среднее | 168,94 | 152,88 | 16,06 | |
6 | 173 | 164,9 | 8,1 | Ст.Отклон. | 7,48 | 19,39 | 13,96 | |
7 | 164,1 | 137,9 | 26,2 | Ош.средн. (+-) | 2,49 | 6,46 | 4,65 | |
8 | 158,3 | 121,7 | 36,6 | Объем выборки | 10 | 10 | 10 | |
9 | 168,4 | 129,9 | 38,5 | |||||
10 | 174,8 | 160,5 | 14,3 | Статистика Стьюдента | ||||
11 | 167,4 | 155,3 | 12,1 | 3,45 | ||||
12 | Гипотеза | Альтернатива | Принимается | |||||
13 | Не изменилось | Стало меньше | 0,004 | Альтернатива | ||||
14 | Вывод: выборочные данные высоко значимо подтверждают эффективность лечения | |||||||
a Порядок вычислений.
1) Ввести данные в столбцы A и B.
2) В столбце C вычислить разности значений до и после лечения
Ø в ячейку C2 ввести формулу
Ø =A2-B2
Ø скопировать ячейку C2 параллельно данным столбца A.
|
|
3) Вычислить основные характеристики столбцов A, B и C
Ø средние значения (ячейки F5, G5, H5)
– функция СРЗНАЧ;
Ø стандартные отклонения (ячейки F6, G6, H6)
– функция СТАНДОТКЛОНП;
Ø объемы выборок (ячейки F8, G8, H8)
– функция СЧЕТ;
Ø стандартные ошибки среднего – формула
=F6/КОРЕНЬ(F8)
введенная в ячейку F7 и скопированная в ячейки G7, H7.
4) В ячейке G11 вычислить статистику Стьюдента
Ø =H5/H7
{ }.
5) В ячейке G11 вычислить критический уровень значимости
=СТЬЮДРАСП(G11; H8-1; 1)
{ , “1” – число хвостов для односторонней альтернативы }.
6) В ячейке H15 сделать вывод о предпочтении гипотезы или выбранной альтернативы.
Замечание 1. Если по каким-либо причинам вычислялось стандартное отклонение, основанное на несмещенной оценке дисперсии (функция «СТАНДОТКЛОН»), то в формуле для ошибки среднего необходимо делитель заменить на . Аналогичную замену нужно производить и при вычислениях .
Замечание 2. Описанную выше схему с очевидными изменениями можно применить и в случае одновыборочного варианта задания. Например, если перед исследователем стояла задача полного излечения гипертонических больных, то необходимо было бы проверить гипотезу о том, что среднее значение верхнего артериального давления у пациентов, прошедших курс лечения, будет больше 125 при альтернативе меньше 125. Всё отличие вычислений в этом случае будет состоять в рассмотрении разности давлений после лечении у каждого пациента минус нормативная граница 125.
|
|
Контрольные вопросы.
1. Сформулируйте статистическую задачу.
2. Как вычисляется статистика одновыборочного критерия Стьюдента?
Ответ: см. [4] стр. 39.
3. Почему к рассматриваемым данным нельзя применить двухвыборочный критерий Стьюдента?
Ответ: см. [4] стр. 38.
4. Когда следует применять критерий Стьюдента, а когда критерий знаков?
Ответ: см. [4] стр. 38, 40.
5. Чему равен критический уровень значимости для критерия Стьюдента при двухсторонней альтернативе?
Ответ: см. [4] стр. 39.
6. Можно ли к рассматриваемым данным применить критерий однородности хи-квадрат?
Ответ: см. [4] стр. 48.
7. Можно ли однозначно утверждать, что пребывание в спортивном летнем лагере повышает спортивную форму, если средний вес случайно отобранной части студентов после пребывания в лагере уменьшился на 7 кг?
Ответ: см. [4] стр. 8.
8. Что еще нужно знать, чтобы правильно ответить на предыдущий вопрос?
9. Найдите по таблице критический уровень значимости при двухсторонней альтернативе, если значение и объем выборки .
|
|
Ответ: см. [4] стр. 20, 39 или ниже стр. 76-77.
Задание 6.
Критерий знаков.
Постановка задачи.
Двухвыборочный вариант. Имеются две выборки одинакового объема. Известно, что каждое -ое наблюдение в 1-ой выборке зависит (в вероятностном смысле) от соответствующего -ого наблюдения во второй выборке. Распределение выборок неизвестно. Требуется проверить гипотезу однородности выборок.
Одновыборочный вариант. Имеется одна выборка. Требуется проверить гипотезу, что некоторое фиксированное событие происходит чаще, чем противоположное к этому событию утверждение (например, лечение чаще приводит к выздоровлению).
Теоретические основы.
См. стр. 40-42 пособия [4].
Вычисления.
При малых значениях критический уровень значимости может быть вычислен с использованием простого калькулятора. Например, если в эксперименте наблюдалось в испытаниях, то критический уровень значимости можно вычислить так:
m | 8 | 9 | 10 | Сумма | 210 | |
45 | 10 | 1 | 56 | 1024 | 56/1024≈ 0,055 |
Пакет Excel имеет встроенную функцию БИНОМРАСП (см. стр. 74), которая позволяет вычислять вероятность для биномиального распределения. Нам необходима вероятность противоположного события, причем значение m должно быть учтено при вычислении этой вероятности. Таким образом, для вычисления следует использовать функцию
=1-БИНОМРАСП(m -1; n; 0,5; 1)
(единица отнимается с целью учета значения m).
Пример.
Рассмотрим данные, которые использовались для иллюстрации одновыборочного критерия Стьюдента.
A | B | C | D | E | F | |
1 | До | После | Эффект |
| ||
2 | 162,8 | 139 | 1 |
| Число наблюдений n | 10 |
3 | 186,9 | 189 | 0 | Число успехов m | 8 | |
4 | 167,2 | 162 | 1 |
| ||
5 | 166,5 | 168,6 | 0 |
| Уровень значимости | |
6 | 173 | 164,9 | 1 | = | 0,055 | |
7 | 164,1 | 137,9 | 1 |
| ||
8 | 158,3 | 121,7 | 1 |
| Наличие эффекта | |
9 | 168,4 | 129,9 | 1 | слабо значимо | ||
10 | 174,8 | 160,5 | 1 | Вывод: по-видимому, препарат способствует уменьшению давления. Для уточнения необходимо провести дополнительное исследование. | ||
11 | 167,4 | 155,3 | 1 |
a Порядок вычислений.
1) В столбце С указать наличие эффекта для каждой пары данных;
2) в ячейке F2 вычислить количество пар данных;
3) в ячейке F3 подсчитать число пар с наличием эффекта;
4) в ячейке F6 вычислить критический уровень значимости
Ø =1-БИНОМРАСП(F3-1; F2; 0,5; 1)
5) сделать вывод о степени влиянии лечения на артериальное давление.
Замечание 1. Проведенные вычисления можно разместить на том же листе, где строился одновыборочный критерий Стьюдента.
Замечание 2. Если для этих данных построить нижнюю 95%-доверительную границу для вероятности эффекта (см. Задание 13), то получим , что говорит в пользу гипотезы, поскольку интервал не попадает полностью в область альтернативы (см. способ проверки гипотезы, основанный на доверительной границе, описанный в [4]). Если же построить 90%-ю границу, то получим , свидетельствующее в пользу альтернативы. Это объясняет тот странный вывод, что сделан нами по результатам статистической обработки.
Замечание 3. Описанную схему можно применять также для проверки гипотезы о вероятности “успеха” при биномиальных испытаниях – одновыборочный вариант критерия. Это связано с тем, что при применении критерия знаков вывод основывается исключительно на количестве положительных эффектов и не зависит от того, как это количество было подсчитано.
Например, если бы перед исследователем стояла задача окончательного излечения больных гипертонией, то для представленных данных мы имели бы лишь один положительный эффект: . В этом случае
=1-БИНОМРАСП(0; 10; 0,5; 1)=0,999.
То есть, несколько преждевременно говорить, что лечение приводит к выздоровлению.
В качестве другого примера рассмотрим ситуацию, когда при составлении договора купли-продажи заказчиком была оговорена верхняя граница в 8% для доли бракованной продукции. При поступлении товара заказчик проводит контрольные измерения n единиц продукции. По результатам испытаний требуется проверить гипотезу (опять же гипотеза противоположна ожиданиям). Все вычисления в данном случае будут аналогичны вышеприведенным. Единственное отличие возникнет при нахождении критического уровня значимости – здесь нужно, во-первых, вычислять не функцию надежности, а функцию распределения биномиального закона (объясните самостоятельно), и, во-вторых, заменить граничное значение гипотезы 0,5 на значение 0,08. Например, если среди 37 проконтролированных изделий было обнаружено 1 некондиционное (т.е. 2,7% от объема контроля), то критический уровень значимости равен
=БИНОМРАСП(1; 37; 0,08; 1)=0,193.
Другими словами, нет достаточных оснований утверждать, что продукция удовлетворяет требованиям заказчика (гипотеза не отвергается). Может быть, надо провести еще ряд контрольных замеров.
Еще один пример см. пособие [4] стр. 42.
Контрольные вопросы.
1. Сформулируйте статистическую задачу.
2. Чему равна статистика критерия знаков?
Ответ: см. [4] стр. 41.
3. Чему равен критический уровень значимости критерия знаков?
Ответ: см. [4] стр. 41.
4. Когда следует применять критерий Стьюдента, а когда критерий знаков?
Ответ: см. [4] стр. 38, 40.
5. Чем, как Вы думаете, обусловлен неоднозначный вывод в нашем первом примере?
6. Вычислите с помощью калькулятора значение критического уровня значимости, если число успехов равно 6 при 9 испытаниях.
Ответ: см. выше стр. 33.
7. Проверьте гипотезу о том, что вероятность рождения мальчика равна 0,515, если среди 1000 новорожденных детей 509 оказались мальчики.
Ответ: см. [4] стр. 41-42.
Задание 7.
Дата добавления: 2018-04-05; просмотров: 913; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!