Критерии согласия распределения.



Эмпирические распределения могут отличаться по средним значениям, дисперсиям, ассиметрии, эксцессу и сочетанию данных параметров.

X2- критерий Пирсона

Назначение:

1) позволяется сопоставить эмпирическое распределение с теоритическим;

2) позволяет сопоставить 2,3 или более эмпирических распределений признака между собой

Ограничения

· Количество испытуемых от 30 человек

· Кол-во наблюдений для каждого «разряда» (варинта распределения признака) от 5

· Выбранные «разряды» должны полностью отражать все возможные варианты распределения признака

· Сумма наблюдений по разрядам всегда должна быть равна общему кол-ву наблюдений

Сопоставления эмпирического и теоритического

Гипотезы:

Н0: эмпирическое и теоритическое распределение не отличаются

Н1: эмпирическое и теоритическое распределение отличаются.

Сопоставление эмпирических распределений между собой

Н0: Эмпирическое значение 1 не отличается от эмпирических значений 2

Н1: Эмпирическое значения 1 и 2 отличаются между собой

Критерий Колмогорова-Смирнова

Назначение:

1) позволяется вычислить теоритическое и эмпирическое распределения

2) позволяется провести сравнение 2х эмпирических распределений друг с другом

Ограничения:

· шкала интервалов или абсолютная шкала

· выборки случайные и независимые

· суммарный объм выборок должен быть не менее 50 элементов, причем с увеличением объема выборки достоверность расчета повышается.

Гипотеза:

Н0: Полученное на практике эмпирическое распределение не отличается от теоритического распределения

Н1: Эмпирическое и теоритическое распределения отличаются

 

U – критерий Манна-Уитни: назначение, ограничения, алгоритм.

Назначение: позволяет выявить различия в уровне выраженности количественно измеренного признака даже при сопоставлении малых по численности независимых выборок.

Ограничения:

- измерение в интервальной шкале или шкале отношений

- допустимо неодинаковое количество элементов в независимых выборках

-в каждой выборке должно быть не менее 3 измерений и не более 60

Алгоритм:

1. формулируем нулевую и альтернативную гипотезы.

2. в каждой выборке упорядочиваем значения от большего к меньшему. Сопоставляем ряды так, чтобы они составили одну упорядоченную выборку.

3.проранжировать значения в полученном путем объединения, приписывая меньшему значению меньший ранг.

4.проверка правильности ранжирования.

5.ранжированный ряд чисел снова переносится в выборку 1 и выборку 2 так, как это было установлено изначально вместе с теми рангами, которые каждое значение приобрело при ранжировании обобщенной выборки.

6. подсчитать ранговые суммы отдельно в каждой выборке

7. эмпирическое значение критерия по формуле:

8. по таблице с учетом численности каждой выборки определяются критические значения

9. нанести на ось значимости критические значения и эмпирические значения, сделать вывод о значимости различий между независимыми выборками.

Вопрос 18

Основные понятия корреляционного анализа

Одной из задач большинства медико-биологических исследований, является выявление взаимосвязей одного или нескольких явлений.

Постановка задачи втакого рода исследованиях обычно выглядит следующим образом: «Определить наличие и силу статистической связи какого-либо признака, от одного или нескольких других признаков. Знание взаимосвязи отдельных признаков дает возможность решать одну из кардинальных задач любого научного исследования: возможность предвидеть, прогнозировать развитие ситуации при изменении тех или иных известных характеристик объекта исследования.

Термин зависимость при статистической обработке материалов медико-биологических исследований должен использоваться весьма осторожно. С помощью статистических критериев можно дать только формальную оценку взаимосвязей. Попытки механически перенести данные статистических расчетов в объективную реальность могут привести к ошибочным выводам.

Например, утверждение: «Чем громче утром кричат воробьи, тем выше встает солнце», несмотря на явную несуразность, с точки зрения формальной статистики, это утверждение вполне правомерно. Таким образом, термин «зависимость» в статистическом анализе подразумевает только оценку соответствующих статистических критериев.

Принцип ковариацииимеетместо,если основанием для заключения о наличии связи служит одновременное и параллельное изменение количественных характеристик.В математическом отношении задача сводится к определению меры взаимных численных изменений взаимосвязанных признаков. В качестве таких мер на практике особенно широко используют коэффициент корреляции, коэффициент ранговой корреляции Спирмена и др.

Принцип взаимной сопряженности предполагает установление связи между двумя событиями в тех случаях, когда с появлением одного события происходит другое событие.

Например: свет в окне может означать (с той или иной вероятностью), что хозяева находятся дома, кашель с мокротой может означать заболевание хроническим бронхитом. Если в серии повторяющихся наблюдений один из признаков (или его часть, градация) появляется одновременно с другим чаще, чем можно объяснить случайным стечением обстоятельств, то это служит основанием говорить о взаимосвязи, сопряженности появления этих признаков.

Любые явления в окружающем нас мире могут быть связаны прямой или обратной связью. Эта характеристика называется направленностью связи. По направленности связь может быть прямой или обратной.

Прямая (или положительная) связь характеризует зависимость, при которой увеличение или уменьшение значения одного признака ведет, соответственно, к увеличению или уменьшению - второго. Например: при увеличение температуры возрастает давление газа (при сохранении неизменным его объема). При уменьшении температуры - снижается и давление.

Обратная (или отрицательная) связь характеризуется такой зависимостью, когда при увеличении одного признака, второй – уменьшается, или наоборот, при уменьшении одного, второй - увеличивается. Обратная зависимость или обратная связь является основой нормального регулирования почти всех процессов жизнедеятельности любого организма.

Всякая из этих зависимостей по характеру связи может быть функциональной или статистической (корреляционной).

Функциональная зависимость - такой вид зависимости, когда каждому значению одного признака соответствует точное значение другого. Например: взаимосвязь площади кругаи длины окружности.

Умножив длину окружности на половину радиуса круга, можно точно определить площадь круга. Такую зависимость можно считать полной (исчерпывающей). Она полностью объясняет изменение одного признака изменением другого. Этот вид связи характерен для объектов, являющихся точкой приложения точных наук. В медико-биологических исследованиях сталкиваться с функциональной связью приходится крайне редко, поскольку объекты этих исследований имеют большую индивидуальную изменчивость. С другой стороны, характеристики биологических объектов зависят, как правило, от комплекса большого числа сложных взаимосвязей и не могут быть сведены к отношению двух или трех факторов.

Статистическая (корреляционная) зависимость. В этом случае при изменении величины одного признака изменяется тенденция (характер) распределения значений другого признака и, соответственно, характеристики этого распределения.

Например,средние значения изучаемых признаков. Если величины Х и У находятся в статистической связи, то это не означает, что при изменении величины Х величина У обязательно будет изменяться определенным образом. Это означает только то, что при достаточно большом числе наблюдений изменение величины Х сопровождается, как правило, изменением величины У. Такая тенденция существует только в общих чертах.

Например: при изменении роста человека меняется и масса тела. Однако эта зависимость не является полной, т. е. функциональной. У людей с одинаковым ростом может быть разная масса тела, поскольку на нее влияют и многие другие факторы (питание, здоровье и т. п.). При оценке статистических связей можно говорить только о тенденции, когда возрастание одного признака вызывает тенденцию возрастания или уменьшения другого признака.

Корреляционный анализ занимается измерением степени связи между двумя переменными х и у. Вначале мы предполагаем, что как х, так и у — количественные величины, например, рост и вес.

Предположим, что есть пара величин (х, у), измеренных у каждого из пациентов в выборке. Мы можем отметить точку, соответствующую паре величин каждого пациента, на двухмерном графике рассеяния точек (рис 1,2,3). Обычно мы располагаем переменную х на горизонтальной оси, а у — на вертикальной в той же диаграмме. Размещая точки для всех пациентов, мы получаем график рассеяния точек, которые говорят о соотношении между этими двумя переменными

Корреляционный анализ последовательно решает три практиче­ские задачи:

определение корреляционного поля и составление корреляци­онной (в данном случае это комбинированная) таблицы;

вычисление выборочных корреляционных отношений или ко­эффициентов корреляции;

проверка статистической гипотезы значимости связи.

Коэффициент корреляции не содержит информации о том, явля­ется ли данная связь между ними причинно-следственной или сопут­ствующей (порожденной общей причиной). Этот вопрос исследователь должен решать самостоятельно на основе содержательных представле­ний о структуре, динамике изучаемых социальных объектов, корре­ляций между изучаемыми признаками, использовать иные способы статистического анализа (регрессионный, факторный, дискриминант­ный, путевой и т.д.). Но величина коэффициента позволяет оценить плотность связи как меньшую (незначимую) или большую. По знаку коэффициента корреляции для порядковых рядов мы можем сказать, является ли эта связь прямой или обратной (для номинальных рядов знак коэффициента не несет смысловой нагрузки).

Для установления корреляционной связи между двумя призна­ками необходимо доказать, что все другие переменные не оказывают воздействия на отношения двух переменных, являющихся предметом изучения. В противном случае возникает ситуация ложной корреляции. Секрет возникновения ложной корреляции заключается в том, что у двух явлений, связь которых формально подкрепляется наличием ста­тистической связи, есть общая причина, в равной степени влияющая на каждое из них.

Корреляционному анализу предшествует стадия расчета стати­стики х2- Но на основании полученного значения статистики х2 мы ни­чего не можем сказать о плотности связи анализируемых переменных. Цля решения такой задачи необходимо обратиться к коэффициентам корреляционной связи.

Множественный коэффициент корреляции (IV), который иногда называют коэффициентом конкордации, применяется для оценки со­гласованности двух или нескольких рядов ранжированных значений переменных.

Критерии:

Пирсона;

Спирмена;

Кендалла;

 

Коэффициента корреляции Пирсона (r) определяет силу и направление связи между зависимой и независимой переменными

Свойства коэффициента r:

• r находится в интервале от — 1 до +1.

• Его знак показывает, увеличивается ли одна переменная, по мере того как увеличивается другая (положительный г) или уменьшается (отрицательный r).

• Его величина указывает, как близко расположены точки к прямой линии. В частности, если г =+1 или г = -1, то имеется абсолютная (функциональная) корреляция по всем точкам, лежащим на линии (рис 1, рис. 2); если г=0, то линейной корреляции нет (рис. 3). Чем ближе r к крайним точкам (±1), тем больше степень линейной связи.

• Коэффициент корреляции безразмерен, т.е. не имеет единиц измерения.

• Его величина действительна только в диапазоне значений х и у в выборке. Вы не можете заключить, что он будет иметь ту же величину при рассмотрении значений х или у, значительно больших, чем в выборке.

• х и у могут заменять друг друга, не влияя на величину r (rху~rух).

• Корреляция между х и у не обязательно означает соотношение «причины и следствия».

Сила корреляционной связи между признаками оценивается по коэффициенту r согласно таблице 1

Таблица 1

Распределение значений коэффициента линейной корреляции Пирсона
Характеристики связи Прямая Обратная
Связи нет    
Слабая от 0 до 0,3 от 0 до -0,3
Средняя от 0,3 до 0,7 от - 0,3 до -0,7
Сильная от 0,7 до 1 от - 0,7 до - 1
Полная (функциональная) + 1 -1

Следует отметить, что в случае биологических факторов тот или иной характер связи сохраняется, как правило, только в определенном интервале изменений признаков. За пределами этого интервала связь может ослабнуть, стать прямо противоположной по направлению либо совсем исчезнуть.

Например, при увеличении возраста ребенка сила скелетной мускулатуры увеличивается. В зрелом возрасте такой связи уже нет. А в старших возрастных группах тенденция становится обратной.

Главные условия для расчета коэффициента корреляции Пирсона:

· выборка состоит из n независимых пар величин х и у.

· по крайней мере, одна из этих двух переменных нормально распределена.

 

Для чего используется коэффициент Спирмена?

Коэффициент ранговой корреляции Спирмена используется для выявления и оценки тесноты связи между двумя рядами сопоставляемых количественных показателей. В том случае, если ранги показателей, упорядоченных по степени возрастания или убывания, в большинстве случаев совпадают (большему значению одного показателя соответствует большее значение другого показателя - например, при сопоставлении роста пациента и его массы тела), делается вывод о наличии прямойкорреляционной связи. Если ранги показателей имеют противоположную направленность (большему значению одного показателя соответствует меньшее значение другого - например, при сопоставлении возраста и частоты сердечных сокращений), то говорят об обратной связи между показателями.

Коэффициент корреляции Спирмена обладает следующими свойствами:

Коэффициент корреляции может принимать значения отминус единицы до единицы, причем при rs=1 имеет место строго прямая связь, а при rs= -1 – строго обратная связь.

Если коэффициент корреляции отрицательный, то имеет место обратная связь, если положительный, то – прямая связь.

Если коэффициент корреляции равен нулю, то связь между величинами практически отсутствует.

Чем ближе модуль коэффициента корреляции к единице, тем более сильной является связь между измеряемыми величинами.

3. В каких случаях можно использовать коэффициент Спирмена?

В связи с тем, что коэффициент является методом непараметрического анализа, проверка на нормальность распределения не требуется.

Сопоставляемые показатели могут быть измерены как в непрерывной шкале (например, число эритроцитов в 1 мкл крови), так и в порядковой (например, баллы экспертной оценки от 1 до 5).

Эффективность и качество оценки методом Спирмена снижается, если разница между различными значениями какой-либо из измеряемых величин достаточно велика. Не рекомендуется использовать коэффициент Спирмена, если имеет место неравномерное распределение значений измеряемой величины.

4. Как рассчитать коэффициент Спирмена?

Расчет коэффициента ранговой корреляции Спирмена включает следующие этапы:

Сопоставить каждому из признаков их порядковый номер (ранг) по возрастанию или убыванию.

Определить разности рангов каждой пары сопоставляемых значений (d).

Возвести в квадрат каждую разность и суммировать полученные результаты.

Вычислить коэффициент корреляции рангов по формуле:

Определить статистическую значимость коэффициента при помощи t-критерия, рассчитанного по следующей формуле:

5. Как интерпретировать значение коэффициента Спирмена?

При использовании коэффициента ранговой корреляции условно оценивают тесноту связи между признаками, считая значения коэффициента равные 0,3 и менее - показателями слабой тесноты связи; значения более 0,4, но менее 0,7 - показателями умеренной тесноты связи, а значения 0,7 и более - показателями высокой тесноты связи.

Статистическая значимость полученного коэффициента оценивается при помощи t-критерия Стьюдента. Если расчитанное значение t-критерия меньше табличного при заданном числе степеней свободы, статистическая значимость наблюдаемой взаимосвязи - отсутствует. Если больше, то корреляционная связь считается статистически значимой

 


Дата добавления: 2019-09-02; просмотров: 394; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!