Оценка центральной тенденции (положения) вариационного ряда. Метод средних величин



 


· Медиана –это варианта, находящаяся посередине рядараспределения и делящая этот ряд на две равные части по количеству членов. Выбросы, т.е. экстремальные значения, и несимметричные данные оказывают на медиану меньшее влияние, чем на среднюю величину. Поэтому медиану часто используют для описания, например, веса или роста в группах.

 

· Мода –это величина, представленная наибольшей частотойв ряду распределения. Значение моды легко определяется для категориальных данных. К недостаткам моды является не возможность её алгебраического измерения и игнорирование большой части информации.

 

· Среднее арифметическое– показатель среднего уровня, самого типичного и характерного для всего ряда.

Получают путь сложения всех значений и деления суммы на число значений в выборке.

Недостатками среднего является искажение данной величины выбросами и асимметричными данными.

Кроме средней арифметической величины твкже различают среднюю геометрическую и среднюю взвешенную.

    Значения средней арифметической величины и медианы не обязательно совпадают (рис).

При симметричном распределении значений признака лучшими характеристиками совокупности являются среднее значение и стандартное отклонение, а при несимметричном – медиана и процентили.

Показатели рассеивания


Основными характеристиками рассеивания, применяемых для оценки вариации величин относительно выборочной средней, являются дисперсия, среднее квадратическое отклонение, коэффициент вариации.

· Дисперсия (D, σ2)

o указывает на варьирование, т.е. рассеивание (разброс) исходных данных относительно средней арифметической величины (в квадрате).

o Нелостатком является чувствительность к выбросам. Дисперсия не подходит для асимметрично распределённых данных.

o вычисляется как сумма квадратов разностей эмпирических данных и выборочной средней, делённой на объём выборки:

или

             Если n менее 30, то в формуле используется значение (n-1).

 

· Среднеквадратическое отклонение(σ – сигма) или стандартное отклонение

o характеризует степень отклонения результатов от среднего значения конкретной выборки в абсолютных единицах, является основной мерой изменчивости признака у членов совокупности, имеюшей нормальный тип распределения.

o выражается в тех же единицах, что и варианты ряда.

o может меняться непредсказуемо (расти или уменьшаться с увеличением разброса выборки). Недостатки как и у дисперсии.

o определяется как положительный квадратный корень из дисперсии (поэтому и называется «средним квадратичным отклонением»).

 

 

       Характеристикой рассеяний является также размах ряда и процентили.

 

· Стандартная ошибка средней величины (выборки) или ошибка репрезентативности

o Не является описательной статистикой и не должна использоваться в таком качестве.

o Является оценкой возможного отличия между значением среднего в анализируемой выборке и истинным средним во всей популяции (которое на самом деле не может быть определено без анализа бесконечно большого числа наблюдений). Следует использовать для оценки среднего генеральной совокупности.

o Зависит от размера выборки (чем больше размер, тем меньше ошибка репрезентативности).

o Определяется по формуле:

Отличие «m» от «σ»заключается в том, что «σ»характеризует варьирование отдельных вариант вокруг средней величины конкретного вариационного ряда, а «m» – варьирование средних величин отдельных выборок вокруг средней величины генеральной совокупности, т.е. стандартная ошибка отражает точность оценки.

· Коэффициент вариации

o является относительной характеристикой однородности наблюдений.

o определяется как отношение среднего квадратического отклонения к среднему арифметическому, выраженное в процентах:

o В спортивной практике колеблемости результатов измерений в зависимости от величины коэффициента вариации считают небольшой (0-10%), средней (11-20%) и большой (V>20%).

 

Средняя арифметическое и сигма выражаются в абсолютных единицах и не могут быть использованы для сравнения колеблемости двух и более совокупностей, имеющих различные единицы измерения. Для этого используется коэффициент вариации.

 

Доверительный интервал (ДИ)

· Диапазон значений (confidence interval, CI), в котором с определённым уровнем надёжности (доверия) содержится истинное популяционное значение параметра (например, среднего). 90%-й доверительный интервал означает, что истинное популяционное значение величины (которое обычно не известно) попадает в рассчитанный интервал с вероятностью 90%. Чем шире доверительный интервал, тем ниже точность оценки. В этом случае ДИ служит описательным целям.

· В биомедицинских исследованиях доверительный интервал среднего обычно устанавливается на уровне 95% и определяется как ± 1,96 стандартной ошибки среднего (коэффициент 1,96 вытекает из предположения нормальности распределения при условии достаточно бальшой выборки). Например, при среднем значении систолического АД в группе равном 125 мм.рт.ст., границы 95% доверительного интервала составляют 115,2 и 134,8 мм.рт.ст. Это значит, что 95% уверенность в том, что истинное среднее значение находится между 115,2 и 134,8 мм.рт.ст. Другими словами 95% ДИ – это 95% доверительный интервал вокруг точечной оценки. 95% - это показатель доверия (доверительная вероятность)


Дата добавления: 2018-04-05; просмотров: 1757; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!