Понятие описательных статистик



Описательная статистика позволяет обобщать первичные результаты, полученные при наблюдении или в эксперименте. Процедуры здесь сводятся к группировке данных по их значениям, построению распределения их частот, выявлению центральных тенденций распределения (например, средней арифметической) и, наконец, к оценке разброса данных по отношению к найденной центральной тенденции.

Описательная статистика нужна, как правило, для понимания характера совокупности, сырых данных. Включает в себя различные методы агрегирования данных. Общие из них таковы:

1. Частотный анализ

· Анализ гистограммы (позволяет выявить характер распределения данных)

· Подгонка распределения (Для прогноза часто необходимо знать закон распределения.Для определения закона, в большинстве случаев нужно подогнать наблюдаемое распределение под теоретическое, сравнением наблюдаемых частот в данных с ожидаемыми частотами в теоретическом распределении)

2. Вычисление и анализ показателей центра распределения

· Мода (наиболее часто встречающееся значение варьирующего признака в вариационном ряду)

· Медиана (значение, которое разбивает выборку на две равные части.Половина наблюдений лежит ниже медианы, и половина наблюдений лежит выше медианы.)

· Среднее (среднее арифметическое, рассчитанное путем сложения группы чисел и деления на количество этих чисел)

3. Оценка разброса данных в совокупности

· Стандартное отклонение (мера того, насколько широко разбросаны точки данных относительно их среднего)

· Дисперсия (отклонение наблюдаемого значения (для каждого наблюдения) от среднего арифметического.)

· Коэффициенты вариации (Мера относительного разброса случайной величины; показывает, какую долю среднего значения этой величины составляет её средний разброс.Коэффициент вариации равен отношению стандартного отклонения к среднему значению)

Понятие мер центральной тенденции

Центральная тенденция – то количественное (численное) значение признака, к которому тяготеет переменная величина. Поскольку понятие «тяготеет» несколько произвольно и с математической точки зрения не вполне корректно, имеет смысл рассмотреть различные меры центральной тенденции более подробно.

В психологических исследованиях в качестве мер центральной тенденции чаще всего используются мода, медиана и среднее арифметическое значение. Значительно реже используются такие меры как среднее геометрическое, среднее гармоническое, обратное среднее гармоническое значение и др.

Самой известной из таких мер является среднее (точнее среднеарифметическое) значение (М). Оно находится сложением всех результатов и делением получившейся суммы на число случаев (N).

Другой мерой центральной тенденции является мода. Мода — это просто наиболее часто встречающееся в определенной совокупности наблюдений значение переменной. При сгруппированных данных мода определяется как середина интервала группирования, содержащего наибольшее число значений наблюдаемой переменной.

Третья мера центральной тенденции - это медиана, т.е. результат, находящийся в середине последовательности показателей, если их расположить в порядке возрастания или убывания. Медиана есть точка, делящая распределение ровно пополам, причем одна половина результатов лежит справа от нее, а другая слева.

Меры центральной тенденции: мода. Мономодальное, бимодальное и полимодальное распределения

Мода (Mo) - это наиболее часто встречающееся значение варьирующего признака в вариационном ряду. Модой распределения называется такая величина изучаемого признака, которая в данной совокупности встречается наиболее часто, т.е. один из вариантов признака повторяется чаще, чем все другие.

1 , 2, 3, 2, 5, 56, 3, 2, 8

Mo = 2

Мода не является достаточно строгой мерой центральной тенденции, поскольку она не учитывает характера распределения переменных, а значит может использоваться лишь в предварительных выводах и прогнозах. Кроме того, необходимо использовать моду только для больших объемов выборок, поскольку для малых она недостаточно информативна.

В зависимости от того, сколько значений признака удовлетворяют определению моды, различают

· мономодальные (имеющие одну моду),

· бимодальные (имеющие две моды)

· полимодальные распределения (имеют более чем две моды)

А также различают распределения, не имеющие моды (все значения признака встречаются примерно с одинаковой частотой). В бимодальном и полимодальном распределениях, в свою очередь, можно определить наибольшую и наименьшую моды.

Не подходит для описания непрерывных данных. Мода может не существовать или быть не единственной.


Дата добавления: 2018-08-06; просмотров: 596; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!