СРЕДНИЕ ВЕЛИЧИНЫ В СТАТИСТИКЕ.
Для обобщения численных выражений, которыми санитарная статистика характеризует какие-либо явления и свойственные закономерности, применяются средние величины. Они используются для оценки здоровья населения различных сторон деятельности лечебно-профилактических учреждений, результатов клинических исследований и т.д. Средние величины наряду с относительными относятся к производным величинам.
Роль средних величин в статистике чрезвычайно велика. Некоторые математики, статистики даже склонны переоценивать их роль, называя статистику "наукой о средних". Однако это совершенно неверно. Статистическая наука имеет несравненно более богатое содержание. Но средние в ней наряду с методом групп, занимают центральное положение.
Исследователь сталкивается с тем, что закономерность пробивает себе дорогу через массу случайных отклонений. Общее существует лишь в отдельном, через отдельное. Одним из важнейших методов выражения закономерности на основе отдельных наблюдений является метод средних величин. В современных исследованиях этот метод находит все большее применение.
Одной из важнейших областей применения метода средних величин являются общественные науки. "Внутренний закон, прокладывающий себе дорогу через эти случайности и регулирующий их, становится видимым лишь тогда, они охватываются в больших массах". Именно в средней исключается, отбрасывается, исчезает всё случайное, преходящее, непоказательное и вскрывается типичное, существенное, характерное для всей совокупности в целом. Средняя представляет собой основную характеристику ряда, отражающую закономерность распределения. В средней величине осуществляется единство общего и отдельного. Средние необходимы для оценки значений отдельных величин. Сами по себе отдельные величины, взятые изолированно от всей массы мало что говорят, они становятся многозначительными лишь при сравнении со средними, лишь на фоне средних.
|
|
Основным моментом в диалектической трактовке средних является проблема соотношения количества и качества. При исчислении средних величин решающее значение имеет наличие однородной в социально-экономическом отношении совокупности. Нарушение этого процесса ведет к искажению, фальсификации процессов и тенденций. Средние величины, выведенные из неординарной совокупности, дают ложную количественную характеристику, так как не относятся к определенному качеству. Эти средние можно назвать фиктивными. Методология средних величин учит применять средние величины лишь для качественно однородной совокупности.
Что же мы называем средними величинами?
|
|
Средняя величина - обобщающий показатель, выражающий типичные размеры качественно варьирующих признаков качественно однородных общественных явлений.
Средние величины получают из ряда распределения или так называемых вариационных рядов. В таком ряду количественно изменяющийся признак носит название варьирующего, а отдельные его количественные выражения называются вариантами. Отсюда вытекает определение вариационного ряда.
Вариационный ряд - такой ряд числовых значений, которые характеризуют какой-либо признак и расположены в определенном порядке.
Рассмотрим пример. В качестве статической совокупности взят студенческий коллектив 4 курса лечебного факультета. Если нас интересует вопрос о возрасте студентов, то число прожитых лет каждым студентом является в данном случае вариантом, т.е. конкретным значением варьирущего признака. Возраст каждого студента колеблется, варьируют от одного студента к другому. Одному - 21 год, другому 22, третьему 25 и т.д.
Таким образом, варьирующий признак принимает различные значения, т.е. встречается в различных вариантах. В результате нашего эксперимента мы получили ряд чисел, который можно назвать неупорядоченным рядом отдельных наблюдений. Первым шагом в деле обработки такого ряда будет распределение результатов отдельных наблюдений по их числовому значению в возрастающем или убывающем порядке.
|
|
Такой ряд называется ранжированным. Несмотря на то, что оперирование ранжированным рядом приносит пользу, все же необходимо от анализа отдельных случаев переходить к более совершенным, более компактным формам написания вариационного признака. Такая форма заключается в образовании групп с одинаковым значением варьирующего признака и с некоторым числом случаев, приходящихся на каждую группу. Описание колебания варьирующего признака осуществляется при помощи ряда распределения. По своей конструкции ряд распределения или варьирующий ряд состоит из двух столбцов: один - числовое значение вариант, другой - столбец частот, т.е. чисел случаев данной варианты. Тогда вариационный ряд, характеризующий возраст студентов 4 курса будет представлен как:
V (возраст) | P (частота) |
20 лет | 10 |
21 год | 145 |
22 года | 80 |
23 года | 35 |
24 года | 20 |
25 лет | 15 |
26 лет | 20 |
n = 325 чел. |
Ряды распределения или вариационные ряды бывают двух видов: дискретные и интервальные. Дискретный ряд состоит из вариант, между которыми не может быть никаких промежуточных значений. Например: вариационный ряд, характеризующий численный состав семей. Каждая семья в отношении числа членов может быть выражена в следующих вариантах 2, 3, 4, 5, 6, 7, 8, 9, 10 и 11. Это значит, что не может быть семей с дробным числом членов.
|
|
Применение интервалов приводит к интервальному ряду распределения. Такие ряды обычно характеризуют явление в мерах длины, веса. В таком вариационном ряду нужно установить определенную величину интервала, который будет положен в основу ряда.
Ряд распределения можно выразить графически в виде линии. Несмотря на все разнообразия встречающихся на практике кривых распределения, можно выделить несколько типов этих кривых. Прежде всего, следует указать на так называемую нормальную кривую (кривая Гаусса-Ляпунова). Нормальная кривая отражает закон распределения в тех случаях, когда отклонение от среднего значения в одну сторону встречается также часто, как и отклонение в другую сторону.
Асимметрия кривых распределения различается между собой по направлению и по степени направления симметрии. Различие по направлению определяется тем, в какой стороне находится растянутое крыло кривой.
левосторонняя асимметрия правосторонняя асимметрия
Интервалом вариационного ряда называется расстояние между двумя близлежащими вариантами.
Амплитудой или размахом вариационного ряда называется разность между наибольшей и наименьшей вариантой.
В статистике различают несколько десятков средних величин. Чаще всего в жизни приходится сталкиваться со средней арифметической, но кроме средней арифметической существует и средняя геометрическая, и средняя гармоническая, и средняя квадратическая, и средняя кубическая, и средняя смешанная и другие.
В связи с наличием такого количества средних величин появилась необходимость их систематизировать, классифицировать. Наиболее удачную классификацию предложил итальянский ученый К.Джини. По классификации все средние величины делятся на две большие группы:
а) средние аналитические
б) средние неаналитические.
Аналитические средние - это все средние величины, которые выражаются или определяются при помощи формул.
Неаналитические (или позиционные) - определяются без формул. В свою очередь и те, и другие подразделяются на простые и взвешенные.
СРЕДНИЕ ВЕЛИЧИНЫ |
АНАЛИТИЧЕСКИЕ |
НЕАНАЛИТИЧЕСКИЕ |
ПРОСТЫЕ |
ВЗВЕШЕННЫЕ |
1. средняя арифметическая 2. средняя геометрическая 3. полусумма крайних членов |
1. средняя арифметическая 2. средняя геометрическая |
ПРОСТЫЕ |
ВЗВЕШЕННЫЕ |
1. медиана |
1. мода 2. высшее значение 3. низшее значение |
КЛАССИФИКАЦИЯ СРЕДНИХ ВЕЛИЧИН (по К.Джини)
К простым неаналитическим относится медиана, делящая вариационный ряд на две равные половины.
Для вариационного ряда, имеющего нечетное число наблюдений медиана рассчитывается по формуле:
Me | = | V | n + 1 |
2 |
Например, распределение больных по срокам лечения:
Число дней лечения (V) | Число больных (P) |
13 | 1 |
14 | 2 |
16 | 2 |
17 | 5 |
18 | 7 |
20 | 4 |
n = 21 |
Подставляя в формулу для определения медианы общее число наблюдений получим:
Me | = | V | (21+1) | = | V 11 |
2 |
Таким образом, одиннадцатая варианта в данном вариационном ряду и будет медианой. В нашем примере такой медианой будет варианта, равная 18.
Если вариационный ряд состоит из четного числа наблюдений, то медиана определяется по формуле:
Me | = | V (n + 1) / 2 + V n / 2 |
2 |
Для определения Ме из ряда, состоящего из четного числа наблюдений, воспользуемся вариационным рядом, характеризующим результаты выборочного обследования жилищных условий в группе семей.
Жилплощадь на 1 чел., м (V) | Число семей (P) |
5 | 4 |
6 | 6 |
7 | 10 |
8 | 8 |
9 | 6 |
10 | 4 |
n = 38 |
Подставляя в формулу определения Ме для четного ряда получим:
Me | = | V (38 + 1) / 2 + V 38 / 2 | = v 19,25 |
2 |
Такой медианой в данном вариационном ряду будет варианта 7.
Следует отметить, что Ме всегда конкретна (при большом числе наблюдений или в случае нечетного числа совокупности), так как под медианой подразумевается некоторый действительный реальный элемент совокупности, тогда как средняя арифметическая часто принимает такое значение, которое не может принимать ни одна из единиц совокупности.
Медиана применяется в санитарной статистике. С помощью медианы определяется, например, так называемая вероятная продолжительность предстоящей жизни в таблицах смертности. С использованием медианы следует вычислять средний радиус удаленности отдельных селений от сельского врачебного участка, когда надлежит учитывать не только расстояние, но и число жителей, живущих на данном расстоянии от врачебного участка.
Средние величины подразделяются на устойчивые и подвижные.
Устойчивые средние - это такие средние величины, величина которых зависит от величины всех членов вариационного ряда, так что с изменением любого из них меняется и величина средней. К таким устойчивым средним относится средняя арифметическая.
Подвижные средние - это такие средние величины, величена которых не меняется при изменении членов вариационного ряда. К таким подвижным средним относятся медиана, мода, полусумма крайних членов.
Мода (Мо) - эта варианта, наиболее часто встречающаяся в данном вариационном ряду или, иначе говоря, мода - это варианта с наибольшей частотой.
Например: результаты измерения роста у группы мальчиков 8 лет.
Рост (см), V | Число лиц, P |
115 | 1 |
116 | 1 |
117 | 2 |
118 | 4 |
119 | 8 |
120 | 10 |
121 | 13 |
122 | 15 |
123 | 10 |
124 | 3 |
125 | 6 |
126 | 4 |
127 | 2 |
n = 84 |
В данном примере варианте 122 соответствует, наибольшая частота, значит Мо = 122.
Мода в санитарной статистике применяется довольно ограничено. Модой можно пользоваться для оценки средней длительности заболеваний, особенно при малом количестве больных данной болезнью. В этом случае несколько больных с особо длительными или очень короткими сроками лечения окажут значительное влияние на величину средней арифметической, если пользоваться ею для определения средней длительности заболевания. В этом случае мода, т.е. обычная длительность заболевания, окажется более полезной для практического использования.
К неаналитическим взвешенным величинам кроме моды относятся "высшее значение" и "низшее значение".
"Высшее значение" - этот термин применяется к тем членам ряда, которые будучи помноженные на свою частоту, дают наибольшею величину.
"Низшее значение" - этот термин применяется к тем членам ряда, которые будучи помноженные на свою частоту, дают наименьшую величину.
Дата добавления: 2019-07-15; просмотров: 163; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!