Основные правила образования групп по количественным признакам



Число групп и величина интервалов. При группировке по количественным у признакам часто возникают вопросы о числе групп и величине интервала. Эти показатели взаимосвязаны: чем больше групп, тем меньше интервал.

При решении данного вопроса во внимание принимают размах варьирования, то есть разность между максимальным и минимальным значениями признака. Чем он больше, тем больше можно образовать групп.

Также должна быть принята во внимание численность изучаемой совокупности: если она невелика, то нельзя организовать большое число групп.

Ориентировочное число групп (n) в зависимости от численности единиц совокупности (N) определяется по формуле американского ученого Стерджесса (Sturges):

n =1+3,3222 ln N

На основании этой формулы можно составить следующую номограмму:

Интервал – разница между максимальным и минимальным значением признака в каждой группе.

Интервалы могут быть равными и неравными в зависимости от характера распределения единиц совокупности по данному признаку.

Если распределение носит более или менее равномерный характер, то устанавливают равные интервалы. Так поступают, например, при группировке рабочих по уровню заработной платы или посевов сельскохозяйственных культур по величине урожайности. Величина интервала определяется путем деления размаха вариации на число групп:

Неравные интервалы применяются в случае, если распределение единиц совокупности носит неравномерный характер. Тогда в пределах скопления единиц совокупности применяется более узкие интервалы, а рассеяния – более широкие.

Часто первоначальный материал делят на большое число групп, чтобы увидеть распределение единиц совокупности. Затем эти группы укрупняют, получая качественно однородные группы.

Следует также иметь в виду, что одинаковая количественная мера группировочного признака может иметь разное качественное значение в различных условиях. Так, различные отрасли промышленности имеют различную энергоемкость. Поэтому, группируя предприятия по уровню энерговооруженности, следует дифференцированно строить группировки по отраслям промышленности.

Для того, чтобы полнее и глубже изучить сложное общественное явление, необходимо сгруппировать данные по двум или более признакам. Такие группировки называют сложными.

Наиболее распространенным видом сложных группировок являются комбинированные группировка, когда группы, образованные по одному признаку, делятся затем на подгруппы по второму и т.д. признакам. Обычно в основание группировки кладется от 2 до 4 признаков.

Одновременное использование группировочных признаков позволяет выявить и сравнить такие различия и связи между исследуемыми признаками, которые нельзя обнаружить на основе изолированной группировки по ряду группировочных признаков.

При изучении влияния большого числа признаков применение комбинированных группировок становится невозможным, поскольку чрезмерное дробление информации затушевывает проявление закономерностей и тем самым не позволяет выявить одновременное влияние всего комплекса факторных признаков на исследуемый показатель.

Данная задача может быть решена одним из методов статистической теории распознавания образов – кластерным анализом, разработанного в 60-х годах ХХ века.

Кластерный анализ позволяет решать задачи многомерной группировки. Весь набор признаков образует так называемое «признаковое пространство». Каждому из признаков придается смысл координаты. Задача многомерной группировки сводится к выделению сгущений точек (групп объектов) в этом пространстве.

Мерой близости (сходства) между объектами могут служить различные критерии. Самой распространенной мерой близости является евклидово расстояние между объектами.

Нахождение групп близких объектов производится методами кластерного анализа с использованием компьютеров.

 


Ряды распределения

Определение ряда распределения. В результате сводки статистических материалов образуются ряды статистических данных, которые показывают либо изменение объемов совокупностей в динамике (будут рассмотрены в отдельной теме), либо распределение совокупностей по тем или иным признакам в статике.

Распределение может быть по признакам, не имеющим количественной меры (атрибутивным), и по признакам, в которых изменяется их количественная мера (вариационные ряды).

Атрибутивные ряды распределения. Примерами таких распределений являются распределение населения на городское и сельское, мужское и женское, товарооборота на продовольственные и непродовольственные товары, занятого населения по отраслям и профессиям.

Вариационные ряды. Примерами служат распределение рабочих по размеру среднемесячной заработной платы, предприятий по объемам производства или численности работающих.

В вариационном ряду различают два элемента: варианты и частоты. Вариантами называются отдельные значения группировочного признака, которые он принимает в вариационном ряду. Частотами называют числа, показывающие, как часто встречаются те или иные варианты.

Вариационные ряды по способу построения бывают интервальными и дискретными. Интервальные вариационные ряды – ряды, в которых значения вариант даны в виде интервалов (например, численность населения по возрастам). Дискретные вариационные ряды - ряды, в которых значения вариант имеют значения целых чисел (например, общее число семей по числу человек)

Характер вариационного ряда (интервальный или дискретный) определяется характером вариации. Вариация может быть непрерывной и прерывной (дискретной).

Примерами непрерывной вариации служат урожайность сельскохозяйственных культур, заработная плата, объемы производства.

Примерами дискретной вариации могут служить число членов семьи, тарифный разряд рабочего, число комнат в квартире, число рабочих на предприятии.

Если дискретная вариация проявляется в широких пределах (например, численность рабочих на предприятии), то строятся интервальные вариационные ряды.

Статистические таблицы

Статистические таблицы имеют заголовок, описывающий содержание таблицы. Сама таблица состоит из трех частей: подлежащего (боковика таблицы), сказуемого (шапки таблицы) и поля данных.

Подлежащее может быть простым и сложным. Простое подлежащее бывает трех типов:

1) перечневым, когда в строках подлежащего содержатся значения признаков, описывающих различные аспекты изучаемого социально-общественного явления, за исключением пространственно-временного;

2) хронологические, когда в строках подлежащего содержатся значения признака, описывающего временной аспект (периоды или моменты времени);

3) территориальные, когда в строках подлежащего содержатся значения признака, описывающего пространственный аспект (страны, регионы).

Сложное подлежащее бывает двух типов:

1) групповые, содержащие в строках подлежащего располагаются наименования различных группировок изучаемого явления;

2) комбинационные, когда в строках подлежащего помещаются различные комбинации простых подлежащих.

При заполнении статистических таблиц (поля данных) применяются следующие правила:

· если явление не имеет место, то ставят тире «-»;

· если нет сведений о явлении, то ставится многоточие «…» или пишут «нет сведений»;

· если данные очень малы, то ставят 0,0.

 

 


Дата добавления: 2020-11-23; просмотров: 82; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!