Социально-профессиональный статус
частота | процент | |
руководители предприятий | 16 | 1,8 |
предприниматели | 52 | 5,8 |
инженерно-технические работники | 83 | 9,3 |
непроизводственная интеллигенция | 89 | 9,9 |
служащие без специального образования | 48 | 5,4 |
квалифицированные рабочие | 93 | 10,4 |
рабочие средней и низкой квалификации | 102 | 11,4 |
неработающие пенсионеры | 226 | 25,3 |
прочие | 186 | 20,8 |
Всего | 895 | 100,0 |
Источник: Аналитический отчет об опросе 12-13 марта 1998 года.
Мы видим, что в таблице, помимо указания частоты в абсолютных цифрах, приведены данные в процентах (что указывает на пропорцию, удельный вес каждого из значений определяемой переменной пола или статуса). Пропорции и процентные доли в процессе анализа предпочтительнее частотных распределений вследствие того, что они облегчают процесс сравнения двух популяций различных размеров. Например, в табл.5.5 представлены две гипотетические студенческие популяции различных размеров, но с одинаковыми пропорциями выбора дисциплин, которые представляются им предпочтительными для изучения в смысле интереса к ним. Вы можете прикрыть полоской бумаги столбцы, содержащие проценты, и убедиться, что непосредственно из частотного распределения (без указания процентов) выявить этот факт было бы довольно трудно. Проценты же раскрывают эту информацию немедленно. Поэтому нередко, особенно в достаточно больших по размерам таблицах, в целях экономии места показывают только проценты. Частотные распределения в абсолютном выражении выпускаются, однако при этом желательно приводить общее число наблюдений и тем самым давать возможность читателю в случае необходимости вычислить соответствующее частотное распределение.
|
|
Таблица 5.5
Распределение предпочтений, отдаваемых различным учебным
Дисциплинам
Учебная дисциплина | Экономический факультет | Коммерческий факультет | ||
частота | процент | частота | процент | |
Маркетинг | 35 | 25,9 | 48 | 25,9 |
Социология | 30 | 22,2 | 41 | 22,2 |
Английский язык | 45 | 33,3 | 61 | 33,3 |
Математика | 25 | 18,5 | 34 | 18,5 |
Всего | 135 | 100,0 | 184 | 100,0 |
Источник: гипотетические данные.
Пропорции и проценты сообщают нам информацию, которая оказывается более убедительной, значимой и легко запоминаемой, нежели частотное распределение в абсолютных значениях частот. К примеру, табл.5.6 представляет пример частотного распределения: пропорции и проценты голосов делегатов Национальной конвенции Демократической партии США, поданных в 1984 г. за выдвижение трех главных кандидатов от этой партии в Президенты – Уолтера Мондейла, Гэри Харта и Джесси Джексона.
|
|
Таблица 5.6
Частотное распределение, пропорции и проценты голосов делегатов
Национальной Демократической Конвенции 1984 г. (переменная: число
поданных голосов на номинации кандидата в Президенты США от Демократической
партии в избирательной кампании 1984 г.)
Имя кандидата (значение переменной) | Частота | Пропорция | Процент |
Мондейл | 2191 | 0,568 | 56,8 |
Харт | 1200 | 0,311 | 31,1 |
Джексон | 465 | 0,121 | 12,1 |
Всего | 3856 | 1,000 | 100,0 |
Источник: New York Times, July 20, 1984, A12
Из этой таблицы, конечно, и так видно, что абсолютное число голосов, поданных за Мондейла, больше, нежели за каждого из двух других кандидатов; однако, благодаря использованию пропорций и процентов, сопоставление различных значений переменных становится более рельефным и отчетливым, что, конечно же, облегчает анализ. Преимущество становится особенно бесспорным при необходимости последовательного сравнения достаточно длинных рядов распределений.
Для данных номинального уровня измерение центральной тенденции производится с помощью определения моды. Модой или модальной категорией называется то значение переменной, которое встречается среди данных наиболее часто. В распределении, представленном в табл.5.3, модальную категорию представляют собою женщины; в табл. 5.4 – это категория неработающих пенсионеров, которых оказалось большинство среди респондентов.
|
|
Частотное распределение раскрывает не только центральную тенденцию, но и дисперсию данных. Дисперсия характеризует разброс значений переменной. Для данных номинального уровня наибольший уровень дисперсии проявляется когда наблюдения распределены поровну между категориями[103][12]. Поэтому можно считать, что данные табл.5.3 весьма дисперсны, поскольку имеется приблизительно одинаковое число мужчин и женщин. Полное отсутствие дисперсии проявляется в тех случаях, когда все наблюдаемые значения переменной совершенно однородны, т.е. попадают в одну и ту же категорию.
При проведении одномерного анализа могут обнаружиться такие характеристики данных, которые представляют собой существенные препятствия для дальнейшего анализа данных. Представьте, например, что вы намереваетесь изучить взаимосвязь между полом и родом занятий, и обнаружили, что в выборке опроса оказались одни лишь мужчины. Поскольку налицо отсутствие дисперсии (т.е. нет вариаций по одной из ключевых переменных – по полу), каких-либо сравнений провести нельзя. Урок, который необходимо из этого усвоить, состоит в следующем: нет изменения – нет сравнения. А процедура сравнения являет собою, по своей сути, ядро анализа. При отсутствии изменений вы можете обнаружить какое-то интересное единообразие, но не сможете изучить связей между переменными, то есть выявить, что же происходит с одной из них, когда другая варьирует (изменяется). Самый простой одномерный анализ уже в ходе сбора данных (хотя бы беглый взгляд на частотное распределение) мог бы предостеречь вас от такой опасности.
|
|
При анализе рядов распределений, когда мы выявляем центральную тенденцию, следует сразу обращать внимание на максимальные и минимальные значения изучаемой переменной. Другими словами, когда вы имеете дело с переменной, принимающей целый ряд значений, анализ следует начинать с акцента на самом большом и самом маленьком значении – это сразу дает вам представление и о масштабах изменения рассматриваемой переменной, и о дисперсии.
Ранговая шкала. В принципе, та же одномерная статистика, что используется для суммирования данных номинального уровня, может быть применена и для данных рангового уровня. Данные рангового уровня измерений включают в себя категории наблюдения, которые размещены по порядку[104][13] (от большего значения какого-то признака к меньшему его значению или наоборот – от меньшего к большему). Таким образом, существуют некоторые дополнительные допустимые методы описательной статистики, дающие нам информацию о характере упорядоченности измерений. Так, в дополнение к определению моды для выявления центральной тенденции в распределении значений переменной, измеренной по ранговой шкале, может быть выявлена медиана. Медиана – это категория или значение в распределении значений, лежащих выше и ниже того уровня, на который приходится половина всех частот. Иными словами, это категория (значение переменной), к которой принадлежит серединное наблюдение.
Можно посмотреть, как определяется медиана, на примере распределений ответов на вопрос о том, какова частота использования различных источников информации о работе городской администрации г. Нижнего Новгорода (табл.5.7):
Таблица 5.7
Дата добавления: 2020-12-22; просмотров: 109; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!