Для категориальных переменных рассчитываются такие итожащие статистики, как частота и проценты



Для итогов и подитоговрассчитываются такие итожащие статистики, как

1. меры центральной тенденции (среднее и медиана);

2. меры разброса (стандартное отклонение);

3. частота – количество наблюдений в каждой ячейке или количество ответов в наборе множественных ответов;

4. невзвешенная частота – невзвешенное количество наблюдений в каждой ячейке таблицы;

5. проценты по столбцу или по строке используют в случае, когда переменная строк является категориальной.

6. проценты по строке и столбцу в слое– сумма процентов по строке или столбцу для всех вложенных подтаблиц в каждом слое равна 100%.

7. стандартная ошибка среднего значения – мера различий среднего значения от выборки к выборке, извлекаемых из одного и того же распределения.

Можно применять для грубого сравнения наблюдаемого среднего с гипотетическим значением (то есть можно заключить, что два значения различаются, если отношение их разности к стандартной ошибке меньше минус 2 или больше плюс 2).

8. стандартное отклонение – мера разброса вокруг среднего, выраженная в тех же единицах измерения, что и наблюдения

При нормальном распределении 68% наблюдений укладываются в одно стандартное отклонение от среднего 95% - в два стандартных отклонения.

Например, средний возраст равен 45 лет, стандартное отклонение– 10 лет, то 95% наблюдений должны оказаться между 25 и 65 г.

§ определение числа десятичных знаков;

§ определение значка процента

Для итожащих статистик может быть выбран формат их вывода через команду Итожащие статистики/Формат/ Десятичные

 Например, ячейки с процентами по строке и столбцу могут быть форматированы таким образом:

Выделяют следующие форматы вывода итожащих статистик:

nnnn – простой числовой;

nnnn% –добавляется знак процента.

$n,nnn.n. Доллар – выводится значок доллара.

Авто– формат, задаваемый форматом самой переменной, включая количество десятичных знаков.

N=nnnn – выводит N= перед значением (используется для частот, для вывода количества валидных наблюдений)

(nnnn) – все значения заключаются в скобки.

(nnnn)(отр.значение) – все отрицательные значения заключаются в скобки.

(nnnn%) – все значения заключаются в скобки, и в конце каждого значения добавляется знак процента.

 

ЗАДАНИЯ ДЛЯ САМОСТОЯТЕЛЬНОЙ РАБОТЫ

1. Откройте файл Служащие.sav

2. Вывести предложенные ниже статистики

 

   

Зарплата в настоящее время

    Для среднего Медиан-ный критерий Мини-мум 75-й Процен-тиль Мода

Категория занятости

Сотрудник секретариата 27839 26550 15750 31200 24000
Сотрудник среднего звена 30939 30750 24300 31200 30750
Менеджер 63978 60500 34410 71688 55000

 

9. Сравнить статистики для Зарплата в настоящее время и Начальная заработная плата

10. В файле Выборы.sav, поместить переменную Пол (v35) и Сфера занятости (v39) – в строки, Голос за КПРФ (v32_2) – в столбцы.

11. Построить таблицу, приведенную ниже, выставить процент по строке. Примечание: возможна сортировка категорий по: количеству наблюдений,метке (по алфавиту), значению (нумерация меток)

 

       

КПРФ (Геннадий Зюганов)

       

0

1

        Частоты % по строке Частоты % по строке

В какой сфере Вы работаете?

Государственное, муниципальное управление

Пол

М 7 87,5% 1 12,5%
Ж 16 100,0% 0 ,0%

Строительство, транспорт, связь, коммунальное хозяйство

Пол

М 58 96,7% 2 3,3%
Ж 18 100,0% 0 ,0%

Культура, СМИ, образование, здравоохранение

Пол

М 17 100,0% 0 ,0%
Ж 63 91,3% 6 8,7%

Сфера услуг, торговля, финансы

Пол

М 27 96,4% 1 3,6%
Ж 20 83,3% 4 16,7%

Военнослужащий, правоохранительные органы

Пол

М 5 100,0% 0 ,0%
Ж 4 100,0% 0 ,0%

Нефтегазовая отрасль, геология

Пол

М 55 94,8% 3 5,2%
Ж 19 90,5% 2 9,5%

Энергетика

Пол

М 7 77,8% 2 22,2%
Ж 3 100,0% 0 ,0%

Сельское, лесное хозяйство

Пол

М 1 100,0% 0 ,0%
Ж 2 100,0% 0 ,0%

Другое

Пол

М 1 50,0% 1 50,0%
Ж 5 83,3% 1 16,7%

Отказ

Пол

М 0 ,0% 0 ,0%
Ж 0 ,0% 0 ,0%

 

12.В файле Выборы.sav построить таблицу по переменнымv10 –v12 (Расположение категорий /Метки строк – в столбцах)

  Полностью удовлетворены В основном удовлетворены В основном не удовлетворены Совсем не удовлетворены Затрудняюсь ответить
  Частоты Частоты Частоты Частоты Частоты
Насколько Вы лично удовлетворены качеством медицинских услуг, оказываемых населению города /района? 64 227 119 82 8
Насколько Вы лично удовлетворены качеством общего образования в городе / районе? 102 302 61 16 16
Насколько Вы удовлетворены услугами ЖКХ в городе/ районе? 49 166 144 135 5

 

13.В файле Выборы.sav построить таблицу по переменной v20

 

    Частоты % по таблице

Оцените, пожалуйста, деятельность следующих структур власти по 5-ти балльной шкале. Дума Вашего города / района

1 Плохо 22 4,4%
2 Неудовлетворительно 40 8,0%
3 Удовлетворительно 198 39,7%
4 Хорошо 166 33,3%
5 Отлично 27 5,4%
6 Затрудняюсь ответить 46 9,2%

 

 
Изменение внешнего вида мобильных таблиц.

Закладка Заголовки диалогового окна Настраиваемые таблицы  

· позволяет задавать заголовок таблицы;

· управлять подписями – текст, выводимый под таблицей перед сносками;

· управлять углами – текст в левом верхнем углу мобильной таблицы, выводимом только в случае, если таблица содержит переменные строк. 

В заголовки, подписи и угловые метки можно также включать автоматически генерируемый текст:

Дата – выводится текущий год, месяц и дата в формате;

Время – выводится текущий час, минута;

кн. Выражение – выводятся переменные или ее метка, используемые в таблице, и порядок их использования (знак «означает состыкованные переменные, знак «означает вложение) BY означает таблицу сопряженности или слои

 

Распределение сотрудников фирмы Н по переменным Зарплата в настоящее время BY Категория занятости10.12.2014 13:31:04

 

Категория занятости

  1 Сотрудник секретариата 2 Сотрудник среднего звена 3 Менеджер
  Для среднего Для среднего Для среднего
Зарплата в настоящее время 27839 30939 63978

По данным исследования Краснодар, 2014

 

Закладка Параметры позволяет определить:

 

§ Значения в ячейках определит вид пустых ячеек, не содержащих наблюдений, где можно указать один из трех вариантов вывода: ноль, пробел или текст (до 255 символов).

§ Статистики, которые не могут быть подсчитаны, например, среднее значение для категории наблюдений. Значение по умолчанию – точка или текст

§ Ширина столбцов позволяет управлять минимальной и максимальной шириной столбцов или создавать шаблоны таблиц  

Пропущенные значения для количественных переменных предназначена для таблиц, содержащих более одной количественной переменной, где можно указать различные варианты обработки пропущенных значений.


Закладка Статистические критериипозволяет рассчитать значение статистики хи-квадрат.

При вычислении критерия поверяется гипотеза об отсутствии связи между переменными; процентные распределения по столбцам не различаются, а наблюдаемые отличия являются случайными.

Статистика хи-квадрат измеряет общее различие между наблюдаемыми значениями и теми, которые были бы в случае, если процентные распределения были бы одинаковыми.

Большее значение статистики хи-квадрат указывает на большее отличие между наблюдаемыми и ожидаемыми частотами, т.е. процентные распределения неодинаковы, гипотеза неверна, есть связь.

 


Дата добавления: 2018-04-04; просмотров: 124;