Графическое изображение двух или более вариационных рядов.



-

Двумерные распределения. Таблица сопряженности. Маргинальные частоты.

Двумерные распределения служат для выявления различных типов зависимостей между двумя или более переменными, т.е. совместной встречаемости каких-то значений одних признаков с некоторыми значениями других признаков.

Таблица сопряженности – это средство представления совместного распределения двух переменных, предназначенное для исследования связи между ними. Таблица сопряженности является наиболее универсальным средством изучения статистических связей, так как в ней могут быть представлены переменные с любым уровнем измерения.

Строки таблицы сопряженности соответствуют значениям одной переменной, столбцы - значениям другой переменной.  при этом количественные шкалы предварительно должны быть сгруппированы в интервалы. Например, таблица сопряжённости может быть использована для показа зависимости музыкальных предпочтений от места проживания слушателей.

  Кантри Рок-н-рол Джаз Всего
Город 15 30 5 50
Село 25 20 5 50
Всего 40 50 10 100
 
   
 

На пересечении строки и столбца указывается частота совместного появления соответствующих значений двух признаков и . Сумма частот по строке . называется маргинальной частотой строки; сумма частот по столбцу — маргинальной частотой столбца. Сумма маргинальных частот равна объёму выборки ; их распределение представляет собой одномерное распределение переменной, образующей строки или столбцы таблицы. В таблице сопряжённости могут быть представлены как абсолютные, так и относительные частоты (в долях или процентах). Относительные частоты могут рассчитываться по отношению: а) к маргинальной частоте по строке; б) к маргинальной частоте по столбцу; в) к объёму выборки.

МАРГИНАЛЬНАЯ ЧАСТОТА (или СУММА) В любой матрице данных – сумма любой из строк или столбцов, то есть частоты на полях. Например, в таблице, где представлены люди, согласно их полу и росту один набор маргинальных частот даст число мужчин и число женщин безотносительно к росту; а другой набор даст общие количества каждого роста безотносительно к полу.

 

Анализ взаимосвязей признаков. Типы связей

 

Иногда измерения двух исследуемых признаков производятся в номинальной шкале, т.е. в шкале классификаций. Например, учащихся можно классифицировать по полу, а также по специальности: гуманитарий или естественник. В этом случае информация может быть представлена в виде таблицы, которая получила название таблица сопряженности. Для ее построения сначала выясняем, сколько уровней содержит тот или иной признак. Пусть первый признак имеет Iуровней, а второй признак - J. В этом случае таблица сопряженности имеет следующий вид:



Признак 2

Итого по строкам


Признак 1

f11 f12 f1J f1
f21 f22 f2J f2
fI1 fI2 fIJ fI
Итого по столбцам f 1 f 2 f J f n

 

В этой таблице клетки называются ячейками, а числа, стоящие в ячейках – частотами.

 

Виды связей:

Функциональная связь — такой вид соотношения между двумя признаками, когда каждому значению одного из них соответствует строго определенное значение другого (площадь круга зависит от радиуса круга и т.д.). Функциональная связь характерна для физико-математических процессов.

1. Корреляционная связь — такая связь, при которой каждому определенному значению одного признака соответствует несколько значений другого взаимосвязанного с ним признака (связь между ростом и массой тела человека; связь между температурой тела и частотой пульса и др.). Корреляционная связь характерна для медико-биологических процессов.

2. Практическое значение установления корреляционной связи. Выявление причинно-следственной между факторными и результативными признаками (при оценке физического развития, для определения связи между условиями труда, быта и состоянием здоровья, при определении зависимости частоты случаев болезни от возраста, стажа, наличия производственных вредностей и др.)

Зависимость параллельных изменений нескольких признаков от какой-то третьей величины. Например, под воздействием высокой температуры в цехе происходят изменения кровяного давления, вязкости крови, частоты пульса и др.

3. Величина, характеризующая направление и силу связи между признаками. Коэффициент корреляции, который одним числом дает представление о направлении и силе связи между признаками (явлениями), пределы его колебаний от 0 до ± 1

4. Способы представления корреляционной связи

o график (диаграмма рассеяния)

o коэффициент корреляции

5. Направление корреляционной связи

o прямая

o oбратная

6. Сила корреляционной связи

o сильная: ±0,7 до ±1

o средняя: ±0,3 до ±0,699

o слабая: 0 до ±0,299

7. Методы определения коэффициента корреляции и формулы

o метод квадратов (метод Пирсона)

o ранговый метод (метод Спирмена)

8. Методические требования к использованию коэффициента корреляции

o измерение связи возможно только в качественно однородных совокупностях (например, измерение связи между ростом и весом в совокупностях, однородных по полу и возрасту)

o расчет может производиться с использованием абсолютных или производных величин

o для вычисления коэффициента корреляции используются не сгруппированные вариационные ряды (это требование применяется только при вычислении коэффициента корреляции по методу квадратов)

o число наблюдений не менее 30

9. Рекомендации по применению метода ранговой корреляции (метод Спирмена)

o когда нет необходимости в точном установлении силы связи, а достаточно ориентировочных данных

o когда признаки представлены не только количественными, но и атрибутивными значениями

o когда ряды распределения признаков имеют открытые варианты (например, стаж работы до 1 года и др.)


Дата добавления: 2018-02-15; просмотров: 370; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!