Оценка достоверности расхождения или согласия распределений (критерий l - Колмогорова-Смирнова)

⇐ ПредыдущаяСтр 10 из 11Следующая ⇒

Задание. Рассмотрим распределение красного цвета в 8-цветном тесте М. Люшера. Можно ли утверждать, что распределение красного цвета по 8-и позициям в выборке A у здоровых испытуемых отличается от равномерного распределения? Можно ли утверждать, что распределение красного цвета в выборке A и выборке B не различается?

Разряды - позиции цвета	1 вариант		2 вариант		3 вариант		4 вариант
Разряды - позиции цвета	A	B	A	B	A	B	A	B
1	22	98	10	92	12	50	12	19
2	25	100	15	98	12	10	14	10
3	13	116	16	116	21	60	11	34
4	8	87	25	82	8	10	6	10
5	15	91	12	91	6	10	4	10
6	10	112	8	112	8	112	5	12
7	9	97	14	97	14	97	10	97
8	8	86	9	86	9	10	9	10

Разряды - позиции цвета	5 вариант		6 вариант		7 вариант		8 вариант
Разряды - позиции цвета	A	B	A	B	A	B	A	B
1	22	92	10	98	12	19	12	50
2	25	98	15	100	12	10	14	55
3	13	116	16	116	21	34	16	58
4	8	82	25	87	8	10	21	60
5	15	91	12	91	6	10	18	44
6	10	112	8	112	8	12	15	40
7	9	97	14	97	14	97	10	20
8	8	86	9	86	9	10	9	10

Разряды - позиции цвета	9 вариант		10 вариант		11 вариант		12 вариант
Разряды - позиции цвета	A	B	A	B	A	B	A	B
1	12	59	10	98	8	48	10	92
2	14	46	15	100	10	55	15	98
3	16	42	16	116	15	58	16	116
4	21	35	25	87	21	55	25	82
5	18	20	12	91	18	30	12	91
6	15	24	8	112	15	40	8	112
7	10	28	14	97	10	20	14	97
8	8	86	9	86	9	10	9	10

Рекомендации для выполнения лабораторных работ на компьютере:

· эмпирическое значение критерия l – Колмогорова-Смирнова находится с использованием формул в среде Excel.

Лабораторная работа №10

Многофункциональный критерий Фишера

Задание. В выборке студентов факультета психологии Санкт-Петербургского университета с помощью «карандашного» теста определялось преобладание левого (количество А) или правого (количество В) глаза в прицельной способности глаз. Совпадают ли эти данные с результатами обследования 100 студентов медицинских специальностей, представленными в другом эксперименте?

	1 вариант		2 вариант		3 вариант		4 вариант		5 вариант		6 вариант
	А	В	А	В	А	В	А	В	А	В	А	В
Студенты-психологи	6	8	8	6	5	8	19	25	16	18	7	8
Студенты медики	19	81	75	25	15	85	45	55	68	32	40	60

	7 вариант		8 вариант		9 вариант		10 вариант		11 вариант		12 вариант
	А	В	А	В	А	В	А	В	А	В	А	В
Студенты-психологи	5	7	7	5	4	7	18	24	15	17	6	7
Студенты медики	68	32	40	60	19	81	75	25	15	85	45	55

Рекомендации для выполнения лабораторных работ на компьютере:

· эмпирическое значение критерия Фишера находится с использованием формул в среде Excel.

ПРИЛОЖЕНИЕ 3

Описание статистических функций

Табличного процессора Microsoft Excel

ЧАСТОТА

Вычисляет частоту появления значений в интервале значений и возвращает массив цифр. Функция ЧАСТОТА может быть использована, например, для подсчета количества результатов тестирования, попадающих в интервалы результатов. Поскольку данная функция возвращает массив, она должна задаваться в качестве формулы массива.

Синтаксис

ЧАСТОТА(массив_данных;массив_карманов)

Массив_данных – это массив или ссылка на множество данных, для которых вычисляются частоты. Если массив_данных не содержит значений, то функция ЧАСТОТА возвращает массив нулей.

Массив_карманов – это массив или ссылка на множество интервалов, в которые группируются значения аргумента массив_данных. Если массив_карманов не содержит значений, то функция ЧАСТОТА возвращает количество элементов в аргументе массив_данных.

Замечания

ЧАСТОТА вводится как формула массива после выделения интервала смежных ячеек, в которые нужно вернуть полученный массив распределения.
Количество элементов в возвращаемом массиве на единицу больше числа элементов в массив_карманов. Дополнительный элемент в возвращаемом массиве содержит количество значений, больших чем максимальное значение в интервалах. Например, при подсчете трех диапазонов значений (интервалов), введенных в три ячейки, убедитесь в том, что функция ЧАСТОТА возвращает значения в четырех ячейках. Дополнительная ячейка возвращает число значений в массив_данных, больших чем значение границы третьего интервала.
ЧАСТОТА игнорирует пустые ячейки и тексты.
Формулы, которые возвращают массивы, должны быть введены как формулы массивов.

Пример

Предположим, что на рабочем листе перечислены результаты тестирования в баллах. Баллы 79, 85, 78, 85, 83, 81, 95, 88 и 97 введены в ячейки A1:A9 соответственно. Тогда аргумент массив_данных содержит столбец этих баллов. Аргумент массив_карманов будет другим столбцом, задающим интервалы, в которые должны быть сгруппированы данные В данном примере массив_карманов – это интервал ячеек C4:C6, который будет содержать значения 70, 79, 89. Если ввести функцию ЧАСТОТА как формулу массива, то можно подсчитать количество результатов тестирования, попадающих в интервалы 0-70, 71-79, 80-89 и 90-100. В этом примере предполагается, что все баллы – целые числа. Следующая формула вводится как формула массива после выделения четырех вертикально смежных ячеек для результата. Четвертое число (2) представляет собой счетчик значений (95 и 97), которые больше чем граница наибольшего интервала (89).

ЧАСТОТА(A1:A9;C4:C6) равняется {0:2:5:2}

______________________________

РАНГ

Возвращает ранг числа в списке чисел. Ранг числа - это его величина относительно других значений в списке. (Если список отсортировать, то ранг числа будет его позицией.)

Синтаксис

РАНГ(число;ссылка;порядок)

Число - это число, для которого определяется ранг.

Ссылка - это массив или ссылка на список чисел. Нечисловые значения в ссылке игнорируются.

Порядок - это число, определяющее способ упорядочения.

Если порядок равен 0 (нулю) или опущен, то Microsoft Excel определяет ранг числа так, как если бы ссылка была списком, отсортированным в порядке убывания.
Если порядок - это любое ненулевое число, то Microsoft Excel определяет ранг числа так, как если бы ссылка была списком, отсортированным в порядке возрастания.

Замечания

РАНГ присваивает повторяющимся числам одинаковый ранг. Однако наличие повторяющихся чисел влияет на ранг последующих чисел. Например, для списка целых, если число 10 появляется дважды и имеет ранг 5, то 11 будет иметь ранг 7 (и никакое число не будет иметь ранг 6).

Примеры

Если ячейки A1:A5 содержат числа 7, 3,5, 3,5, 1 и 2 соответственно, то:

РАНГ(A2;A1:A5;1) равняется 3;

РАНГ(A1;A1:A5;1) равняется 5.

МАКС

Возвращает наибольшее значение из набора значений.

Синтаксис

МАКС(число1;число2; ...)

Число1, число2, ... - это от 1 до 30 чисел, среди которых ищется максимальное значение.

Можно задавать аргументы, которые являются числами, пустыми ячейками, логическими значениями или текстовыми представлениями чисел. Аргументы, которые являются значениями ошибки или текстами, не преобразуемыми в числа, вызывают значения ошибок.
Если аргумент является массивом или ссылкой, то в нем учитываются только числа. Пустые ячейки, логические значения или текст в массиве или ссылке игнорируются. Если логические значения или текст не должны игнорироваться, следует использовать функцию МАКСА.
Если аргументы не содержат чисел, то функция МАКС возвращает 0 (ноль).

Примеры

Если ячейки A1:A5 содержат числа 10, 7, 9, 27 и 2, то:

МАКС(A1:A5) равняется 27;

МАКС(A1:A5;30) равняется 30.

______________________________

МИН

Возвращает наименьшее значение в списке аргументов.

Синтаксис

МИН(число1;число2; ...)

Число1, число2, ... – это от 1 до 30 чисел, среди которых ищется минимальное значение.

Можно задавать аргументы, которые являются числами, пустыми ячейками, логическими значениями или текстовыми представлениями чисел. Аргументы, которые являются значениями ошибки или текстами, не преобразуемыми в числа, вызывают значения ошибок.
Если аргумент является массивом или ссылкой, то учитываются только числа. Пустые ячейки, логические значения или тексты в массиве или ссылке игнорируются. Если логические значения или тексты игнорироваться не должны, следует пользоваться функцией МИНА.
Если аргументы не содержат чисел, то функция МИН возвращает 0.

Примеры

Если ячейки A1:A5 содержат числа 10, 7, 9, 27 и 2, то:

МИН(A1:A5) равняется 2;

МИН(A1:A5; 0) равняется 0;

МИН подобна функции МАКС. См. также примеры к функции МАКС.

______________________________

СРЗНАЧ

Возвращает среднее (арифметическое) своих аргументов.

Синтаксис

СРЗНАЧ(число1; число2; ...)

Число1, число2, ... - это от 1 до 30 аргументов, для которых вычисляется среднее.

Замечания

Аргументы должны быть числами или именами, массивами или ссылками, содержащими числа.
Если аргумент, который является массивом или ссылкой, содержит тексты, логические значения или пустые ячейки, то такие значения игнорируются; однако, ячейки, которые содержат нулевые значения, учитываются.

Совет. Вычисляя средние значения ячеек, следует учитывать различие между пустыми ячейками и ячейками, содержащими нулевые значения, особенно если не установлен флажок Нулевые значения на вкладке Вид (команда Параметры, меню Сервис). Пустые ячейки не учитываются, но нулевые ячейки учитываются.

Примеры

Если ячейки A1:A5 имеют имя Баллы и содержат числа 10, 7, 9, 27 и 2, то:

СРЗНАЧ(A1:A5) равняется 11;

СРЗНАЧ(Баллы) равняется 11;

СРЗНАЧ(A1:A5; 5) равняется 10;

СРЗНАЧ(A1:A5) равняется СУММ(A1:A5)/СЧЁТ(A1:A5) и равняется 11;

Если ячейки C1:C3 имеют имя ДругиеБаллы и содержат числа 4, 18 и 7, то:

СРЗНАЧ(Баллы; ДругиеБаллы) равняется 10,5.

______________________________

МЕДИАНА

Возвращает медиану заданных чисел. Медиана - это число, которое является серединой множества чисел, то есть половина чисел имеют значения большие, чем медиана, а половина чисел имеют значения меньшие, чем медиана.

Синтаксис

МЕДИАНА(число1;число2; ...)

Число1, число2, ... - это от 1 до 30 чисел, для которых определяется медиана.

Аргументы должны быть числами или именами, массивами или ссылками, содержащими числа. Microsoft Excel проверяет все числа, содержащиеся в аргументах, которые являются массивами или ссылками.
Если аргумент, который является массивом или ссылкой, содержит тексты, логические значения или пустые ячейки, то такие значения игнорируются; однако, ячейки, которые содержат нулевые значения учитываются.

Замечания

Если в множестве четное количество чисел, то функция МЕДИАНА вычисляет среднее двух чисел, находящихся в середине множества. См. второй из следующих примеров.

Примеры

МЕДИАНА(1; 2; 3; 4; 5) равняется 3

МЕДИАНА(1; 2; 3; 4; 5; 6) равняется 3,5, среднее 3 и 4

______________________________

МОДА

Возвращает наиболее часто встречающееся или повторяющееся значение в массиве или интервале данных. Также как и функция МЕДИАНА, функция МОДА является мерой взаиморасположения значений

Синтаксис

МОДА(число1;число2; ...)

Число1, число2, ... - это от 1 до 30 аргументов, для которых вычисляется мода. Можно использовать один массив или одну ссылку на массив вместо аргументов, разделяемых точкой с запятой.

Замечания

Аргументы должны быть числами, именами, массивами или ссылками, которые содержат числа.
Если аргумент, который является массивом или ссылкой, содержит тексты, логические значения или пустые ячейки, то такие значения игнорируются; однако ячейки, которые содержат нулевые значения учитываются.
Если множество данных не содержит одинаковых данных, то функция МОДА возвращает значение ошибки #Н/Д.

В наборе значений мода – это наиболее часто встречающееся значение; медиана – это значение в середине массива; среднее - это среднее арифметическое значение. Ни одно из этих чисел не характеризует в полной мере то, в какой степени центрированы данные. Пусть данные сгруппированы в трех областях, одна половина данных близка к некоторому малому значению, а другая половина данных близка к двум другим большим значениям. Обе функции, СРЗНАЧ и МЕДИАНА, могут вернуть значение из относительно пустой середины, а функция МОДА скорее всего вернет доминирующее малое значение.

Пример

МОДА({5,6; 4; 4; 3; 2; 4}) равняется 4.

______________________________

СЧЁТ

Подсчитывает количество чисел в списке аргументов. Функция СЧЁТ используется для получения количества числовых ячеек в интервалах или массивах ячеек.

Синтаксис

СЧЁТ(значение1; значение2; ...)

Значение1, значение2, ... - это от 1 до 30 аргументов, которые могут содержать или ссылаться на данные различных типов, но в подсчете участвуют только числа.

Учитываются аргументы, которые являются числами, пустыми значениями, логическими значениями, датами, или текстами, изображающими числа; аргументы, которые являются значениями ошибки или текстами, которые нельзя интерпретировать как числа, игнорируются.
Если аргумент является массивом или ссылкой, то подсчитываются только числа в этом массиве или ссылке. Пустые ячейки, логические значения, тексты и значения ошибок в массиве или ссылке игнорируются.

Примеры

СЧЁТ(A1:A7) возвращает 3;

СЧЁТ(A4:A7) возвращает 2;

СЧЁТ(A1:A7, 2) возвращает 4.

______________________________

СЧЁТЕСЛИ

Подсчитывает количество ячеек внутри диапазона, удовлетворяющих заданному критерию.

Синтаксис

СЧЁТЕСЛИ(диапазон; критерий)

Диапазон – это диапазон, в котором нужно подсчитать ячейки.

Критерий – это критерий в форме числа, выражения или текста, который определяет, какие ячейки надо подсчитывать. Например, критерий может быть выражен следующим образом: 32, "32", ">32", "яблоки".

Замечания

Microsoft Excel предлагает дополнительные функции, которые можно применять для анализа данных с использованием условий. Например, для вычисления суммы значений, попадающих в интервал, заданный текстовой строкой или числами, используйте функцию СУММЕСЛИ. Для получения формулы, возвращающей в зависимости от выполнения условия одно из двух значений, например вознаграждение по указанному объему продаж, используйте функцию ЕСЛИ.

Примеры

Пусть ячейки A3:A6 содержат "яблоки", "апельсины", "персики", "яблоки" соответственно:

СЧЁТЕСЛИ(A3:A6;"яблоки") равняется 2.

Пусть ячейки B3:B6 содержат 32, 54, 75 и 86 соответственно:

СЧЁТЕСЛИ(B3:B6;">55") равняется 2.

______________________________

ДИСП

Оценивает дисперсию по выборке.

Синтаксис

ДИСП(число1;число2; ...)

Число1, число2, ... - это от 1 до 30 числовых аргументов, соответствующих выборке из генеральной совокупности.

Замечания

ДИСП предполагает, что аргументы являются только выборкой из генеральной совокупности. Если данные представляют всю генеральную совокупность, вычисляйте дисперсию, используя функцию ДИСПР.
Логические значения, такие как ИСТИНА или ЛОЖЬ, а также текст игнорируются. Если они не должны игнорироваться, пользуйтесь функцией рабочего листа ДИСПА.

Пример

Предположим, что из инструментов, отштампованных одной и той же машиной, выбраны наугад 10 штук и испытаны на излом. Значения выборки (1345, 1301, 1368, 1322, 1310, 1370, 1318, 1350, 1303, 1299) сохранены в ячейках A2:E3 соответственно. Тогда функция ДИСП оценивает дисперсию сопротивления на излом для всех инструментов.

ДИСП(A2:E3) равняется 754,3.

______________________________

СТАНДОТКЛОН

Оценивает стандартное отклонение по выборке. Стандартное отклонение – это мера того, насколько широко разбросаны точки данных относительно их среднего.

Синтаксис

СТАНДОТКЛОН(число1; число2; ...)

Число1, число2, ... – это от 1 до 30 числовых аргументов, соответствующих выборке из генеральной совокупности. Можно использовать массив или ссылку на массив вместо аргументов, разделяемых точкой с запятой.

Логические значения, такие как ИСТИНА или ЛОЖЬ, а также текст игнорируются. Если текст и логические значения игнорироваться не должны, следует использовать функцию рабочего листа СТАНДОТКЛОНА.

Замечания

СТАНДОТКЛОН предполагает, что аргументы являются только выборкой из генеральной совокупности. Если данные представляют всю генеральную совокупность, то стандартное отклонение следует вычислять с помощью функции СТАНДОТКЛОНП.
Стандартное отклонение вычисляется с использованием "несмещенного" или "n-1" метода.

Пример

СТАНДОТКЛОН(A2:E3) равняется 27,46.

______________________________

СКОС

Возвращает асимметрию распределения. Асимметрия характеризует степень несимметричности распределения относительно его среднего. Положительная асимметрия указывает на отклонение распределения в сторону положительных значений. Отрицательная асимметрия указывает на отклонение распределения в сторону отрицательных значений.

Синтаксис

СКОС(число1;число2; ...)

Число1, число2, ... - это от 1 до 30 аргументов, для которых вычисляется асимметричность. Можно использовать массив или ссылку на массив вместо аргументов, разделяемых точкой с запятой.

Замечания

Аргументы должны быть числами или именами, массивами или ссылками, содержащими числа.
Если аргумент, который является массивом или ссылкой, содержит тексты, логические значения или пустые ячейки, то такие значения игнорируются; однако ячейки, которые содержат нулевые значения, учитываются.
Если имеется менее трех точек данных или стандартное отклонение равно нулю, то функция СКОС возвращает значение ошибки #ДЕЛ/0!.

Пример

СКОС(3;4;5;2;3;4;5;6;4;7) равняется 0,359543

ЭКСЦЕСС

Возвращает эксцесс множества данных. Эксцесс характеризует относительную остроконечность или сглаженность распределения по сравнению с нормальным распределением. Положительный эксцесс обозначает относительно остроконечное распределение. Отрицательный эксцесс обозначает относительно сглаженное распределение.

Синтаксис

ЭКСЦЕСС(число1;число2; ...)

Число1, число2, ... - это от 1 до 30 аргументов, для которых вычисляется эксцесс. Можно использовать массив или ссылку на массив вместо аргументов, разделяемых точкой с запятой.

Замечания

Аргументы должны быть числами или именами, массивами или ссылками, содержащими числа.
Если аргумент, который является массивом или ссылкой, содержит тексты, логические значения или пустые ячейки, то такие значения игнорируются; однако ячейки, которые содержат нулевые значения, учитываются.
Если задано менее четырех точек данных или если стандартное отклонение выборки равняется нулю, то функция ЭКСЦЕСС возвращает значение ошибки #ДЕЛ/0!.

Пример

ЭКСЦЕСС(3;4;5;2;3;4;5;6;4;7) равняется -0,1518

______________________________

ХИ2ТЕСТ

Возвращает тест на независимость. ХИ2ТЕСТ возвращает значение для распределения хи-квадрат. Критерий хи-квадрат используется для определения того, подтверждается ли гипотеза экспериментом.

Синтаксис

ХИ2ТЕСТ(фактический_интервал;ожидаемый_интервал)

Фактический_интервал – это интервал данных, которые содержат наблюдения, подлежащие сравнению с ожидаемыми значениями.

Ожидаемый_интервал – это интервал данных, который содержит отношение произведений итогов по строкам и столбцам к общему итогу.

Заметки

Если фактический_интервал и ожидаемый_интервал имеют различное количество точек данных, то функция ХИ2ТЕСТ возвращает значение ошибки #Н/Д.
Критерий хи-квадрат сначала вычисляет хи-квадрат статистики, а затем ХИ2ТЕСТ возвращает вероятность для хи-квадрат статистики и степеней свободы df, где df = (r - 1)(c - 1).

______________________________

ХИ2ОБР

Возвращает значение, обратное к односторонней вероятности распределения хи-квадрат. Если вероятность = ХИ2РАСП(x;...), то ХИ2ОБР(вероятность;...) = x. функция используется для сравнения наблюдаемых результатов с ожидаемыми, для того чтобы решить, была ли исходная гипотеза обоснованной.

Синтаксис

ХИ2ОБР(вероятность;степени_свободы)

Вероятность – это вероятность, связанная с распределением хи-квадрат.

Степени_свободы – это число степеней свободы.

Заметки

Если какой-либо из аргументов не является числом, то функция ХИ2ОБР возвращает значение ошибки #ЗНАЧ!.
Если вероятность < 0 или вероятность > 1, то функция ХИ2ОБР возвращает значение ошибки #ЧИСЛО!.
Если степени_свободы не целое, то оно усекается.
Если степени_свободы < 1 или степени_свободы ≥ 10², ХИ2ОБР возвращает значение ошибки #ЧИСЛО!.

ПРИЛОЖЕНИЕ 4

Применение пакета анализа

Дата добавления: 2019-09-13; просмотров: 255; Мы поможем в написании вашей работы!

Поделиться с друзьями:

⇐ Предыдущая 2 3 4 5 6 7 8 91011 Следующая ⇒

Мы поможем в написании ваших работ!