Оценка достоверности расхождения или согласия распределений (критерий l - Колмогорова-Смирнова)
Задание. Рассмотрим распределение красного цвета в 8-цветном тесте М. Люшера. Можно ли утверждать, что распределение красного цвета по 8-и позициям в выборке A у здоровых испытуемых отличается от равномерного распределения? Можно ли утверждать, что распределение красного цвета в выборке A и выборке B не различается?
Разряды - позиции цвета | 1 вариант | 2 вариант | 3 вариант | 4 вариант | ||||
A | B | A | B | A | B | A | B | |
1 | 22 | 98 | 10 | 92 | 12 | 50 | 12 | 19 |
2 | 25 | 100 | 15 | 98 | 12 | 10 | 14 | 10 |
3 | 13 | 116 | 16 | 116 | 21 | 60 | 11 | 34 |
4 | 8 | 87 | 25 | 82 | 8 | 10 | 6 | 10 |
5 | 15 | 91 | 12 | 91 | 6 | 10 | 4 | 10 |
6 | 10 | 112 | 8 | 112 | 8 | 112 | 5 | 12 |
7 | 9 | 97 | 14 | 97 | 14 | 97 | 10 | 97 |
8 | 8 | 86 | 9 | 86 | 9 | 10 | 9 | 10 |
Разряды - позиции цвета | 5 вариант | 6 вариант | 7 вариант | 8 вариант | ||||
A | B | A | B | A | B | A | B | |
1 | 22 | 92 | 10 | 98 | 12 | 19 | 12 | 50 |
2 | 25 | 98 | 15 | 100 | 12 | 10 | 14 | 55 |
3 | 13 | 116 | 16 | 116 | 21 | 34 | 16 | 58 |
4 | 8 | 82 | 25 | 87 | 8 | 10 | 21 | 60 |
5 | 15 | 91 | 12 | 91 | 6 | 10 | 18 | 44 |
6 | 10 | 112 | 8 | 112 | 8 | 12 | 15 | 40 |
7 | 9 | 97 | 14 | 97 | 14 | 97 | 10 | 20 |
8 | 8 | 86 | 9 | 86 | 9 | 10 | 9 | 10 |
Разряды - позиции цвета | 9 вариант | 10 вариант | 11 вариант | 12 вариант | ||||
A | B | A | B | A | B | A | B | |
1 | 12 | 59 | 10 | 98 | 8 | 48 | 10 | 92 |
2 | 14 | 46 | 15 | 100 | 10 | 55 | 15 | 98 |
3 | 16 | 42 | 16 | 116 | 15 | 58 | 16 | 116 |
4 | 21 | 35 | 25 | 87 | 21 | 55 | 25 | 82 |
5 | 18 | 20 | 12 | 91 | 18 | 30 | 12 | 91 |
6 | 15 | 24 | 8 | 112 | 15 | 40 | 8 | 112 |
7 | 10 | 28 | 14 | 97 | 10 | 20 | 14 | 97 |
8 | 8 | 86 | 9 | 86 | 9 | 10 | 9 | 10 |
|
|
Рекомендации для выполнения лабораторных работ на компьютере:
· эмпирическое значение критерия l – Колмогорова-Смирнова находится с использованием формул в среде Excel.
Лабораторная работа №10
Многофункциональный критерий Фишера
Задание. В выборке студентов факультета психологии Санкт-Петербургского университета с помощью «карандашного» теста определялось преобладание левого (количество А) или правого (количество В) глаза в прицельной способности глаз. Совпадают ли эти данные с результатами обследования 100 студентов медицинских специальностей, представленными в другом эксперименте?
| 1 вариант | 2 вариант | 3 вариант | 4 вариант | 5 вариант | 6 вариант | ||||||
А | В | А | В | А | В | А | В | А | В | А | В | |
Студенты-психологи | 6 | 8 | 8 | 6 | 5 | 8 | 19 | 25 | 16 | 18 | 7 | 8 |
Студенты медики | 19 | 81 | 75 | 25 | 15 | 85 | 45 | 55 | 68 | 32 | 40 | 60 |
| 7 вариант | 8 вариант | 9 вариант | 10 вариант | 11 вариант | 12 вариант | ||||||
А | В | А | В | А | В | А | В | А | В | А | В | |
Студенты-психологи | 5 | 7 | 7 | 5 | 4 | 7 | 18 | 24 | 15 | 17 | 6 | 7 |
Студенты медики | 68 | 32 | 40 | 60 | 19 | 81 | 75 | 25 | 15 | 85 | 45 | 55 |
|
|
Рекомендации для выполнения лабораторных работ на компьютере:
· эмпирическое значение критерия Фишера находится с использованием формул в среде Excel.
ПРИЛОЖЕНИЕ 3
Описание статистических функций
Табличного процессора Microsoft Excel
ЧАСТОТА
Вычисляет частоту появления значений в интервале значений и возвращает массив цифр. Функция ЧАСТОТА может быть использована, например, для подсчета количества результатов тестирования, попадающих в интервалы результатов. Поскольку данная функция возвращает массив, она должна задаваться в качестве формулы массива.
Синтаксис
ЧАСТОТА(массив_данных;массив_карманов)
Массив_данных – это массив или ссылка на множество данных, для которых вычисляются частоты. Если массив_данных не содержит значений, то функция ЧАСТОТА возвращает массив нулей.
Массив_карманов – это массив или ссылка на множество интервалов, в которые группируются значения аргумента массив_данных. Если массив_карманов не содержит значений, то функция ЧАСТОТА возвращает количество элементов в аргументе массив_данных.
Замечания
- ЧАСТОТА вводится как формула массива после выделения интервала смежных ячеек, в которые нужно вернуть полученный массив распределения.
- Количество элементов в возвращаемом массиве на единицу больше числа элементов в массив_карманов. Дополнительный элемент в возвращаемом массиве содержит количество значений, больших чем максимальное значение в интервалах. Например, при подсчете трех диапазонов значений (интервалов), введенных в три ячейки, убедитесь в том, что функция ЧАСТОТА возвращает значения в четырех ячейках. Дополнительная ячейка возвращает число значений в массив_данных, больших чем значение границы третьего интервала.
- ЧАСТОТА игнорирует пустые ячейки и тексты.
- Формулы, которые возвращают массивы, должны быть введены как формулы массивов.
Пример
|
|
Предположим, что на рабочем листе перечислены результаты тестирования в баллах. Баллы 79, 85, 78, 85, 83, 81, 95, 88 и 97 введены в ячейки A1:A9 соответственно. Тогда аргумент массив_данных содержит столбец этих баллов. Аргумент массив_карманов будет другим столбцом, задающим интервалы, в которые должны быть сгруппированы данные В данном примере массив_карманов – это интервал ячеек C4:C6, который будет содержать значения 70, 79, 89. Если ввести функцию ЧАСТОТА как формулу массива, то можно подсчитать количество результатов тестирования, попадающих в интервалы 0-70, 71-79, 80-89 и 90-100. В этом примере предполагается, что все баллы – целые числа. Следующая формула вводится как формула массива после выделения четырех вертикально смежных ячеек для результата. Четвертое число (2) представляет собой счетчик значений (95 и 97), которые больше чем граница наибольшего интервала (89).
|
|
ЧАСТОТА(A1:A9;C4:C6) равняется {0:2:5:2}
______________________________
РАНГ
Возвращает ранг числа в списке чисел. Ранг числа - это его величина относительно других значений в списке. (Если список отсортировать, то ранг числа будет его позицией.)
Синтаксис
РАНГ(число;ссылка;порядок)
Число - это число, для которого определяется ранг.
Ссылка - это массив или ссылка на список чисел. Нечисловые значения в ссылке игнорируются.
Порядок - это число, определяющее способ упорядочения.
- Если порядок равен 0 (нулю) или опущен, то Microsoft Excel определяет ранг числа так, как если бы ссылка была списком, отсортированным в порядке убывания.
- Если порядок - это любое ненулевое число, то Microsoft Excel определяет ранг числа так, как если бы ссылка была списком, отсортированным в порядке возрастания.
Замечания
РАНГ присваивает повторяющимся числам одинаковый ранг. Однако наличие повторяющихся чисел влияет на ранг последующих чисел. Например, для списка целых, если число 10 появляется дважды и имеет ранг 5, то 11 будет иметь ранг 7 (и никакое число не будет иметь ранг 6).
Примеры
Если ячейки A1:A5 содержат числа 7, 3,5, 3,5, 1 и 2 соответственно, то:
РАНГ(A2;A1:A5;1) равняется 3;
РАНГ(A1;A1:A5;1) равняется 5.
МАКС
Возвращает наибольшее значение из набора значений.
Синтаксис
МАКС(число1;число2; ...)
Число1, число2, ... - это от 1 до 30 чисел, среди которых ищется максимальное значение.
- Можно задавать аргументы, которые являются числами, пустыми ячейками, логическими значениями или текстовыми представлениями чисел. Аргументы, которые являются значениями ошибки или текстами, не преобразуемыми в числа, вызывают значения ошибок.
- Если аргумент является массивом или ссылкой, то в нем учитываются только числа. Пустые ячейки, логические значения или текст в массиве или ссылке игнорируются. Если логические значения или текст не должны игнорироваться, следует использовать функцию МАКСА.
- Если аргументы не содержат чисел, то функция МАКС возвращает 0 (ноль).
Примеры
Если ячейки A1:A5 содержат числа 10, 7, 9, 27 и 2, то:
МАКС(A1:A5) равняется 27;
МАКС(A1:A5;30) равняется 30.
______________________________
МИН
Возвращает наименьшее значение в списке аргументов.
Синтаксис
МИН(число1;число2; ...)
Число1, число2, ... – это от 1 до 30 чисел, среди которых ищется минимальное значение.
- Можно задавать аргументы, которые являются числами, пустыми ячейками, логическими значениями или текстовыми представлениями чисел. Аргументы, которые являются значениями ошибки или текстами, не преобразуемыми в числа, вызывают значения ошибок.
- Если аргумент является массивом или ссылкой, то учитываются только числа. Пустые ячейки, логические значения или тексты в массиве или ссылке игнорируются. Если логические значения или тексты игнорироваться не должны, следует пользоваться функцией МИНА.
- Если аргументы не содержат чисел, то функция МИН возвращает 0.
Примеры
Если ячейки A1:A5 содержат числа 10, 7, 9, 27 и 2, то:
МИН(A1:A5) равняется 2;
МИН(A1:A5; 0) равняется 0;
МИН подобна функции МАКС. См. также примеры к функции МАКС.
______________________________
СРЗНАЧ
Возвращает среднее (арифметическое) своих аргументов.
Синтаксис
СРЗНАЧ(число1; число2; ...)
Число1, число2, ... - это от 1 до 30 аргументов, для которых вычисляется среднее.
Замечания
- Аргументы должны быть числами или именами, массивами или ссылками, содержащими числа.
- Если аргумент, который является массивом или ссылкой, содержит тексты, логические значения или пустые ячейки, то такие значения игнорируются; однако, ячейки, которые содержат нулевые значения, учитываются.
Совет. Вычисляя средние значения ячеек, следует учитывать различие между пустыми ячейками и ячейками, содержащими нулевые значения, особенно если не установлен флажок Нулевые значения на вкладке Вид (команда Параметры, меню Сервис). Пустые ячейки не учитываются, но нулевые ячейки учитываются.
Примеры
Если ячейки A1:A5 имеют имя Баллы и содержат числа 10, 7, 9, 27 и 2, то:
СРЗНАЧ(A1:A5) равняется 11;
СРЗНАЧ(Баллы) равняется 11;
СРЗНАЧ(A1:A5; 5) равняется 10;
СРЗНАЧ(A1:A5) равняется СУММ(A1:A5)/СЧЁТ(A1:A5) и равняется 11;
Если ячейки C1:C3 имеют имя ДругиеБаллы и содержат числа 4, 18 и 7, то:
СРЗНАЧ(Баллы; ДругиеБаллы) равняется 10,5.
______________________________
МЕДИАНА
Возвращает медиану заданных чисел. Медиана - это число, которое является серединой множества чисел, то есть половина чисел имеют значения большие, чем медиана, а половина чисел имеют значения меньшие, чем медиана.
Синтаксис
МЕДИАНА(число1;число2; ...)
Число1, число2, ... - это от 1 до 30 чисел, для которых определяется медиана.
- Аргументы должны быть числами или именами, массивами или ссылками, содержащими числа. Microsoft Excel проверяет все числа, содержащиеся в аргументах, которые являются массивами или ссылками.
- Если аргумент, который является массивом или ссылкой, содержит тексты, логические значения или пустые ячейки, то такие значения игнорируются; однако, ячейки, которые содержат нулевые значения учитываются.
Замечания
Если в множестве четное количество чисел, то функция МЕДИАНА вычисляет среднее двух чисел, находящихся в середине множества. См. второй из следующих примеров.
Примеры
МЕДИАНА(1; 2; 3; 4; 5) равняется 3
МЕДИАНА(1; 2; 3; 4; 5; 6) равняется 3,5, среднее 3 и 4
______________________________
МОДА
Возвращает наиболее часто встречающееся или повторяющееся значение в массиве или интервале данных. Также как и функция МЕДИАНА, функция МОДА является мерой взаиморасположения значений
Синтаксис
МОДА(число1;число2; ...)
Число1, число2, ... - это от 1 до 30 аргументов, для которых вычисляется мода. Можно использовать один массив или одну ссылку на массив вместо аргументов, разделяемых точкой с запятой.
Замечания
- Аргументы должны быть числами, именами, массивами или ссылками, которые содержат числа.
- Если аргумент, который является массивом или ссылкой, содержит тексты, логические значения или пустые ячейки, то такие значения игнорируются; однако ячейки, которые содержат нулевые значения учитываются.
- Если множество данных не содержит одинаковых данных, то функция МОДА возвращает значение ошибки #Н/Д.
В наборе значений мода – это наиболее часто встречающееся значение; медиана – это значение в середине массива; среднее - это среднее арифметическое значение. Ни одно из этих чисел не характеризует в полной мере то, в какой степени центрированы данные. Пусть данные сгруппированы в трех областях, одна половина данных близка к некоторому малому значению, а другая половина данных близка к двум другим большим значениям. Обе функции, СРЗНАЧ и МЕДИАНА, могут вернуть значение из относительно пустой середины, а функция МОДА скорее всего вернет доминирующее малое значение.
Пример
МОДА({5,6; 4; 4; 3; 2; 4}) равняется 4.
______________________________
СЧЁТ
Подсчитывает количество чисел в списке аргументов. Функция СЧЁТ используется для получения количества числовых ячеек в интервалах или массивах ячеек.
Синтаксис
СЧЁТ(значение1; значение2; ...)
Значение1, значение2, ... - это от 1 до 30 аргументов, которые могут содержать или ссылаться на данные различных типов, но в подсчете участвуют только числа.
- Учитываются аргументы, которые являются числами, пустыми значениями, логическими значениями, датами, или текстами, изображающими числа; аргументы, которые являются значениями ошибки или текстами, которые нельзя интерпретировать как числа, игнорируются.
- Если аргумент является массивом или ссылкой, то подсчитываются только числа в этом массиве или ссылке. Пустые ячейки, логические значения, тексты и значения ошибок в массиве или ссылке игнорируются.
Примеры
СЧЁТ(A1:A7) возвращает 3;
СЧЁТ(A4:A7) возвращает 2;
СЧЁТ(A1:A7, 2) возвращает 4.
______________________________
СЧЁТЕСЛИ
Подсчитывает количество ячеек внутри диапазона, удовлетворяющих заданному критерию.
Синтаксис
СЧЁТЕСЛИ(диапазон; критерий)
Диапазон – это диапазон, в котором нужно подсчитать ячейки.
Критерий – это критерий в форме числа, выражения или текста, который определяет, какие ячейки надо подсчитывать. Например, критерий может быть выражен следующим образом: 32, "32", ">32", "яблоки".
Замечания
Microsoft Excel предлагает дополнительные функции, которые можно применять для анализа данных с использованием условий. Например, для вычисления суммы значений, попадающих в интервал, заданный текстовой строкой или числами, используйте функцию СУММЕСЛИ. Для получения формулы, возвращающей в зависимости от выполнения условия одно из двух значений, например вознаграждение по указанному объему продаж, используйте функцию ЕСЛИ.
Примеры
Пусть ячейки A3:A6 содержат "яблоки", "апельсины", "персики", "яблоки" соответственно:
СЧЁТЕСЛИ(A3:A6;"яблоки") равняется 2.
Пусть ячейки B3:B6 содержат 32, 54, 75 и 86 соответственно:
СЧЁТЕСЛИ(B3:B6;">55") равняется 2.
______________________________
ДИСП
Оценивает дисперсию по выборке.
Синтаксис
ДИСП(число1;число2; ...)
Число1, число2, ... - это от 1 до 30 числовых аргументов, соответствующих выборке из генеральной совокупности.
Замечания
- ДИСП предполагает, что аргументы являются только выборкой из генеральной совокупности. Если данные представляют всю генеральную совокупность, вычисляйте дисперсию, используя функцию ДИСПР.
- Логические значения, такие как ИСТИНА или ЛОЖЬ, а также текст игнорируются. Если они не должны игнорироваться, пользуйтесь функцией рабочего листа ДИСПА.
Пример
Предположим, что из инструментов, отштампованных одной и той же машиной, выбраны наугад 10 штук и испытаны на излом. Значения выборки (1345, 1301, 1368, 1322, 1310, 1370, 1318, 1350, 1303, 1299) сохранены в ячейках A2:E3 соответственно. Тогда функция ДИСП оценивает дисперсию сопротивления на излом для всех инструментов.
ДИСП(A2:E3) равняется 754,3.
______________________________
СТАНДОТКЛОН
Оценивает стандартное отклонение по выборке. Стандартное отклонение – это мера того, насколько широко разбросаны точки данных относительно их среднего.
Синтаксис
СТАНДОТКЛОН(число1; число2; ...)
Число1, число2, ... – это от 1 до 30 числовых аргументов, соответствующих выборке из генеральной совокупности. Можно использовать массив или ссылку на массив вместо аргументов, разделяемых точкой с запятой.
- Логические значения, такие как ИСТИНА или ЛОЖЬ, а также текст игнорируются. Если текст и логические значения игнорироваться не должны, следует использовать функцию рабочего листа СТАНДОТКЛОНА.
Замечания
- СТАНДОТКЛОН предполагает, что аргументы являются только выборкой из генеральной совокупности. Если данные представляют всю генеральную совокупность, то стандартное отклонение следует вычислять с помощью функции СТАНДОТКЛОНП.
- Стандартное отклонение вычисляется с использованием "несмещенного" или "n-1" метода.
Пример
СТАНДОТКЛОН(A2:E3) равняется 27,46.
______________________________
СКОС
Возвращает асимметрию распределения. Асимметрия характеризует степень несимметричности распределения относительно его среднего. Положительная асимметрия указывает на отклонение распределения в сторону положительных значений. Отрицательная асимметрия указывает на отклонение распределения в сторону отрицательных значений.
Синтаксис
СКОС(число1;число2; ...)
Число1, число2, ... - это от 1 до 30 аргументов, для которых вычисляется асимметричность. Можно использовать массив или ссылку на массив вместо аргументов, разделяемых точкой с запятой.
Замечания
- Аргументы должны быть числами или именами, массивами или ссылками, содержащими числа.
- Если аргумент, который является массивом или ссылкой, содержит тексты, логические значения или пустые ячейки, то такие значения игнорируются; однако ячейки, которые содержат нулевые значения, учитываются.
- Если имеется менее трех точек данных или стандартное отклонение равно нулю, то функция СКОС возвращает значение ошибки #ДЕЛ/0!.
Пример
СКОС(3;4;5;2;3;4;5;6;4;7) равняется 0,359543
ЭКСЦЕСС
Возвращает эксцесс множества данных. Эксцесс характеризует относительную остроконечность или сглаженность распределения по сравнению с нормальным распределением. Положительный эксцесс обозначает относительно остроконечное распределение. Отрицательный эксцесс обозначает относительно сглаженное распределение.
Синтаксис
ЭКСЦЕСС(число1;число2; ...)
Число1, число2, ... - это от 1 до 30 аргументов, для которых вычисляется эксцесс. Можно использовать массив или ссылку на массив вместо аргументов, разделяемых точкой с запятой.
Замечания
- Аргументы должны быть числами или именами, массивами или ссылками, содержащими числа.
- Если аргумент, который является массивом или ссылкой, содержит тексты, логические значения или пустые ячейки, то такие значения игнорируются; однако ячейки, которые содержат нулевые значения, учитываются.
- Если задано менее четырех точек данных или если стандартное отклонение выборки равняется нулю, то функция ЭКСЦЕСС возвращает значение ошибки #ДЕЛ/0!.
Пример
ЭКСЦЕСС(3;4;5;2;3;4;5;6;4;7) равняется -0,1518
______________________________
ХИ2ТЕСТ
Возвращает тест на независимость. ХИ2ТЕСТ возвращает значение для распределения хи-квадрат. Критерий хи-квадрат используется для определения того, подтверждается ли гипотеза экспериментом.
Синтаксис
ХИ2ТЕСТ(фактический_интервал;ожидаемый_интервал)
Фактический_интервал – это интервал данных, которые содержат наблюдения, подлежащие сравнению с ожидаемыми значениями.
Ожидаемый_интервал – это интервал данных, который содержит отношение произведений итогов по строкам и столбцам к общему итогу.
Заметки
- Если фактический_интервал и ожидаемый_интервал имеют различное количество точек данных, то функция ХИ2ТЕСТ возвращает значение ошибки #Н/Д.
- Критерий хи-квадрат сначала вычисляет хи-квадрат статистики, а затем ХИ2ТЕСТ возвращает вероятность для хи-квадрат статистики и степеней свободы df, где df = (r - 1)(c - 1).
______________________________
ХИ2ОБР
Возвращает значение, обратное к односторонней вероятности распределения хи-квадрат. Если вероятность = ХИ2РАСП(x;...), то ХИ2ОБР(вероятность;...) = x. функция используется для сравнения наблюдаемых результатов с ожидаемыми, для того чтобы решить, была ли исходная гипотеза обоснованной.
Синтаксис
ХИ2ОБР(вероятность;степени_свободы)
Вероятность – это вероятность, связанная с распределением хи-квадрат.
Степени_свободы – это число степеней свободы.
Заметки
- Если какой-либо из аргументов не является числом, то функция ХИ2ОБР возвращает значение ошибки #ЗНАЧ!.
- Если вероятность < 0 или вероятность > 1, то функция ХИ2ОБР возвращает значение ошибки #ЧИСЛО!.
- Если степени_свободы не целое, то оно усекается.
- Если степени_свободы < 1 или степени_свободы ≥ 102, ХИ2ОБР возвращает значение ошибки #ЧИСЛО!.
ПРИЛОЖЕНИЕ 4
Применение пакета анализа
Дата добавления: 2019-09-13; просмотров: 255; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!