Оценка достоверности расхождения или согласия распределений (критерий l - Колмогорова-Смирнова)



 

Задание. Рассмотрим распределение красного цвета в 8-цветном тесте М. Люшера. Можно ли утверждать, что распределение красного цвета по 8-и позициям в выборке A у здоровых испытуемых отличается от равномерного распределения? Можно ли утверждать, что распределение красного цвета в выборке A и выборке B не различается?

 

Разряды - позиции цвета

1 вариант

2 вариант

3 вариант

4 вариант

A B A B A B A B
1 22 98 10 92 12 50 12 19
2 25 100 15 98 12 10 14 10
3 13 116 16 116 21 60 11 34
4 8 87 25 82 8 10 6 10
5 15 91 12 91 6 10 4 10
6 10 112 8 112 8 112 5 12
7 9 97 14 97 14 97 10 97
8 8 86 9 86 9 10 9 10

 

Разряды - позиции цвета

5 вариант

6 вариант

7 вариант

8 вариант

A B A B A B A B
1 22 92 10 98 12 19 12 50
2 25 98 15 100 12 10 14 55
3 13 116 16 116 21 34 16 58
4 8 82 25 87 8 10 21 60
5 15 91 12 91 6 10 18 44
6 10 112 8 112 8 12 15 40
7 9 97 14 97 14 97 10 20
8 8 86 9 86 9 10 9 10

 

Разряды - позиции цвета

9 вариант

10 вариант

11 вариант

12 вариант

A B A B A B A B
1 12 59 10 98 8 48 10 92
2 14 46 15 100 10 55 15 98
3 16 42 16 116 15 58 16 116
4 21 35 25 87 21 55 25 82
5 18 20 12 91 18 30 12 91
6 15 24 8 112 15 40 8 112
7 10 28 14 97 10 20 14 97
8 8 86 9 86 9 10 9 10

 

Рекомендации для выполнения лабораторных работ на компьютере:

· эмпирическое значение критерия l – Колмогорова-Смирнова находится с использованием формул в среде Excel.

 

 

Лабораторная работа №10

Многофункциональный критерий Фишера

Задание. В выборке студентов факультета психологии Санкт-Петербургского университета с помощью «карандашного» теста определялось преобладание левого (количество А) или правого (количество В) глаза в прицельной способности глаз. Совпадают ли эти данные с результатами обследова­ния 100 студентов медицинских специальностей, представленными в другом эксперименте?

 

 

 

1 вариант

2 вариант

3 вариант

4 вариант

5 вариант

6 вариант

А В А В А В А В А В А В
Студенты-психологи 6 8 8 6 5 8 19 25 16 18 7 8
Студенты медики 19 81 75 25 15 85 45 55 68 32 40 60

 

 

7 вариант

8 вариант

9 вариант

10 вариант

11 вариант

12 вариант

А В А В А В А В А В А В
Студенты-психологи 5 7 7 5 4 7 18 24 15 17 6 7
Студенты медики 68 32 40 60 19 81 75 25 15 85 45 55

 

Рекомендации для выполнения лабораторных работ на компьютере:

· эмпирическое значение критерия Фишера находится с использованием формул в среде Excel.

 


 

 


ПРИЛОЖЕНИЕ 3

 

Описание статистических функций

Табличного процессора Microsoft Excel


ЧАСТОТА

Вычисляет частоту появления значений в интервале значений и возвращает массив цифр. Функция ЧАСТОТА может быть использована, например, для подсчета количества результатов тестирования, попадающих в интервалы результатов. Поскольку данная функция возвращает массив, она должна задаваться в качестве формулы массива.

Синтаксис

ЧАСТОТА(массив_данных;массив_карманов)

Массив_данных – это массив или ссылка на множество данных, для которых вычисляются частоты. Если массив_данных не содержит значений, то функция ЧАСТОТА возвращает массив нулей.

Массив_карманов – это массив или ссылка на множество интервалов, в которые группируются значения аргумента массив_данных. Если массив_карманов не содержит значений, то функция ЧАСТОТА возвращает количество элементов в аргументе массив_данных.

Замечания

  • ЧАСТОТА вводится как формула массива после выделения интервала смежных ячеек, в которые нужно вернуть полученный массив распределения.
  • Количество элементов в возвращаемом массиве на единицу больше числа элементов в массив_карманов. Дополнительный элемент в возвращаемом массиве содержит количество значений, больших чем максимальное значение в интервалах. Например, при подсчете трех диапазонов значений (интервалов), введенных в три ячейки, убедитесь в том, что функция ЧАСТОТА возвращает значения в четырех ячейках. Дополнительная ячейка возвращает число значений в массив_данных, больших чем значение границы третьего интервала.
  • ЧАСТОТА игнорирует пустые ячейки и тексты.
  • Формулы, которые возвращают массивы, должны быть введены как формулы массивов.

Пример

Предположим, что на рабочем листе перечислены результаты тестирования в баллах. Баллы 79, 85, 78, 85, 83, 81, 95, 88 и 97 введены в ячейки A1:A9 соответственно. Тогда аргумент массив_данных содержит столбец этих баллов. Аргумент массив_карманов будет другим столбцом, задающим интервалы, в которые должны быть сгруппированы данные В данном примере массив_карманов – это интервал ячеек C4:C6, который будет содержать значения 70, 79, 89. Если ввести функцию ЧАСТОТА как формулу массива, то можно подсчитать количество результатов тестирования, попадающих в интервалы 0-70, 71-79, 80-89 и 90-100. В этом примере предполагается, что все баллы – целые числа. Следующая формула вводится как формула массива после выделения четырех вертикально смежных ячеек для результата. Четвертое число (2) представляет собой счетчик значений (95 и 97), которые больше чем граница наибольшего интервала (89).

ЧАСТОТА(A1:A9;C4:C6) равняется {0:2:5:2}

______________________________

РАНГ

Возвращает ранг числа в списке чисел. Ранг числа - это его величина относительно других значений в списке. (Если список отсортировать, то ранг числа будет его позицией.)

Синтаксис

РАНГ(число;ссылка;порядок)

Число - это число, для которого определяется ранг.

Ссылка - это массив или ссылка на список чисел. Нечисловые значения в ссылке игнорируются.

Порядок - это число, определяющее способ упорядочения.

  • Если порядок равен 0 (нулю) или опущен, то Microsoft Excel определяет ранг числа так, как если бы ссылка была списком, отсортированным в порядке убывания.
  • Если порядок - это любое ненулевое число, то Microsoft Excel определяет ранг числа так, как если бы ссылка была списком, отсортированным в порядке возрастания.

Замечания

РАНГ присваивает повторяющимся числам одинаковый ранг. Однако наличие повторяющихся чисел влияет на ранг последующих чисел. Например, для списка целых, если число 10 появляется дважды и имеет ранг 5, то 11 будет иметь ранг 7 (и никакое число не будет иметь ранг 6).

Примеры

Если ячейки A1:A5 содержат числа 7, 3,5, 3,5, 1 и 2 соответственно, то:

РАНГ(A2;A1:A5;1) равняется 3;

РАНГ(A1;A1:A5;1) равняется 5.

МАКС

Возвращает наибольшее значение из набора значений.

Синтаксис

МАКС(число1;число2; ...)

Число1, число2, ... - это от 1 до 30 чисел, среди которых ищется максимальное значение.

  • Можно задавать аргументы, которые являются числами, пустыми ячейками, логическими значениями или текстовыми представлениями чисел. Аргументы, которые являются значениями ошибки или текстами, не преобразуемыми в числа, вызывают значения ошибок.
  • Если аргумент является массивом или ссылкой, то в нем учитываются только числа. Пустые ячейки, логические значения или текст в массиве или ссылке игнорируются. Если логические значения или текст не должны игнорироваться, следует использовать функцию МАКСА.
  • Если аргументы не содержат чисел, то функция МАКС возвращает 0 (ноль).

Примеры

Если ячейки A1:A5 содержат числа 10, 7, 9, 27 и 2, то:

МАКС(A1:A5) равняется 27;

МАКС(A1:A5;30) равняется 30.

______________________________

МИН

Возвращает наименьшее значение в списке аргументов.

Синтаксис

МИН(число1;число2; ...)

Число1, число2, ... – это от 1 до 30 чисел, среди которых ищется минимальное значение.

  • Можно задавать аргументы, которые являются числами, пустыми ячейками, логическими значениями или текстовыми представлениями чисел. Аргументы, которые являются значениями ошибки или текстами, не преобразуемыми в числа, вызывают значения ошибок.
  • Если аргумент является массивом или ссылкой, то учитываются только числа. Пустые ячейки, логические значения или тексты в массиве или ссылке игнорируются. Если логические значения или тексты игнорироваться не должны, следует пользоваться функцией МИНА.
  • Если аргументы не содержат чисел, то функция МИН возвращает 0.

Примеры

Если ячейки A1:A5 содержат числа 10, 7, 9, 27 и 2, то:

МИН(A1:A5) равняется 2;

МИН(A1:A5; 0) равняется 0;

МИН подобна функции МАКС. См. также примеры к функции МАКС.

______________________________

СРЗНАЧ

Возвращает среднее (арифметическое) своих аргументов.

Синтаксис

СРЗНАЧ(число1; число2; ...)

Число1, число2, ... - это от 1 до 30 аргументов, для которых вычисляется среднее.

Замечания

  • Аргументы должны быть числами или именами, массивами или ссылками, содержащими числа.
  • Если аргумент, который является массивом или ссылкой, содержит тексты, логические значения или пустые ячейки, то такие значения игнорируются; однако, ячейки, которые содержат нулевые значения, учитываются.

Совет. Вычисляя средние значения ячеек, следует учитывать различие между пустыми ячейками и ячейками, содержащими нулевые значения, особенно если не установлен флажок Нулевые значения на вкладке Вид (команда Параметры, меню Сервис). Пустые ячейки не учитываются, но нулевые ячейки учитываются.

Примеры

Если ячейки A1:A5 имеют имя Баллы и содержат числа 10, 7, 9, 27 и 2, то:

СРЗНАЧ(A1:A5) равняется 11;

СРЗНАЧ(Баллы) равняется 11;

СРЗНАЧ(A1:A5; 5) равняется 10;

СРЗНАЧ(A1:A5) равняется СУММ(A1:A5)/СЧЁТ(A1:A5) и равняется 11;

Если ячейки C1:C3 имеют имя ДругиеБаллы и содержат числа 4, 18 и 7, то:

СРЗНАЧ(Баллы; ДругиеБаллы) равняется 10,5.

______________________________

МЕДИАНА

Возвращает медиану заданных чисел. Медиана - это число, которое является серединой множества чисел, то есть половина чисел имеют значения большие, чем медиана, а половина чисел имеют значения меньшие, чем медиана.

Синтаксис

МЕДИАНА(число1;число2; ...)

Число1, число2, ... - это от 1 до 30 чисел, для которых определяется медиана.

  • Аргументы должны быть числами или именами, массивами или ссылками, содержащими числа. Microsoft Excel проверяет все числа, содержащиеся в аргументах, которые являются массивами или ссылками.
  • Если аргумент, который является массивом или ссылкой, содержит тексты, логические значения или пустые ячейки, то такие значения игнорируются; однако, ячейки, которые содержат нулевые значения учитываются.

Замечания

Если в множестве четное количество чисел, то функция МЕДИАНА вычисляет среднее двух чисел, находящихся в середине множества. См. второй из следующих примеров.

Примеры

МЕДИАНА(1; 2; 3; 4; 5) равняется 3

МЕДИАНА(1; 2; 3; 4; 5; 6) равняется 3,5, среднее 3 и 4

______________________________

МОДА

Возвращает наиболее часто встречающееся или повторяющееся значение в массиве или интервале данных. Также как и функция МЕДИАНА, функция МОДА является мерой взаиморасположения значений

Синтаксис

МОДА(число1;число2; ...)

Число1, число2, ... - это от 1 до 30 аргументов, для которых вычисляется мода. Можно использовать один массив или одну ссылку на массив вместо аргументов, разделяемых точкой с запятой.

Замечания

  • Аргументы должны быть числами, именами, массивами или ссылками, которые содержат числа.
  • Если аргумент, который является массивом или ссылкой, содержит тексты, логические значения или пустые ячейки, то такие значения игнорируются; однако ячейки, которые содержат нулевые значения учитываются.
  • Если множество данных не содержит одинаковых данных, то функция МОДА возвращает значение ошибки #Н/Д.

В наборе значений мода – это наиболее часто встречающееся значение; медиана – это значение в середине массива; среднее - это среднее арифметическое значение. Ни одно из этих чисел не характеризует в полной мере то, в какой степени центрированы данные. Пусть данные сгруппированы в трех областях, одна половина данных близка к некоторому малому значению, а другая половина данных близка к двум другим большим значениям. Обе функции, СРЗНАЧ и МЕДИАНА, могут вернуть значение из относительно пустой середины, а функция МОДА скорее всего вернет доминирующее малое значение.

Пример

МОДА({5,6; 4; 4; 3; 2; 4}) равняется 4.

______________________________

СЧЁТ

Подсчитывает количество чисел в списке аргументов. Функция СЧЁТ используется для получения количества числовых ячеек в интервалах или массивах ячеек.

Синтаксис

СЧЁТ(значение1; значение2; ...)

Значение1, значение2, ... - это от 1 до 30 аргументов, которые могут содержать или ссылаться на данные различных типов, но в подсчете участвуют только числа.

  • Учитываются аргументы, которые являются числами, пустыми значениями, логическими значениями, датами, или текстами, изображающими числа; аргументы, которые являются значениями ошибки или текстами, которые нельзя интерпретировать как числа, игнорируются.
  • Если аргумент является массивом или ссылкой, то подсчитываются только числа в этом массиве или ссылке. Пустые ячейки, логические значения, тексты и значения ошибок в массиве или ссылке игнорируются.

Примеры

СЧЁТ(A1:A7) возвращает 3;

СЧЁТ(A4:A7) возвращает 2;

СЧЁТ(A1:A7, 2) возвращает 4.

______________________________

СЧЁТЕСЛИ

Подсчитывает количество ячеек внутри диапазона, удовлетворяющих заданному критерию.

Синтаксис

СЧЁТЕСЛИ(диапазон; критерий)

Диапазон – это диапазон, в котором нужно подсчитать ячейки.

Критерий – это критерий в форме числа, выражения или текста, который определяет, какие ячейки надо подсчитывать. Например, критерий может быть выражен следующим образом: 32, "32", ">32", "яблоки".

Замечания

Microsoft Excel предлагает дополнительные функции, которые можно применять для анализа данных с использованием условий. Например, для вычисления суммы значений, попадающих в интервал, заданный текстовой строкой или числами, используйте функцию СУММЕСЛИ. Для получения формулы, возвращающей в зависимости от выполнения условия одно из двух значений, например вознаграждение по указанному объему продаж, используйте функцию ЕСЛИ.

Примеры

Пусть ячейки A3:A6 содержат "яблоки", "апельсины", "персики", "яблоки" соответственно:

СЧЁТЕСЛИ(A3:A6;"яблоки") равняется 2.

Пусть ячейки B3:B6 содержат 32, 54, 75 и 86 соответственно:

СЧЁТЕСЛИ(B3:B6;">55") равняется 2.

______________________________

ДИСП

Оценивает дисперсию по выборке.

Синтаксис

ДИСП(число1;число2; ...)

Число1, число2, ... - это от 1 до 30 числовых аргументов, соответствующих выборке из генеральной совокупности.

Замечания

  • ДИСП предполагает, что аргументы являются только выборкой из генеральной совокупности. Если данные представляют всю генеральную совокупность, вычисляйте дисперсию, используя функцию ДИСПР.
  • Логические значения, такие как ИСТИНА или ЛОЖЬ, а также текст игнорируются. Если они не должны игнорироваться, пользуйтесь функцией рабочего листа ДИСПА.

Пример

Предположим, что из инструментов, отштампованных одной и той же машиной, выбраны наугад 10 штук и испытаны на излом. Значения выборки (1345, 1301, 1368, 1322, 1310, 1370, 1318, 1350, 1303, 1299) сохранены в ячейках A2:E3 соответственно. Тогда функция ДИСП оценивает дисперсию сопротивления на излом для всех инструментов.

ДИСП(A2:E3) равняется 754,3.

______________________________

СТАНДОТКЛОН

Оценивает стандартное отклонение по выборке. Стандартное отклонение – это мера того, насколько широко разбросаны точки данных относительно их среднего.

Синтаксис

СТАНДОТКЛОН(число1; число2; ...)

Число1, число2, ... – это от 1 до 30 числовых аргументов, соответствующих выборке из генеральной совокупности. Можно использовать массив или ссылку на массив вместо аргументов, разделяемых точкой с запятой.

  • Логические значения, такие как ИСТИНА или ЛОЖЬ, а также текст игнорируются. Если текст и логические значения игнорироваться не должны, следует использовать функцию рабочего листа СТАНДОТКЛОНА.

Замечания

  • СТАНДОТКЛОН предполагает, что аргументы являются только выборкой из генеральной совокупности. Если данные представляют всю генеральную совокупность, то стандартное отклонение следует вычислять с помощью функции СТАНДОТКЛОНП.
  • Стандартное отклонение вычисляется с использованием "несмещенного" или "n-1" метода.

Пример

СТАНДОТКЛОН(A2:E3) равняется 27,46.

______________________________

СКОС

Возвращает асимметрию распределения. Асимметрия характеризует степень несимметричности распределения относительно его среднего. Положительная асимметрия указывает на отклонение распределения в сторону положительных значений. Отрицательная асимметрия указывает на отклонение распределения в сторону отрицательных значений.

Синтаксис

СКОС(число1;число2; ...)

Число1, число2, ... - это от 1 до 30 аргументов, для которых вычисляется асимметричность. Можно использовать массив или ссылку на массив вместо аргументов, разделяемых точкой с запятой.

Замечания

  • Аргументы должны быть числами или именами, массивами или ссылками, содержащими числа.
  • Если аргумент, который является массивом или ссылкой, содержит тексты, логические значения или пустые ячейки, то такие значения игнорируются; однако ячейки, которые содержат нулевые значения, учитываются.
  • Если имеется менее трех точек данных или стандартное отклонение равно нулю, то функция СКОС возвращает значение ошибки #ДЕЛ/0!.

Пример

СКОС(3;4;5;2;3;4;5;6;4;7) равняется 0,359543

ЭКСЦЕСС

Возвращает эксцесс множества данных. Эксцесс характеризует относительную остроконечность или сглаженность распределения по сравнению с нормальным распределением. Положительный эксцесс обозначает относительно остроконечное распределение. Отрицательный эксцесс обозначает относительно сглаженное распределение.

Синтаксис

ЭКСЦЕСС(число1;число2; ...)

Число1, число2, ... - это от 1 до 30 аргументов, для которых вычисляется эксцесс. Можно использовать массив или ссылку на массив вместо аргументов, разделяемых точкой с запятой.

Замечания

  • Аргументы должны быть числами или именами, массивами или ссылками, содержащими числа.
  • Если аргумент, который является массивом или ссылкой, содержит тексты, логические значения или пустые ячейки, то такие значения игнорируются; однако ячейки, которые содержат нулевые значения, учитываются.
  • Если задано менее четырех точек данных или если стандартное отклонение выборки равняется нулю, то функция ЭКСЦЕСС возвращает значение ошибки #ДЕЛ/0!.

Пример

ЭКСЦЕСС(3;4;5;2;3;4;5;6;4;7) равняется -0,1518

______________________________

ХИ2ТЕСТ

Возвращает тест на независимость. ХИ2ТЕСТ возвращает значение для распределения хи-квадрат. Критерий хи-квадрат используется для определения того, подтверждается ли гипотеза экспериментом.

Синтаксис

ХИ2ТЕСТ(фактический_интервал;ожидаемый_интервал)

Фактический_интервал – это интервал данных, которые содержат наблюдения, подлежащие сравнению с ожидаемыми значениями.

Ожидаемый_интервал – это интервал данных, который содержит отношение произведений итогов по строкам и столбцам к общему итогу.

Заметки

  • Если фактический_интервал и ожидаемый_интервал имеют различное количество точек данных, то функция ХИ2ТЕСТ возвращает значение ошибки #Н/Д.
  • Критерий хи-квадрат сначала вычисляет хи-квадрат статистики, а затем ХИ2ТЕСТ возвращает вероятность для хи-квадрат статистики и степеней свободы df, где df = (r - 1)(c - 1).

______________________________

ХИ2ОБР

Возвращает значение, обратное к односторонней вероятности распределения хи-квадрат. Если вероятность = ХИ2РАСП(x;...), то ХИ2ОБР(вероятность;...) = x. функция используется для сравнения наблюдаемых результатов с ожидаемыми, для того чтобы решить, была ли исходная гипотеза обоснованной.

Синтаксис

ХИ2ОБР(вероятность;степени_свободы)

Вероятность – это вероятность, связанная с распределением хи-квадрат.

Степени_свободы – это число степеней свободы.

Заметки

  • Если какой-либо из аргументов не является числом, то функция ХИ2ОБР возвращает значение ошибки #ЗНАЧ!.
  • Если вероятность < 0 или вероятность > 1, то функция ХИ2ОБР возвращает значение ошибки #ЧИСЛО!.
  • Если степени_свободы не целое, то оно усекается.
  • Если степени_свободы < 1 или степени_свободы ≥ 102, ХИ2ОБР возвращает значение ошибки #ЧИСЛО!.

 

 


 

 


ПРИЛОЖЕНИЕ 4

 

Применение пакета анализа


Дата добавления: 2019-09-13; просмотров: 255; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!