Предварительный анализ данных описательная статистика



СОДЕРЖАНИЕ

 

Введение............................................................................................................................

Лабораторная работа №1. Предварительный анализ данных,

описательная статистика..................................................................................................

Лабораторная работа №2. Вычисление средних значений...........................................

Лабораторная работа №3. Нормальное распределение, обработка

экспериментальных данных............................................................................................

Лабораторная работа №4. Непараметрические статистические критерии.................

Лабораторная работа №5. Параметрические статистические критерии.....................

Лабораторная работа №6. Опрос по контрольным вопросам к работам 1-5..............

Лабораторная работа №7. Функция распределения, квантили....................................

Лабораторная работа №8. Аппроксимация данных и определение выбросов...........

Лабораторная работа №9. Интерполяция и экстраполяция..........................................

Лабораторная работа №10. Фильтрация данных...........................................................

Лабораторная работа №11. Опрос по контрольным вопросам к работам 7-10..........

Лабораторная работа №12. Контрольная расчетная работа по главным задачам пройденного материала.............................................................................................................................................

 


 

Введение

 

Курс «Метрология, стандартизация, сертификация» предполагает последовательное изучение трех дисциплин, нацеленных на достижение качества продукции и услуг. Метрология — наука об измерениях, об обеспечении их единства и способах достижения требуемой точности. Стандартизация — деятельность по разработке, опубликованию и применению стандартов, по установлению норм, правил и характеристик в целях обеспечения качества и безопасности продукции и услуг, технической совместимости и взаимозаменяемости. Сертификация — подтверждение соответствия продукции и услуг требованиям нормативных актов.

Среди многообразных задач метрологии, стандартизации, сертификации, встречающихся на практике, одними из главных являются:

а) статистический анализ выборок и графическое представление результатов

б) сравнение выборок, сделанных в разнообразных условиях, на основании статистических критериев

в) прогноз появления элементов в выборке

г) выделение закономерной и случайной составляющей в данных.

Указанные выше задачи наиболее часто встречаются в метрологии, когда становится необходимым оценка аппаратуры ее показаний; при стандартизации, когда необходимо выделить и охарактеризовать главные особенности, закрепляемые в технических регламентах, стандартах и других нормативных актах; в процессе сертификации, когда происходит проверка продукции, услуг и других объектов, с целью подтверждения их соответствия техническим регламентам и стандартам.

Лабораторные занятия по курсу опираются на знания, умения и навыки, полученные ранее как при изучении математики, физики, химии, информатики (вычисления, статистические методы, использование электронных таблиц), так и при изучении геолого-геофизических дисциплин (гравиразведка, магниторазведка и др.), также связанных с разнообразной обработкой данных.

Курс лабораторных занятий поможет не только закрепить полученные навыки, расширить знание методов обработки данных и возможностей электронных таблиц, но и дать понимание о статистической обработке информации в других сферах деятельности.

В ходе лабораторных занятий контролируются не только правильность расчетов, но и основные теоретические сведения, необходимые для понимания используемых методов обработки, посредством контрольных вопросов к каждой работе. Некоторые наиболее важных вопросы повторяются в списках контрольных вопросов.

Первые две работы (с относительно легкими заданиями) также нацелены на актуализацию умений и навыков использования электронных таблиц, получения навыков самоконтроля при выполнении вычислений и навыков оформления работы. Осуществляется промежуточный контроль посредством двух письменных опросов по группам контрольных вопросов, для закрепления полученной информации. В самом конце проводится контрольная расчетная работа по главным задачам пройденного материала. Такой подход в организации лабораторных работ в сочетании с контролем на лекциях пройденного материала прошлых лекций позволяет получить хороший итоговый уровень знаний, умений и навыков несмотря на разный уровень подготовки студентов вначале изучения курса «Метрология, стандартизация, сертификация».


Лабораторная работа №1

Предварительный анализ данных описательная статистика

 

Цель занятия: В программе Microsoft Excel (далее - Excel) выполнить расчет функции и определить ее статистические характеристики.

Решаемые задачи

1) Построение функции на заданном множестве.

2) Построение гистограмм.

3) Расчет описательной статистики с использованием «Пакета анализа».

4) Расчет описательной статистики с использованием встроенных функций Excel.

Задание 1

Исходные данные: файл MCC_1. xls

Номер задания(параметры задания)номер студента в списке группы;

Число отсчетовчисло значений функции, которые надо вычислить

Xmin - минимальное значение аргумента функции

Xmax - максимальное значение аргумента функции

Функция – функция, которую необходимо вычислить

Требуется:

1. Рассчитать значения аргумента функции

2. Рассчитать функцию по заданному аргументу.

3. Рассчитать среднее арифметическое, среднее геометрическое и среднее квадратическое используя формулы этих величин

4. Рассчитать среднее арифметическое и среднее геометрическое, используя встроенные функции Excel

 

Порядок выполнения работы

1. Создать файл в Excel вида Фамилия_МСС_Пр01. xls.

2. Из файла MCC_1. xls  взять: число отсчетов, Xmin, Xmax и Функцию, которую необходимо вычислить.

3. Вычислить столбец аргументов функции, используя исходные данные и формулу n-члена арифметической прогрессии.

4. Вычислить столбец значений функции.

5. Используя значения функции, вычислить среднее арифметическое по формуле

 

 


для вычисления суммы использовать СУММ – встроенную функцию Excel.

6. Используя значения функции, вычислить среднее геометрическое по формуле

 

 

 


для вычисления произведения использовать ПРОИЗВЕД – встроенную функцию Excel;

корень m-степени вычисляется как возведение в степень (1/m)

7. Используя значения функции, вычислить среднее квадратическое по формуле

 

 

для вычисления суммы квадратов использовать СУММКВ – встроенную функцию Excel.

8. Проверить вычисления среднего арифметического и среднего геометрического, рассчитав их с использованием СРЗНАЧ и СРГЕОМ - встроенных функций Excel.

 

 

Задание 2

Исходные данные: функция, рассчитанная в задании 1 лабораторной работы №1.

Требуется:

1. Рассчитать параметры гистограммы

2. Построить и оформить гистограмму средствами Excel

 

Порядок выполнения работы

1. Оценить оптимальное для функции количество интервалов n можно используя формулу Стерджесса:

N = 1+[3,322*lgN]

N — количество всех значений величины (функция СЧЕТ в Excel).

lg - десятичный логарифм (функция LOG10 в Excel).

квадратные скобки [ …] означают выделение целой части числа выражения (функция ОТБР в Excel)

 

2. Найти максимальное и минимальное значения функции (задание 1) с помощью функций Excel: МАКС и МИН

 

3. Найти ширину интервала для гистограммы как (МАКС-МИН)/n

 

4. Создаем столбец со значениями границ интервалов гистограммы от (МИН+ширина интервала) до (МАКС-ширина интервала) с шагом равным вычисленной ширине.

В результате получен массив границ интервалов или кратко Массив_интервалов.

 

5. Вычисляем частоты для каждого интервала гистограммы следующим образом.

- выделяем ячейки рядом с Массив_интервалов (количество элементов на единицу больше, чем в Массив_интервалов)

- нажимаем «F2» и вводим функцию Excel ЧАСТОТА, имеющей два аргумента: Массив_данных - функция, рассчитанная в задании 1 лабораторной работы №1, и Массив_интервалов

- нажать Ctr+Shift+Enter.

В выделенных ячейках появились частоты - количество значений функции (Массив_данных), которые попадают в заданные интервалы.

 

6. Найти сумму частот. Сумма должна быть равна числу отсчетов функции.

Если значения не совпадают, то какой-то из п.1-5 выполнен неправильно.

 

7. Вычислить относительные частоты (разделить значения из столбца с абсолютными частотами на их сумму и умножить на 100)

 

8. Построить в Excel диаграмму (обычная - гистограмма с группировкой) для полученных распределений относительных частот.

 

9. Перенести диаграмму на отдельный лист D-Гист следующим образом:

- щелкнуть правой клавишей мыши на диаграмме

- в контекстном меню задать команду «Переместить диаграмму» как показано на рис.1.1.

 

 

Рис. 1.1. Перемещение диаграммы на отдельный лист

 

10. Сделать подпись вертикальной оси Относительная частота, %.

Сделать подписи горизонтальной оси Величина

 

11. Создать столбец с подписями границ диапазонов - текстовые значения вида «мин-макс.». Границы округлять до одного знака после запятой, отрицательные числа заключать в круглые скобки. Нанести на диаграмму эти подписи, должна получиться диаграмма, сходная по виду с диаграммой, представленной на рис.1.2.

Если на диаграмме больше десятка столбцов, то значит ширина интервала вычислена неправильно, и задание нужно переделать заново.

 

 

Рис. 1.2. Примерный вид результирующей гистограммы

 

 

Задание 3

Исходные данные: функция, рассчитанная в задании 1 лабораторной работы №1.

Требуется:

1. Выполнить расчет описательной статистики с использованием «Пакета анализа».

2. Выполнить расчет описательной статистики с использованием встроенных функций Excel.

 

Порядок выполнения работы

1. Открыть вкладку «Данные», справа должна быть группа «Анализ» (рис.1.3)

 

Рис. 1.3. Вид группы «Анализ»

 

 

2. Щелкнуть мышкой на кнопке «Анализ данных».

В диалоговом окне выбрать «Описательная статистика» (рис.1.4)

 

Рис. 1.4. Диалоговое окно
«Анализ данных»

 

 

3. В новом диалоговом окне указать (рис. 1.5):

 

 

Рис. 1.4. Диалоговое окно
«Описательная статистика»

 

- входной интервал (функция, рассчитанная в задании 1)

- вывод результатов на новый рабочий лист, лист назвать ОпСтат

- отметить галочками: Итоговая статистика и Уровень надежности,

для последнего указать 95% (95% вычисляет уровень надежности среднего со значимостью 0.05)

- К-наибольший = 2

- К-наименьший = 2

 

3. Работать на листе ОпСтат и создав новый столбец Расчет, где вычислять с помощью встроенных функций Excel, указанных на рис. 1.5.

На рисунке приведены только названия функций, для получения численного результата нужны подставить аргументы: функция, рассчитанная в задании 1 и возможно еще один аргумент как в функциях НАИБОЛЬШИЙ и НАИМЕНЬШИЙ.

 

 

Рис.1.5. Соответствие результатов работы «Анализ данных»-«Описательная статистика» встроенным функциям Excel

 

4. Работать на листе ОпСтат и создав новый столбец Расчет2, где вычислять на основании формул следующие величины.

- Стандартное отклонение (выборки) sВ

 

 

 


- Стандартная ошибка (среднеквадратическое отклонение выборочного среднего s)

 

 


- Дисперсия выборки sВ2

 

- Коэффициент вариации

 

 

 


5. Создать новый лист Квартили и на нем вычислить использовать функцию КВАРТИЛЬ (или КВАРТИЛЬ.ВКЛ) первый, второй и третий квартили

 

Контрольные вопросы по лабораторной работе №1

 

1. Что за число 1E-6

 

2. Что больше 1.3E-5 или 4.4Е-7 (или любой другой аналогичный пример)

 

3. Написать формулу среднего арифметического

 

4. Написать формулу среднего геометрического

 

5. Объяснить когда невозможно вычислить среднее геометрическое

 

6. Написать формулу среднего квадратического

 

7. Что такое логарифм числа b по основанию a

 

8. Что такое основание натурального логарифма

 

9. Что дает EXCEL-функция СЧЕТ

 

10. Что такое 0, 1, 2, 3, 4 квартиль.

 

11. Что такое медиана.

 

12. Как связаны стандартное отклонение и дисперсия

 

13. Чем отличаются стандартная ошибка и стандартное отклонение

 

14. Написать формулу стандартного отклонения (выборки)

 

15. Написать формулу стандартной ошибки

 

16. Написать формулу Стерджесса

 

17. Сколько интервалов получается по формуле Стерджесса для функции из 10, 100 и 1000 значений.

 

18. Формула n-члена арифметической прогрессии

 

19. Формула шага арифметической прогрессии при заданном первом и n члене прогрессии.


Лабораторная работа №2

Вычисление средних значений

Цель занятия: В программе Microsoft Excel (далее - Excel) выполнить расчет средних величин.

Решаемые задачи

1) Преобразование данных и добавление случайной составляющей.

2) Расчет средней арифметической величины (простой и взвешенной).

3) Расчет средней геометрической и квадратической величины.

4) Расчет средней гармонической и медианы

5) Построение диаграммы для визуализация средних значений

Задание 1

Исходные данные: функция, рассчитанная в задании 1 лабораторной работы №1.

Требуется:

1. Добавить случайную составляющую

2. Преобразовать данные

3. Построить и оформить диаграмму средствами Excel

 

Порядок выполнения работы

1. Создать файл в Excel вида Фамилия_МСС_Пр02. xls.

 

2. Из файла предыдущей лабораторной работы (Фамилия_МСС_Пр01. xls) перенести два столбца: значения аргумента (X) и функции (Y)

 

3. Создать столбец случайных чисел с использованием функции Excel СЛЧИС() /не забывать ставить пустые скобки при записи функции/.

Случайных чисел должен быть столько же, сколько значений аргумента.

Случайные числа получаются больше или равны 0 и меньше 1.

 

4. Зафиксируем случайные числа. Для этого выделить столбец случайных чисел, скопировать и выполнить команду меню «Специальная вставка». В появившемся диалоговом окне (рис.2.1) отметить пункт «значения и нажать» кнопку ОК.

Будут вставлены числа, которые далее не меняются. Набор назовем СЛ

 

 

Рис. 2.1. Диалоговое окно
«Специальная вставка»

 

5. Получим три новых набора данных (со случайной составляющей) по формуле

Yновое = Y + k*Y*СЛ

где k=0.5, k=0.05, k=0.005

 

6. Преобразовать все три набора значений Yновое так чтобы они стали положительными:

Yновое2 = Yновое - 1.001*МИН(Yновое)

 

7. Построить точечные диаграммы для Yновое2 (линии прямые, маркеров нет, три линии на одной диаграмме, легенда с условными знаками внизу).

Перенести на отдельный лист диаграмм (перенос см. в задании 2 лабораторной работы №1). Лист назвать D1.

 

Задание 2

Исходные данные: функция Yновое2 (k=0.05), рассчитанная в задании 1 лабораторной работы №2.

Требуется:

1. Найти среднюю арифметическую величину

2. Найти среднюю арифметическую взвешенную величину

3. Определить степень расхождения этих величин

 

Порядок выполнения работы

1. Найти среднюю арифметическую величину с использованием СРЗНАЧ - встроенной функции Excel

 

2. Подготовить столбец весов Весi по формуле

Весi = СЛi/СУММ(СЛi)

где СЛi – набор случайных чисел, см. задание 1 лабораторной работы №2.

 

3. Найти среднее взвешенное значение по формуле

 

где fi – веса, Zi – усредняемые значения, т.е. Yновое2 (k=0.05),

 

4. Определить на сколько процентов различаются средняя арифметическая и средняя арифметическая взвешенная величина по формуле:

 

 

 


Задание 3

Исходные данные: функция Yновое2 (k=0.05), рассчитанная в задании 1 лабораторной работы №2.

Требуется:

1. Найти среднюю геометрическую величину

2. Определить степень расхождения средней геометрической, средней арифметической и средней арифметической взвешенной

3. Найти среднюю квадратическую изменения величины

 

Порядок выполнения работы

1. Вычислить среднее геометрическое по формуле

 

для вычисления произведения использовать ПРОИЗВЕД – встроенную функцию Excel;

корень m-степени вычисляется как возведение в степень (1/m)

 

2. Определить на сколько процентов различаются среднее арифметическое и среднее геометрическое (данные см. задание 2 лабораторной работы №2).

 

 

 


3. Вычислить DYновое2 изменение величины Yновое2: для этого вычислить разность текущего и предыдущего значения, начиная со второго значения (число значений изменения будет на 1 меньше исходных данных)

 

4. Используя значения DYновое2, вычислить среднее квадратическое по формуле

 

 

для вычисления суммы квадратов использовать СУММКВ – встроенную функцию Excel.

 

Задание 4

Исходные данные: функция Yновое2 (k=0.05), рассчитанная в задании 1 лабораторной работы №2.

Требуется:

1. Найти среднюю гармоническую величину. Определить степень расхождения средней арифметической и средней гармонической величин.

2. Найти среднюю квадратическую величину. Определить степень расхождения средней арифметической и средней квадратической величин.

3. Найти медиану. Определить степень расхождения средней арифметической и медианы.

4. Построить графики исходной величины и средних величин (квадратической, гармонической, геометрической, средней арифметической) и медианы.

 

Порядок выполнения работы

1. Вычислить среднюю гармоническую с использовать функцию Excel СРГАРМ

 

2. Определить на сколько процентов различаются среднее арифметическое и среднее гармоническое (получить формулу по аналогии с заданиями 2 и 3)

 

3. Вычислить среднюю квадратическую величину по формуле

 

 


для вычисления суммы квадратов использовать СУММКВ – встроенную функцию Excel.

 

4. Определить на сколько процентов различаются среднее арифметическое и среднее квадратическое (получить формулу по аналогии с заданиями 2 и 3)

 

5. Определить медиану с использованием функцию Excel МЕДИАНА

 

6. Определить на сколько процентов различаются среднее арифметическое и медиана (получить формулу по аналогии с заданиями 2 и 3)

 

7. Построить точечные диаграммы для Yновое2 (k=0.05) (линии прямые, маркеров нет, три линии на одной диаграмме, легенда с условными знаками внизу) а также среднего арифметического, квадратического, гармонического, геометрического) и медианы.
Графики средних и медианы – это прямые горизонтальные линии, которые задаются двумя парами значений: (Xmin, Yср.) и (Xmax, Yср.)

Перенести на отдельный лист диаграмм (перенос см. в задании 2 лабораторной работы №1). Лист назвать D2.

 

 

Контрольные вопросы по лабораторной работе №2

 

1. Если массовые доли равны 0.05, 0.05, 0.1, 0.8 для веществ с молекулярными массами 20, 24, 30, 200, может ли быть средняя взвешенная молекулярная масса

а) меньше 20?

б) больше 200?

в) меньше 100?

Объяснить почему.

 

2. Привести примеры, когда могут быть случаи:

а) медиана меньше среднего арифметического

б) медиана равна среднему арифметическому

в) медиана больше среднего арифметического

 

3. Написать формулы среднего арифметического (простого и взвешенного)

 

4. Написать формулы среднего геометрического (простого и взвешенного)

 

5. Написать формулы среднего квадратического (простого и взвешенного)

 

6. Написать формулы среднего кубического (простого и взвешенного)

 

7. По итогам лабораторной работы что больше: среднее арифметическое, гармоническое, геометрическое или квадратическое или медиана?

 

 


Лабораторная работа №3


Дата добавления: 2019-07-15; просмотров: 494; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!