Построение гистограммы. Нормальное распределение. Параметрические и непараметрические методы анализа данных.
Гистограмма — способ графического представления табличных данных.
Построение гситограммы:
Шаг 1: вызовем Мастер диаграмм, выберем тип диаграммы Гистограмма, вид гистограммы – Обычная гистограмма;
Шаг 2: выбираем вкладку Конструктор, кнопку Выбрать данные, заполняем значения полей;
Шаг 3: настройка параметров диаграммы. С помощью вкладок Макет и Формат задайте параметры визуализации и формат диаграммы, настройте размещение легенды внизу диаграммы, включите в подписи данных значения.
Нормальное распределение
Как определить, является ли распределение признака нормальным?
1)Построить гистограмму, оценить визуально:
А)нормальное распределение симметрично относительно среднего значения;
Б)асимметрия и эксцесс равны нулю;
В)среднее значение, мода и медиана совпадают.
2)Найти среднее значение и стандартное отклонение s , для нормального закона распределения приблизительно:
А)68% значений находятся в интервале ±s;
Б)95% – в интервале ±2s;
В)99% – в интервале ±3s.
Воспользоваться проверкой статистических гипотез о виде распределения.
Основы корреляционного анализа.
Корреляционный анализ – статистический метод, позволяющий определить, существует ли зависимость между переменными и на сколько она сильна.
Задачей корреляционного анализа является количественное определение тесноты связи между двумя признаками (при парной связи) и между результативным и множеством факторных признаков (при многофакторной связи).
|
|
Теснота связи количественно выражается величиной коэффициентов корреляции, которые давая количественную характеристику тесноты связи между признаками, позволяют определять «полезность» факторных признаков при построении уравнения множественной регрессии.
Корреляция взаимосвязана с регрессией, поскольку первая оценивает силу (тесноту) статистической связи, вторая исследует ее форму.
Регрессионный анализ заключается в определении аналитического выражения связи в виде уравнения регрессии.
Регрессией называется зависимость среднего значения случайной величины результативного признака от величины факторного, а уравнением регрессии – уравнение описывающее корреляционную зависимость между результативным признаком и одним или несколькими факторными.
Основные понятия: информационная система, база данных, система управления базами данных.
Информационная система (ИС) – взаимосвязанная совокупность средств, методов и персонала, используемых для хранения, обработки и выдачи информации в интересах достижения поставленной цели.
База данных (БД) – структурированная совокупность данных, организованная по определенным правилам.
|
|
Система управления базами данных (СУБД) – это совокупность языковых и программных средств, предназначенных для создания, ведения и использования БД. СУБД позволяют структурировать, систематизировать и организовывать данные для компьютерного хранения и обработки.
Виды моделей данных в СУБД.
Иерархическая модель
Отношения в иерархической модели данных организованы в виде совокупностей деревьев, где дерево – структура данных, в которой тип сегмента потомка связан только с одним типом сегмента предка.
Пример – структура организации.
Свойства иерархической модели данных:
каждый узел связан только с одним вышестоящим узлом, кроме вершины; иерархическая модель данных имеет только одну вершину, узел не подчинен более никаким узлам; от каждого узла существует единственный путь к вершине; связь не может быть установлена между объектами, находящимися через уровень: недостаток – отсутствие универсальности, не всякую информацию можно выразить в иерархической модели данных.
Сетевая модель
- Отличия от иерархической модели в том, что элемент одного уровня может быть связан с любым количеством элементов соседнего уровня, и не существует подчиненности уровней друг другу.
|
|
- Пример – работа над проектами
Реляционная модель
- Реляционной называется база данных, в которой все данные, доступные пользователю, организованны в виде таблиц, а все операции над данными сводятся к операциям над этими таблицами. Элементы: поле (столбец), запись (строка) и таблица (отношение).
Пример – отношения Студенты и Группы.
Классификация баз данных.
По технологии обработки
- Централизованные. Хранятся в памяти одной вычислительной системы. - Распределенные. Состоят из нескольких, возможно пересекающихся частей, хранящихся в различных узлах вычислительной сети.
2)По способу доступа к данным
- С локальным доступом. Характеризуется тем, что к такой БД имеется доступ пользователя одной ЭВМ. - С удаленным (сетевым) доступом. Доступно для всех пользователей сети.
По архитектуре
- Файл-сервер. Предполагает выделение одной машины в сети в качестве центральной (сервер файлов), на ней хранится централизованная БД, которая используется совместно. - Клиент-сервер. Предполагается выделение сервера БД, который кроме хранения осуществляет обработку данных.
По содержимому
Географические. Исторические. Мультимедийные.
Дата добавления: 2019-02-22; просмотров: 373; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!