Построение гистограммы. Нормальное распределение. Параметрические и непараметрические методы анализа данных.



Гистограмма — способ графического представления табличных данных.

Построение гситограммы:

Шаг 1: вызовем Мастер диаграмм, выберем тип диаграммы Гистограмма, вид гистограммы – Обычная гистограмма;

Шаг 2: выбираем вкладку Конструктор, кнопку Выбрать данные, заполняем значения полей;

Шаг 3: настройка параметров диаграммы. С помощью вкладок Макет и Формат задайте параметры визуализации и формат диаграммы, настройте размещение легенды внизу диаграммы, включите в подписи данных значения.

Нормальное распределение

Как определить, является ли распределение признака нормальным?

1)Построить гистограмму, оценить визуально:

А)нормальное распределение симметрично относительно среднего значения;

Б)асимметрия и эксцесс равны нулю;

В)среднее значение, мода и медиана совпадают.

2)Найти среднее значение и стандартное отклонение s , для нормального закона распределения приблизительно:

А)68% значений находятся в интервале ±s;

Б)95% – в интервале ±2s;

В)99% – в интервале ±3s.

Воспользоваться проверкой статистических гипотез о виде распределения.

Основы корреляционного анализа.

Корреляционный анализ – статистический метод, позволяющий определить, существует ли зависимость между переменными и на сколько она сильна.

Задачей корреляционного анализа является количественное определение тесноты связи между двумя признаками (при парной связи) и между результативным и множеством факторных признаков (при многофакторной связи).

Теснота связи количественно выражается величиной коэффициентов корреляции, которые давая количественную характеристику тесноты связи между признаками, позволяют определять «полезность» факторных признаков при построении уравнения множественной регрессии.

Корреляция взаимосвязана с регрессией, поскольку первая оценивает силу (тесноту) статистической связи, вторая исследует ее форму.

Регрессионный анализ заключается в определении аналитического выражения связи в виде уравнения регрессии.

Регрессией называется зависимость среднего значения случайной величины результативного признака от величины факторного, а уравнением регрессии – уравнение описывающее корреляционную зависимость между результативным признаком и одним или несколькими факторными.

Основные понятия: информационная система, база данных, система управления базами данных.

Информационная система (ИС) – взаимосвязанная совокупность средств, методов и персонала, используемых для хранения, обработки и выдачи информации в интересах достижения поставленной цели.

База данных (БД) – структурированная совокупность данных, организованная по определенным правилам.

Система управления базами данных (СУБД) – это совокупность языковых и программных средств, предназначенных для создания, ведения и использования БД. СУБД позволяют структурировать, систематизировать и организовывать данные для компьютерного хранения и обработки.

Виды моделей данных в СУБД.

Иерархическая модель

Отношения в иерархической модели данных организованы в виде совокупностей деревьев, где дерево – структура данных, в которой тип сегмента потомка связан только с одним типом сегмента предка.

Пример – структура организации.

Свойства иерархической модели данных:

каждый узел связан только с одним вышестоящим узлом, кроме вершины; иерархическая модель данных имеет только одну вершину, узел не подчинен более никаким узлам; от каждого узла существует единственный путь к вершине; связь не может быть установлена между объектами, находящимися через уровень: недостаток – отсутствие универсальности, не всякую информацию можно выразить в иерархической модели данных.

Сетевая модель

- Отличия от иерархической модели в том, что элемент одного уровня может быть связан с любым количеством элементов соседнего уровня, и не существует подчиненности уровней друг другу.

- Пример – работа над проектами

Реляционная модель

- Реляционной называется база данных, в которой все данные, доступные пользователю, организованны в виде таблиц, а все операции над данными сводятся к операциям над этими таблицами. Элементы: поле (столбец), запись (строка) и таблица (отношение).

Пример – отношения Студенты и Группы.

Классификация баз данных.

По технологии обработки

- Централизованные. Хранятся в памяти одной вычислительной системы. - Распределенные. Состоят из нескольких, возможно пересекающихся частей, хранящихся в различных узлах вычислительной сети.

2)По способу доступа к данным

- С локальным доступом. Характеризуется тем, что к такой БД имеется доступ пользователя одной ЭВМ. - С удаленным (сетевым) доступом. Доступно для всех пользователей сети.

По архитектуре

- Файл-сервер. Предполагает выделение одной машины в сети в качестве центральной (сервер файлов), на ней хранится централизованная БД, которая используется совместно. - Клиент-сервер. Предполагается выделение сервера БД, который кроме хранения осуществляет обработку данных.

По содержимому

Географические. Исторические. Мультимедийные.


Дата добавления: 2019-02-22; просмотров: 373; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!