Задания для самостоятельной работы
Зайдите на сайт Федеральной службы государственной статистики (http://www.gks.ru/).
1. Найдите информацию по числу зарегистрированных преступлений по видам. Введите данные в MS Office Excel. Постройте отчеты с использованием сводных таблиц и сводных диаграмм:
- Общая сумма зарегистрированных преступлений по видам и годам.
- Сумма зарегистрированных преступлений в процентном выражении.
2. Найдите информацию по численности исследователей, имеющих ученую степень, по субъектам Российской Федерации. Постройте отчеты с использованием сводных таблиц и сводных диаграмм:
- Общее количество докторов и кандидатов наук по Уральскому федеральному округу по всем годам.
- Общее количество докторов и кандидатов наук по субъектам Российской Федерации за все года в процентном выражении.
Статистический анализ
Краткая справка
Выборка – это часть генеральной совокупности, извлекаемая для анализа.
Генеральная совокупность- это множество всех рассматриваемых объектов.
Вычисление выборочных характеристик:
среднее арифметическое выборки – результат деления суммы всех наблюдаемых числовых величин на их количество;
стандартная ошибка – равна стандартному отклонению, деленному на квадратный корень объема выборки.
медиана – срединное значение упорядоченного массива чисел. Если массив не содержит повторяющихся чисел, то половина его элементов окажется меньше, а половина – больше медианы. Если выборка содержит экстремальные значения, для оценки среднего значения лучше использовать не среднее арифметическое, а медиану. Т.е. медиана – это число, разделяющее выборку пополам: 50% элементов меньше медианы, а 50% - больше;
|
|
мода – это число, которое чаще других встречается в выборке;
выборочная дисперсия – это сумма квадратов разностей между элементами выборки и выборочным средним, деленная на величину, равную объему выборки минус один.
стандартное выборочное отклонение – квадратный корень из суммы квадратов разностей между элементами выборки и выборочным средним, деленной на величину, равную объему выборки минус один.
Дисперсия и стандартное отклонение позволяют оценить разброс данных вокруг среднего значения, т.е. определить, сколько элементов выборки меньше среднего, а сколько – больше.
Коэффициент вариации равен стандартному отклонению, деленному на среднее арифметическое и умноженному на 100%. Коэффициент вариации измеряет рассеивание данных относительно среднего значения.
Эксцесс характеризует так называемую «крутость», т.е. островершинность или плосковершинность распределения. Если значение эксцесса больше 0, распределение островершинное, если значение эксцесса меньше 0 - плосковершинное. Для нормального распределения эксцесс равен 0.
|
|
Асимметричность характеризует отклонение от симметричности распределения и является функцией, зависящей от куба разностей между элементами выборки и средним значением. Если распределение симметрично, то коэффициент ассиметрии равен 0.
Максимум – максимальное значение: xmax
Минимум – минимальное значение: xmin
Интервал – интервал значений случайной величины (x), равный xmax - xmin.
Наибольшее (k-е) – предшествующее максимуму значение с номером k.
Наименьшее (k-е) – следующее после минимума минимальное значение с номером k.
Уровень надежности указывает процент надежности данных для вычисления доверительного интервала.
Дата добавления: 2018-04-04; просмотров: 569; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!