Типы и виды данных. Шкалы измерения



Лекция 2

ТЕОРИЯ ИЗМЕРЕНИЙ

План лекции

1. Статистические принципы в задачах управления

2. Типы и виды данных. Шкалы измерения

3. Психофизические шкалы. Функция желательности Харрингтона. Обобщенная функция желательности

4. Нечеткий подход в задачах измерения. Функция принадлежности

 

Статистические принципы в управлении

Статистику (социальную) определяют как науку, изучающую способы и методы сбора и обработки данных о массовых общественных явлениях, допускающих количественные (числовые) выражения. Массовость является исходным положением статистики и она характерна для анализа общества, его состояний и эволюции. Познание общества есть познание взаимосвязей и взаимодействий между всеми компонентами общества, раскрытие внутренней структуры этих взаимодействий и их изменений во времени.

Поскольку социальная статистика изучает массовость, выступающую в числовой форме, т.е. непосредственно связана с измерениями, постольку часто ее обобщенную форму — математическую статистику — определяют как науку об общих способах обработки результатов эксперимента (в широком смысле этого слова). Бытует и другое определение статистики — как науки об анализе данных.

Основным математическим аппаратом статистических исследований является теория вероятностей. Теория вероятностей — наука о закономерностях, характеризующих массовыми явлениями, специфика которых выражается через представление о случайности как важнейшей ее абстракции. Основное понятие теории вероятностей — вероятностное распределение. Смысл этого понятия в том, что массовое случайное явление разбивается (распадается) на подсистемы, относительный «вес» которых (т.е. относительное число элементов в каждой подсистеме) весьма устойчив. Наличие устойчивости соотносится с фундаментальным понятием теории вероятностей и математической статистики — вероятности.

Дальнейшее расширение приложений теории вероятностей и математической статистики к науке управления связано с системным подходом к изучаемым явлениям или процессам. Вероятностные методы как методы исследования применяются к объектам, рассматриваемым в виде системы с двумя выделенными уровнями внутреннего строения. Один из этих уровней характеризует состояния и поведение отдельных элементов, другой — целостные свойства системы. Свойства и отдельных элементов, и целостные свойства системы характеризуются с помощью вероятностных распределений. Целостность системы обусловлена не наличием внутренних связей между элементами, а наличием вполне определенных и жестких внешних условий и воздействий, в которые «погружены» все элементы системы.

Центральным понятием теории вероятностей и математической статистики является понятие «распределение». Только на основе представлений о распределениях возможны постановка задач и формулировка основных зависимостей в соответствующих научных теориях. Фундаментальная роль представлений о распределениях обусловлена тем, что они являются структурными характеристиками статистических систем, в том числе и социальных. Можно сказать, что распределения выступают как основа своеобразного системного видения мира.

В плане надежности и устойчивости фактуальной информации важен вопрос об опытном задании исходных распределений и их оценке. Так, без решения этой задачи принципиально невозможно выбрать исследуемую совокупность ограниченного объема, репрезентирующую изучаемое явление или процесс, наилучшим образом. Не менее важный вопрос касается возможности применения адекватных методов статистического анализа и распространения статистических выводов, полученных на выборочных данных, на генеральную совокупность. Однако, глубокая «первичная» статистическая обработка данных (оценка распределений) не всегда является абсолютно необходимой. Иногда уже простое сравнение средних, относящихся, например, к различным моментам времени, дает исчерпывающую информацию о протекании процесса. Необходимо помнить «закон бережливости»: не следует усложнять методику познания, если более простые методы дают приемлемые результаты.

При изучении больших и сложных систем направляющими идеями, имеющими непосредственное отношение к статистике, как и к научному методу познания вообще, являются идея иерархиии автономности. Статистические показатели состояния и развития общества разнообразны и многочисленны, и перед аналитиком встает вопрос об их целостном рассмотрении, о взаимосвязи различных показателей.

Идея иерархии является одной из основополагающих в системном подходе. Для сложной системы исходные взаимоотношения между понятиями, характеризующими элементы систем и подсистем уже не вписываются в рамки простых отношений координации, а включают в себя также и существенный компонент субординации, что вносит в нее «иерархический порядок». Один из лидеров системного анализа Л. фон Берталанфи в связи с этим подчеркивал, что понятие иерархический порядок является, несомненно, фундаментальным для общей теории систем. Иерархия проявляется как в «структурах», так и в «функциях».

Иерархическое построение сложных систем — это не понятие, вносимое исследователем с целью удобства анализа, это условие, необходимое для их устойчивости. Иерархическое построение в полной мере относится к социальным системам, обладающими свойством самоорганизации. Г. Саймон отмечал, что среди сложных систем только иерархии располагают достаточным временем на развитие. Дж. Николис по этому же поводу высказался так: «Сложность подрывает устойчивость, если не умеряется иерархической структурой... Любая самоорганизующаяся система представляет собой иерархическую структуру».

Идея автономности дополняет идею иерархии. Автономность контексте следует понимать не только как независимость поведения соответствующих систем и элементов от внешнего окружения, т.е. от среды, но и как определенную независимость элементов друг от друга.

Понятия иерархии и автономности являются ключевыми в таком эффективном экспертном методе качественного анализа, как метод анализа иерархий Т. Саати. В этом методе реализовано предвидение Л. фон Берталанфи: «Общая теория иерархического порядка, очевидно, будет важнейшей составной частью общей теории систем. Принципы иерархического порядка могут быть сформулированы в вербальном языке; уже существуют некоторые полуматематические идеи на этот счет, связанные с матричной теорией, и соответствующие формулировки в терминах математической логики. Большое значение, видимо, будет иметь исчисление иерархии... В конечном счете динамика и иерархический порядок могут представлять собой одно и то же». Логические и математические основы метода анализа иерархий будут нами рассмотрены в следующей лекции.

Познание иерархий воздействует и на сами способы организации и обработки статистических данных. Механизм воздействия заключается в разбиении показателей на группы, относящиеся к различным уровням организации и функционирования сложных социально-экономических систем, причем показатели высшего уровня выражают наличие определенной упорядоченности, иерархического мажорирования над показателями более низкого уровня. Тем самым устанавливается структура системы показателей, адекватность которой реальной действительности может быть установлена статистическими методами.

Итак, анализ статистических данных, понимаемый как в узком смысле (статистический анализ), так и в широком смысле (извлечение знаний из данных), является, наряду с теоретическими представлениями об объектах исследования, важнейшим элементом научной культуры аналитика в сфере управления.

 

Типы и виды данных. Шкалы измерения

        При статистическом исследованиисоциально-экономических процессов мы встречаемся с двумя типами данных: пространственные данные (cross-sectional data) и временные ряды (time-series data).

    Примером пространственных данных является, например, набор сведений (объем производства, количество работников, доход и др.) по разным фирмам в один и тот же момент времени (пространственный срез). Пространственные данные часто используются для построения моделей классификации, регрессионных моделей.

    Примерами временных данных могут служить ежеквартальные данные по инфляции, средней заработной плате, национальному доходу за последние годы, ежедневный курс доллара США на ММВБ и т.п. Отличительной чертой временных данных является то, что они естественным образом упорядочены во времени. Часто наблюдения в близкие моменты времени бывают зависимыми.

Наиболее информативными видами представления данных являются временные ряды, многоугольники и гистограммы распределения (частотные и кумулятивные), диаграммы (подробный анализ видов представления данных будет представлен в выпуске 2 данного тома).

Вид представления данных определяется типом шкалы измерения. Различают четыре основные вида данных, отличающихся по тому, как наблюдаемый объект измеряется или описывается (табл. 2.1).

Таблица 2.1

Основные виды данных

 

Вид данных Примеры
1. Данные классификации (номинальные) Лица, классифицированные по полу, национальности. Регионы РФ, классифицированные по принадлежности к центральным федеральным округам.
2. Ранжированные (ординарные, порядковые) Ранжирование регионов по инвестиционной привлекательности и т.д.
3. Данные измерения на интервальной шкале Температура объекта (шкала с произвольной нулевой точкой и масштабом)
4. Данные измерений на относительной шкале Измерения веса, высоты, объема и т.п. (шкалы с произвольным масштабом, но фиксированной нулевой точкой)

Номинальная шкала (шкала наименований, классификационная шкала) является наиболее «слабой» качественной шкалой, по которой объектам дается некоторый признак. Этот тип шкал соответствует простейшему виду измерения, при котором шкальные значения используются лишь как имена объектов. Единственная цель таких измерений — выявление различий между объектами разных классов. Однако не следует пренебрегать значением этих имен; так, одной из задач кластерного анализа является назначение удачных названий выявленных групп близких по совокупности свойств объектов.

Шкала называется ранговой (шкала порядка), если множеству измеряемых объектов можно присвоить монотонно возрастающие шкальные значения. Тем самым допускается не только номинальное различение объектов, но и их упорядочение по измеряемым свойствам. Таковы балльные, рейтинговые оценки.

Измерение в шкале порядка может применяться в различных ситуациях:

— необходимо упорядочить объекты во времени или пространстве, когда интересуются не сравнением степени выраженности какого-либо свойства объектов, а лишь их взаимным пространственным или временным расположением;

— необходимо упорядочить объекты по степени выраженности какого-либо их свойства, при этом не требуется производить его точное измерение;

— какое-либо свойство в принципе измеримо, но измерение невозможно по причинам практического или теоретического характера.

Шкалы интервалов являются одним из наиболее важных типов шкал. Их отличительная особенность — возможность положительного линейного преобразования, когда меняется масштаб и начало отсчета, но сохраняется направленность измеряемого свойства. Классическим примером служат температурные шкалы Цельсия t°C и Фаренгейта t°F, связанные линейным преобразованием шкальных значений

t °F = 1,8 t °C + 32.                                 (2.1)

Шкалы интервалов сохраняют не только различие и упорядочение объектов, но и отношение «расстояний» между парами. Однако отношение самих шкальных значений при этом не сохраняется. Например, в случае температурных шкал Цельсия и Фаренгейта нельзя сказать, что вода, нагретая до 80 °C вдвое горячее, чем вода при 40 °C, поскольку в шкале Фаренгейта соотношение температур воды будет уже другим: 176 °F и 104°F соответственно. В то же время отношение разностей этих температур в обеих шкалах сохраняется. Так, если отсчитывать разность температур двух упомянутых объектов в обеих шкалах относительно третьего объекта, охлажденного до 0 °C (32 °F), то отношение разностей в обеих температурных шкалах составляет одну и ту же величину 2:

(80 °C - 0 °C)/(40 °C - 0 °C) = (176 °F - 32 °F)/( 104 °F - 32 °F) = 2.

Частным случаем шкал интервалов являются шкалы отношений, когда нулевая точка означает отсутствие измеряемого свойства. Шкалы отношений сохраняют не только отношения свойств объектов, но и отношения «расстояний» между парами объектов. Примерами измерений в шкалах отношений являются стоимостные измерения.

Иногда рассматривают также шкалы разностей и абсолютные шкалы. Первые являются частным случаем шкал интервалов; примерами служат измерения прироста продукции в абсолютных единицах, увеличение численности учреждений и т.п. Абсолютные шкалы характеризуются единственностью измерения и применяются, например, для измерения количества объектов.

Шкалы измерения следует учитывать при вычислении средних величин. В общей теории статистики различают структурные и степенные средние. К первым относятся мода и медиана, ко вторым — арифметическая, геометрическая, квадратическая и гармоническая средние.

Наименее информативная номинальная шкала допускает лишь один вид средних — моду. При переходе к более информативной порядковой шкале в моде добавляется медиана как мера центральной тенденции. Эти средние являются частными случаями средних по Коши — функции, ставящей в соответствие совокупности измерений (х1, х2, …, хn) любое число, заключенное между наибольшим и наименьшим членом вариационного ряда.

Обобщением понятия степенных средних является средние по Колмогорову Fyn, задаваемые строго монотонными функциями y:

Fyn (х1, х2, …, хn) = y -1(1/n)S y ( хi),                   (2.2)

где y -1 — функция, обратная y; хi — значение i-го измерения показателя Х; n — объем выборки. При y(х) = х; ln х; х–1; х2 формула (2.2) определяет соответственно среднее арифметическое, среднее геометрическое, среднее гармоническое и среднее квадратическое.

В шкале интервалов и разностей центральную тенденцию адекватно отражает среднее арифметическое, в шкале отношений — среднее геометрическое, однако среднее геометрическое не рекомендуется применять при обработке данных, измеренных в шкале интервалов и разностей. В абсолютной шкале можно пользоваться любым средним, т.е. с усложнением типа шкалы измерения число средних, адекватных в этой шкале, увеличивается. 

 


Дата добавления: 2018-04-15; просмотров: 633; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!