Анализ взаимосвязей между параметрами



        

    Многие объекты характеризуются несколькими признаками, причем между ними могут быть самые разнообразные связи: от детерминированных до полной взаимонезависимости. Например, вес и габариты плат связаны однозначно, а проводимость с твердостью взаимонезависимы. Потери на разных частотах имеют сложные взаимосвязи. Маркетологов обычно интересует, как сочетания признаков товара связаны с объемами продаж, сроками и ценами.

 

 

Рис. 31. Корреляционный график взаимосвязи двух параметров Х и Y.

 

    Принято оперировать корреляционными зависимостями между параметрами. Анализируют поле корреляции, измеряя пару значений параметров X и Y у очередного изделия и откладывая их в виде абсциссы и ординаты. Это поле делят интервалами, считают средние интервальные значения и по ним строят зависимости одного параметра от другого – линии регрессии (см. рис. 31).

Практическое применение как корреляционного так и регрессионного анализа ограничено парными взаимосвязями. Обычно приходится оперировать 3–5 параметрами, так что парные регрессии недостаточно информативны. Кроме того, накладываются ограничения на соответствие НР.

    Анализ взаимосвязей параметров на вероятностном графике не имеет названных ограничений. Для каждого параметра строится горизонтальная ось X,Y,Z и т.п. (см. рис. 32). Все комплекты показаний на очередные изделия нумеруются. Номера откладываются по всем осям точно так же, как выше размещались точки. Построение вероятностного графика для каждой оси ведется точно так же, как рассмотрено выше для одного параметра, но вместо точек ставят маленькие номера. Оси целесообразно разместить «лесенкой» с тем, чтобы было удобнее считывать информацию. Кроме того, расстояния между экстремальными значениями (Rx, Ry, Rz) по каждой оси целесообразно изображать равными, выбирая соответствующие масштабы. Тогда все построенные функции будут, примерно, параллельными. Вертикальный масштаб может быть общим для всех функций или индивидуальным, если законы распределения определяются точно также как для «одинарных» функций.

 

 

 


        

 

Рис. 32. Вероятностный график, построенный для анализа трех параметров X, Y и Z.

 

Совместный анализ начинается с разбиения всех функций на интервалы. Составляется таблица, где изделия группируются по составу интервалов, в которых их присутствие обнаружилось по номерам.

 Крайними случаями будут:

1. Все изделия одинаково размещаются по интервалам, начиная с того, у которого все параметры имеют наименьшее значения и вплоть до изделия с наибольшим значением всех параметров.

2. Все изделия разместились в интервалах хаотически, не наблюдается повторяемости, что демонстрирует их взаимонезависимость.

 Все промежуточные ситуации демонстрируют взаимозависимость.

    Выявляются изделия, разместившиеся по интервалам идентично, затем с различиями на 1 интервал, далее на 2 близлежащих интервала и т.д. Доли таких изделий в выборке заносятся в итоговую таблицу для последующих расчетов.

 

Выбор теоретических функций распределения

 

Наиболее часто используемой, а во многих источниках единственной, является теоретическая функция Гаусса. По ГОСТу – нормальное распределение (НР). Ему посвящена обширная библиотека профессиональной литературы, его меры математическое ожидание М(х) =  и дисперсия D = s2 являются "универсальными", используемыми в практике безотносительно к виду распределения.

    Прочие 200 теоретических распределений, разработанные для конкретных типов прикладных задач, включая несовместимые с НР, редко применяются или вовсе не известны специалистам. Особенно опасными, с катастрофическими последствиями, являются расчеты прочности и надежности по некорректным мерам. Близки к ним по разрушительности некоторые экономические расчеты.

    Противопоказания по применению НР проясняются при чтении, самом поверхностном, вывода формулы нормального распределения. Собственно вывод занимает десятки страниц математических выкладок. Методическая их основа относительно доступна и является необходимой при корректном использовании НР в качестве инструмента.

    Задачи, для которых формировалось НР, связаны с погрешностями измерений. Измерения рассматривались с относительно небольшим разбросом. Разность экстремальных значений делилась на среднее для оценки коэффициента вариации К<< 1.

Рассматриваемые задачи ограничивались исходными допущениями:

1. Все отклонения случайной величины Х от некоторого значения А вызвано действием множества воздействий, число которых N стремится к бесконечности.

2. Каждое воздействие проявляется в отклонении ±e, которое стремится к нулю.

3. Отклонения из-за каждого воздействия взаимонезависимы.

Для «доходчивости» названных допущений в университетах США использовали доску, по которой скатывались шарики, задевая множество штырьков, достаточно малых.

Можно представить в воображении толпу студентов, спешащих к двери автобуса. Видя впереди дверь (координата А), надо обходить очередную спину справа или слева (+e и –e) вплоть до проезжей части. Скорее всего, дверь окажется в стороне от протянутых рук. При многократных попытках попасть в автобус можно отмечать, сколько метров осталось до вожделенной двери, когда удалось выбраться из толпы.

Далее следуют преобразования, которые могут анализировать любители математики. Практиков интересуют итоги. Формулу удалось получить для функции распределения плотности вероятностей f(х). Эта функция не интегрируется, поэтому F(х) получают исключительно посредством численного интегрирования. Для этого теперь есть типовые программы, по которым, в частности, считается масштаб вероятностного графика для НР.

Величина А становится математическим ожиданием М(х) при устремлении к бесконечности N. Конечное число значений определяет .

Дисперсия, т.е. s2, опять таки при устремлении к бесконечности числа реализаций N является пределом

где e – отклонение из-за одной причины.

Если каждое отклонение из-за одной причины бесконечно мало, но причин бесконечно много и есть конечный предел (в практике это далеко не всегда имеет место), то можно оперировать названной мерой.

Наличие этого предела легко узнаваемо в эмпирических данных по характерному «колоколу». Отклонения симметричны относительно центра, так, что среднее значение равно медианому и модальному значениям, а мера s «нормирует» отклонения по инженерному правилу «3s»:

 

   

2%      14%       34%       34%       14%       2%

-3s      -2s        -1s             0           1s            2s     3s,

 

оставляя вне этих интервалов всего 0,27% реализаций.

    В состав задач, вписывающихся в НР, кроме ошибок измерений, входят вариации параметров продукции с относительно малым разбросом, прежде всего, в массовом и автоматизированном производствах. Вертикальная шкала вероятностного графика симметрична относительно уровня 0,5 и, если ее измерять в количестве s, является линейной.

 

Распределение Вейбулла

 

    Вейбулловское распределение (ВР) – термин гостированный. По Колмогоровской классификации ВР надо называть третьим предельным распределением. Класс предельных распределений развит в ХХ веке. Первые публикации с теоретическим выводом и эмпирическими данными появились в 1936 году в журнале «Текстильная промышленность». Автор – А.С. Турчанинов – был забыт. Принято цитировать исследования Вейбулля прочности канатов от 1940 г., которые не содержали теоретического вывода.

    Вводить Турчаниновский термин «Ассимтотические» распределения уже поздно. Здесь используются только названия статистических мер из первоисточника, поскольку общепринятых наименований и обозначений для них нет в литературе до сих пор.

    Главной сферой применения этих распределений является прочность и надежность. Первыми объектами исследований были всяческие катастрофы. Позднее от наводнений перешли к находкам, выигрышам, выздоровлениям и т.п. Однако при моделировании и сегодня рассматривают цепь, в которой естественно существует самое «слабое звено». Поскольку все началось с практического наблюдения – чем длиннее нить или канат, тем меньше предельная нагрузка. Это явление стали называть «масштабным фактором» и находить его в самых неожиданных ситуациях.

    В теоретическом выводе применяется понятие дефекта, который проявляется в разрушении объекта, или в отклонении измеряемого параметра, никак не ограниченном. Дефект - это несоответствие объекта установленным требованиям.

    Если моделировать ВР на вышеупомянутой наклонной доске, то шарики придется разгонять до большой скорости, и штырьки на их пути нужны высокие, такие, что одно соударение сразу меняет траекторию, оставаясь для шарика первым и последним. Шарики разместятся внизу доски несимметрично.

    При выводе формулы ВР предполагается наличие в объекте множества дефектов, каждый из которых может вызвать наблюдаемое отклонение. Например, множество трещин, и любая из них способна расти вплоть до разрушения. Далее рассматривается вероятность отклонения из-за 1 дефекта, а затем ассимтотическое представление формулы при переходе к множеству дефектов. В отличие от НР, для ВР есть формула функции распределения. По ней, в частности, рассчитывается масштаб вертикальной оси вероятностного графика ВР. Он ориентирован относительно уровня 0,632. Это число следует из выражения 1 – 1/е, поэтому отмечается индексом Хе. Хе – характеристическое значение. В литературе можно встретить, например, обозначение «а» с названием «параметр положения». Аналитический теоретический расчет Хе весьма сложен. По вероятностному графику Хе просто считывается, как абсцисса точки пересечения с уровнем 0,632.

    Равные участки по вертикальной оси определяют параметр К – меру рассеяния. В литературе его называют параметр положения (в). Масштаб нессиметричен: вверх откладывается всего один интервал 1/К и уже – уровень 0,999986.

    Вниз откладывается неограниченное число таких интервалов, и каждое очередное значение будет меньше предыдущего на порядок – 0.1; 0,01; 0,001 и т.д. Разность между соседними уровнями, например, 0,1 и 0,01, будучи перенесена на горизонтальную ось, равна 1/К. Аналитический расчет К нуждается в весьма пространной формуле.

    Мера рассеяния К принципиально отличается от меры s. Именно К определяет действие масштабного фактора. Вводят базовый объем Vе (площадь, длину), на котором измеряются все данные для эмпирического распределения, а затем рассчитываются меры распределения элементов с другими размерами.

    Например, трубопровод надо испытывать на образцах 1м, а рассчитывать функцию распределения на длине 1000 км – чтобы не было «неожиданных» разрывов и пожаров.

    При расчете статистических мер для искомых размеров V, учитывается, что параметр К остается прежним, а новое характеристическое значение определяется, исходя из формулы:

lgVe – lgV = K(lg Xe1 – lgXe2),

 

где Хе1 – значение, найденное для базовых размеров Ve,

           Хе2 – искомое значение для размеров V.

    Поскольку это распределение часто подменяют другими, более привычными, целесообразно сравнить его с популярными функциями:

1. Если параметр формы К >> 4 т.е. дефекты проявляются слабо, имеет место аналогия с НР, так, что в центре распределения в диапазоне вероятностей от 0,01 до 0,99 распределения неразличимы.

2. При 2 < К < 4 распределение Вейбулла аналогично логарифмически–нормальному в диапазоне 0,01 – 0,99. Вероятностный график этого распределения строится при нормальном масштабе по вертикали и логарифмическом по горизонтали.

3. При К = 1 и при постоянных размерах имеет место частный случай ВР – экспонентциальное распределение (ЭР). Это распределение стало практически единственным в теории надежности, благодаря особо упрощенным расчетам. Хе в этом применении называют Тср – средним временем безотказной работы, а l = 1/Т – интенсивностью отказов.

    Если К < 1, то ВР не сравнимо с прочими теоретическими распределениями. Это проявление весьма «опасных» дефектов.

    Применительно к прочности, К будет расти при увеличении пластичности материала. Хрупкие материалы имеют малое К.

    Сегодня ВР имеет множество применений и понятие дефекта надо воспринимать условно. Скажем, распределение расходов населения в России характеризуется: К << 1.

    У ВР, как уже отмечалось, вероятностный график с логарифмическим масштабом горизонтальной оси. При относительно малом размахе можно ввести линейный масштаб, но это уже будет первое предельное распределение.

 

 


Дата добавления: 2019-01-14; просмотров: 244; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!