Электронные и Internet-ресурсы: http:/e.lanbook.com



Nbsp; 1. МАТЕМАТИЧЕСКИЕ ОСНОВЫ ПЛАНИРОВАНИЯ ЭКСПЕРИМЕНТА   1.1. Постановка задачи   Планирование эксперимента – научная дисциплина, занимающаяся разработкой и изучением оптимальных программ проведения экспериментальных исследований [1]. Главная цель планирования заключается в уменьшении количества опытов при достаточной точности описания свойств изучаемого объекта. При этом сокращаются затраты времени и ресурсов (трудовых, материальных, финансовых), необходимых для проведения опытов. Традиционный метод получения информации состоит в наблюдении за реакцией (откликом y) исследуемого объекта при небольших изменениях сначала одного воздействия, затем другого и т. д. Все остальные параметры, влияющие на процесс, остаются постоянными. При оптимальном планировании эксперимента предполагается одновременное изменение нескольких воздействий, влияющих на процесс, что позволяет либо уменьшить количество опытов, либо дать более точное описание изучаемого объекта. Различные воздействия на объект исследования (рис. 1.1) делятся на контролируемые (ui), возмущающие (zi) и управляемые (хi).     Рис. 1.1   Контролируемые воздействия u1, u2,…, um можно измерить в процессе исследования, но нельзя изменить. Эти параметры можно учесть в математической модели, но нельзя целенаправленно менять. Поэтому при разработке планов эксперимента контролируемые воздействия обычно считают постоянными во всех проводимых опытах. Помехи, или возмущающие воздействия z1, z2,…, zp изменяются с течением времени случайным образом. Если в опыте выполнить измерения несколько раз, то при наличии помех результаты будут различаться. Если разброс значений отклика y не превышает некоторой величины, то объект удовлетворяет требованию воспроизводимости результатов. В этом случае можно построить математическую модель объекта даже при наличии помех. Управляемые воздействия (или факторы) х1, х2, …, хk можно целенаправленно менять. В процессе эксперимента эти факторы могут принимать определенные значения, называемые уровнями варьирования факторов. Факторы бывают количественными и качественными. Хотя качественным факторам не соответствует числовая шкала, можно построить условную порядковую шкалу, ставящую в соответствие различным уровням качества фактора некоторые числа. Факторы должны быть независимыми и совместимыми. Это означает, что факторы не должны быть функциями других факторов, должна существовать возможность установления фактора на выбранных уровнях независимо от уровней других факторов, а все комбинации уровней факторов должны давать осуществимые и безопасные для объекта режимы. Сочетание определенных уровней всех факторов называется точкой плана. Число точек в плане эксперимента – это количество проводимых опытов. Для снижения влияния помех в точках плана может быть проведено несколько измерений (повторений опытов). Пусть в результате N проведенных опытов с различными уровнями факторов  получены значения откликов . Математической моделью объекта является функция                                (1.1.1)   которая принимает значения, мало отличающиеся от величин отклика  в точках плана. Прежде всего требуется задать общий вид функции (1.1.1). В планировании экспериментов функция отклика представляется многочленом       (1.1.2)   Параметр b0 функции (1.1.2) называется свободным членом уравнения, bj – линейными эффектами, bji – эффектами парного взаимодействия (i ≠ j), bjj – квадратичными эффектами и т. д. Модель не должна быть слишком сложной. Чем больше параметров в модели, тем больше опытов придется провести, чтобы их найти, а при планировании эксперимента предполагается уменьшение количества опытов. Чтобы упростить модель, некоторые параметры сразу приравнивают нулю. Обычно сначала изучается простейшая линейная модель                                    (1.1.3)   с k + 1 неизвестными параметрами . В параграфе 1.4 будет показано, как определяются параметры  методом наименьших квадратов (МНК). Сочетание МНК и методов статистической проверки гипотез с оценкой точности и надежности полученного результата при наличии помех называется регрессионным анализом [2, 3]. Построенная по результатам опытов функция (1.1.3) называется регрессионной. Если значения у функции (1.1.3) значительно отличаются от экспериментальных откликов, то в функцию следует добавить слагаемые. Например, взаимодействие факторов имеет место тогда, когда эффект изменения одного фактора зависит от уровня, на котором находится другой фактор. Квадратичная модель второго порядка                    (1.1.4)   содержит [1] (k + 1)(k + 2)/2 неизвестных параметров, т. е. она существенно сложнее линейной модели. После выбора конфигурации функции (1.1.2) построение математической модели сводится к определению параметров уравнения многочлена по результатам опытов. Выбирая план эксперимента, необходимо определить, какие сочетания уровней факторов следует реализовать. Оптимален план, в котором без потери нужной информации о функции (1.1.2) удается уменьшить количество опытов, отсекая малосущественные. Выигрыш в достоверности и точности модели дает как оптимальное планирование эксперимента, так и рациональная обработка результатов измерений. Поэтому в монографии сначала (главы 1, 2) разобраны методы расчета параметров при различных планах эксперимента, затем (главы 3, 4) проанализированы методы статистической обработки результатов наблюдений в эксперименте при наличии помех.   1.2. Нормирование переменных модели   Факторы, как правило, имеют различную физическую природу и размерность, а опыты нередко проводятся только на двух уровнях факторов xHj и xBj. Для упрощения обработки результатов эксперимента уровни факторов нормализуются, т. е. центрируются и нормируются. За нулевой (начальный, основной) принимается уровень х0j, соответствующий середине интервала [xHj, xBj]:                                     (1.2.1)   Точка факторного пространства с координатами  называется центром плана. На рис. 1.2 показано расположение центра плана при двух факторах.     Рис. 1.2   Если для каждого фактора выбрать интервал варьирования                              (1.2.2)   то прибавление  к нулевому уровню дает верхний уровень , а вычитание – нижний уровень xHj фактора. Линейное преобразование                                    (1.2.3) переменных  дает возможность перейти к новой системе координат , в которой функция (1.1.2) принимает вид        (1.2.4)   При значениях фактора  уровни исходных факторов становятся равными xBj и xHj соответственно. Следовательно, для всех безразмерных и нормированных факторов  в новой системе координат верхний уровень равен +1, нижний уровень равен –1, а координаты центра плана равны нулю и совпадают с началом координат (рис. 1.2.2).     Рис. 1.2.2   Геометрически нормализация факторов равноценна линейному преобразованию пространства факторов, при котором производится перенос начала координат в точку, отвечающую основным уровням, и сжатие-растяжение пространства в направлении координатных осей. Нормализация переменных существенно упрощает построение математической модели объекта. После построения модели с нормированными факторами и ее оценки можно вернуться к многочлену (1.1.2) с натуральными факторами, используя нормирующие соотношения                                        (1.2.5)   1.3. Полные факторные планы   В плане полного факторного эксперимента (ПФЭ) реализуются все возможные сочетания уровней факторов [1]. Если при k факторах опыты проводятся только на двух уровнях, то необходимое количество опытов N = . Такой план используется только при небольшом количестве факторов (k £ 5) и называется ПФЭ . Исходные данные для всех факторов записываются в таблицу (табл. 1.3.1).   Таблица 1.3.1 Уровень Фактор х1 х2 … хk xHj         xBj                           План эксперимента можно описать с помощью специальной таблицы (матрицы), в которой каждая строка соответствует условиям одного опыта. В табл. 1.3.2 приведен план эксперимента при двух факторах.   Таблица 1.3.2 Номер опыта Фактор, отклик y 1 + + + у1 2 + – + у2 3 + + – у3 4 + – – у4   Результаты опытов записываются в последнем столбце табл. 1.3.2. Для вычисления свободного параметра а0 в таблицу добавлен столбец фиктивной переменной , всегда равный +1. В таблице пишутся только знаки уровней . В первом опыте оба фактора находятся на верхнем уровне, т. е.  и . Во втором опыте значения  и  и т. д. При трех факторах в плане ПФЭ 23 необходимо провести восемь опытов. В таблице опытов этого эксперимента (табл. 1.3.3) дважды повторяется план ПФЭ 22, сначала при значении , а затем при .   Таблица 1.3.3   План   Номер опыта y     22 1 + + + + + y1       2 + – + + + y2       3 + + – + + y3       4 + – – + + y4   23   5 + + + – + y5       6 + – + – + y6       7 + + – – + y7       8 + + – – + y8 24     9 + + + + – y9       10 + – + + – y10       11 + + – + – y11       12 + – – + – y12       13 + + + – – y13       14 + – + – – y14       15 + + – – – y15       16 + – – – – y16                           Аналогично при любом количестве факторов k необходимо дважды повторить план для случая k – 1 (сначала при значении k-го фактора на верхнем уровне, а затем на нижнем). В таблице 1.3.3 показано последовательное достраивание таблицы плана ПФЭ при увеличении k от 2 до 4. Нормированное значение j-го фактора в опыте с номером i обозначим через . Планы ПФЭ  (см. табл. 1.3.3) обладают свойствами симметричности   ;                                    (1.3.1)   нормировки   ;                                 (1.3.2)   ортогональности   .             (1.3.3)   1.4. Вычисление параметров модели   Вычисление неизвестных параметров функции (1.2.4) осуществляется методом наименьших квадратов. Согласно этому методу параметры должны быть выбраны так, чтобы достигалось наименьшее значение функции   ,        (1.4.1)   где – значения отклика и факторов (приведенные в табл. 1.3.3) в опыте с номером i. Рассмотрим сначала линейную модель   .             (1.4.2)   В методе наименьших квадратов параметры аj вычисляются [4] по матричной формуле   ,                            (1.4.3)   где .   Эти матрицы называются соответственно матрицей – столбцом параметров аi, матрицей – столбцом откликов yi (вектором наблюдений) и матрицей независимых переменных .Транспонированная матрица  имеет вид   .   Произведение  вычисляется с учетом равенств (1.3.2) и (1.3.3)     . (1.4.4)     Матрица, обратная , имеет вид [5]   ,   так как .   Учитывая, что   ,   получаем   .   Следовательно, любой параметр aj определяется по единой формуле   .                (1.4.5)   На практике приходится рассматривать более сложные модели, содержащие нелинейные слагаемые. Если в табл. 1.3.3 добавить столбец со значениями произведений  или , то для нового столбца также будут выполнены равенства (1.3.1), (1.3.2) и (1.3.3). Следовательно, эффекты взаимодействия вычисляются по формулам, аналогичным (1.4.5):   ;            (1.4.6)   .         (1.4.7)   Важнейшее свойство планов ПФЭ  состоит в том, что значения параметров  (1.4.5) не надо пересчитывать после введения эффектов парного взаимодействия в математическую модель объекта. Это свойство обеспечивает прежде всего равенство (1.3.3), подобные планы называют ортогональными. Если расстояние от центра до всех точек плана одинаково, то планирование называется ротатабельным. Ортогональные и ротатабельные планы существенно упрощают расчеты и улучшают результаты статистического анализа. Одновременно ортогональными и ротатабельными могут быть только планы ПФЭ . Для построения более сложных моделей, содержащих, например, слагаемые , приходится строить другие планы эксперимента. При оценке оптимальности новых планов могут быть использованы различные критерии [6], но в этой книге в дальнейшем будут рассматриваться только планы, обладающие свойством ортогональности.   1.5. Композиционные планы   Планы ПФЭ  не дают возможности определять квадратичные эффекты . Значения  всегда равны единице и не отличаются друг от друга, а также от значений в столбце . Для вычисления параметров модели, включающей квадраты факторов, необходимо варьировать параметры хотя бы на трех уровнях. Однако планы ПФЭ типа 3k требуют очень большого числа опытов. Композиционные планы дают возможность не только сокращать количество опытов, но и выполнять опыты последовательно, переходя от простых моделей к более сложным. Основу (ядро) таких планов составляет план ПФЭ 2k, к которому добавлен опыт в центре плана. Затем проводятся дополнительные опыты в  «звездных» точках. Так называются точки, расположенные на координатных осях  факторного пространства симметрично относительно центра плана на некотором расстоянии a. Для двухфакторного эксперимента четыре «звездных» точки (–α; 0), (α; 0), (0; –α), (0; α) с номерами 6, 7, 8, 9 изображены на рис. 1.5.1. Точки с номерами 1, 2, 3, 4 образуют план ПФЭ 2k, а опыт 5 проведен в центре плана.   Рис. 1.5.1   На рис. 1.5.2 изображено расположение точек композиционного плана в трехфакторном пространстве. Следует отметить, что в этом плане проводится 15 опытов, а в плане ПФЭ типа 3k надо проводить на 12 опытов больше.     Рис. 1.5.2     Ранее указывалось, что при переходе к композиционным планам невозможно обеспечить выполнение всех критериев оптимальности плана, поэтому проблема выбора значения a решается неоднозначно. Построение ортогонального плана для двух факторов надо начинать с проверки свойств матрицы, приведенной в табл. 1.5.1.     Таблица 1.5.1   Номер опыта Фактор, отклик Примечание 1 + + + + + + Ядро – план ПФЭ 22 2 + – + – + + 3 + + – – + + 4 + – – + + + 5 + 0 0 0 0 0 Нулевая точка 6 + –a 0 0 a2 0 Звездные точки 7 + +a 0 0 a2 0 8 + 0 –a 0 0 a2 9 + 0 +a 0 0 a2   Очевидно, что в двух последних столбцах не выполняются свойства симметричности (1.3.1) и ортогональности (1.3.3) с первым столбцом. Чтобы выполнялось равенство (1.3.1), достаточно центрировать элементы этих столбцов, т. е. заменить  величиной   .        (1.5.1)   Тогда таблица принимает вид табл. 1.5.2, причем свойство симметричности выполняется для всех (кроме первого) столбцов.   Таблица 1.5.2   Номер опыта Фактор, отклик 1 + + + + 2 + – + – 3 + + – – 4 + – – + 5 + 0 0 0 6 + –a 0 0 7 + +a 0 0 8 + 0 –a 0 9 + 0 +a 0   Значение a необходимо подобрать так, чтобы для двух последних столбцов таблицы 1.5.2 выполнялось свойство ортогональности (1.3.3). Перемножая элементы столбцов и складывая полученные произведения, имеем     После упрощений получаем   ,   откуда следует, что  следует приравнять единице.   Таблица 1.5.3   Номер опыта Фактор, отклик 1 + + + + 1/3 1/3 2 + – + – 1/3 1/3 3 + + – – 1/3 1/3 4 + – – + 1/3 1/3 5 + 0 0 0 –2/3 –2/3 6 + –a 0 0 1/3 1/3 7 + +a 0 0 1/3 1/3 8 + 0 –a 0 –2/3 –2/3 9 + 0 +a 0 –2/3 –2/3   Окончательный композиционный план эксперимента, для которого выполняются свойства симметричности и ортогональности, приведен в табл. 1.5.3. Формулы (1.4.5) вычисления коэффициентов математической модели меняются, поскольку в плане ПФЭ 22 матрица Х задавалась табл. 1.3.2, а в композиционном плане она задается табл. 1.5.3. Поэтому =       Свойство нормировки (1.3.2) выполняется лишь для первого столбца , поэтому                                          (1.5.2)   Линейные эффекты вычисляются по формуле   .          (1.5.3)   Формула вычисления смешанного эффекта одинакова как в плане ПФЭ 22, так и в композиционном плане:   .                  (1.5.4)   С учетом того что после центрирования при  переменная  (1.5.1) становится равной , квадратичные эффекты вычисляются по формулам, аналогичным (1.5.3):   . (1.5.5)   Построенная модель имеет вид   (1.5.6)     Если ввести параметр   .                                  (1.5.7)   то уравнение (1.5.6) принимает обычный вид (1.2.4)   .   В общем случае композиционный план становится ортогональным, если для «звездного плеча» a выполняется условие   .                    (1.5.8)   В табл. 1.5.4 указаны величины a и общее количество опытов при различных значениях k.   Таблица 1.5.4   Число факторов k Число точек «ядра» nя Число нулевых точек n0 Число «звездных» точек nз a Общее число опытов N 2 4 1 4 1,00 9 3 8 1 6 1,215 15 4 16 1 8 1,414 25 Композиционный ортогональный план для трех факторов при значении , приведен в табл. 2.5.1 Математическую модель объекта для k факторов следует записать в виде   .    (1.5.9)   Произведение матриц  и  записывается в виде       Формула вычисления смешанного эффекта одинакова как в плане полного факторного эксперимента, так и в композиционном плане:   . (1.5.10)     Параметры модели (1.5.9) можно вычислить по формулам, аналогичным (1.5.2) – (1.5.5):     .        (1.5.11)   . (1.5.12)     Если вычислить параметр           (1.5.13)   то уравнение (1.5.9) можно привести к виду   .                 (1.5.14)   Параметры функции (1.5.14) вычисляются независимо друг от друга (кроме ), что дает возможность упрощать модель, отбрасывая незначимые, мало влияющие на  слагаемые.     1.6. Дробный факторный план   С увеличением числа факторов количество опытов в полном факторном эксперименте быстро растет. Но число опытов можно существенно сократить, если количество определяемых параметров в модели объекта сравнительно мало. Пусть при рассмотрении трехфакторной модели заранее известно, что она близка к линейной:   .          (1.6.1)   Для определения четырех параметров модели (1.6.1) в ПФЭ 23 предполагается проведение восьми опытов, хотя для линейной модели можно ограничиться, например, половиной, т. е. четырьмя опытами. Такое планирование называется планом дробного факторного эксперимента (ДФЭ) [1], или дробной репликой полного факторного плана. Число опытов при этом должно быть не меньше количества неизвестных параметров модели. При построении дробных реплик строки таблицы плана ПФЭ нельзя сокращать произвольно. Если в плане, представленном в табл. 1.3.3, оставить для трех факторов только первые четыре строки, то для столбца , все значения которого равны 1, не будут выполнены свойства (1.3.1) и (1.3.3). Ортогональность плана будет обеспечена, если в качестве основы выбрать план ПФЭ 22, а значения  принять, например, равными . Равенство  называется генерирующим соотношением. В табл. 1.6.1 приведен сокращенный план – половина плана ПФЭ 23. Такой план называют полурепликой и обозначают 23–1.   Таблица 1.6.1   Номер опыта Фактор, отклик 1 + + + + 2 + – + – 3 + + – – 4 + – – +   После изменения всех знаков столбца  на противоположные получается вторая полуреплика 23–1, которая является другой половиной полного факторного плана 23. Эта матрица рассмотрена в параграфе 2.6. При увеличении числа факторов целесообразность использования дробных реплик для получения модели объекта возрастает. Если часть эффектов (обычно это взаимодействия высших порядков) в модели отсутствует, то дробный факторный план (дробная реплика) дает возможность существенно уменьшить количество опытов. Реплика называется регулярной, если она представляет  часть от плана ПФЭ , где k – число факторов, l – целое число. Такая реплика содержит  опытов и обозначается ДФЭ . Если, например, k = 7, l = 4, то план ДФЭ  включает столбцы матрицы плана ПФЭ  для любых трех факторов, например  и . Остальные l столбцов плана для других факторов можно определить, например, генерирующими соотношениями , , , . Тогда план ДФЭ  будет иметь вид, приведенный в табл. 1.6.2.   Таблица 1.6.2   Номер опыта Фактор   1 + + + + + + + + 2 + – + + – – + – 3 + + – + – + – – 4 + – – + + – – + 5 + + + – + – – – 6 + – + – – + – + 7 + + – – – – + + 8 + – – – + + + –   Количество опытов равно числу определяемых параметров линейной модели, следовательно, данная дробная реплика является насыщенным линейным ортогональным планом. Для определения параметров линейной семифакторной модели надо провести всего восемь опытов, тогда как план ПФЭ  предусматривает 128 опытов. Если реализуется часть плана ПФЭ , не равная числу  то реплика называется нерегулярной.       2. РАСЧЕТ ПАРАМЕТРОВ модели ПО результатам опытов   2.1. План полного факторного эксперимента 22   Одним из основных строительных материалов является бетон – искусственный каменный композиционный материал. Он образуется [7] при затвердевании рационально подобранной бетонной смеси из вяжущего вещества (цемента), воды, заполнителей (песок, щебень) и в ряде случаев специальных добавок. Прочность бетона и удобоукладываемость бетонной смеси являются важнейшими требованиями, предъявляемыми к этому материалу. По результатам опытов (см. табл. 2.1.1) требуется определить зависимость средней прочности бетона `Rб от водоцементного соотношения В/Ц и активности цемента Rц.   Таблица 2.1.1   Уровень Фактор = В/Ц Марка цемента = Rц xHj 0,4 400 1 600   Середина интервала изменения факторов принимается за нулевой уровень: ; .   Для каждого фактора вычисляется интервал варьирования     и осуществляется линейное преобразование   .                                  (2.1.1)   После преобразования безразмерные факторы (2.1.1) принимают только значения ±1, например, наименьшее значение водоцементного соотношения равно –1 и т. д. Далее в таблицах значения факторов обозначаются лишь знаками «+» или «–». В табл. 2.1.2 приведены результаты четырех опытов двухфакторного эксперимента. Для удобства расчетов в эту таблицу добавлен фиктивный фактор , все значения которого равны +1.   Таблица 2.1.2 Номер опыта Фактор, отклик y =`Rб, МПа 1 + + + 25 2 + – + 70 3 + + – 15 4 + – – 45   Для линейной модели (1.4.2) параметры  вычисляются по следующим формулам (1.4.5):   ; ; .   В этих формулах знаки между значениями  совпадают со знаками соответствующих столбцов табл. 2.1.2. Подставив вычисленные значения  в формулу (1.4.2), получим     .           (2.1.2) Эта функция в точках плана 2.1.2 принимает следующие значения:   ,   которые отличаются от исходных значений  на 3,75 МПа. Наибольшая относительная ошибка достигает 25%. Если эта точность не удовлетворительна, в математическую модель, прежде всего, следует добавить нелинейное слагаемое  с коэффициентом   .   Функция (1.4.2) принимает вид   . (2.1.3)   Значения данной функции на уровнях факторов ±1 полностью совпадают с соответствующими исходными значениями . Это объясняется тем, что четыре параметра модели (1.4.2) были определены по четырем опытам. Такие планы называются насыщенными [1]. Недостаток подобных планов состоит в том, что для проверки адекватности модели надо проводить дополнительные опыты (см. стр. 31). После построения модели с нормированными факторами и ее оценки следует вернуться к натуральным факторам, используя нормирующие соотношения (1.2.5). Подставляя, например, в формулу (2.1.3) натуральные значения факторов (2.1.1), получаем     Формулы расчета параметров модели легко программируются. На рис. 2.1 приведен пример расчета, выполненный в программе «EXCEL».     Рис. 2.1 2.2. Композиционные планы при двух факторах   В параграфе 2.1 в насыщенном плане была получена математическая модель объекта (2.1.3). В результате дополнительного опыта, проведенного в центре плана (0; 0), величина отклика  приняла значение 30. Значение функции (2.1.5) в этой точке , т. е. погрешность составляет приблизительно 29%. Если такая погрешность слишком велика, необходимо добавить слагаемые в функцию (2.1.5). В табл. 2.2.1 приведен композиционный план для построения модели с квадратичными эффектами.   Таблица 2.2.1   Номер опыта Фактор, отклик y 1 + + + 25 2 + – + 70 3 + + – 15 4 + – – 45 5 + 0 0 30 6 + – 0 60 7 + + 0 20 8 + 0 – 25 9 + 0 + 45     Параметры модели вычисляются по формулам (1.5.2) – (1.5.5):     ;   ;         По формуле (1.5.7) вычисляется свободный член уравнения   .   Итак, модель с квадратичными эффектами имеет вид         После перехода к натуральным факторам получим     (2.2.1) .   Таблица 2.2.2 дает возможность оценить качество прогноза результатов опытов по математической модели (2.2.1).   Таблица 2.2.2   Номер опыта Результат опыта Прогноз модели (2.2.1) Абсолютная погрешность Относительная погрешность, % 1 25 26,25 1,25 5,00% 2 70 72,08 2,08 2,98% 3 15 15,42 0,42 2,78% 4 45 46,25 1,25 2,78% 5 30 33,33 3,33 11,11% 6 60 58,33 1,67 2,78% 7 20 20,00 0 0,00% 8 25 25,00 0 0,00% 9 45 43,33 1,67 3,70%   Модель (2.2.1) можно попробовать упростить, отбрасывая слагаемое с наименьшим коэффициентом 0,83. После пересчета параметра   ,   математическая модель принимает вид   .   (2.2.2)   Если исключить дополнительно из формулы (2.2.2) сравнительно небольшое слагаемое , то получим еще более простую модель   .     (2.2.3)   В параграфе 4.3 показано, как можно упростить модель при наличии помех.     2.3. Анализ результатов моделирования   Адекватность математической модели – это соответствие модели экспериментальным данным по выбранному критерию [1]. Существуют различные способы выбора критерия. Главное требование к модели – способность предсказывать результаты дальнейших опытов с требуемой точностью. Естественно требовать, чтобы прогноз результатов проведенных опытов был бы как можно более точным. Лучше та модель, в которой меньше различие между экспериментальным и теоретическим значениями отклика. В табл. 2.3.1 для построенных в параграфах 2.1 и 2.2 математических моделей объекта приведены теоретические значения отклика в точках плана.   Таблица 2.3.1   Номер формулы 1 2 3 4 5 6 7 8 9 25 70 15 45 30 60 20 25 45 2.1.2 28,75 66,25 11,25 48,75           2.1.3 25 70 15 45           2.2.1 25,69 71,53 14,86 45,69 32,78 57,78 19,44 24,44 42,78 2.2.2 27,07 72,91 16,12 47,07 33,33 58,33 19,99 25,82 44,16 2.2.3 23,32 76,66 19,87 48,32 33,33 58,33 19,99 25,82 44,16   Примечание. В шапке таблицы в первой строке – номер опыта, во второй – отклик yi.   Если количество вычисляемых параметров модели  совпадает с числом проведенных опытов, то экспериментальные и теоретические значения отклика полностью совпадают (формула 2.1.3). Это не означает, что данная модель лучшая. В критерии проверки адекватности должна учитываться разность между числом опытов N и количеством параметров r, вычисляемых по результатам эксперимента. Величина  называется числом степеней свободы. Учитывая, что в методе наименьших квадратов минимизируется функция (1.4.1), в качестве критерия точности прогноза обычно выбирают сумму квадратов погрешностей, деленную на число степеней свободы:   .                    (2.3.1)   Эта величина называется остаточной дисперсией или дисперсией адекватности. Например, для модели (2.1.2)   .   В табл. 2.3.2 приведены значения дисперсии адекватности для всех построенных моделей.   Таблица 2.3.2   Номер формулы N r 2.1.2 4 3 56,25 2.1.3 4 4 – 2.2.1 9 6 7,18 2.2.2 9 5 8,39 2.2.3 9 4 19,43   Если при сравнении двух моделей остаточные дисперсии различаются незначительно (формулы 2.2.1 и 2.2.2), то предпочтительной является более простая модель. Наличие помех может поменять значение отклика при повторном измерении. В параграфе 4.4 показано, как проверяется статистическая адекватность модели в этом случае. Для проверки адекватности модели (2.1.3) нужен другой подход. Можно, например, провести дополнительный опыт. Тогда логично узнать отклик  в центре плана при нулевых нормированных факторах, так как эта точка находится на равных расстояниях от других точек плана. Величина отклика объекта у0 в центре плана должна мало отличаться от параметра a0, т. е. если задана разрешенная погрешность модели , то должно выполняться условие . Проверка адекватности модели, построенной по насыщенному плану, проведена в параграфе 4.4. Выбор модели зависит, конечно, от того, с какой целью она строилась. Если требовалось изучить качественное влияние факторов на отклик, то можно ограничиться линейной моделью. Величина параметра определяет степень воздействия фактора на отклик. Если в линейной модели (2.1.2) параметр а1 отрицателен, то уменьшение фактора  приводит к росту отклика объекта. Чем больше модуль параметра а1, тем больше его влияние. В более сложных моделях, например (2.1.3), с отрицательными эффектами парного взаимодействия уменьшение отклика происходит при одновременном увеличении или уменьшении величин факторов. Модель может создаваться для решения задач оптимизации, т. е. определения сочетания значений факторов, при котором отклик становится наибольшим или наименьшим. В этом случае нужна более точная модель. При решении задач оптимизации модели с двумя факторами отклик объекта можно геометрически представить поверхностью в пространстве. На рис. 2.3 изображена поверхность, соответствующая нелинейной модели (2.2.1). Очевидно, что в точке с координатами  отклик имеет максимальное значение, а в точке  отклик становится минимальным. В случае большего количества факторов геометрическая наглядность функции отклика теряется. Однако известно [9], что в линейной модели экстремальные значения отклика достигаются при значениях факторов ±1, т. е. в точках плана ПФЭ 2k. При этом наибольшее значение отклика , а наименьшее . Методы нахождения экстремальных значений функции подробно изложены в литературе [8, 9].     Рис. 2.3   На практике приходится учитывать несколько откликов объекта. Так, например, при изучении свойств бетона исследуется как прочность бетона, так и удобоукладываемость бетонной смеси. Математические модели можно построить для каждого отклика, но нельзя одновременно решать задачи оптимизации несколько функций. Однако всегда полезно исследовать возможность уменьшения числа выходных откликов. Для этого между парами откликов необходимо (см. 3.13) вычислить выборочный коэффициент корреляции , который является характеристикой связи между двумя случайными величинами. Чем ближе модуль значения  к единице, тем сильнее значение одного отклика зависит от того, какое значение принял другой. В этом случае дальнейший анализ можно проводить для одного из двух откликов.   2.4. План полного факторного эксперимента 23   Одной из оценок удобоукладываемости пластичных смесей является подвижность, значение которой определяется [7] величиной ОК, т. е. осадкой стандартного конуса. По результатам опытов требуется определить зависимость подвижности бетонной смеси от расхода цемента, водоцементного соотношения В/Ц и специальных добавок при постоянном расходе щебня (10 кг). В табл. 2.4.1 приведены исходные данные опытов с тремя факторами, вычислены координаты центра плана  и интервалы варьирования . Таблица 2.4.1   Уровень Факторы Масса цемента , кг Водоцементное соотношение Добавка , % от массы цемента 1,7 0,6 0,5 2,1 0,8 0,7 1,9 0,7 0,6 0,2 0,3 0,1   Результаты восьми опытов полного факторного эксперимента 23 приведены в последнем столбце табл. 2.4.2.   Таблица 2.4.2   Номер опыта Фактор, отклик y = ОК 1 + + + + 9 2 + – + + 6 3 + + – + 8,5 4 + – – + 5,5 5 + + + – 8 6 + – + – 6 7 + + – – 7 8 + – – – 5   Для линейной модели (1.4.2) параметры  вычисляются по формулам (1.4.5):   ; ;   ;   Следовательно, линейная модель имеет вид                   (2.4.1)   Эффекты взаимодействия вычисляются по формулам (1.4.6) и (1.4.7):   ; ; ; .   Математическая модель с эффектами взаимодействия имеет вид   .   Слагаемые с нулевыми коэффициентами  и , конечно, не меняют функцию отклика, а слагаемые с малыми коэффициентами меняют ее незначительно. Поэтому кроме построенной функции            (2.4.2)   можно рассмотреть более простую функцию   .                    (2.4.3)     В таблице 2.4.3 приведены предсказываемые значения отклика, а в табл. 2.6.2 – остаточные дисперсии для различных моделей. На рис. 2.4 приведен пример расчета, выполненный в программе «EXCEL».   Таблица 2.4.3   Номер формулы 1 2 3 4 5 6 7 8 9 6 8,5 5,5 8 6 7 5 2.4.1 8,875 6,375 8,125 5,625 8,125 5,625 7,375 4,875 2.4.2 9 6 8,5 5,5 8 6 7 5 2.4.3 9,125 6,125 8,375 5,375 7,875 5,875 7,125 5,125   Примечание. В шапке таблицы в первой строке номер опыта, во второй – отклик yi.   Рис. 2.4   2.5. Композиционные планы при трех факторах   В табл. 2.5 представлен композиционный план для трех факторов, дающий возможность построить модель с квадратичными слагаемыми.   Таблица 2.5   Номер опыта Фактор, отклик y = ОК 1 + + + + + + + 0,270 0,270 0,270 9 2 + – + + – – + 0,270 0,270 0,270 6 3 + + – + – + – 0,270 0,270 0,270 8,5 4 + – – + + – – 0,270 0,270 0,270 5,5 5 + + + – + + + 0,270 0,270 0,270 8 6 + – + – – – + 0,270 0,270 0,270 6 7 + + – – – + – 0,270 0,270 0,270 7 8 + – – – + – – 0,270 0,270 0,270 5 9 + 0 0 0 0 0 0 –0,730 –0,730 –0,730 7 10 + –1,215 0 0 0 0 0 0,747 –0,730 –0,730 5 11 + +1,215 0 0 0 0 0 0,747 –0,730 –0,730 9 12 + 0 –1,215 0 0 0 0 –0,730 0,747 –0,730 6,5 13 + 0 +1,215 0 0 0 0 –0,730 0,747 –0,730 7,5 14 + 0 0 –1,215 0 0 0 –0,730 –0,730 0,747 6 15 + 0 0 +1,215 0 0 0 –0,730 –0,730 0,747 7,5 Сумма квадратов 15 10,952 10,952 10,952 8 8 8 4,361 4,361 4,361       В последней строке табл. 2.5 записаны значения вспомогательных величин, необходимых для дальнейших расчетов:   ; ; ;   В плане ПФЭ и композиционном плане эффекты взаимодействия рассчитываются одинаково (см. 1.5), поэтому из формулы (2.4.2) имеем ; ; . Остальные эффекты вычисляются по формулам (1.5.2) – (1.5.5):   ;                   Математическая модель, построенная по композиционному плану, имеет вид     2.6. Дробный план при трех факторах   В табл. 2.6.1 записана полуреплика 23–1 с генерирующим соотношением . В последнем столбце таблицы приведены значения откликов, взятые из табл. 2.4.2.   Таблица 2.6.1   Номер опыта Фактор, отклик y = ОК 1 + + + – 8 2 + – + + 6 3 + + – + 8.5 4 + – – – 5   Параметры  линейной модели находим по следующим формулам (1.4.5):   ;   ;   ;   .   Следовательно, линейная модель имеет вид   .           (2.6.1)   В табл. 2.6.2 приведены остаточные дисперсии  (2.3.1) для различных моделей.   Таблица 2.6.2   Номер формулы N r 2.4.1 8 4 0,157 2.4.2 8 6 0 2.4.3 8 5 0,025 2.5.1 15 9 0,078 2.6.1 4 4 –   Следует отметить, что у моделей (2.4.1) и (2.6.1) во всех точках плана погрешность одинакова и равна 0,375, но количество проводимых опытов в последнем случае в два раза меньше. Проверка адекватности модели (2.6.1) проведена в параграфе 4.4.         3. ЭЛЕМЕНТЫ ТЕОРИИ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ   3.1. Основные формулы теории вероятностей Испытанием в теории вероятностей называется регистрация некоторого результата при выполнении определенного комплекса условий. Предполагается, что испытание может быть воспроизведено многократно. События А и В называются несовместными, если они никогда не происходят вместе в одном испытании. Событие , состоящее в том, что событие А в испытании не происходит, называется событием, противоположным событию А. Объединение событий А В означает, что происходят либо А, либо В, либо оба события; пересечение событий А В – происходят и А и В. Разность событий А\В означает, что происходят событие А и событие . Вероятность  есть числовая характеристика возможности появления события А в испытании. Классическое определение вероятности     где n – общее число возможных элементарных исходов (событий); m – число исходов, при которых происходит событие А. Классическое определение вероятности можно применять в случаях, когда элементарные исходы единственно возможны (одно из них обязательно произойдет), попарно несовместны (более одного элементарного исхода в испытании произойти не может) и равновозможны. Событие W, которое всегда происходит в испытании, называется достоверным событием; событие Æ,которое в испытании никогда не происходит, называется невозможным событием. Перечислим основные свойства вероятности: 1) Р(W) = 1; 2) Р(Æ) = 0; 3) ; 4) , если события А и В несовместны; 5) ; 6) , если событие В всегда происходит, когда происходит А. Условной вероятностью  события А относительно события В называется вероятность события А, вычисленная в предположении, что событие В произошло. События А и В называются независимыми, если = Р(А) и = Р(В). Теорема умножения вероятностей: Р(А В) = Р(А) · Р(В/А); теорема умножения для независимых событий: Р(А В) = Р(А)×Р(В). Теорема сложения вероятностей: Р(А В) = Р(А) + Р(В) – Р(А В); теорема сложения для несовместных событий: Р(А В) = Р(А) + Р(В); теорема сложения для совместных и независимых событий: Р(А В) = Р(А) + Р(В) – Р(А)×Р(В).     3.2. Случайные величины Случайной называется переменная величина X, принимающая в результате испытания одно из множества возможных значений. Вероятность  того, что случайная величина X примет значение меньшее, чем заданное х, называется функцией распределения  случайной величины, т. е.   F(х) = , хÎR.   Случайная величина х называется дискретной, если она принимает конечное или счетное множество значений. Дискретная случайная величина задается множеством пар (xi, pi), где хi – возможные значения случайной величины, pi – вероятности принятия случайной величиной значений xi. При этом . Соответствие pi и хi называется законом распределения дискретной случайной величины:   хi х1 х2 х3 … хn рi р1 р2 р3 … рn   Для дискретной случайной величины X функция распределения   ,   где суммируются вероятности тех значений xi, которые меньше x.     Неслучайную величину С можно рассматривать как случайную с законом распределения   хi С рi 1 Непрерывная случайная величина может принимать все значения из некоторого (конечного или бесконечного) промежутка, и ее функция распределения F(х) должна быть непрерывной. Если функция F(х) дифференцируема, то ее производная f(х) = F ¢(х) называется плотностью распределения вероятностей. Перечислим основные свойства функции и плотности распределения вероятностей: 1) Р(а £ х < b) = F(a) – F(b) = , вероятность попадания случайной величины х в интервал [a; b) равна площади заштрихованной криволинейной трапеции (рис. 3.2); 2) ; 3) ; 4) неубывающая функция; 5) f(х) ³ 0; 6) F(х) = ; 7)  = 1, площадь S, заключенная между графиком плотности распределения f(х) и осью 0х, равна единице (рис. 3.2).         Рис. 3.2.1       0     Рис. 3.2     3.3. Числовые характеристики случайных величин   Математическое ожидание МХ – величина, около которой группируются возможные значения случайной величины (числовая характеристика положения); дисперсия DХ характеризует рассеивание (разбросанность) случайной величины относительно ее математического ожидания. Для дискретной случайной величины математическое ожидание и дисперсия вычисляются по формулам   МХ = ;                              (3.3.1)   DХ = .                         (3.3.2)   Для непрерывной случайной величины   МХ = ;                               (3.3.3)   DХ = .                (3.3.4)   Если непрерывная случайная величина может принимать значения только на конечном интервале [a; b], то   МХ =    DХ = .   Размерность величины МХ совпадает с размерностью самой случайной величины Х, а размерность DХ равна квадрату размерности Х. Поэтому в качестве числовой характеристики рассеивания используется также среднеквадратичное отклонение . Математическое ожидание и дисперсия обладают следующими свойствами: 1)  (С – const); 2) 3) 4)  если X и Y независимы; случайные величины называются независимыми, если закон распределения одной случайной величины не зависит от того, какие значения приняла другая; 5)  (С – const); 6) 7) 8)  если X и Y независимы; 9) DХ = М(Х 2) – (МХ)2.     3.4. Числовые характеристики среднего арифметического случайных величин   В теории измерений часто вычисляется среднее арифметическое  независимых случайных величин х1, х2, … , хN с одинаковыми математическими ожиданиями МХ и дисперсиями DX. Случайная величина     имеет такое же математическое ожидание MX, как и слагаемые . Действительно, учитывая свойства 2 и 3 математического ожидания, получаем    (3.4.1) .     Дисперсия среднего арифметического  в N меньше DX:   .                        (3.4.2)   Для стандартного отклонения имеем:   .       (3.4.3)   3.5. Нормальное распределение   Случайная непрерывная величина Х подчинена нормальному закону распределения (закону Гаусса) с двумя параметрами a и s, т. е. Х Î N(a; s), если ее плотность распределения имеет вид   .                                 (3.5.1)   В теории планирования эксперимента принято считать, что ошибки измерений величин распределены по нормальному закону. Случайная величина Х, распределенная по закону Гаусса, может принимать любые значения (ХÎR). Вид кривой плотности распределения , представленной на рис. 3.5.1, определяется значениями  и  [10].     Рис. 3.5.1   Изменение величины параметра  не изменяет формы нормальной кривой, но сдвигает ее вдоль оси х. Максимум функции f(x) достигается в точке а и равен . С возрастанием  нормальная кривая становится более пологой, т. е. сжимается к оси x и растягивается вдоль нее. При уменьшении  нормальная кривая стягивается к прямой x = a. Математическое ожидание случайной величины с нормальным распределением МХ = а. Точка x = a называется центром распределения вероятностей, или центром рассеивания. Дисперсия нормального распределения случайной величины DХ = s2. Сумма независимых случайных величин, подчиненных закону Гаусса, также имеет нормальное распределение, но с другими параметрами. Нормальное распределение является хорошим приближением в случае, когда изучаемая величина представляет собой сумму независимых и одинаково распределенных случайных слагаемых. А. М. Ляпуновым была доказана более общая теорема, называемая центральной. Если случайная величина X представляет собой сумму достаточно большого числа независимых случайных величин (причем среди них нет доминирующих) с любыми распределениями вероятностей, то X имеет распределение вероятностей близкое к нормальному. Согласно свойству 6 (см. 3.2) функция распределения вычисляется по формуле   F(х) = .                 (3.5.2)   График функции F(х) изображен на рис. 3.5.2.   1   Рис. 3.5.2   Распределение с параметрами  и  называется стандартным нормальным распределением. В этом случае функция распределения (Ф(х)) имеет вид   .                                  (3.5.3)   На практике чаще используется функция Лапласа   .   Так как , то в таблицах (см. приложение 1) можно приводить значения функции  только для положительных значений аргумента. Производные функций  и  равны и   .                                  (3.5.4)   Таблицы значений функции также приведены в приложении 1. Зная значения функции Лапласа, можно найти величину функции распределения (3.5.2) в любой точке:   .   Тогда вероятность попадания случайной величины X, распределенной по нормальному закону N(а, s), в интервал [х1; х2) вычисляется по формуле   Р(х1 £ Х < х2) = . (3.5.5)   Для нормального распределения также верна формула   .   В теории планирования эксперимента часто используются распределения, связанные с нормальным. Пусть х1, х2, … , хk – независимые стандартные нормальные случайные величины, т. е. xi Î N(0; 1). Случайная величина   U = х12 + х22+ … + хk2                                          (3.5.6) имеет [11] распределение ck2 (распределение хи-квадрат) с k степенями свободы, плотность которого задается формулой                (3.5.7)   где  – гамма-функция. Пусть t, х1, … , хk – независимые стандартные нормальные случайные величины. Случайная величина                                                  (3.5.8)   имеет [11] распределение Стьюдента с k степенями свободы, плотность которого задается формулой   .                       (3.5.9)   Функция  – четная, следовательно,                                    (3.5.10) и .                  (3.5.11)   Пусть U и V – независимые случайные величины с распределением  и  соответственно. Случайная величина                                              (3.5.12) имеет [11] распределение Фишера с m и n степенями, плотность которого задается формулой   (3.5.13)   Распределения c2, Стьюдента, Фишера широко используются при проверке гипотез (см. 3.8). Необходимые для расчетов таблицы этих функций приведены в приложениях.   3.6. Коррелированные случайные величины   Характеристикой связи между случайными величинами Х и Y является коэффициент корреляции   rxy = М((Х – МХ)(Y – МY)).             (3.6.1)   Значение коэффициента корреляции как меры взаимосвязи случайных величин определяется следующими свойствами rxy: 1) ; 2) если случайные величины независимы, то rxy = 0 (обратное утверждение в общем случае неверно); 3)  только в том случае, когда величины Х и Y связаны между собой линейной зависимостью. Случайные величины Х и Y называются коррелированными, если их коэффициент корреляции отличен от нуля. Чем ближе к линейной зависимость между Х и Y, тем менее величина  отличается от единицы. Если Х и Y – коррелированные величины, то приближенное представление Y в виде линейной функции от Х определяется уравнением линейной регрессии:   Y = МY + rху (Х – МХ).   Величина b = rху  называется коэффициентом регрессии Y на Х. 3.7. Эмпирическая функция распределения   Как правило, экспериментатор во время проведения опыта выполняет измерения несколько раз. В математической статистике предлагаются методы обработки данных, позволяющие получить наиболее точную информацию об измеряемой величине. До проведения опыта результат измерения является случайной величиной, которая в статистике называется генеральной совокупностью. Если предполагается проведение n независимых измерений, то их результаты следует считать независимыми одинаково распределенными случайными величинами с одинаковыми математическими ожиданиями МХ и дисперсиями DX. Полученный набор результатов измерений х1, х2, … , хn называется независимой выборкой объема n из генеральной совокупности. Упорядоченная по величине выборка х1 ≤ х2 ≤ … ≤ хn называется вариационным рядом. Функция F*(х) = , где nх – число членов вариационного ряда меньших х, называется эмпирической функцией распределения. Аналогом графика плотности распределения случайной величины в математической статистике является гистограмма (рис. 3.7). Весь диапазон изменения выборки делится на k интервалов точками а0, а1, … , аk . Эти точки наносятся на ось 0х, и отрезки [аj–1; аj] длиной hj = аj – аj–1 принимаются за основания прямоугольников. Высоты прямоугольников равны приведенным частотам  (или относительным частотам ; где nj – количество элементов выборки, попавших в j-й интервал [аj–1; аj).       Рис. 3.7   Площадь S гистограммы равна 1 (или объему выборки n для относительных частот).     3.8. Оценка параметров функции распределения   Функция g(х1, х2, … , хn) элементов выборки называется статистикой. Точечной оценкой (оценкой одним числом) неизвестного параметра q функции распределения F(х) является такая статистика, что при любом положительном значении e   .   Выборочное среднее   ,                                   (3.8.1)   выборочная дисперсия   ,   а также «исправленная» выборочная дисперсия                            (3.8.2)   являются соответственно точечными оценками математического ожидания и дисперсии генеральной совокупности. Пример расчета выборочного среднего и исправленной выборочной дисперсии приведен в параграфе 4.4 (формулы 4.4.4 и 4.4.5). Промежуток (q* – e, q* + e), покрывающий неизвестное значение q с заданной вероятностью g, называется интервальной оценкой параметра q:   .                  (3.8.3)   Интервал (q* – e, q* + e) называется доверительным (рис. 3.8), e – точностью оценки, g – доверительной вероятностью. Величина  называется уровнем значимости.     Рис. 3.8   При построении интервальной оценки математического ожидания принимается, что случайная величина Х подчинена нормальному закону распределения с параметрами a и s. Пусть по результатам n испытаний для Х вычислены точечные оценки математического ожидания (3.8.1)  и исправленной дисперсии (3.8.2) . Для того чтобы построить доверительный интервал (3.8.3) для математического ожидания а, рассмотрим случайную величину   ,   которая имеет [11] распределение Стьюдента с k = n – 1 степенями свободы (3.5.8). Так как плотность вероятности f(x, k) распределения Стьюдента (3.5.9) известна, то, используя формулы (3.5.10) и (3.5.11), для любого значения t можно вычислить вероятность   (3.8.4)     Обозначив  через g, найдем   .   В приложении 2 приведена таблица, по которой можно найти , зная значения k и . Условие  можно записать в форме двойного неравенства   ,   которому можно придать вид   .                    (3.8.5)   Значит, равенство (3.8.4) может быть записано в виде доверительного интервала (3.8.3)   ,                    (3.8.6)   где  – точность интервального оценивания,  – точечная оценка дисперсии среднего арифметического , g – доверительная вероятность, т. е. надежность, с которой математическое ожидание а расположено внутри доверительного интервала . При уменьшении g увеличивается значение t, а следовательно, и e. Более надежная оценка является менее точной. Пример расчета доверительного интервала для математического ожидания приведен в параграфе 4.6. При построении интервальной оценки дисперсии также принимается, что случайная величина Х подчинена нормальному закону распределения с параметрами a и s. Пусть по результатам n испытаний вычислена точечная оценка дисперсии (3.7.2) . Для того чтобы построить доверительный интервал (3.7.3) для дисперсии s, рассмотрим случайную величину   ,                                             (3.8.7)   которая имеет [12] распределение  с k = n – 1 степенями свободы. Так как плотность вероятности распределения  (3.5.7) известна, то, выбрав значение g, можно найти числа t1 и t2: , .   Тогда   .   Неравенство  эквивалентно неравенству , которое можно записать в виде доверительного интервала (3.8.3)   ,                         (3.8.8)   где , .   В приложении 3 приведена таблица, по которой можно найти q1 и q2, зная значения k и g. Если, например, s = 1,33, k = 12, а надежность g выбрана 0,95, то уровень значимости  и табличные значения q1 = 0,746, q2 = 1,718. Тогда согласно (3.8.8) истинное значение  с вероятностью 0,95 находится в интервале   .     3.9. Статистические гипотезы   Статистической называется гипотеза о виде неизвестного распределения или о параметрах известных распределений. Проверяемая гипотеза называется нулевой (основной) и обозначается Н0. Наряду с гипотезой Н0 рассматривается альтернативная (конкурирующая) гипотеза Н1, которая принимается, если нулевая гипотеза будет отвергнута. Перед статистическим анализом назначается некоторое близкое к нулю число a (уровень значимости) – граница пренебрежимо малых вероятностей. Проверка статистической гипотезы основывается на принципе практической достоверности, в соответствии с которым маловероятные случайные события являются практически невозможными в единичном испытании. Сначала предполагается истинность нулевой гипотезы, затем исследуются результаты опытов. Если при этом фиксируется событие, вероятность появления которого меньше a, то нулевая гипотеза считается неверной. Действительно, достаточно привести один контрпример, противоречащий некоторому утверждению, чтобы это утверждение было отклонено. Хотя это решение может быть ошибочным с малой вероятностью (риском) a. Гипотезу, принятую на основании одного примера, нельзя считать несомненно истинной. Поэтому вывод следует формулировать следующим образом: нет оснований отклонять нулевую гипотезу, так как результаты наблюдений согласуются с ней. В итоге проверки гипотезы могут быть допущены ошибки двух типов. Ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза, так как осуществилось маловероятное событие. Вероятность такой ошибки равна уровню значимости a. Ошибка второго рода состоит в том, что будет принята неправильная гипотеза. Возможные при проверке предположений ошибки сведены в табл. 3.9.   Таблица 3.9   Результат проверки гипотезы Реальный результат Н0 истина Н1 истина Н0 принимается Верное решение Ошибка 2-го рода (вероятность b) Н0 отклоняется Ошибка 1-го рода (вероятность a) Верное решение   Фактически a и b означают риски исследователя, принимающего решение. Проверяемую гипотезу Н0 нужно выбирать так, чтобы наиболее опасная ошибка при принятии решения была ошибкой первого рода. Поэтому при проверке гипотез задают величину a, т. е. вероятность «ложной тревоги». Вероятность ошибки a характеризует надежность проверки гипотезы в целом, а не результат одной проверки. Последнее означает, что если проверка при уровне значимости a = 0,05 проводится достаточно часто, то примерно в 5% случаев гипотеза Н0 будет отклоняться, хотя она в действительности верна. Но величину a нельзя выбирать слишком малой, так как уменьшение a связано с увеличением вероятности b ошибки второго рода. При планировании эксперимента наиболее распространенным значением a является 0,05, но в некоторых случаях исследователь может выбирать другие значения a, например, 0,1; 0,01 и т. п. Правило, по которому принимается решение об отклонении гипотезы Н0, основано на заранее выбранном критерии – возможной величине статистики G. До проведения опытов G – случайная величина, принимающая значения в некоторой области V, с известной функцией распределения при выполнении нулевой гипотезы. После проведения опытов величина G рассчитывается по значениям выборки, следовательно, принимает определенное значение Gpac. Для того чтобы выделить критическую область Vк Î V , попадание в которую конкретной величины Gpac является событием практически невозможным, надо вычислить условнуя вероятность   Р(Gpac Î Vк/Н0) = a.                          (3.9.1)   Статистический критерий проверки гипотезы формулируется следующим образом: следует отклонить нулевую гипотезу Н0, если Gpac Î Vк. Область, дополнительную к критической, называют областью принятия гипотезы. Если Gpac Î V\Vк (V\Vк – разность множеств V и Vк ), то можно считать, что опытные данные не противоречат гипотезе Н0,. Таким образом, множество всех возможных значений контролируемой величины G разбивается на два непересекающихся подмножества: 1) значения критерия G, при которых нулевая гипотеза Н0 отвергается; 2) значения критерия G, при которых нулевая гипотеза принимается. Обычно все возможные значения контролируемого параметра G заполняют некоторый промежуток (конечный или бесконечный). Критическими называются точки Gкр, отделяющие критическую область от области принятия гипотезы. Критические области подразделяют на правосторонние (рис. 3.9.1), левосторонние (рис. 3.9.2) и двусторонние (рис. 3.9.3).       Рис. 3.9.1     Рис. 3.9.2     Рис. 3.9.3   Для правосторонней области, например, значение Gкр – это величина, определенная из равенства Р(G ³ Gкр) = a. Значения Gкр для различных критериев и уровней значимости a сведены в таблицы, наиболее полные из них опубликованы в справочнике [13]. В приложениях приведены фрагменты таблиц, используемых в расчетах при планировании эксперимента. Таким образом, проверка статистической гипотезы состоит из нескольких этапов: 1) формулируются проверяемая (Н0) и конкурирующая (Н1) гипотезы; 2) выбирается уровень значимости a; 3) для проверки гипотезы Н0 выбирается случайная величина G с известной функцией распределения; 4) определяется по таблицам критическое значение Gкр; 5) вычисляется значение Gpac по конкретной выборке; 6) принимается статистическое решение: если точка Gpac попала в критическую область, то следует отклонить статистическую гипотезу Н0 как не согласующуюся с результатами наблюдений. Если для выбранного критерия установлена критическая область, то ошибка первого рода a = Р(Gpac Î Vк/Н0) может быть интерпретирована как условная вероятность, вычисленная в случае, когда верна нулевая гипотеза Н0. Предполагая, что верна конкурирующая гипотеза Н1, можно вычислить b – условную вероятность попадания G в область принятия гипотезы Н0. При фиксированном значении a и наличии нескольких критериев лучшим считается тот, у которого меньшее значение ошибки второго рода b. Вероятность 1 – b того, что нулевая гипотеза Н0 будет отклонена, если верна конкурирующая гипотеза Н1, называется мощностью критерия. Измерения в эксперименте обычно считаются случайной величиной, распределенной по нормальному закону. Для проверки этой статистической гипотезы надо всю числовую ось разбить на r частей (разрядов) таким образом, чтобы в каждом разряде оказалось не менее пяти элементов выборки. Эмпирическая (наблюдаемая) частота – это количество элементов выборки nj в разряде, деленное на объем выборки n. Эмпирические частоты не должны существенно отличаться от теоретических вероятностей pj, вычисленных в предположении о нормальном распределении генеральной совокупности. Следовательно, если верна нулевая гипотеза, то величина ÷nj/n – pjê не должна быть слишком большой. Обозначим через а1< а2< ... < аr–1 границы разрядов. Вероятность попадания случайной величины  в промежуток [аj ‑1, аj) можно вычислить по формуле (3.5.5)   .   Для проверки нулевой гипотезы можно выбрать критерий Пирсона (критерий χ2)   .        (3.9.2)   Эта величина случайная, так как в различных опытах она принимает различные, заранее неизвестные значения. Значение U зависит от общей степени расхождения эмпирических частот nj/n и теоретических вероятностей pj во всех разрядах. Возведение в квадрат исключает возможность взаимного погашения отрицательных и положительных разностей. Поправочный коэффициент  меняет вес слагаемых в зависимости от вероятности попадания Х в данный разряд. В разрядах с большей вероятностью pj допускаются большие отклонения эмпирической частоты от теоретической вероятности. Для выборок большего объема n разности ÷nj/n – pjê должны быть в целом меньше, чтобы критерий Пирсона принял то же самое значение. При больших n статистика (3.9.2) имеет распределение, близкое к распределению  с k = r – 3 степенями свободы [11, 14]. Числом степеней свободы в статистике называется разность между числом опытов и количеством формул, связывающих между собой элементы выборки. В данном случае элементы выборки использовались при вычислении выборочного среднего  и выборочной дисперсии s2, а кроме того, . Рис. 3.9.4 Если статистика U примет значение больше c2кр, то гипотеза о нормальном распределении генеральной совокупности отвергается. Значения c2кр сведены в таблицу (приложение 3). Это таблица с двумя входами. По строкам меняется число степеней свободы k, столбцы связаны с уровнем надежности a. На пересечении соответствующих строки и столбца расположены критические значения c2кр. На рисунке 3.9.4 показан пример обработки выборки с проверкой нормальности распределения, вычислением доверительного интервала для математического ожидания (параграф 3.8) и построением гистограммы (см. 3.7). Критерий Пирсона можно применять, когда количество результатов наблюдений больше 50. Существуют методы [15] проверки нормальности распределения при числе наблюдений от 16 до 50. В том же ГОСТе [15] указано, что при меньшем количестве наблюдений принадлежность их к нормальному распределению не проверяется. В планировании эксперимента не всегда удается провести большое количество измерений в опыте, и обычно предположение о нормальном распределении принимается без проверки (см. 4.1).   3.10. Критерий Кохрена   Если имеется N независимых случайных величин, распределенных по нормальному закону, и есть основания считать, что все они имеют одинаковые дисперсии, то следует проверить эту статистическую гипотезу. Для каждой случайной величины по результатам m испытаний вычисляется исправленная выборочная дисперсия (3.7.2). Для проверки нулевой гипотезы можно выбрать критерий Кохрена G [11], в котором вычисляется отношение максимальной исправленной выборочной дисперсии и суммы всех дисперсий. Для конкретной выборки   .                                  (3.10.1)   Распределение этой случайной величины зависит только от двух параметров N и k = m – 1. В приложении 4 приведена таблица критических значений  для уровня значимости a = 0,05. При выбранном уровне значимости гипотеза о равенстве (однородности) дисперсий отвергается, если   . В этом случае дисперсии  различаются значимо (существенно). Следует отметить, что применять критерий Кохрена можно лишь в случае, когда выборки имеют одинаковый объем m для всех N случайных величин. В параграфе 4.5 приведен пример проверки однородности дисперсий, вычисленных в различных точках плана полного факторного эксперимента.   3.11. Критерий Фишера   Проверить гипотезу о равенстве дисперсий можно также по критерию Фишера. Пусть имеются две независимые случайные величины, распределенные по нормальному закону. Для них по выборкам объемом m1 и m2 вычислены исправленные выборочные дисперсии (3.7.2), большая из которых обозначена , а меньшая – . В качестве критерия F проверки нулевой гипотезы равенства дисперсий (при конкурирующей гипотезе ) можно принять отношение большей выборочной дисперсии к меньшей                                             (3.11.1)   Случайная величина F имеет распределение Фишера [11] и зависит от двух параметров: степени свободы меньшей дисперсии k1 = m1 – 1 и степени свободы большей дисперсии k2 = m2 – 1. При уровне значимости a гипотеза о равенстве дисперсий отвергается, если . Таблица критических значений  для уровня значимости 0,05 приведена в приложении 5. Если проверяется гипотеза о равенстве дисперсий N случайных величин (N > 2), то по критерию Фишера можно сравнить у них наибольшую и наименьшую дисперсии. Если различие между ними незначимо, то и подавно незначимо различие между остальными дисперсиями. Недостаток такого подхода состоит в том, что не учитывается информация, которая содержится в остальных вычисленных дисперсиях. В параграфе 4.5 приведен пример проверки однородности дисперсий по критерию Фишера.     3.12. Проверка гипотезы о равенстве двух средних значений   Пусть имеется две независимые распределенные нормально величины Y1 и Y2, для которых по результатам выборок одинакового объема m вычислены выборочные средние ,  и дисперсии s12, s22. Если установлено, что случайные величины имеют примерно одинаковые дисперсии , то в качестве критерия проверки нулевой гипотезы равенства средних  можно принять статистику t. Тогда   .                                         (3.12.1)   Если нулевая гипотеза справедлива, то случайная величина  имеет [11] распределение Стьюдента с k = 2m – 2 степенями свободы. При конкурирующей гипотезе  критическая область является двусторонней (рис. 3.12). Наибольшая мощность критерия достигается тогда [11], когда критические точки  и  выбраны так, что   .       (3.12.2)     Рис. 3.12     Плотность распределения Стьюдента является функцией четной (рис. 3.12), следовательно,  и . При уровне значимости a гипотеза о равенстве средних значений отвергается, если . Таблица значений  приведена в приложении 3. Если объем выборок в двух опытах различен, равен  и  соответственно, то число степеней свободы , а величина  вычисляется по формуле   . 3.13. Проверка гипотезы о значимости выборочного коэффициента корреляции   Пусть имеются две независимые распределенные нормально случайные величины Y1 и Y2. По результатам выборок одинакового объема m вычислены средние , исправленные дисперсии  и выборочный коэффициент корреляции   .               (3.13.1)   Если Y1 и Y2 некоррелированы (см. 3.6), то величина rв незначительно отличается от нуля. В качестве критерия проверки нулевой гипотезы о равенстве нулю коэффициента корреляции можно выбрать статистику   .                                   (3.13.2)   Если справедлива нулевая гипотеза, то случайная величина  имеет распределение Стьюдента [11] с k = m – 2 степенями свободы. Нулевая гипотеза отвергается при уровне значимости a, если . Таблица значений  приведена в приложении 2. Если нулевая гипотеза признана ошибочной, то выборочный коэффициент корреляции следует считать отличным от нуля, а случайные величины Y1 и Y2 – коррелированными.       4. ОБРАБОТКА РЕЗУЛЬТАТОВ ЭКСПЕРИМЕНТА ПРИ НАЛИЧИИ ПОМЕХ     4.1. Ошибки эксперимента   Преимущества научного планирования эксперимента проявляются наиболее полно, если при обработке результатов необходимо оценить ошибки, вызванные помехами. Чтобы уменьшить их влияние, в каждом опыте проводится несколько измерений отклика при неизменных значениях факторов. При дублировании испытаний ошибка результата опыта становится меньше ошибки одного измерения. Результат измерения  содержит в себе как истинное значение отклика , так и ошибку , вызванную помехами. Погрешности наблюдений e принято подразделять на три группы. Грубые ошибки появляются, например, при поломках оборудования или серьезном нарушении регламента проведения опыта. Систематические ошибки одинаковы при многократных измерениях. Они могут быть вызваны плохой настройкой оборудования или дефектами метода измерений. Случайные погрешности наблюдений являются следствием причин, влияние которых учесть практически невозможно. При грубой ошибке результат испытания значительно отличается от остальных измерений. В этом случае следует провести испытание повторно (если это возможно) или не учитывать данное измерение при дальнейшей обработке результатов. Для устранения систематических ошибок необходимо регулярно проверять как оборудование, так и метод проведения опытов. Эти ошибки также можно устранить, делая поправки в результатах измерений [17]. Случайные ошибки появляются вследствие большого количества незначительных помех. Влияние каждой из них мало, но суммарное их воздействие должно приниматься во внимание при оценке полученных результатов. Теория ошибок основана на гипотезе, что случайные величины  имеют нормальное распределение (см. 3.5) с двумя параметрами: математическим ожиданием а и дисперсией s2. Ранее было показано (см. 3.9), что в реальных экспериментах эту гипотезу редко удается проверить. Но можно сформулировать следующее утверждение: все вычисленные далее точности оценок измерений и опытов наверняка верны с выбранной надежностью при нормальном распределении ошибок измерений. При других распределениях надежности оценок могут измениться. В отсутствие грубых и систематических ошибок среднее значение случайных погрешностей  можно принять равным нулю, следовательно, математическое ожидание . Последнее предположение обычно в эксперименте выполняется. Тогда распределение случайной ошибки  в каждом измерении определяется одним параметром – дисперсией . Такую же дисперсию имеет и случайный результат одного измерения  в разных точках плана эксперимента, так как   .   Метод наименьших квадратов (см. 1.4) дает возможность определять параметры математической модели. Объединение этого метода с проверками различных статистических гипотез о построенной модели называется регрессионным анализом.     4.2. Оценка рассеивания результатов наблюдений   Пусть в каждой точке плана произведено М измерений уi1, уi2, . . ., уiМ отклика уi . Выборочные средние (3.8.1) измерений   ,                                   (4.2.1)   вычисленные в каждой точке плана, определяют точечные оценки истинных значений величин отклика уi. Каждое значение (4.2.1) является случайной величиной с числовыми характеристиками  и , полученными в параграфе 3.4.  Для оценки рассеивания  результатов измерений вокруг величины отклика уi вычисляется исправленная выборочная дисперсия (3.8.2):                            (4.2.2) При обработке результатов эксперимента предполагается, что дисперсии  не зависят от величины  в разных точках плана. Проверку статистической гипотезы о примерном равенстве (однородности) выборочных дисперсий (4.2.2) можно осуществить по критерию Кохрена (см. 3.10), в котором исследуется отношение максимальной дисперсии к сумме всех дисперсий. Наблюдаемая в опыте величина критерия  вычисляется по формуле   .                                  (4.2.3)   В планировании эксперимента уровень значимости a обычно выбирается равным 0,05. Таблица критических значений  для a = 0,05 и двух параметров k = М – 1 и N приведена в приложении 4. Гипотеза о равенстве дисперсий отвергается, если . В этом случае выборочные дисперсии  различаются существенно. Значительное различие между выборочными дисперсиями может появиться из-за малого числа параллельных измерений. Тогда однородности дисперсий  можно добиться увеличением количества измерений М в тех точках плана эксперимента, где дисперсии значительно различаться. Однако после этого количество измерений в тех или иных точках плана будет различаться и критерий Кохрена применять нельзя. Но проверить однородность дисперсий можно, сравнивая наибольшую и наименьшую дисперсии, по критерию Фишера (см. 3.11). Если гипотеза о примерном равенстве этих двух дисперсий установлена по критерию Фишера, то однородными можно считать все остальные дисперсии, так как их значения являются промежуточными. Следует отметить, что при неравномерном дублировании нарушается ортогональность матрицы планирования и, следовательно, меняются формулы вычисления параметров модели [8]. Если гипотеза об однородности дисперсий принята, то все величины  считаются одинаковыми и равными некоторой величине . В случае равномерного дублирования измерений за оценку  дисперсии  естественно принять среднее значение (3.8.1) всех оценок :         (4.2.4)   Фактически все измерения в эксперименте объединены в единую выборку для оценки дисперсии . Величина  называется дисперсией воспроизводимости, и она характеризует погрешность эксперимента в целом, в отличие от дисперсии  среднего арифметического результатов измерений в одном опыте. Величина  называется числом степеней свободы статистики . Наиболее простой вид формула (4.2.4) принимает при М = 2:   .                              (4.2.5)   При разном числе измерений в различных точках плана оценка дисперсии воспроизводимости вычисляется по формуле   .                                  (4.2.6)   где mi – количество измерений в опыте с номером i.     4.3. Оценка параметров модели   Строить математическую модель объекта имеет смысл в том случае, когда значения  статистически различимы. Если обозначить максимальное и минимальное значения средних откликов  и  (с оценками дисперсий  соответственно), то для проверки нулевой гипотезы о равенстве этих значений необходимо по формуле 3.12.1 вычислить величину   .   Для различных уровней значимости a и степеней свободы  таблица критических значений  приведена в приложении 2. Гипотеза о равенстве всех средних значений отвергается, если . При наличии помех параметры модели становятся случайными. В формулах (1.4.5), (1.4.6), (1.4.7) значения параметров  модели (1.2.4) заменяются их оценками , а величины откликов  – средними значениями . Например, для двухфакторной линейной модели                    (4.3.1)   оценки линейных эффектов (1.4.5) определяются по формуле   .                                  (4.3.2)   Если все случайные величины  имеют одинаковую дисперсию (3.4.2)   ,                        (4.3.3)   то величина , вычисленная по формуле (4.3.2), имеет дисперсию в N раз меньше. Действительно, повторяя вывод формулы (3.4.2) с учетом значений , получаем     (4.3.4) Знаменатель NM – это общее количество проведенных испытаний при одинаковом количестве измерений М в каждом из N опытов. Следует отметить, что для всех параметров  дисперсии  одинаковы и оценивать их можно величиной . Модель можно упростить, исключая незначимые слагаемые с параметрами , мало влияющие на функцию            (4.3.5)     аналогичную (1.4.1). Чтобы определить, является ли  значимым параметром, нужно для  построить доверительный интервал (3.8.6)   .   При однородности дисперсий  в планах ПФЭ величина доверительного интервала  одинакова для всех параметров. Внутри этого интервала с надежностью  находится истинное значение любого параметра . Если параметр  оценивается величиной  и , то абсолютная величина  меньше погрешности, с которой она определена. В этом случае параметр  по своему влиянию не отличается от случайных воздействий и соответствующее слагаемое можно исключить из модели объекта. Параметр  считается значимым, если его оценка удовлетворяет неравенству   .                                   (4.3.6)   При выбранном уровне значимости  (обычно 0,05) условие (4.3.6) можно представить в другом виде. Параметр  незначим, если величина                                    (4.3.7)   больше значения коэффициента Стьюдента , приведенного в таблице приложения 2.     4.4. Проверка адекватности модели   Между предсказанными по модели и экспериментальными откликами всегда существуют различия. Если эти различия могут быть объяснены наличием помех, то модель считается статистически адекватной. При проверке адекватности сравниваются две дисперсии: ошибок прогноза модели  и погрешностей измерений . Оценка  дисперсии  результатов моделирования, названной в параграфе 2.3 дисперсией адекватности, вычисляется по формуле   ,            (4.4.1)   где N – число точек плана эксперимента; r – количество значимых параметров модели;  и – усредненные значения результатов измерения откликов и отклики, рассчитанные по модели при тех же значениях факторов;  – число степеней свободы статистики . Если дисперсия адекватности  (3.4.1) значительно больше дисперсии воспроизводимости  (4.2.4), то ошибки модели не могут быть объяснены погрешностями измерений, на основе которых она построена. Модель считается адекватной, если для оценок дисперсий выполняется неравенство . Модель также статистически адекватно описывает результаты эксперимента, когда различие между дисперсиями  и  незначимо. При  проверку гипотезы о равенстве дисперсий адекватности и воспроизводимости (при конкурирующей гипотезе ) можно осуществить по критерию Фишера, в котором исследуется отношение (3.11.1) большей дисперсии  к меньшей . Наблюдаемая в эксперименте величина критерия  вычисляется по формуле     Критические значения критерия Фишера зависят от числа степеней свободы дисперсии адекватности  и числа степеней свободы дисперсии воспроизводимости . Таблица критических значений  для уровня значимости a = 0,05 приведена в приложении 5. Гипотеза о возможном равенстве дисперсий отвергается, если . При  модель считается адекватной объекту. Если гипотеза о равенстве дисперсий противоречит экспериментальным данным, то для получения адекватной модели можно или увеличивать порядок модели (дополнительно вводить в модель, например, эффекты взаимодействия или квадраты факторов), или вводить дополнительные факторы в модель, или увеличивать количество измерений в опытах. В моделях (2.1.3) и (2.6.1), построенных в насыщенных планах, невозможно вычислить дисперсию адекватности. Обычно в этом случае опыты в точках плана не дублируются, а информация о дисперсии  извлекается из параллельных измерений в одной, например нулевой, точке. Если в центре плана проведен опыт, состоящий из М измерений y01, y02…y0М, то в качестве оценки дисперсии воспроизводимости эксперимента в целом принимается выборочная дисперсия (3.8.2)   ,                       (4.4.2)   где  – среднее значение параллельных измерений. В параграфе 2.3 было установлено, что в нулевой точке параметр  должен незначительно отличаться от отклика , оцениваемого величиной . Если параметр  свободного члена модели попадает в доверительный интервал для математического ожидания , то модель считается адекватной. Доверительный интервал определяется по формуле ,                          (4.4.3)   полученной в параграфе 3.8. Ранее по насыщенному плану была построена линейная модель (2.6.1)     После восьми дополнительных измерений в нулевой точке плана  были получены следующие результаты: 7; 6; 6,5; 7,5; 7; 8; 6,5; 7,5. Среднее значение (3.8.1) этих измерений   ;   выборочная дисперсия (4.4.2)     Число степеней свободы  статистики  равно . При g = 0,95 уровень значимости a равен 0,05. Значение коэффициента Стьюдента  приведено в приложении 2. Тогда     и доверительный интервал (4.4.3) равен . Так как параметр  попадает в этот интервал, то модель (2.6.1) можно считать адекватной результатам измерений.   4.5. Оценка рассеивания в плане полного факторного эксперимента 22   Рассмотрим план полного факторного эксперимента 22. В параграфе 2.1 была получена зависимость средней прочности бетона `Rб от водоцементного соотношения В/Ц и активности цемента Rц. Пусть в каждой точке плана произведено четыре измерения (М = 4). Все результаты записываются в таблицу, аналогичную таблице 1.3.2. Для двух факторов таблица плана ПФЭ 22 принимает вид табл. 4.5.   Таблица 4.5   Номер опыта Фактор, отклик sy2 1 + + + 24; 27; 25; 24 25 2 2 + – + 70; 69; 74; 67 70 8,67 3 + + – 18; 15; 12; 15 15 4,67 4 + – – 43; 45; 47; 45 45 2,67   За истинное значение величины отклика в первом опыте следует принять среднее значение измерений (см. 3.8.1)   .        (4.5.1)   Для оценки рассеивания  результатов измерений в первом опыте вычисляется исправленная выборочная дисперсия (см. 3.8.2):     Такие расчеты проводятся в каждой точке плана. Результаты вычислений записываются в двух последних столбцах табл. 4.5. Математическую модель имеет смысл создавать, если значения откликов в разных точках плана статистически различимы. Наибольшая и наименьшая выборочные средние  и  имеют выборочные дисперсии s22 = 8,67, s32 = 4,67 соответственно. Подставляя эти значения в формулу (3.12.1), получаем   Для уровня значимости 0,05 и числа степеней свободы  табличное значение . Так как , то статистическая гипотеза о примерном равенстве откликов в различных точках плана отвергается. Проверка гипотезы об однородности выборочных дисперсий проводится по критерию Кохрена. Наблюдаемая в опыте величина критерия  вычисляется по формуле (4.2.3)   .       (4.5.3)   Критическое значение  для a = 0,05 и двух параметров k = М – 1 = 3 и N = 4 приведено в приложении 4 и равно 0,6841. Так как , то гипотеза об однородности выборочных дисперсий не противоречит экспериментальным данным. Тогда оценка дисперсии воспроизводимости вычисляется по формуле (4.2.4)   .             (4.5.4)   Параметры линейной математической модели для данного эксперимента были получены в параграфе 2.1:   .           (4.5.5)   Точность интервальной оценки параметров модели определяется по формуле (4.3.6)   .                             (4.5.6)   Значение  при уровне значимости a = 0,05 и количестве параллельных измерений М = 4 приведено в приложении 2. Все параметры модели (4.5.5) больше величины (4.5.6), следовательно, все они значимы. Определив точность оценки, можно с надежностью 0,95 указать для всех параметров модели доверительные интервалы:   (4.5.7)   Для проверки адекватности модели при трех (r = 3) значимых параметрах, надо сравнить дисперсию воспроизводимости  с дисперсией адекватности . Оценка  дисперсии адекватности для модели (4.5.5) была получена в параграфе 2.2 (см. табл. 2.3.2). Проверка гипотезы о равенстве дисперсий (при конкурирующей гипотезе ) проводится по критерию Фишера. Наблюдаемая в эксперименте величина критерия  вычисляется по формуле   .                       (4.5.8)   При  значение приведено в приложении 5. Гипотеза о равенстве дисперсий отвергается, так как . Ошибки прогноза модели не могут быть объяснены погрешностями измерений, на основе которых построена модель. Статистический анализ более сложной модели с нелинейными слагаемыми проведен в следующем параграфе.     4.6. Оценка рассеивания в композиционном плане   Для построения модели с квадратичными эффектами в параграфе 2.2 был реализован композиционный план. В табл. 4.6 приведены результаты девяти опытов, причем в каждом опыте измерения дублировались четыре раза (М = 4). Таблица 4.6   Номер опыта Фактор, отклик   1 + + + 24; 27; 25; 24 25 2 2 + – + 70; 69; 74; 67 70 8,67 3 + + – 18; 15; 12; 15 15 4,67 4 + – – 43; 45; 47; 45 45 2,67 5 + 0 0 30; 33;27; 30 30 6 6 + – 0 61; 61; 57; 61 60 4 7 + + 0 18; 20; 18; 24 20 8 8 + 0 – 25; 21; 27; 27 25 8 9 + 0 + 48; 45; 45; 42 45 6   Проверка гипотезы об однородности выборочных дисперсий  проводится по критерию Кохрена:   .                 (4.6.1)   Критическое значение  для a = 0,05 и двух параметров k = М – 1 = 3 и N = 9 приведено в приложении 4 и равно 0,4027. Так как , то гипотеза об однородности выборочных дисперсий не противоречит экспериментальным данным. Оценка дисперсии воспроизводимости вычисляется по формуле (4.2.4)   .                 (4.6.2)   Для рассматриваемого эксперимента параметры нелинейной математической модели были получены в параграфе 2.2:           (4.6.3)   В планах ПФЭ все параметры вычислялись по единой формуле (4.3.2), поэтому их дисперсии (4.3.4) были одинаковыми. В композиционных планах формулы (1.5.2) – (1.5.5) вычисления разных параметров имеют различные знаменатели. Соответственно изменяются знаменатели и в формулах расчета оценки дисперсии параметров. Например, для параметра , вычисленного по формуле (1.5.3), получаем     При М = 4 величина  является точечной оценкой дисперсии . Аналогично вычисляются Для параметра  дисперсия   .   Тогда .   Формулы (1.5.2) и (1.5.5) дают возможность вычислить оценку дисперсии свободного члена модели.   . .   .   Число степеней свободы  статистики  равно . При g = 0,95 уровень значимости a = 0,05 и значение  приведено в приложении 3. Тогда доверительные интервалы для параметров модели (4.6.3) задаются неравенствами     Значение  находится внутри доверительного интервала, следовательно, этот параметр модели (4.6.3) является незначимым и соответствующее слагаемое можно исключить из построенной модели. Остальные параметры значимы (r = 5), и модель принимает вид (2.2.2). Оценка дисперсии адекватности  этой модели приведена в таблице 2.3.2 и равна 8,39. Проверка нулевой гипотезы равенства дисперсий  (при конкурирующей гипотезе ) проводится по критерию Фишера. Наблюдаемая в эксперименте величина критерия  вычисляется по формуле   .                          (4.6.10)   При  гипотеза о равенстве дисперсий не противоречит опытным данным, так как   .   Значение  приведено в приложении 5. Ошибки прогноза модели (2.2.2) могут быть объяснены погрешностями измерений в эксперименте, на основе которого построена модель.  Вычислим предполагаемый отклик при значениях факторов х1 = 0,5 и х2 = 500. В этом случае безразмерные факторы принимают значения       При значениях факторов х1 = 0,5 и х2 = 500 предполагаемый отклик заключен в интервале (44,94; 51,36).

Рекомендуемая литература

Основная

1. Бенин А. В., Гарбарук В. В. Планирование эксперимента. –СПб.: ПГУПС.2009.

2. Фаддеев М. А. Элементарная обработка результатов эксперимента: учеб. пособие/ - М.; Лань, 2008.

 

Дополнительная

1. Гарбарук В.В., Елизаров С.В., Родин В.И., Шварц М.А. Тезисы курса высшей математики для втузов.- СПб.: ПГУПС, 2012.

2. Гарбарук В.В., Родин В.И., Шварц М.А. Экстремальные задачи. Элементы теории катастроф. –СПб.: ПГУПС.2008.

3. Гарбарук В.В., Пупышева Ю.Ю. Случайные величины. –СПб.: ПГУПС.2007.

4. Герасименко П. В. Специальные разделы высшей математики для экономических специальностей. Часть 3. Теория вероятностей и математическая статистика. . –СПб.: ПГУПС, 2007.

5. Гмурман В.Е. Теория вероятностей и математическая статистика. –М.: Лань, 2008.

6. Луценко М.М. Точечные и интервальные оценки параметров. Проверка гипотезы о виде распределения. –СПб.: ПГУПС, 2009.

7. Письменный Д. Т. Конспект лекций по теории вероятностей, математическаой статистике и случайным процессам.– М: Айрис-Пресс, 2008.

8. Теория вероятностей и математическая статистика, Учебное пособие /З. С. Галанова, И.М. Соловьева, И.И. Павлова. – Спб: ПГУПС, 2012.

 

Электронные и Internet-ресурсы: http:/e.lanbook.com


Дата добавления: 2018-04-05; просмотров: 230; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!