Пример пошаговой множественной регрессии: взаимосвязь психического и биологического



Урок 6. Методы, использующие обучающую информацию

Группа методов анализа данных «с учителем» использует дополнительную информацию, которую несет так называемый «внешний критерий». Этот критерий может быть представлен номинальным, ранговым или количественным показателем, привязанным к объектам анализируемой таблицы данных. Привязка номинального показателя означает разбиение исследуемых объектов на классы (группы). Ранговый показатель задает на множестве объектов отношение порядка. В случае количественного показателя отношения между объектами выражаются в какой‑либо количественной шкале /Пфанцагль И., 1976/. Указанный показатель будет в дальнейшем обозначаться «z».

Множественный регрессионный анализ

В регрессионном анализе критериальный показатель z рассматривается как «зависимая» переменная (как правило, ранговая или количественная), которая выражается функцией от «независимых» признаков x1, … , xp . Линейная функция множественной регрессии записывается следующим образом

w0 называется свободным членом, а элементы весового вектора w = (w1, … , wp)T называются коэффициентами регрессии.

Для оценки эффективности регрессионного уравнения вводится вектор остатков  который отражает влияние на z совокупности неучтенных случайных факторов либо меру достижимой аппроксимации значений zi .

Различают два подхода к определению параметров уравнения множественной регрессии в зависимости от происхождения матрицы данных. В первом считается, что признаки детерминированы и случайной величиной является только зависимая переменная z. Этот подход используется наиболее часто. Во втором подходе полагается, что и независимые признаки xj и z — случайные величины, имеющие совместное распределение. В такой ситуации оценка уравнения регрессии есть оценка условного математического ожидания случайной величины z в зависимости от случайных величин xj.

Каждый из приведенных подходов имеет свои особенности. Вместе с тем, показано, что они отличаются только статистическими свойствами оценок параметров уравнения регрессии, тогда как вычислительные аспекты этих моделей совпадают /Демиденко Е. З., 1981/.

В уравнении множественной регрессии обычно полагают, что величины  независимы и случайно распределены с нулевым средним и дисперсией  а оценка параметров w0 и w производится с помощью метода наименьших квадратов (МНК). Ищется минимум суммы квадратов невязок

Это приводит к нормальной системе уравнений со следующим решением:

где czx — вектор оценок ковариации между внешним критерием z и признаками x1, … , xp ; mz — оценка среднего значения z ; mx и S — вектор средних значений и матрица ковариаций признаков x1, … , xp .

Основным показателем качества уравнения множественной регрессии является коэффициент детерминации (квадрат коэффициента множественной корреляции)

 — оценка дисперсии прогнозируемой переменной

Статистический смысл коэффициента детерминации заключается в том, что он показывает, какая доля дисперсии зависимой переменной z объясняется построенной функцией регрессии. Например, при коэффициенте детерминации 0,49 регрессионная модель объясняет 49 % дисперсии внешнего критерия, остальные же 51 % считаются обусловленными факторами, не отраженными в регрессионное уравнение.

Еще одним важным показателем качества уравнения множественной регрессии является статистика

С помощью этой статистики проверяется гипотеза H0 : w1 = w2 = … = wp = 0, то есть гипотеза о том, что совокупность признаков x1, … , xp не улучшает описания критериального показателя по сравнению с тривиальным описанием zi = mz . Если F > fp, N –p – 1 , где fp, N –p – 1 — случайная величина, имеющая F‑распределение с p и N – p – 1 степенями свободы, то H0 отклоняется (критерий Фишера).

Ниже приведено уравнение множественной регрессии, связывающее себестоимость продукции на 10 отечественных предприятиях (зависимая переменная) с валовым объемом и производительностью труда (независимые переменные — предикторы):

себестоимость = 0,8×(валовой объем) + 0,3×(производительность труда)

По статистическим критериям доверие к выявленной зависимости более 99 %. Вместе с тем, часто для иллюстрации полученного уравнения множественной регрессии используют график «наблюдения—предсказания» (Рис. 6. 1):

Рис. 6. 1. Иллюстрация полученной модели множественной регрессии

При большем, чем в рассмотренном примере, числе переменных нередко приходится решать задачу отбора таких переменных в уравнение множественной регрессии. При этом наиболее популярными являются три алгоритма отбора: последовательного увеличения, последовательного уменьшения и алгоритм плюс l минус r, поочередно «работающего» то на добавление, то на удаление переменных. Все алгоритмы являются эвристическими и не гарантируют сходимости к оптимальному решению. Поэтому на практике попытки приблизиться к желаемому оптимуму всегда сопряжены с комбинированным применением указанных алгоритмов.

Пример пошаговой множественной регрессии: взаимосвязь психического и биологического

Пошаговая множественная регрессия применяется для минимизации количества независимых переменных, входящих в исследуемую модель. Известно много подходов к такой минимизации. В Базовой Системе STATGRAPHICS Plus for Windows реализованы две наиболее популярные процедуры: последовательное увеличение и последовательное уменьшение группы независимых переменных.

Рассматриваемый пример относится к одной из наиболее важных и интересных проблем современных научных исследований.

Соотношение сознания и вещественного мира — одна из ключевых проблем современной науки. Представление о Вселенной как гигантской супермашине, собранной из бесчисленных отдельных объектов и существующих независимо от наблюдателя, отошло в прошлое. Новые модели Вселенной предполагают, что связующим принципом в космической сети выступает сознание — первичный атрибут существования. Ряд известных физиков (Ю. Вигнер, Д. Бом, Дж. Чу, Ф. Капра, А. Янг и др.) высказываются за включение сознания в качестве неотъемлемой и главной части будущей глобальной теории материи.

На фоне эволюции идей о структуре мира биологические и психологические исследования выглядят, может быть, менее масштабно, но не менее весомо. Их основные темы концентрируются около фундаментальной задачи изучения взаимосвязей различных уровней биоорганизации: ген — клетка — организм — психика. Раскрытие данных взаимосвязей, кроме локальных целей, призвано в конечном счете дать ответ на вопрос о биологической обусловленности психики и о свободе воли как важнейшей составляющей индивидуального сознания.

Известно много достижений, например, психофизиологии, описывающей связи физиологических процессов в организме с проявлениями психического, нейропсихологии (о зависимостях между особенностями функционирования нейронных ансамблей и психическими свойствами), генетической психологии (о наследовании различных черт характера, темперамента, психических заболеваний) и др. Вместе с тем накопленные сведения основаны на различных теоретических базах, экспериментальных технологиях, описаны на разных научных языках и пока не поддаются междисциплинарному обобщению, не говоря уже об интеграции с современными космологическими теориями.

Всеобщие законы подобия между предметами и явлениями умели находить восточные мыслители. Их философские концепции, ориентированные на модель «Человек во Вселенной», легли в основу теоретических и практических положений медицины, которые были изложены в многочисленных трактатах (например, китайские «Ней‑цзин», «Хуай нань‑цзы», тибетский медицинский трактат «Жуд‑Ши» и др.). В этих трудах отмечается, что организм человека нужно рассматривать как единое целое, и между работой сердца, центральной нервной системой и внутренними органами человека существует тесная связь. Говорится о влиянии внутренних органов человека на его нравственные черты и описываются связи между некоторыми психическими свойствами и состоянием внутренних органов.

Таким образом, на качественном уровне связи элементов организма человека с его психическими свойствами были известны уже давно. Однако количественное выражение подобных связей стало возможным лишь в наши дни, благодаря соединению ряда обстоятельств.

Во‑первых, к ним относится модернизация восточных знаний по акупунктурной диагностике организма человека и развитие технических средств измерений в биологически активных точках (БАТ), в частности средств электропунктурной диагностики. Во‑вторых, важным обстоятельством является современный уровень психодиагностических тестов, позволяющий с достаточно высокой точностью и надежностью проводить психологические измерения. И, в‑третьих, извлечение закономерностей из результатов электропунктурных и психологических измерений стало возможным на основе развитой технологии компьютерного многомерного анализа данных.

Направление исследований взаимосвязей соматического профиля человека, определяемого методами электропунктурной диагностики, с его психологическими характеристиками получило название электропунктурной психодиагностики. Ниже приводятся сведения об одном из последних экспериментов в этой области.

Испытуемыми были студенты (мужского пола, возраст 20—22 года) Санкт‑Петербургского Государственного Технического Университета. У каждого из них проводилось измерение электрокожного сопротивления с помощью автоматизированного комплекса рефлексотерапевта «АКРО» в 24 биологически активных точках (12 слева и 12 справа), являющихся проекциями отдельных органов (Табл. 6. 1). Кроме того, каждый студент тестировался по психологической методике Шмишека‑Мюллера, диагностирующей 10 акцентуаций характера (Табл. 6. 2).

Таблица 6. 1. Наименование и обозначение репрезентативных точек

обозначения канал точка
P легкие 9‑I тай‑юань
GI толстый кишечник 5‑II ян‑си
E желудок 42‑III чун‑ян
RP селезенка 3‑IV тай‑бай
C сердце 7‑V шэнь‑мэнь
IG тонкий кишечник 4‑VI вань‑гу
V мочевой пузырь 65‑VII шу‑гу
R почки 3‑VIII тай‑си
MC перикард 7‑IX да‑лин
TR тройной обогреватель 4‑Х ян‑чи
VB желчный пузырь 40‑ХI цю‑сюй
F печень 3‑ХII тай‑чун

 

Таблица 6. 2. Диагностируемые психологические свойства

Название акцентуации Краткая характеристика
1 Гипертимность активность, энергичность, оптимистичность, с высоким жизненным тонусом
2 Застревание длительное переживание одних и те же чувств, упрямость, сопротивление изменениям
3 Эмотивность богатство эмоциональных реакций, изменчивость настроения
4 Педантичность приверженность к определенному порядку, плохое переключение на новое в деятельности
5 Тревожность ощущение неблагополучия, внутренней напряженности.
6 Циклотимность периоды ровного настроения чередуются с подъемами и субдепрессивными фазами
7 Демонстративность эгоцентричность, стремление постоянно быть в центре внимания
8 Возбудимость агрессивность, упрямство, самолюбие, обидчивость
9 Дистимность частые и длительные изменения настроения в сторону его снижения
10 Экзальтированность склонность приходить в состояние восторженного возбуждения по незначительным поводам и впадать в отчаяние под влиянием разочарования

Ввод и преобразование данных

Откроем окно таблицы данных и введем следующие результаты измерений электрокожного сопротивления в биологически активных точках (табл. 6. 3) у 14 студентов.

Таблица 6. 3. Результаты измерений электрокожного сопротивления в биологически активных точках справа (x — фоновые, y — после нагрузки)

  x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12
1 80 107 44 87 85 214 47 91 69 77 54 86
2 94 93 72 106 130 254 75 97 130 69 99 76
3 95 115 81 186 73 79 95 111 96 129 114 110
4 99 126 87 74 69 107 61 121 65 176 85 78
5 117 53 94 122 139 113 101 144 108 59 127 148
6 78 80 58 112 66 195 96 94 86 79 144 142
7 91 95 120 82 131 142 62 140 106 50 76 116
8 104 52 45 113 136 385 65 53 114 180 82 84
9 55 54 65 140 77 173 117 117 82 100 90 107
10 130 109 51 34 129 302 37 126 123 126 60 62
11 64 66 70 186 61 204 157 129 66 86 99 69
12 81 82 94 167 78 112 153 130 85 75 138 149
13 58 144 49 53 53 289 55 115 82 135 105 81
14 91 144 49 49 82 293 64 88 113 124 90 60

 

y1 y2 y3 y4 y5 y6 y7 y8 y9 y10 y11 y12
113 115 67 163 88 293 96 98 94 93 79 58
124 75 76 152 86 125 108 139 133 60 101 62
122 107 77 191 91 101 96 142 99 123 116 147
124 78 75 105 82 121 89 83 78 171 82 97
112 84 92 131 124 154 91 139 97 100 116 120
87 58 90 221 60 137 127 227 109 79 159 119
97 74 88 94 113 191 61 125 111 95 85 75
111 43 84 116 88 284 91 70 108 147 124 71
70 100 63 132 99 209 104 141 91 130 79 97
123 74 67 74 66 194 61 115 118 106 100 81
76 76 42 231 62 156 140 130 72 79 117 66
75 59 96 170 86 94 119 119 89 63 126 116
69 115 77 72 48 274 89 100 67 146 99 74
80 83 66 56 70 235 70 88 117 107 89 71

Введем в эту же таблицу данные психологического тестирования.

Результаты тестирования (Z — акцентуации)

  z1 z2 z3 z4 z5 z6 z7 z8 z9 z10
1 18 18 12 12 3 6 10 0 9 12
2 12 12 21 22 6 6 10 15 9 12
3 12 8 3 10 3 12 8 6 6 12
4 12 20 12 14 18 9 12 15 6 12
5 9 18 18 12 0 12 16 6 15 12
6 24 12 21 16 9 12 18 9 9 12
7 21 6 12 18 12 15 10 6 12 6
8 6 4 6 10 3 9 14 9 9 6
9 18 12 0 4 0 6 20 3 6 12
10 15 10 12 12 3 12 10 12 15 6
11 15 14 24 6 3 15 20 21 6 12
12 21 12 9 10 0 6 18 3 3 12
13 24 12 15 12 15 12 20 12 9 12
14 12 12 3 14 2 9 8 12 15 6

Как уже отмечалось, удалось построить статистически значимые регрессионные модели практически для всех акцентуаций характера. При этом в модели входили результаты измерения ЭКС как фоновые, так и после нагрузки. В то же время значительный интерес представляют собой новые переменные, представляющие собой отношения фона к нагрузке. Для создания таких переменных произведем следующие операции.

Выделим новую колонку в таблице данных и щелкнем правой кнопкой мыши. В появившемся меню выберем Generate Data. В поле Expression диалогового окна Generate Data введем требуемое преобразование — отношение фонового замера к измерению после нагрузки (Рис. 6. 2). Нажмем OK.

Выберем в контекстном меню команду Modify Column. Зададим в поле Name имя новой переменной rr1. В поле Comment запишем комментарий «отношение фона к нагрузке» (Рис. 6. 3). Нажмем кнопку OK. Аналогичным образом сгенерируем остальные переменные rr2 — rr12.

Рис. 6. 2. Окно диалога для генерации новых переменных

Рис. 6. 3. Окно для наименования переменных, задания их типа и ввода комментариев


Дата добавления: 2021-03-18; просмотров: 66; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!