Бинарная регрессия, или Как заработать на неудачах



Что такое бинарная логистическая регрессия и как она может помочь делать более осмысленные предсказания? Марк Тейлор продолжает серию статей, где он показывает, как извлечь знания из успехов и неудач.

В предыдущих двух постах мы затрагивали вопрос, как на основе вероятности оценить шансы того, что удары с разных точек игрового поля приведут к голу. Затем мы разработали методику, позволяющую оценивать исход матча.

Что такое бинарная логистическая регрессия?

Этот метод был основан на регрессионном анализе, при котором независимыми переменными величинами являлись координаты x и y места, с которого производится удар, а также тип удара. Зависимой переменной был результат этой попытки забить гол.

Тип используемой регрессии – простая бинарная логистическая (существуют и другие, более сложные), для которой в Интернете есть много калькуляторов и подробных объяснений – например, здесь: www.sigmaxl.com/LogisticRegression.shtml.

По существу, регрессия вычисляет вероятность осуществления события, для которого возможно только два варианта исхода: успех, если гол забит, или неудача в случае любого другого исхода – попадание в штангу, отбитие вратарем или удар мимо ворот.

Методология работает исключительно хорошо с моделями математического ожидания гола, но, кроме того, она может быть применена к целому ряду других игровых событий, связанных с командами и игроками, а также к исходу матча. Итак, взглянем наконец на некоторые полезные применения этой методики в области спортивных ставок.

Короче говоря, если можно сказать, что исход события, который мы хотим предсказать, – это наступление или ненаступление данного события, то можно оценить, насколько вводные параметры, предшествующие этому событию, могут иметь существенное влияние на предсказание вероятности.

Применение к модели простого математического ожидания гола

Модель математического ожидания гола использует две непрерывные переменные – координаты места удара, а также третью дискретную переменную, которая может принимать одно из двух значений – удар ногой или головой. Можно использовать другие непрерывные или дискретные переменные, чтобы усложнить модель с учетом других факторов, которые могут иметь значение: погодные условия, удар с игры, контратака, стандартное положение и т. п. Также можно вводить параметры, учитывающие место или даже силу удара.

Можно также учитывать тактические аспекты игры: подготовленность команды к матчу, наигранные стандартные положения и угловые удары. Аналогично, базовая модель может применяться для предсказания точности удара. Попадание в цель, приводящее к прямому голу или к необходимости вмешательства вратаря, можно определить как успех (зависимая переменная). В этом случае мы можем определить команду, которая, используя точность и вероятность повторного отскока мяча, имеет повышенные шансы забить гол. Удар по отскочившему мячу предоставляет атакующему больше возможностей забить гол, чем при ударе с игры, поэтому такой тактический прием может быть эффективным.

Применение к определению процента точных передач

Точные передачи – еще один вариант дискретного (успех или неудача) исхода в рамках футбольного матча, к которому можно применить данную методику. Вопрос сбора достаточного количества исходных данных здесь также важен, но попытка сделать передачу имеет всего четыре непрерывные переменные, влияющие на вероятность прохождения паса. Такими основными параметрами являются координаты х и у двух точек, с которой передается мяч и в которой он принимается или перехватывается.

Например, в типичном матче чемпионата 2011/12 «Болтон» – «Манчестер-Сити» защитники обеих команд совершили по 76 % точных передач, а нападающие – только по 68 %. Отбросив в сторону нарекания на техническое мастерство атакующих игроков, логистический подход использует начальную и конечную точки каждого паса, чтобы предсказать более низкий уровень математического ожидания точного исполнения пасов, переданных из более напряженных участков поля.

Дальность передачи и место ее выполнения могут стать поводом для дискуссии о соотношении уровней мастерства такого разыгрывающего игрока, как Леон Бриттон, и креативного форварда Давида Силвы. Их роли на поле абсолютно различны.

Сам по себе процент точных передач мало о чем говорит. Пас, отданный вдоль своих ворот, в 90 % случаев будет точным, хотя бы потому, что его не будет пытаться перехватить соперник. А в середине поля, при помехах со стороны противника, только четверть передач являются удачными.


Дата добавления: 2018-09-20; просмотров: 256; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!