Как работает продвинутая аналитика в футболе и хоккее: от xG до Corsi
Счёт на табло не всегда отражает реальную картину матча. Команда может доминировать весь матч, создать двадцать моментов — и проиграть 0:1 после единственного удара соперника. В таких ситуациях классическая статистика бессильна, а результат маскирует истинное соотношение сил. Именно для решения этой проблемы аналитики разработали продвинутые метрики, которые сегодня используют не только букмекерские компании, но и тренерские штабы ведущих клубов мира.
В этом материале разберём, как устроены главные инструменты продвинутой аналитики в двух самых популярных видах спорта — футболе и хоккее — и как они помогают делать более точные прогнозы.
Футбол: xG и всё, что за ним стоит
Модель ожидаемых голов — xG (expected goals) — стала мейнстримом. Её упоминают тренеры на пресс-конференциях, показывают в студиях крупнейших телеканалов, а игроки шутят, что скоро xG появится на табло рядом со счётом. Но за модным термином стоит серьёзная математика.
Суть xG проста: каждый удар по воротам оценивается числом от нуля до единицы — это вероятность того, что данный удар приведёт к голу. Вероятность рассчитывается на основе исторических данных: учитываются расстояние до ворот, угол удара, часть тела (нога или голова), тип атаки (позиционная, контратака, стандарт), положение защитников и вратаря. Сумма этих значений за матч и есть xG команды.
Основоположником подхода считают бывшего главного тренера сборной Норвегии Эгиля Ольсена, который ещё в девяностых разделил футбольное поле на двенадцать зон и вычислил вероятность гола из каждой на основе статистики. Позже модель усовершенствовали аналитики из компании Opta, и сегодня единого алгоритма расчёта не существует — каждый сервис (Understat, FBref, FotMob, StatsBomb) считает по-своему. Расхождения между моделями иногда достигают пятидесяти процентов, что важно учитывать при анализе.
Практическая ценность xG раскрывается не в отдельном матче, а на дистанции. Если команда стабильно создаёт xG выше двух за игру, но забивает в среднем один гол — это статистическое underperformance, и регрессия к среднему неизбежна. Именно на этом принципе строятся модели, которые ищут расхождения между реальной результативностью и ожидаемой.
Мэттью Бенхэм — владелец Брентфорда и датского Мидтьюлланда — сколотил состояние, регулярно обыгрывая букмекеров с помощью собственной xG-модели. Его компания SmartOdds предоставляет данные профессиональным игрокам, а методы аналитики активно применяются в селекции обоих клубов. Другой пример — Тони Блум, владелец Брайтона и букмекерской компании Starlizard, построивший империю на тех же принципах.
Вокруг xG: метрики, которые дополняют картину
Сам по себе xG — лишь вершина айсберга. Для полноценного анализа используют целый набор производных метрик.
xGC (expected goals conceded) — ожидаемые пропущенные голы. Показатель оценивает качество обороны и работу вратаря. Если голкипер пропускает значительно меньше, чем его xGC, он выручает команду сверх нормы. Если больше — либо вратарь ошибается, либо защита допускает удары из крайне опасных позиций.
PPDA (passes per defensive action) — количество пасов соперника на одно оборонительное действие. Метрика измеряет интенсивность прессинга. Чем ниже PPDA, тем агрессивнее команда давит на чужой половине. Для прогнозирования это важно: команды с низким PPDA создают больше моментов после отборов высоко по полю, но расходуют больше энергии и уязвимы при плотном календаре.
xPTS (expected points) — ожидаемые очки. Рассчитываются на основе xG обеих команд за матч. Таблица по xPTS часто отличается от реальной турнирной таблицы: команда может набирать очки «не по игре», выигрывая матчи с минимальным преимуществом при слабом xG. На дистанции такие команды обычно проседают — и это окно для выгодных прогнозов.
xGOP (expected goals from open play) — ожидаемые голы из позиционных атак. xGSP (expected goals from set pieces) — из стандартных положений. Разделение помогает понять, за счёт чего команда создаёт опасность: если большая часть xG приходится на стандарты, значит позиционная атака работает слабо, а зависимость от угловых и штрафных повышает нестабильность результатов.
По статистике, на середине чемпионата в семидесяти семи процентах матчей побеждает команда с лучшим показателем xG. Для сравнения: при оценке только по количеству ударов по воротам точность прогноза составляет шестьдесят шесть процентов. Разница в одиннадцать процентных пунктов — именно столько добавляет качественная модель.
Хоккей: Corsi, Fenwick и борьба за владение шайбой
В хоккее аналогом xG стала метрика Corsi, названная в честь тренера вратарей Баффало Джима Корси. Принцип похож на футбольный, но адаптирован под специфику хоккея, где владение шайбой — ключ к победе.
Corsi учитывает все попытки бросков: в створ ворот, мимо ворот и заблокированные защитниками. По сути, это расширенный «плюс-минус», рассчитанный не по забитым шайбам, а по бросковой активности. Corsi For (CF) — броски своей команды, Corsi Against (CA) — броски соперника. Процент CF% показывает долю бросковых попыток команды от общего числа при нахождении конкретного хоккеиста на льду.
Fenwick — модификация Corsi без учёта заблокированных бросков. Считается, что Fenwick лучше отражает командную динамику, тогда как Corsi точнее оценивает индивидуальный вклад игрока.
PDO — сумма процента реализации бросков и процента отражённых бросков вратарём в равных составах. По сути, это индикатор удачи. Средний PDO по лиге всегда стремится к ста. Если у команды PDO значительно выше сотни — она «перевыполняет план» за счёт везения, и регрессия неизбежна. Если ниже — команда играет лучше, чем показывают результаты.
Статистика подтверждает: семь Кубков Стэнли из девяти в период с 2008 по 2017 год выиграли клубы из топ-пяти по CF%. В последних пяти регулярных чемпионатах НХЛ первую строчку занимал клуб с положительным значением CF%, а четыре из пяти победителей регулярки входили в десятку лучших по этому показателю.
С сезона 2014/15 НХЛ публикует продвинутую статистику в открытом доступе на официальном сайте — более тридцати показателей, включая Corsi, Fenwick, PDO, распределение смен по зонам и среднюю дистанцию бросков. Каждый генеральный менеджер лиги сегодня имеет в штате аналитиков, работающих с этими данными при скаутинге и заключении контрактов. Двадцатисемилетний Джон Чайка, начинавший карьеру хоккейным аналитиком, стал генеральным менеджером Аризоны — наглядная иллюстрация того, как данные меняют индустрию.
В КХЛ все необходимые данные о бросках собираются статистическими бригадами, однако публичный доступ к продвинутой аналитике пока ограничен по сравнению с НХЛ. Это создаёт определённое информационное преимущество для тех, кто умеет считать самостоятельно.
Где брать данные и как применять на практике
Для футбола основные источники продвинутой статистики — Understat, FBref, FotMob, WhoScored и Wyscout. Первые три доступны бесплатно с базовым функционалом. Для хоккея — официальный сайт НХЛ (раздел Enhanced Stats), Natural Stat Trick и Hockey Reference.
Алгоритм анализа матча с использованием продвинутых метрик выглядит так. Первый шаг — сравнение xG (в футболе) или CF% (в хоккее) обеих команд за последние десять-пятнадцать матчей. Второй — проверка на удачу: сопоставление реальной результативности с ожидаемой. Если команда забивает значительно больше своего xG, это сигнал к осторожности. Третий — учёт контекста: календарная нагрузка, травмы ключевых игроков, мотивация. Четвёртый — сравнение полученной оценки с коэффициентами букмекера. Если расхождение существенное — это потенциально выгодная ситуация.
Продвинутые бетторы автоматизируют этот процесс, используя Python для сбора данных через API статистических сервисов и построения собственных моделей на основе исторических данных за пять и более сезонов. Но даже без программирования базовый анализ xG и Corsi доступен любому — достаточно регулярно проверять данные на бесплатных ресурсах.
Тем, кто хочет применять продвинутую аналитику на практике и следить за актуальными разборами матчей, полезно обращаться к прогнозам на футбол и хоккей с учётом xG, формы команд и кадровых потерь — такой подход значительно повышает качество анализа по сравнению с интуитивным методом.
Ограничения и подводные камни
Продвинутая статистика — не волшебная таблетка. У каждой метрики есть слабые стороны.
xG не учитывает психологическое давление, командную химию и тактические перестроения по ходу матча. Модели разных провайдеров дают различные результаты для одного и того же матча, и выбор источника влияет на выводы. Кроме того, xG работает на дистанции, но плохо предсказывает отдельные матчи — в футболе слишком мало голов, чтобы статистика сходилась на коротких отрезках.
Corsi в хоккее имеет аналогичную проблему: не все броски одинаково опасны. Бросок от синей линии и бросок из слота — разные вещи, но Corsi учитывает их одинаково. Некоторые игроки, как отмечал тренер Барри Тротц, сознательно набрасывают дополнительные броски, чтобы улучшить личный Corsi перед переговорами о контракте.
PDO — самая «случайная» метрика, и именно поэтому она так полезна: отклонение PDO от сотни с высокой вероятностью временное, что даёт основания для прогнозов на будущие матчи.
Главное правило: ни одна метрика не должна быть единственным основанием для прогноза. Данные — это инструмент, который уменьшает неопределённость, но не устраняет её. Комбинация продвинутой статистики, контекстуального анализа и финансовой дисциплины — то, что отличает системный подход от азартной игры.
Источник: wvstavke.ru
Сообщение Как работает продвинутая аналитика в футболе и хоккее: от xG до Corsi появились сначала на Навіны Ліды.

