新進気鋭の統計学者によるサッカー版セイバーメトリクス。

本書は現時点で取得可能なサッカー(Jリーグ)の試合におけるデータを統計学的に解析し、得点や失点を防ぐことに貢献したプレイヤーや勝利に貢献したプレイヤーを客観的に明らかすることを趣旨としている。

まずはじめに言っておきたいのは、こういったデータによる統計的分析をサッカーに持ち込むアプローチを否定すべきではないということだ。よく「サッカーではデータで計りきれない要素があるから」「野球と違ってプレーが途切れないから」と言葉を並べてデータ分析を批判する言説を目にする。確かにそれらの主張も一理ある。しかし取得できるプレーの種類は年々飛躍的に増加しており、年を追うごとに解析の精度(説明力)が上がることは間違いない。そうやって科学は進歩していく。現時点における努力は将来への布石であり、今できることをやっておくことは決して無駄なことではない。

ただ、確かに指摘したくなる箇所があるのも事実だ。

この手の統計で大切なことは関係性を明らかにすることであり、その関係性は該当分野に造詣の深い人の主観的な仮説から生まれる。著者の西内啓氏は自身のベストセラー『統計学が最強の学問である 』において以下のように述べている。

だからビジネスにおいて解析すべき指標は、直接的な利益か、あるいはそこに至る因果関係の道筋が明らかな何か、ということになる。(強調は著者によるもの)
(中略)
自分たちの仕事の中で何が利益に直結することか、というのは私などよりみなさん自身のほうがよく知っているし、アイディアだって浮かぶはずだ。(P.89-90より引用)

サッカーにおいて分析すべきは得点や失点を防ぐことにつながるプレーである。それらのプレーはどのようなものであるかは当然サッカーに精通している人が仮説を立てるべきで、そのようなアプローチが取られているか本書内では不明である(データスタジアム社の取得している約2000のプレー情報から解析対象を200に絞っているがこの選択根拠も明らかにされていない)。

また、本書内に以下の記述が登場する。

攻撃面での2つの指標(筆者注:シュート貢献度とチャンスメイク貢献度)について、チャンスメイクが増えればシュートも増えるという関連性は当然考えられるが、データ構造上の検討を行った結果、一方のみによって得点の多寡がすべて説明できるわけではなく、両者はある程度独立した増減を示しており、これら4つの貢献度(筆者注:前述の2つに加え、守備貢献度とセーブ貢献度)は試合の行方を予測するうえで独立した重要な指標として扱うことができそうだということがわかった。(P.172より引用)

ステップワイズ法(統計学的に予測精度の高いモデルを構築する手法)を用いて各貢献度の尺度の内訳を選択しているが、セーブ貢献度を除けば各貢献度が独立していることは常識的に考えてあり得ない。各貢献度が独立した動きを見せるのであればモデルの方が誤っていると考える方がよいように思える。

とはいえ冒頭で述べたようにこれらはデータ取得の精度の向上や仮説検証のサイクルを回し続けることでいずれ解決することであり、現時点のデータを使った分析を眺めること自体はとてもおもしろく、そして興味深い。

例えばJリーグ2011シーズンでのシュート貢献度(シュートに関する項目から実際のシーズン予測得点を分析した指標)の上位はケネディ、ジュニーニョ、佐藤寿人の順となっている。彼らは実際に19点、9点、11点の得点をあげており、信ぴょう性も高そうである。

また、チャンスメイク貢献度(チャンスメイクに関する項目から実際のシーズン予測得点を分析した指標)の上位は遠藤保仁、小川佳純、高萩洋次郎の順である。彼らは実際に得点を多くあげているわけではないが、得点への貢献という意味では素晴らしいものがある選手であり、こちらも主観による予測と大体あっている。

本書内では得点や失点を防ぐこと、GKのセービングの指標からデータによるベストイレブンも明らかにしており、個人的なベストイレブンと比べてみるのもおもしろい。

最近はサッカーに関するデータが公開されていたりするので、それらを眺めてデータへの耐性を強くしておくのもよいかもしれない。

football-lab.jpg

Football Lab
Chance Building Point(CBP)と呼ばれるチャンスメイクへの貢献に関する独自の指標を用いてチームや選手をポイント化している。「データによってサッカーはもっと輝く」が謳い文句。


castrol football.jpg

Castrol Football(英語)
ヨーロッパでプレーする選手のパフォーマンスをポイント化してランキング形式で示している。ポイント化に関する説明動画も提供している。


j-league official.jpg

Jリーグ公式サイト
Jリーグに関する記録はほぼ全てここで手に入る。時間帯別得失点や先取点を取った場合の勝率など細かいデータも網羅している。


Jリーグの分析に関しては2012シーズンのガンバの低迷によっていろいろ不都合がおきそうだ。笑



tags サッカーと統計, セイバーメトリクス, 統計学が最強の学問である, 遠藤保仁がいればチームの勝ち点は117%になる