データがあぶり出すサッカー界の真実。
世はビッグデータブームである。統計学という言葉がこれほどお茶の間で流布したのは初めてのことではないかと思う。理論よりも感情、古典的な経済学よりも行動経済学的なものに傾倒しがちではあるが、データの存在価値が重要視され始めている。
そんな今だからこそ、もう一度読み返したいのが2010年に出版された本書『「ジャパン」はなぜ負けるのか』である。本書はサッカー版の『ヤバい経済学』であり、巷にあふれる噂を統計学の観点からバッサリと斬る科学あふれる内容となっている。
データの有用性とは何か
例えばポゼッションについて考えてみる。チームAとBが対戦し、以下のような結果だったとする。果たしてこの結果から、ポゼッションが高い方が勝つ確率が高いと考えてよいだろうか。
確かにこの試合だけを見ればポゼッション率が高いチームが勝っている。しかしそれは偶然によるものであるかもしれないと誰もが気づくだろう。
では別の試合、さらに別の試合と調査し続け、100試合を集計した結果、ポゼッション率が高いチームの勝率が8割でしたということに仮になったとしたらどうだろう。ポゼッション率が勝敗に関係あると考えてよさそうである。
ここでポイントになるのは「関係あると考えてよさそう」という極めて主観的な表現である。100試合やって勝率8割なら誰もが関係あると異論はなさそうだが、それでは100試合で勝利7割なら?80試合で勝率7割なら?60試合で勝率6割なら?
段々と意見が分かれていくだろう。この境目はどこにあるのか。それを数学的に明らかにしてくれるのが統計学である。
詳しい説明は避けるが、統計的な検定をかければ、例えば「推定(ポゼッション率が勝敗に関係ある)が棄却される(正しくない)確率は5%未満」といったことが分かる。これを有意水準という。一概に言うことは難しいが、一般的に有意水準が5%未満であれば統計的に有意、つまりその推定は正しいといって差し支えないということになる。
このようにデータを用いて主観ではなく客観的に有意な関係性を明らかにできるところに統計学の強みがある。
ちなみにアンチェロッティも『アンチェロッティの戦術ノート』で言うように、ポゼッション率は勝敗とは関係ないと言われている。
では、勝利を勝ち取るためにはボールポゼッションを高めることが重要なのだろうか?実際のところ話はそう単純ではない。「ボールを保持する」のと「得点を挙げる」のとは、まったく異なることだからだ。
両者の間に直接の連関はない。どんなに長い時間ボールを保持し続けても、敵の守備網を破ってシュートを打たない限り得点を挙げることはできない。逆に、たとえボールの保持時間が短くとも、奪ったボールを素早く敵陣に持ち込んでシュートを打てば、ほんの数秒のうちに得点を挙げることができる。(P.40から引用)
サッカーの真実につながるあらゆるデータ
前置きが長くなったが、本書は統計の力を使ってサッカーにまつわる様々な事象を「正しい」「正しくない」とバサバサ斬りつける内容となっている。
第3章では選手の移籍に関するデータを使って移籍市場を勝ち抜く12のポイントを紹介したり、第5章では黒人選手と白人選手の年俸と成績を用いて差別が存在しているかなどを紹介したりするなど、「なるほど」と思わせる角度からアプローチしている。
第2章の「ジャパンはなぜ負けるのか」は本書のタイトルにもなっている日本語版向けの書きおろしである。イギリス版では本書の12章にある「イングランドはなぜ負けるのか」がタイトル(Why England Lose?)となっており、アメリカ版では「サッカー経済学(Soccernomics)」がタイトルとなっている。
第2章では、統計的に調査すれば代表の試合結果は
- 国の人口を増やす
- 国民所得を増やす
- 代表チームとしての経験値を増やす
という3点でかなりの部分が説明できるとされている。この観点で分析すれば日本は平均で対戦相手を0.75ゴール上回っていておかしくないそうだ。
また、お気づきかも知れないが、本書で用いているデータとは試合におけるスタッツと呼ばれるデータではなく、ピッチ外のデータを使っている。本書内にもこのような記述がある。
この本で私たちは、新しい数字、新しい考え方をサッカーに持ち込みたい。自殺者の数、選手の年俸、国の人口など、サッカーの新しい真実につながるものなら何でも紹介したい。ステファン(筆者注:本書の著者の1人)はスポーツ経済学者だが、これは金に関する本ではない。サッカークラブの存在意義は利益を出すことではない(利益をあげているクラブはほとんどないから、クラブにとってはグッドニュースだ)。クラブがときどき手にする利益にも、私たちはとくに関心がない。むしろ私たちがやろうとしているのは、経済学者のスキル(に加えて地理学や心理学や社会学も少し)を使って、ピッチの中のゲームとピッチの外のファンを理解することである。(P.13-14から引用)
so whatにならないように
このようなデータは数字好きの一部の人にはウケるだろうが、興味を示さない人もいるだろう。それはもっともである。なぜなら、本書のデータ解析には統計学を「何かに役立てる」という観点で使用する際に、決定的なことが欠けているからだ。
『統計学が最強の学問である』では「データをビジネスに使うための3つの問い」として以下が挙げられている。
1.何かの要因が変化すれば利益は向上するのか
2.そうした変化を起こすような行動は実際に可能なのか
3.変化を起こす行動が可能だとしてそのコストは利益を上回るのか
(P.59から引用)
これの2番目を見てほしい。変化を起こすための行動が可能なのか。これが決定的に大事なのである。先ほどの例で言えば、日本を勝たせるために人口を増やすことは個人レベルでは無理だし、国民所得を増やすことも代表の経験値をあげることも無理である。
よって、いくら統計的に相関のあるデータが分かっても変化を起こすための提言すら難しいため、ウンチク留まりになってしまう。
この観点で言えば、試合のスタッツと勝敗や得失点についての統計的な調査があれば、もちろんこの観点でも個人レベルでどうこうすることは無理だが、ポゼッション率、スプリント回数、ディフェンシブサードでのヘディングの競り合いの勝率、縦パスの成功率、などの観点から試合のあれこれについて議論することができるようになる。
数年前までは試合のスタッツを正確に取得することは非常に難しかったが、テクノロジーの進化によって最近ではかなり正確に素早くデータを取得することが可能になっている。
スタッツを用いた統計的な観点による書籍の登場が待たれるところである。
コメントする
※ コメントは認証されるまで公開されません。ご了承くださいませ。