人間の心理を超越したAI分析、南米2強を優勝候補に挙げた「AIシミュレータ」はサッカー好きのこだわりと精度の高い数理モデルのタッグで誕生
2022.12.09 19:00 Fri
◆分析結果の精度は80〜90%

より現実のサッカーで起こりそうなことまで細分化して分析を行っている「AIシミュレータ」。ただ、試作段階からリリースまでの間には、順調にいかないものもあったという。
「僕は結構こだわりがあるので、数理モデルを構築していたときにアルファ版、ベータ版、完成版と何度か強化していきましたが、一番最初の初期モデルでは、ブラジルやアルゼンチンが優勝候補ではなかったんです」と細野さんは明かす。その理由は、指標の1つとして入れた「移動距離」が影響を与えすぎていたからだという。
「アルファ版ではセルビアが有力な優勝候補で、欧州国が過大評価されていた印象がありました。それは移動距離によるコンディション不良がかなり加味された結果になっていたからなんですが、蓋を開けてみると開催国のカタールはホームアドバンテージが生きず、初戦で負けてしまいました。移動のアドバンテージは結局あまり効いていないなと。大会前にそういった部分を修正することができたので、結果的には確率の高いシミュレーション結果になったと思います」
サッカー好きの細野さんの感覚、そしてサッカーに明るくない衛藤さんのデータに基づいた数理モデルが合わさり、今回の「AIシミュレータ」が完成した。
最初に完成したものとリリースされたものの違いについては「移動距離というものを必要以上に加味しすぎていたので、よりカタールから遠い南米のチームが過小評価されるというものにはなっていました」と衛藤さんは語る。
細野さんは「概ね今のモデルの方が、肌感覚としても近いですし、今起きているグループリーグの結果を見ても確からしいという感じがしていて、ブラジル代表の優勝確率が一番高いんですが、どのデータ分析会社も同じ様な予測結果だと思います。初期のバージョンに比べると、格段に確度は高いのかなと思います」と、実際に残っている結果との差もあまりない感じがするとした。
では一体どれくらい信じて良いものなのか。衛藤さんは「事前の確認作業をしていた時は8割〜9割ぐらい当たっていました」とコメント。それには考え方の違いがあり、「普通は勝ち、引き分け、負けをしっかり当てるというものになると思います。ただ、結果的に引き分けになった試合は、どっちが勝ってもおかしくなかったと考え、勝ち、負け、引き分けのどれで予想しても間違ってはいないと考えました」と、引き分けと言いながらも、どちらも勝つ確率があったと考え、「二回引き分けだったという試合は除外しました。勝ちと負けがしっかりついたケースは、9割近くありました。かなり高い精度になっていると思います」と、勝敗がつくようなモデルになっているとのこと。ただ、「それでも10%ぐらいは番狂わせの要素があったので、そこがサッカーの面白さかなと思います」と、番狂わせが起こる可能性もしっかりと残る結果になるとした。
細野さんも、結果については実際に起こった試合でも、どちらに転ぶか分からないものは多いと語る。
「日本とコスタリカとの試合では、46%が日本の勝利、34%はコスタリカの勝利で、残りは引き分けでした。実際の試合前のムード的には、95%ぐらい日本が勝つだろうという空気だったと思いますが、実際の数字はちょっと勝率の高いジャンケンの様なもの。蓋を開けてみると、どっちに転んでもおかしくない試合だったと思います」
「仮に、伊東純也が抜け出してファウルで止められたシーンがPKだったとしたら、日本が勝っていたかもしれない。あそこで、伊東純也が抜け出した時にPKだったとしたら、日本が勝っていたかもしれない。あの50cmの差が勝敗を分けたと思います」
「2018年の時もコロンビア戦で相手がハンドでレッドカードになり、PKを取れなかったらまったく違う展開になっていたと思います。そういう意味で言うと、どっちに転んでもおかしくなかったんだなと」
「勝敗確率は人間の肌感覚から逸脱している様に見えますが、そういったものを超えて客観的に見ると言う意味では面白いと思います。人間の肌感覚を超えたところの客観的な指標を提示することで、サッカーの見方が魅力的になることを期待しています」
今回の「AIシミュレータ」では、採用されていないものの、試合中のデータを取り込んで分析するような仕組みを作れば、シュート数やボール支配率など、試合の動きに合わせて勝率が変動するものも開発は可能だという。
ただ、「今の分析はミクロというよりは、マクロのデータの分析なので、試合中に起こるできごとを細かく分析するよりも、結局勝ったのか負けたのか、何点入ったのかというアプローチでモデルを構築しました」と細野さんは語り、最終結果がどうなるかという確率を算出するものになっているとした。
◆今後はサッカーはもちろん、他スポーツや非スポーツにも

「AIシミュレータ」が算出する確率は、毎日更新されるが、これは毎日1万回のW杯を開催し、そのデータから算出された数字となっている。毎日6万4000試合の結果が1つずつ出され、それをもとに算出された数字。妙に納得感があり、説得力を感じる数字になっているのは、そこが理由だと言える。
加えて、選手個々のデータも短期のデータを採用しており、過去の高い能力やコンディションなどは加味しない状況に。より今大会に参加している選手の状況が反映されるようになっているという。
そういった点では、大会前の各グループの突破確率を見た際に、各グループで最も高い数字が出ていながら敗退となったのはグループFのベルギー代表(71.8%)のみ。他のグループは70%以上の突破確率が弾き出された国は全て決勝トーナメントに進出している。ベルギーもクロアチア代表戦では、勝利してもおかしくない展開だっただけに、ほとんど当たっていたと言っても良いのかもしれない。
一方で、各グループで最も突破の確率が低い国で実際は決勝トーナメントに進出したのもグループDのオーストラリア代表だけ。ベスト16でみれば、11カ国が当たっており、的中率は68.75%という結果だった。より調整を行えば、その精度はさらに上がることも考えられるだろう。
人々の熱狂とは裏腹に、冷静にデータから分析した結果を弾き出す「AIシミュレータ」だが、バイアスがかからない分、リアルな数字と言っても良い。
このAIの分析を今後どう発展させていくのか。衛藤さんは「サッカーに限らず、色々なスポーツで生かせると思います」と語り、「野球は典型的な例ですが、数理的な分析、確率を使って作戦が変わったり、選手の動きに影響したりしています」と、試合の進行が止まる野球では、選手ごとの投手の配球や守備、プレーの選択などもデータを基にされており、特にメジャーリーグではその傾向が強い。
「そういうことを考えると、サッカーだけじゃなく野球やラグビーなど、色々なスポーツでもできると考えています。将来的に他のスポーツだったり、サッカーもJリーグなどにも予測の対象を広めていく可能性は十分あると思います」と衛藤さんは展望を語った。
また、細野さんは「もともと我々はスポーツではなく選挙の予想から入っているので、究極言うと大会の様なものであれば、スポーツじゃなくても予想できます」と語り、「引き続き我々はスポーツも挑戦していきますが、選挙や非スポーツの分野で分析や予測をしていくことは1つ我々のミッションだと思っています」と、様々な分野での数値分析をしていくことに使っていきたいとした。
ちなみに、勝敗の確率を算出するとなれば、スポーツベッティングに生かしたいと考える人も現れるだろう。細野さんは「人間のバイアスや感覚でオッズは決まってしまうので、あまり客観的な指標にはならない印象です」と語り、「バイアスに基づかずに、過去の成績、W杯の傾向、選手のコンディションというものを数理モデル化した上で、数理モデル化した上で、勢いや空気に惑わされずシミュレーションするほうが、結果的には賭け事にも使えると思います」と、よりシビアな数値を見ていくことはできると語った。
また、「ドイツ戦に勝った後は、W杯が始まる前は3試合全て厳しいという感じだったのに、いきなりコスタリカは余裕という空気になりました。人間の群集心理や危うさ、脆さを、改めて目の当たりにしました」と、どうしても人間の感覚ではブレが生まれてしまうとし、「人間の心理をベースにした推測や予測は、W杯の様なお祭りごとであればあるほど、当てにしてはいけないなと感じました」と、バイアスが掛かりやすい状況であればあるほど、AIの分析は活用できるかもしれないとした。
企画を出した細野さんは、最後に意外な言葉を残した。
「衛藤は元々サッカーは好きでもないし、詳しくもない人間ですが、ある種バイアスをかけずに数理モデルを構築した結果、サウジアラビアがアルゼンチンに10%勝率あるんだというものを、決め込まずに作れたことが、結果的に良かったなと思っています」
「サッカー好きが作ると、アルゼンチンはもっと勝率あるでしょうと思ってしまうかもしれないですが、詳しくないからこそ、バイアスがかからずにドライにジャッジをして開発できた側面はあるなと思いました」
サッカー好きの細野さんのこだわりと、データ分析に長けた衛藤さんの力が合わさった結果が、納得感のある結果を生み出す「AIシミュレータ」を生み出したと言えそうだ。4年後のW杯では、より精度の高いものが誕生しているかもしれない。
取材・文:菅野剛史(超ワールドサッカー編集部)

[大会前に出された分析結果、グループステージ突破国の的中率?]
より現実のサッカーで起こりそうなことまで細分化して分析を行っている「AIシミュレータ」。ただ、試作段階からリリースまでの間には、順調にいかないものもあったという。
「僕は結構こだわりがあるので、数理モデルを構築していたときにアルファ版、ベータ版、完成版と何度か強化していきましたが、一番最初の初期モデルでは、ブラジルやアルゼンチンが優勝候補ではなかったんです」と細野さんは明かす。その理由は、指標の1つとして入れた「移動距離」が影響を与えすぎていたからだという。
「アルファ版ではセルビアが有力な優勝候補で、欧州国が過大評価されていた印象がありました。それは移動距離によるコンディション不良がかなり加味された結果になっていたからなんですが、蓋を開けてみると開催国のカタールはホームアドバンテージが生きず、初戦で負けてしまいました。移動のアドバンテージは結局あまり効いていないなと。大会前にそういった部分を修正することができたので、結果的には確率の高いシミュレーション結果になったと思います」
サッカー好きの細野さんの感覚、そしてサッカーに明るくない衛藤さんのデータに基づいた数理モデルが合わさり、今回の「AIシミュレータ」が完成した。
最初に完成したものとリリースされたものの違いについては「移動距離というものを必要以上に加味しすぎていたので、よりカタールから遠い南米のチームが過小評価されるというものにはなっていました」と衛藤さんは語る。
細野さんは「概ね今のモデルの方が、肌感覚としても近いですし、今起きているグループリーグの結果を見ても確からしいという感じがしていて、ブラジル代表の優勝確率が一番高いんですが、どのデータ分析会社も同じ様な予測結果だと思います。初期のバージョンに比べると、格段に確度は高いのかなと思います」と、実際に残っている結果との差もあまりない感じがするとした。
では一体どれくらい信じて良いものなのか。衛藤さんは「事前の確認作業をしていた時は8割〜9割ぐらい当たっていました」とコメント。それには考え方の違いがあり、「普通は勝ち、引き分け、負けをしっかり当てるというものになると思います。ただ、結果的に引き分けになった試合は、どっちが勝ってもおかしくなかったと考え、勝ち、負け、引き分けのどれで予想しても間違ってはいないと考えました」と、引き分けと言いながらも、どちらも勝つ確率があったと考え、「二回引き分けだったという試合は除外しました。勝ちと負けがしっかりついたケースは、9割近くありました。かなり高い精度になっていると思います」と、勝敗がつくようなモデルになっているとのこと。ただ、「それでも10%ぐらいは番狂わせの要素があったので、そこがサッカーの面白さかなと思います」と、番狂わせが起こる可能性もしっかりと残る結果になるとした。
細野さんも、結果については実際に起こった試合でも、どちらに転ぶか分からないものは多いと語る。
「日本とコスタリカとの試合では、46%が日本の勝利、34%はコスタリカの勝利で、残りは引き分けでした。実際の試合前のムード的には、95%ぐらい日本が勝つだろうという空気だったと思いますが、実際の数字はちょっと勝率の高いジャンケンの様なもの。蓋を開けてみると、どっちに転んでもおかしくない試合だったと思います」
「仮に、伊東純也が抜け出してファウルで止められたシーンがPKだったとしたら、日本が勝っていたかもしれない。あそこで、伊東純也が抜け出した時にPKだったとしたら、日本が勝っていたかもしれない。あの50cmの差が勝敗を分けたと思います」
「2018年の時もコロンビア戦で相手がハンドでレッドカードになり、PKを取れなかったらまったく違う展開になっていたと思います。そういう意味で言うと、どっちに転んでもおかしくなかったんだなと」
「勝敗確率は人間の肌感覚から逸脱している様に見えますが、そういったものを超えて客観的に見ると言う意味では面白いと思います。人間の肌感覚を超えたところの客観的な指標を提示することで、サッカーの見方が魅力的になることを期待しています」
今回の「AIシミュレータ」では、採用されていないものの、試合中のデータを取り込んで分析するような仕組みを作れば、シュート数やボール支配率など、試合の動きに合わせて勝率が変動するものも開発は可能だという。
ただ、「今の分析はミクロというよりは、マクロのデータの分析なので、試合中に起こるできごとを細かく分析するよりも、結局勝ったのか負けたのか、何点入ったのかというアプローチでモデルを構築しました」と細野さんは語り、最終結果がどうなるかという確率を算出するものになっているとした。
◆今後はサッカーはもちろん、他スポーツや非スポーツにも

[3人のチームで作り上げたAIシミュレータ、未来はどうなるのか]
「AIシミュレータ」が算出する確率は、毎日更新されるが、これは毎日1万回のW杯を開催し、そのデータから算出された数字となっている。毎日6万4000試合の結果が1つずつ出され、それをもとに算出された数字。妙に納得感があり、説得力を感じる数字になっているのは、そこが理由だと言える。
加えて、選手個々のデータも短期のデータを採用しており、過去の高い能力やコンディションなどは加味しない状況に。より今大会に参加している選手の状況が反映されるようになっているという。
そういった点では、大会前の各グループの突破確率を見た際に、各グループで最も高い数字が出ていながら敗退となったのはグループFのベルギー代表(71.8%)のみ。他のグループは70%以上の突破確率が弾き出された国は全て決勝トーナメントに進出している。ベルギーもクロアチア代表戦では、勝利してもおかしくない展開だっただけに、ほとんど当たっていたと言っても良いのかもしれない。
一方で、各グループで最も突破の確率が低い国で実際は決勝トーナメントに進出したのもグループDのオーストラリア代表だけ。ベスト16でみれば、11カ国が当たっており、的中率は68.75%という結果だった。より調整を行えば、その精度はさらに上がることも考えられるだろう。
人々の熱狂とは裏腹に、冷静にデータから分析した結果を弾き出す「AIシミュレータ」だが、バイアスがかからない分、リアルな数字と言っても良い。
このAIの分析を今後どう発展させていくのか。衛藤さんは「サッカーに限らず、色々なスポーツで生かせると思います」と語り、「野球は典型的な例ですが、数理的な分析、確率を使って作戦が変わったり、選手の動きに影響したりしています」と、試合の進行が止まる野球では、選手ごとの投手の配球や守備、プレーの選択などもデータを基にされており、特にメジャーリーグではその傾向が強い。
「そういうことを考えると、サッカーだけじゃなく野球やラグビーなど、色々なスポーツでもできると考えています。将来的に他のスポーツだったり、サッカーもJリーグなどにも予測の対象を広めていく可能性は十分あると思います」と衛藤さんは展望を語った。
また、細野さんは「もともと我々はスポーツではなく選挙の予想から入っているので、究極言うと大会の様なものであれば、スポーツじゃなくても予想できます」と語り、「引き続き我々はスポーツも挑戦していきますが、選挙や非スポーツの分野で分析や予測をしていくことは1つ我々のミッションだと思っています」と、様々な分野での数値分析をしていくことに使っていきたいとした。
ちなみに、勝敗の確率を算出するとなれば、スポーツベッティングに生かしたいと考える人も現れるだろう。細野さんは「人間のバイアスや感覚でオッズは決まってしまうので、あまり客観的な指標にはならない印象です」と語り、「バイアスに基づかずに、過去の成績、W杯の傾向、選手のコンディションというものを数理モデル化した上で、数理モデル化した上で、勢いや空気に惑わされずシミュレーションするほうが、結果的には賭け事にも使えると思います」と、よりシビアな数値を見ていくことはできると語った。
また、「ドイツ戦に勝った後は、W杯が始まる前は3試合全て厳しいという感じだったのに、いきなりコスタリカは余裕という空気になりました。人間の群集心理や危うさ、脆さを、改めて目の当たりにしました」と、どうしても人間の感覚ではブレが生まれてしまうとし、「人間の心理をベースにした推測や予測は、W杯の様なお祭りごとであればあるほど、当てにしてはいけないなと感じました」と、バイアスが掛かりやすい状況であればあるほど、AIの分析は活用できるかもしれないとした。
企画を出した細野さんは、最後に意外な言葉を残した。
「衛藤は元々サッカーは好きでもないし、詳しくもない人間ですが、ある種バイアスをかけずに数理モデルを構築した結果、サウジアラビアがアルゼンチンに10%勝率あるんだというものを、決め込まずに作れたことが、結果的に良かったなと思っています」
「サッカー好きが作ると、アルゼンチンはもっと勝率あるでしょうと思ってしまうかもしれないですが、詳しくないからこそ、バイアスがかからずにドライにジャッジをして開発できた側面はあるなと思いました」
サッカー好きの細野さんのこだわりと、データ分析に長けた衛藤さんの力が合わさった結果が、納得感のある結果を生み出す「AIシミュレータ」を生み出したと言えそうだ。4年後のW杯では、より精度の高いものが誕生しているかもしれない。
取材・文:菅野剛史(超ワールドサッカー編集部)
|
|
関連ニュース