人間の心理を超越したAI分析、南米2強を優勝候補に挙げた「AIシミュレータ」はサッカー好きのこだわりと精度の高い数理モデルのタッグで誕生
2022.12.09 19:00 Fri
「人間の肌感覚を超えたところの客観的な指標を提示すると、サッカーの見方が魅力的になることを期待しています」そう語ったのは、株式会社JX通信社で上級執行役員 兼 CXOを務める細野雄紀さん。JX通信社は、カタール・ワールドカップ(W杯)に向けて、「サッカーW杯 勝敗確率&優勝国AIシミュレータ(以下、AIシミュレータ)」を開発し、サービス展開している。
勝敗予想というのは大きな大会になれば必ずと言っていいほど行われ、元選手や現役選手、解説者など数多くの人が、しかも世界各国で行われ、それぞれの意見がぶつかり合うもの。そして、サッカーファンも仲間内で行うほど、定番のコンテンツとなっている。
中には、タコやネコ、パンダ、カワウソなど、動物の予想も登場し、高い的中率が大きな話題になったこともある。
ただ、動物などの選択は直感どころか、何も考えていないで選んでいるはずであり、人の予想はそれぞれのバイアス(かたより)が掛かり、当たらない確率が高まってしまうこともある。
その理由は、バイアスが掛かり希望的観測になってしまうためだが、そのバイアスを一切排除したものがこの「AIシミュレータ」となる。今回は開発に関わった、JX通信社執行役員 兼 データアナリスト/ 情勢調査 事業責任者の衛藤健さん、そして細野さんにインタビューを行った。
◆ベースは選挙の当選確率シミュレータ

今回の「AIシミュレータ」を開発するにあたり、衛藤さんはAI分析の数理モデルを、細野さんは見せ方や必要なデータ、細かい調整を行ったという。しかし、そのスタートはまさかの開幕が迫った11月初旬だったと細野さんが明かした。
「個人的に20年以上サッカーが好きで、W杯の試合予想をAIでやっていく企画を提案したのが11月の初旬だったんですが、そこから急ピッチで立ち上げて、無事にリリースになったという形です」
リリースされたのがカタールW杯前の11月18日、つまり企画から3週間もかけずに完成形にまで持っていったというから驚きだ。
AIと聞くと、一般的には非常に複雑なものという印象が強く、そんな短時間で機能させることなどできないと考えてしまうが、関わったのは3名だと衛藤さんは語った。
「本当に急ピッチで進みました。実は私たち以外でもう1人、インターン的に関わっている人がいて、サッカーに詳しい方でした。
「私と細野と3人でこういうデータを集めたら良いのではないかということを急ピッチに議論して、急ピッチにデータを集めてスタートしました」
たった3人で、データを集めてから完成まで持っていったというが、それにはベースになったものがあったという。それが2022年7月の参院選で開発した「当選確率シミュレータ」だった。
「実はベースになるノウハウがあって、サッカーやW杯の分析は初めてですが、今年の夏の参院選の予測をはじめ選挙まわりのAIを使ったシミュレーション自体はずっとやってきました」と語る細野さん。「そこで数理モデルを構築し、精度を高めるためのノウハウがあったので、今回は違う分野に転用して実現しました。だから急ピッチでもどうにか間に合った感じです」と、ベースがあったからこそのスピード開発が実現できたという。
ただ、選挙とサッカーのW杯では大きく状況が異なるはず。衛藤さんは「選挙だと、例えば候補者が10人いて、その中から1人選ぶとか、単純なものでしたが、サッカーの場合はチームvsチームの試合でありながらも、チームを構成する人、1人1人の選手が11人いて成り立つものなので、1人1人の能力をどう置くのか。その辺りに関しては、結構ドメイン知識(専門分野に特化した知識)が必要で、選挙とは違ったかなと思います」と、ベースはありながらも考え方は違ったという。
一方で、細野さんは共通する考えを持っていると語り、「参院選を1つの大会とみなすと共通するところは結構あります。今回のW杯では、1万回の大会を擬似シミュレーションしているのですが、参院選も同じく1万回試行して、当選確率を出していました。1万大会を行えば、日本が優勝する場合も、あるいは自民党が相当議席を失う場合も起こり得ます。そういう意味で、ノウハウとして共通しているかなと思います」と語り、発生回数は少ないながらもイレギュラーな結果はどちらも出るという共通項もあるとした。
◆想像以上に細かいデータ分析

とは言え、選挙に関しては、不祥事やスキャンダルなど社会的な問題となることが起きない限りは、なかなか大番狂わせということは起こりにくいもの。事前の票読みはおおよそ当たることが通例だ。一方で、サッカーの試合の場合は、選手の能力値はもちろんのこと、コンディションや起用方法など、様々に変動することが多く、さらに対戦カードごとの相性や傾向も存在する。
しかし、そこに関しては細かいデータを用意したと衛藤さんは語る。
「個々の選手について、攻撃とか守備とか、そういうレベルのスコアを独自の指標を使って算出して、それを選手1人1人やって、それを26人ずつつけ、加重平均(特定の数値に対して、他の数値よりも重要度が高いことを加味した平均値)というものでつけていくということやっています」
「例えばケガ人が出たとか、欠員が出た、監督と仲違いをして試合全然使われないとか、そういうことにも対応できる仕組みにはしています」
実にサッカーらしい事象を考慮した構造となっており、実際のカタールW杯でもカメルーン代表GKアンドレ・オナナが途中でW杯を離れることが発生。また、個人的な事情でイングランド代表DFベン・ホワイトが帰国。また、大会中のケガでプレーが不可能になった選手が出るなど、準備していたことが実際にも起きていた。
細野さんは「チームごとの相性の話もありますが、選手が持っているスキルを指標化することに加えて、例えばカタールリーグで活躍している選手がカタールで活躍することはイメージが湧きますが、一方で南米からわざわざ来ると移動距離やコンディション調整が難しいといった変数も裏では加味しています」とコメント。環境やコンディション面なども変数を用いて影響を与えることができる仕組みになっているという。
また、衛藤さんは選手の調子にも注目。「能力が高かったとしても調子の波がもちろんあるわけで、調子の波をきちんと反映できる仕組みも採用しています。例えば、直前の親善試合での結果、W杯が進んでいく中で試合が増えていくので、その結果、相手の強さというのも加味して計算しています」と、目に見える範囲での選手の変化にも対応が可能だという。言うなれば、ゴールを決め続ける選手が出て来ればプラスに働き、期待されながらもパフォーマンスが悪ければマイナスに働くというようなことだ。
加えて、細野さんはW杯という大会が持つ特異性も加味していると語り、「例えばキリンチャレンジカップのような親善試合と、W杯というのは決定的に異質だと思います。代表チームごとの戦力分析も当然やっていますが、W杯という大会フォーマット固有の傾向に対しての変数も組み入れています」とコメント。「よく言われる初戦で勝つと圧倒的に有利とか、初戦で負けると圧倒的に不利というのもありますが、そういうところのW杯の傾向も加味されています」と、過去のW杯で実際に起こっている傾向も加味されて結果が出る仕組みになっているようだ。
「日本代表は初戦の前は、グループリーグの突破は33%ぐらいでしたが、(ドイツ戦後に)70%超に跳ね上がったのは、日本代表のコンディションだけでなく、そういうW杯特有の傾向も過去のデータから出されているということです」とコメント。勝った、負けたという結果だけでは算出されていないという。
中には、タコやネコ、パンダ、カワウソなど、動物の予想も登場し、高い的中率が大きな話題になったこともある。
ただ、動物などの選択は直感どころか、何も考えていないで選んでいるはずであり、人の予想はそれぞれのバイアス(かたより)が掛かり、当たらない確率が高まってしまうこともある。
例えば、カタールW杯で日本がグループステージを首位通過すると予想した人はどれだけいたのか。また、ドイツ代表とスペイン代表に勝利し、コスタリカ代表に負けると予想した人がどれだけいたのか。その数は多くはないはずだ。
その理由は、バイアスが掛かり希望的観測になってしまうためだが、そのバイアスを一切排除したものがこの「AIシミュレータ」となる。今回は開発に関わった、JX通信社執行役員 兼 データアナリスト/ 情勢調査 事業責任者の衛藤健さん、そして細野さんにインタビューを行った。
◆ベースは選挙の当選確率シミュレータ

[サッカー好きでこだわりを持ってAIシミュレータを作った細野雄紀さん]
今回の「AIシミュレータ」を開発するにあたり、衛藤さんはAI分析の数理モデルを、細野さんは見せ方や必要なデータ、細かい調整を行ったという。しかし、そのスタートはまさかの開幕が迫った11月初旬だったと細野さんが明かした。
「個人的に20年以上サッカーが好きで、W杯の試合予想をAIでやっていく企画を提案したのが11月の初旬だったんですが、そこから急ピッチで立ち上げて、無事にリリースになったという形です」
リリースされたのがカタールW杯前の11月18日、つまり企画から3週間もかけずに完成形にまで持っていったというから驚きだ。
AIと聞くと、一般的には非常に複雑なものという印象が強く、そんな短時間で機能させることなどできないと考えてしまうが、関わったのは3名だと衛藤さんは語った。
「本当に急ピッチで進みました。実は私たち以外でもう1人、インターン的に関わっている人がいて、サッカーに詳しい方でした。
「私と細野と3人でこういうデータを集めたら良いのではないかということを急ピッチに議論して、急ピッチにデータを集めてスタートしました」
たった3人で、データを集めてから完成まで持っていったというが、それにはベースになったものがあったという。それが2022年7月の参院選で開発した「当選確率シミュレータ」だった。
「実はベースになるノウハウがあって、サッカーやW杯の分析は初めてですが、今年の夏の参院選の予測をはじめ選挙まわりのAIを使ったシミュレーション自体はずっとやってきました」と語る細野さん。「そこで数理モデルを構築し、精度を高めるためのノウハウがあったので、今回は違う分野に転用して実現しました。だから急ピッチでもどうにか間に合った感じです」と、ベースがあったからこそのスピード開発が実現できたという。
ただ、選挙とサッカーのW杯では大きく状況が異なるはず。衛藤さんは「選挙だと、例えば候補者が10人いて、その中から1人選ぶとか、単純なものでしたが、サッカーの場合はチームvsチームの試合でありながらも、チームを構成する人、1人1人の選手が11人いて成り立つものなので、1人1人の能力をどう置くのか。その辺りに関しては、結構ドメイン知識(専門分野に特化した知識)が必要で、選挙とは違ったかなと思います」と、ベースはありながらも考え方は違ったという。
一方で、細野さんは共通する考えを持っていると語り、「参院選を1つの大会とみなすと共通するところは結構あります。今回のW杯では、1万回の大会を擬似シミュレーションしているのですが、参院選も同じく1万回試行して、当選確率を出していました。1万大会を行えば、日本が優勝する場合も、あるいは自民党が相当議席を失う場合も起こり得ます。そういう意味で、ノウハウとして共通しているかなと思います」と語り、発生回数は少ないながらもイレギュラーな結果はどちらも出るという共通項もあるとした。
◆想像以上に細かいデータ分析

[AI分析シミュレータの数理モデルを作った衛藤健さん]
とは言え、選挙に関しては、不祥事やスキャンダルなど社会的な問題となることが起きない限りは、なかなか大番狂わせということは起こりにくいもの。事前の票読みはおおよそ当たることが通例だ。一方で、サッカーの試合の場合は、選手の能力値はもちろんのこと、コンディションや起用方法など、様々に変動することが多く、さらに対戦カードごとの相性や傾向も存在する。
しかし、そこに関しては細かいデータを用意したと衛藤さんは語る。
「個々の選手について、攻撃とか守備とか、そういうレベルのスコアを独自の指標を使って算出して、それを選手1人1人やって、それを26人ずつつけ、加重平均(特定の数値に対して、他の数値よりも重要度が高いことを加味した平均値)というものでつけていくということやっています」
「例えばケガ人が出たとか、欠員が出た、監督と仲違いをして試合全然使われないとか、そういうことにも対応できる仕組みにはしています」
実にサッカーらしい事象を考慮した構造となっており、実際のカタールW杯でもカメルーン代表GKアンドレ・オナナが途中でW杯を離れることが発生。また、個人的な事情でイングランド代表DFベン・ホワイトが帰国。また、大会中のケガでプレーが不可能になった選手が出るなど、準備していたことが実際にも起きていた。
細野さんは「チームごとの相性の話もありますが、選手が持っているスキルを指標化することに加えて、例えばカタールリーグで活躍している選手がカタールで活躍することはイメージが湧きますが、一方で南米からわざわざ来ると移動距離やコンディション調整が難しいといった変数も裏では加味しています」とコメント。環境やコンディション面なども変数を用いて影響を与えることができる仕組みになっているという。
また、衛藤さんは選手の調子にも注目。「能力が高かったとしても調子の波がもちろんあるわけで、調子の波をきちんと反映できる仕組みも採用しています。例えば、直前の親善試合での結果、W杯が進んでいく中で試合が増えていくので、その結果、相手の強さというのも加味して計算しています」と、目に見える範囲での選手の変化にも対応が可能だという。言うなれば、ゴールを決め続ける選手が出て来ればプラスに働き、期待されながらもパフォーマンスが悪ければマイナスに働くというようなことだ。
加えて、細野さんはW杯という大会が持つ特異性も加味していると語り、「例えばキリンチャレンジカップのような親善試合と、W杯というのは決定的に異質だと思います。代表チームごとの戦力分析も当然やっていますが、W杯という大会フォーマット固有の傾向に対しての変数も組み入れています」とコメント。「よく言われる初戦で勝つと圧倒的に有利とか、初戦で負けると圧倒的に不利というのもありますが、そういうところのW杯の傾向も加味されています」と、過去のW杯で実際に起こっている傾向も加味されて結果が出る仕組みになっているようだ。
「日本代表は初戦の前は、グループリーグの突破は33%ぐらいでしたが、(ドイツ戦後に)70%超に跳ね上がったのは、日本代表のコンディションだけでなく、そういうW杯特有の傾向も過去のデータから出されているということです」とコメント。勝った、負けたという結果だけでは算出されていないという。
|
|
関連ニュース