コンテンツにスキップ

サッカー

シミュレーションデータを用いたサッカー基盤モデルの構築に向けて


はじめに

本研究では、サッカーの基盤モデルの構築に向け、シミュレーションデータを用いてサッカーの軌道データ予測を行います。近年の大規模基盤モデルの応用とスポーツ分析の発展に基づき、特にサッカーにおける複数エージェントの連携をモデル化することに焦点を当てています。

データセット

サッカーの軌道データ

2019年の明治安田生命J1リーグの55試合分のトラッキングデータを使用。選手とボールの位置座標を記録し、10Hzにダウンサンプリングして前処理を行いました。

シミュレーションデータ

RoboCup2021 Soccer Simulation 2D Leagueのログデータを使用し、プレイモードが”play on”のサイクルのみを抽出してデータを前処理しました。

データ拡張

データの増強のため、各フレームにおける選手とボールの座標を点対称および線対称に移動したデータを生成しました。

実験

モデル

いくつかのモデルを使用し、軌道データの予測性能を評価しました。使用モデルには、Constant Velocity、LSTM、LSTM-GNN、PatchTST、PatchTSMixerなどがあります。

学習方法

入力系列長と予測系列長の長さを変動させ、モデルの予測性能を評価しました。学習にはAdamWオプティマイザを使用しました。

評価方法

平均L2誤差(Mean L2)と失敗率(Miss Rate)を用いてモデルの性能を評価しました。

結果・考察

軌道予測性能

入力系列長を20に固定した場合、出力系列長が短い時にはLSTMベースモデルが高性能を示し、出力系列長が長い場合にはPatchTSMixer-largeが最も高い性能を発揮しました。また、シミュレーションデータを用いることで性能が向上することが確認されました。

軌道埋め込みの有効性の検証

モデルにより得られた軌道データの埋め込み表現の有効性を定性的に評価し、軌道の特徴を捉えることができることを示しました。

おわりに

本研究では、多変量時系列予測モデルを用いてサッカーの基盤モデルの構築可能性を示しました。シミュレーションデータの有効性も確認され、今後のさらなるアーキテクチャの改善が期待されます。

謝辞

本研究は、国立研究開発法人産業技術総合研究所事業の令和5年度覚醒プロジェクトの助成を受けたものです。

言語モデリングによる行動選択・状態推移確率の推定に基づくサッカーのプレー定量評価指標


序論

サッカーなどのゴール型スポーツにおける行動選択と状態推移確率の推定を言語モデリングを用いて行い、選手やチームの定量評価指標を構築する試みについて説明します。

研究の背景

サッカーの定量的評価指標としては、ボールの位置や近辺の統計データに基づくシンプルな機械学習モデルが主流です。しかし、これらの手法は試合全体の文脈を考慮しておらず、ボール非保持者の動きを評価できていない問題があります。最近では、自然言語処理の分野で注目されている大規模言語モデル(LLM)の応用が試みられています。

研究方法

データセット

本研究では、明治安田生命J1リーグ(2021年、2022年シーズン)のトラッキングデータとイベントデータを使用しました。トラッキングデータは、試合中の選手とボールの位置座標を記録したもので、イベントデータは、ボール保持者のアクションや試合イベントの情報を含みます。

前処理

データのダウンサンプリングや欠損データの補完、イベントデータとトラッキングデータの結合を行いました。また、攻撃シークエンスごとにデータを分割し、学習・検証・評価用データセットを作成しました。

モデル

強化学習モデル

状態、行動、報酬の3要素からなる強化学習モデルを用いました。状態は選手とボールの位置座標、行動は攻撃選手の動きやパス、シュートなど、報酬は得点や期待ゴール値(EPV)に基づいて設定しました。

言語モデル

トークン化された状態と行動の系列を予測する言語モデルを学習しました。各選手やボールの座標と移動方向をトークン化し、GPT-2モデルを用いて学習しました。

結果と考察

チーム評価値と指標との関係

強化学習モデルと言語モデルにより得られた評価指標と2022年シーズンの総得点数との関係を評価しました。言語モデルの指標は、得点機会を創出する行動を捉える可能性が示唆されました。

Q値の評価

言語モデルにより得られた行動選択確率から算出されたQ値は、シーズンの総得点数と正の相関を示し、妥当な評価指標であることが確認されました。

結論

言語モデリングを用いた行動選択確率の推定により、従来の指標では捉えられない情報を含む新しい評価指標を構築できることが示されました。今後の研究では、ゲーム理論の知見や自然言語処理の技術を応用したさらなる改善を目指します。

謝辞

本研究に用いたデータは『情報・システム研究機構統計数理研究所 医療健康データ科学研究センター』『データスタジアム株式会社』により提供されました。