AI検証の時代:現在のAI論を超越して
AIシステムの能力が高まり、意思決定プロセスに深く組み込まれるにつれ、次の課題はもはや生成そのものにとどまらず、検証、信頼性、そして現実世界の理解へと移りつつある

パトリック・ルーシー博士は、Stats Performのチーフサイエンティストとして、同社のAI研究およびイノベーション戦略を統括しています。今回の記事では、AIをめぐる議論が、「システムが何を生み出せるか」から、「組織が何を信頼し、検証し、大規模に実用化できるか」へとどのようにシフトしつつあるか、そしてなぜスポーツがその次の時代に向けた実証の場となりつつあるのかについて考察しています。
ここ数ヶ月、私はAIエコシステム全体を網羅してきました。その範囲は、 NVIDIA GTC や MITスポーツサミット から、 ウィスコンシンAIビジネスサミット、そして当社独自の Optaフォーラム、そしてEMBAの教室。

サミットやカンファレンスの喧騒から一歩離れて見れば、我々が転換点に差し掛かっていることは明らかです。議論の焦点は、現在の自律型AIモデルが「何ができるか」という「目新しさ」から、「何をするべきか」という必要性へと移り変わっています。 私たちは、AIを単なる反応型のチャットボットとして扱うことから、能動的な生産システム、すなわち「AIファクトリー」として扱う方向へと移行しつつあります。しかし、こうしたファクトリーを展開する前に、必要な検証と監督体制が整っていることを確認しなければなりません。ビジネス界がデジタル領域でのシステム導入に注力する一方で、研究とイノベーションの「話題」は、確実にフィジカルAIに集中しています。
しかし、これは私たちがスポーツ界で行っている活動とどう結びつくのでしょうか?
スポーツは、物理的な世界とデジタル世界の境界に完璧に位置しているという点で、他に類を見ない存在です。多くの産業がテキスト、コード、画像といったデジタル世界のみに存在している一方で、スポーツの本質は、人間がリアルタイムで身体を使って行う活動にあります。 スポーツは、経済的だけでなく社会的にも、地球上で最も価値ある資産の一つであり、普遍的な言語を通じて国境を越えてコミュニティをつなぐ、世界的な社会構造の一部を成しています。私たちはこうした人間的な瞬間を深く大切にしているため、データの生成とAIによるその活用は、非の打ち所がないものでなければなりません。私がこの記事を書いた動機は、次の2つです:
- エコシステムの架け橋:スポーツ界が、AI分野全体における急速な変化――特に、自律的なワークフローや「AIファクトリー」への移行――を十分に認識し、こうした世界的なトレンドがいかにして競技の現場に直接結びついているかを理解できるようにするため。
- スポーツこそ究極の実証の場:スポーツ以外の分野の人々に、私たちがスポーツAIの分野で行っている取り組みが、現存する中で最も高度なものであることを示すためです。物理的な現実をリアルタイムかつ大規模に解明しなければならないため、スポーツはAIの信頼性、そして検証可能性、信頼、確実性を中核とする次世代AIにとって、究極の「ストレステスト」となるのです。
以下に、この期間に私が捉えた主なトレンドの概要と、それらがStats Performでの私たちの取り組みとどのように関連しているかについてまとめました。
1. トークンの賢い活用
NVIDIAのGTCにおいて、CEOのジェンセン・フアン氏は、我々が従来のデータセンターの時代をすでに脱したと強調しました。数十年にわたり、データセンターは受動的なコストセンター、つまり情報の保存と検索を目的とした「デジタル倉庫」に過ぎませんでした。しかし今日、我々は「AIファクトリー」、すなわち実際の作業が行われる施設を構築しています。この新しいパラダイムにおいて、「エージェント型AI」こそが、その作業を実行するエンジンとなるのです。
具体的には、こうしたエージェント型システムは、まるでデジタル従業員のように機能します。つまり、計画を立て、ソフトウェアを操作し、多段階のワークフローを自律的に完了できるシステムです。 Claude Code や OpenClaw といったツールは、この新しい「自動化された労働」の一端を垣間見せてくれます。
業務運営の観点から見ると、議論は「AIをどう活用するか」から、価値と効率という視点に立ち、「AIをどのように最大限に活用するか」へと移行しています。AIによってコードの記述やコンテンツの生成が驚くほど容易になった一方で、新たなコードベースや生成結果の維持・検証という新たな負担も生じているのです。
これらのシステムをどこで活用するかについては、現実的な判断が求められます。トークンにはコストがかかります。単純なスプレッドシートの照会に高度な推論能力を持つエージェントを使うのは、スーパーへの買い物にジェットエンジンを駆使するようなものです。だからこそ、エージェント型AIシステムの利用にかかる真のコストを反映させるべく、AI企業は価格モデルを急速に見直しているのです。企業が注意を怠れば、計算リソースの予算をあっという間に使い果たしてしまう恐れがあります。 さらに、自動化されたアクションの一つひとつが新たなセキュリティリスクとなります。これは、Anthropic社のMythosモデルが、人間による数十年にわたるレビューを経ても見過ごされていた脆弱性を、わずか数秒で発見したことで、最近実証されたことです。
多くの点で、これは古典的な機械学習の核心的な原則を反映しています。つまり、線形モデルは正則化が容易で、解釈しやすく、破られにくいという点で、深層ニューラルネットワークよりも優れている場合があるのです。
2026年のメッセージは明確です:
AIシステムの仕組みを理解できず、その検証もできないのであれば、そもそもそのシステムを開発すべきではないでしょう。「ブラックボックス」という言い訳は通用しなくなりました。EU AI法のような規制が本格的に施行され、米国の各州法でも厳格な民事責任が導入される中、組織は今や、あらゆる「自律的な」誤判断に対して法的・倫理的な責任を負うことになります。理解できないシステムの背後に隠れることはできないのです。
AI時代において成功を収めるためには、組織にはAIシステムを管理し、例外的なケースを特定し、必要に応じて介入できる専門家が必要です。
2. コンテキストの専門家の時代
私が訪れたサミットや教室のあらゆる場所で、あらゆる会話の根底に一つの疑問が横たわっていた。「自分の仕事の未来はどうなるのか?」。新卒者にとっても、職を失った人々にとっても、デジタル世界を自律的に探索し、独自のソフトウェアを記述できるシステムである「エージェント型AI」の台頭は、手に取るように感じられる不安を生み出している。
今まさに、ある逆説的な現象が目の前で起きている。AIが将来の労働の基盤となりつつあるにもかかわらず、今学年度のコンピュータサイエンス専攻の入学者数は8.1%減少し、全専攻の中で最も大きな減少幅を記録した。
なぜこの落ち込みが起きているのか?私の見解では、「コーダーの時代」が「コンテキストの専門家の時代」に取って代わられつつあるためだ。一般的なコーディングの知識はコモディティ化しつつある。差別化要因となるのは、深い専門知識、とりわけ「ラストマイル」におけるものだ。そこでは、エッジケースや制約、現実世界の変動性を理解し、検証しなければならない。 AIが平均的なケースを処理する一方で、最も重要なシナリオにおいてシステムが正しく動作することを保証するには、人間の専門知識が不可欠となります。
医療、法律、金融といった規制の厳しい分野では、価値の重心が、推測に基づく「推定」から、決定論的な監査へと移行しつつある。これは ジェヴォンズのパラドックス の現れです。AIが基本的な認知タスクをより安価かつ迅速にするにつれ、私たちの仕事量は減るどころか、指数関数的に増加するのです。これは以前、会計分野で電子表計算ソフトが導入された際にも見られました。多くの人が会計士の必要性が減ると予想していましたが、結局のところ、その分野は拡大したのです。 生産量が増大するにつれ、リスクも同様に増大する。その結果、仕事量が減るのではなく、その作業を検証・妥当性確認し、最終的に責任を負うための高度な専門知識への需要が高まる。AIはこのプロセスを支援するが、説明責任は自動化できない。検証と承認には、依然として人間の専門家が不可欠である。
とはいえ、コーディングが中核的なスキルとして消え去ることはないでしょう。むしろ、優れたコーディング能力と深い専門知識を組み合わせることこそが、競争優位性をもたらすことになるでしょう。今後、コーディングとAIは、あらゆる分野において基盤となる存在となり、単なる専門分野ではなく、中核的な能力として位置づけられていくでしょう。
スポーツにおいて、専門知識を装うことはできない。
リスクが高すぎる上、状況も極めて特殊です。参入障壁となっているのは、単なる技術的な熟練度だけではありません。AIの出力を検証し、バリューチェーンの上流で活動するために必要な専門知識こそが障壁となっているのです。つまり、単なる記述的分析から、チームやファンに真の影響をもたらす処方的なイノベーションへと移行することが求められているのです。
この変化を如実に示す事例が、当社の Optaフォーラムで明らかになりました。
これまで、アナリストやデータサイエンティストは、ダッシュボードの維持管理や定型的なレポート作成に追われていました。しかし、Agentic AIの登場により、その状況は変わりつつあります。ダッシュボードは「検証の層」へと進化しています。もはやインサイトを発見するための「目的地」ではなく、AIシステムが作成した成果物を監査・検証するためのインターフェースとなっているのです。世界中の主要クラブとの対話を通じて、ある共通した傾向が浮かび上がりました。それは、アナリストやデータサイエンティストが、ついに「以前から解決したいと願っていた課題」に集中できるようになったということです。
この転換により、アナリストは単に成果物を維持する役割から、その整合性を自ら責任を持って管理する役割へと移行できるようになり、これまで手が回らなかった、価値が高く影響力の大きい課題のバックログに取り組むための余裕が生まれる。
3. 物理AIと、誤りを犯すことのコストの高まり
多くの人が「フィジカルAI」と聞くと、ヒューマノイドロボットを思い浮かべます。ロボティクスが次の大きなフロンティアとして急速に台頭している一方で、その実現を可能にする重要なブレークスルーとなっているのが、ワールドモデルの開発です。これは、現実世界の物理法則や相互作用を、ますます高い精度で理解・シミュレートできるAIシステムです。 主にテキストや画像を処理する従来の大規模言語モデル(LLM)や大規模視覚モデル(VLM)とは異なり、ワールドモデルは、共有された埋め込み空間において、物体、環境、運動、相互作用のダイナミクスを統合的に表現することを学びます。これらのモデルは、物理環境における知覚、推論、計画、意思決定を可能にするための基盤となります。
長年にわたり、私たちはデジタル上の「サンドボックス」の中で活動してきました。そこでは、エラーが発生してもリンクが切れたり、出力が間違ったりする程度です。しかし現実世界では、エラーは深刻な結果を招きます。誤りを犯した際の代償は、劇的に大きくなります。だからこそ、検証が極めて重要になるのです。
この変革を可能にする重要な要素の一つが、高精度なデジタルツインの活用です。これは、システムが実世界と相互作用する前に、安全にトレーニングやテストを行うことができる仮想環境のことです。しかし、こうしたシステムの性能は、その基盤となるデータや前提条件の質に左右されます。 その好例が、WaymoがGoogleの「Genie 3」モデルを活用して、現実世界では捉えるのが極めて困難なリアルなシナリオをシミュレーションしている点です。そうした事態は過去に発生していないかもしれませんが、将来的に起こり得る可能性があるため、こうした状況下でどう行動すべきかを把握しているシステムを持つことが、安全性と信頼性の鍵となります。
これにより、新たな種類の「データ・モート」が形成されます。それは単なる規模の大きさだけでなく、正確性と現実への根ざしを備えたものです。これは、深い専門知識を持つ人材――つまり、AIシステムが運用されるべき現実を確実に反映させる科学者やエンジニア――の必要性をさらに強めるものです。
AIが現実世界へと進出するにつれ、人間の専門知識の役割は薄れるどころか、ますます重要になっていきます。なぜなら、システムが現実世界で動作する際、信頼はもはや「あれば良い」ものではなく、不可欠なものとなるからです。
4. 究極の検証問題としてのスポーツ
スポーツは、現実世界とデジタル世界の交差点に位置しています。
数十年にわたり、スポーツ分野におけるAIは、グラフィックや要約、単純な統計データといった情報を提供する手段として利用されてきました。しかし今日、ファンやチームはデータと対話することを求めています。この点において、汎用AIには限界があり、ドメイン特化型AIが不可欠となります。スポーツ向けのAIを構築するには、単に汎用モデル(LLMやワールドモデルなど)を適用するだけでは不十分であり、その競技のデータ、物理的特性、言語に対する深い理解が求められます。
Stats Performの強みは、スポーツ特有の3つの基盤分野にわたる深い専門知識にあります:
- スポーツの台帳:スポーツ分野における信頼性の高いAIの実現には、一般公開されているウェブ上には存在しない、独自かつ包括的で継続的に更新されるデータカバレッジが不可欠です。 信頼性の高いシステムを構築するには、1秒単位のイベントストリームから文脈に応じたメタデータに至るまで、試合を完全かつ詳細に構造化した表現が必要です。この確固たるスポーツの「台帳」がなければ、高度な汎用AIアシスタントでさえ、基本的な事実を誤認したり、信頼できる戦術的洞察を提供できなかったりすることが多々あります。これこそがStats Performの強みです。当社は、深いデータカバレッジ、専門知識、そしてスポーツのために特別に構築された確固たるAIシステムを組み合わせています。
- スポーツのための物理世界モデル:スポーツを理解するには、空間と時間という基盤が必要です。 Stats Performでは、ピッチの物理モデルを構築し、映像を現実世界の座標に高精度で紐づけています。しかし、課題は単に選手を追跡することだけではありません。選手同士の相互作用をモデル化することです。試合には、動き、空間、戦術によって駆動される独自の「物理法則」が存在します。これにより、視界の遮蔽、ボールから離れた動き、隠れた状況などを考慮に入れることができ、完全かつ現実的、そして検証可能なデータを生成しています。
- 「ゲームの言語」:生データだけでは不十分です。スポーツには独自の言語があり、そこには記述的な指標(期待ゴール、期待脅威)、予測モデル、そして戦術的な文脈が組み合わさっています。私たちは、AIが専門家並みの厳密さで試合を分析できる「語彙」を構築しました。これは大規模に展開可能であり、誰もが利用できます。
この基盤により、当社の3層システムが実現します:
- センシング– 「何」「どこ」「誰」を正確に把握する。
- 言語– イベントをスポーツの体系的な言語へと翻訳する。
- 推論– ユーザーがゲームの文脈の中で探索し、疑問を持ち、理解できるようにします。このレイヤーは、当社のドメイン言語で動作する汎用AIモデルと、より深い分析や予測のために設計された専用モデルの両方を活用し、真の双方向性を支えています。
こうした層こそが、AIシステムを信頼できるものにしているのです。
確固たる知覚と言語がなければ、推論は成り立たない。ダッシュボードを検証レイヤーとして活用することで、アナリストはスタックの上位へと移行し――単なる出力の生成からその検証へと――より深いモデリングやイノベーションに注力できるようになる。
これは、より高速なツールを開発することではありません。世界で最も重要な分野の一つに、「真実の基盤」を築くことなのです。
より詳しく知りたい方のために、NVIDIA GTCおよびOpta Forumでの私のセッションへのリンクを以下に掲載しました。
NVIDIA GTC セッション Optaフォーラムのセッション







