AI 검증의 시대: 현재의 AI 담론을 넘어
AI 시스템의 성능이 향상되고 의사결정 과정에 더욱 깊이 뿌리내림에 따라, 이제 다음 과제는 단순히 모델 생성 그 자체에 그치지 않고 검증, 신뢰, 그리고 현실 세계에 대한 이해로 확대되고 있다

패트릭 루시 박사는 Stats Perform의 수석 과학자로, 회사의 AI 연구 및 혁신 전략을 총괄하고 있습니다. 이번 최신 글에서 그는 AI에 대한 논의가 ‘시스템이 무엇을 생성할 수 있는가’에서 ‘조직이 무엇을 신뢰하고, 검증하며, 대규모로 운영에 적용할 수 있는가’로 어떻게 전환되고 있는지, 그리고 왜 스포츠가 그 다음 시대를 위한 시험대가 되고 있는지에 대해 살펴봅니다.
지난 몇 달 동안 저는 AI 생태계 전반을 훑어보았습니다. NVIDIA GTC 와 MIT 스포츠 서밋 부터 위스콘신 AI 비즈니스 서밋, 우리만의 옵타 포럼, 그리고 EMBA 강의실까지.

각종 정상회담과 컨퍼런스를 잠시 뒤로 하고 보면, 우리가 전환점에 도달했음이 분명합니다. 논의의 초점은 현재의 능동형 AI 모델이 ‘무엇을 할수있는가’라는 ‘신기함’에서, ‘무엇을해야하는가’라는 필요성으로 옮겨갔습니다. 우리는 AI를 단순히 반응형 챗봇으로 취급하던 방식에서 벗어나, 능동적인 생산 시스템, 즉 “AI 팩토리”로 인식하는 방향으로 나아가고 있습니다. 그러나 이러한 팩토리를 본격적으로 가동하기 전에, 반드시 필요한 검증 및 감독 체계가 마련되어 있는지 확인해야 합니다. 비즈니스 세계가 디지털 영역에서의 시스템 구축에 주력하는 동안, 연구 및 혁신 분야의 “화제”는 단연 물리적 AI(Physical AI)에 집중되어 있습니다.
하지만 이것이 우리가 스포츠계에서 하고 있는 일과 어떤 관련이 있을까요?
스포츠는 물리적 세계와 디지털 세계가 완벽하게 교차하는 지점에 위치한다는 점에서 독보적입니다. 많은 산업이 텍스트, 코드, 이미지로 이루어진 디지털 세계에만 국한되어 있는 반면, 스포츠는 근본적으로 인간이 실시간으로 자신의 몸을 움직여 만들어내는 활동입니다. 스포츠는 경제적 측면뿐만 아니라 사회적 측면에서도 지구상에서 가장 가치 있는 자산 중 하나이며, 보편적인 언어를 통해 국경을 넘어 공동체를 연결함으로써 우리 글로벌 사회 구조의 일부를 형성합니다. 우리는 이러한 인간의 순간들을 깊이 소중히 여기기 때문에, 데이터의 생성 및 AI를 통한 데이터 활용은 그 어떤 비난도 받아서는 안 됩니다. 이 글을 쓰게 된 동기는 두 가지입니다:
- 생태계 간 가교 역할:스포츠계가 광범위한 AI 분야의 급격한 변화, 특히 자율적 워크플로우와 “AI 팩토리”로의 전환을 충분히 인식하고, 이러한 글로벌 트렌드가 이제 경기장 현장과 어떻게 직접적으로 연결되고 있는지 파악할 수 있도록 하기 위함입니다.
- 스포츠, 그야말로 최고의 시험대:스포츠 분야 외부의 사람들에게 우리가 스포츠 AI 분야에서 수행하는 작업이 현존하는 기술 중 가장 정교한 수준에 있음을 보여주기 위함입니다. 우리는 실시간으로, 그리고 대규모로 물리적 현실을 정확히 파악해야 하기에, 스포츠는 AI의 신뢰성을 검증하는 최고의 ‘스트레스 테스트’이자, 검증 가능성, 신뢰, 그리고 안정성을 핵심으로 하는 차세대 AI의 시험대가 됩니다.
다음은 그동안 제가 파악한 주요 트렌드와, 이러한 트렌드가 Stats Perform에서 우리가 진행하는 업무와 어떻게 연결되는지에 대한 요약입니다.
1. 토큰을 현명하게 활용하기
엔비디아(NVIDIA)의 GTC 행사에서 젠슨 황 CEO는 우리가 이제 전통적인 데이터 센터의 시대를 넘어섰다고 강조했습니다. 수십 년 동안 데이터 센터는 단순히 정보를 저장하고 검색하기 위해 설계된 수동적인 비용 센터, 즉 디지털 창고에 불과했습니다. 오늘날 우리는 실제 업무가 수행되는 시설인 ‘AI 팩토리’를 구축하고 있습니다. 이러한 새로운 패러다임에서 ‘에이전틱 AI( Agentic AI)’는 바로 그 업무를 수행하는 엔진입니다.
실질적으로 이러한 에이전트 기반 시스템은 디지털 직원과 같은 역할을 수행합니다. 즉, 계획을 세우고, 소프트웨어를 활용하며, 여러 단계로 구성된 워크플로를 자율적으로 완료할 수 있는 시스템입니다. 다음과 같은 도구들 Claude Code 나 OpenClaw 와 같은 도구는 이러한 새로운 “자동화된 노동”의 일면을 엿볼 수 있게 해줍니다.
비즈니스 운영의 관점에서 볼 때, 논의의 초점은 ‘AI를 어떻게 활용할 것인가’에서 가치와 효율성이라는 관점을 통해 ‘AI를 어떻게가장효과적으로 활용할 것인가’로 옮겨갔습니다. AI는 코드 작성이나 콘텐츠 생성을 놀라울 정도로 쉽게 만들어 주었지만, 동시에 새로운 코드베이스와 산출물을 유지 관리하고 검증해야 하는 새로운 부담을 안겨주기도 합니다.
이러한 시스템을 어디에 활용할지에 대해서는 현실적인 접근이 필요합니다. 토큰은 공짜가 아닙니다. 단순한 스프레드시트 쿼리를 처리하는 데 고도의 추론 능력을 갖춘 에이전트를 사용하는 것은 마치 식료품점에 가기 위해 제트 엔진을 사용하는 것과 같습니다. 바로 이 때문에 AI 기업들이에이전트형 AI 시스템 활용의 실제 비용을 반영하기 위해 가격 정책을 급속도로 변경하고 있는 것입니다. 기업들이 주의를 기울이지 않으면컴퓨팅 예산을 순식간에 소진해 버릴수 있습니다. 게다가 모든 자동화된 작업은 새로운 보안 위험 요소이기도 합니다.앤트로픽(Anthropic)의 '마이토스(Mythos)' 모델이 최근수십 년간 사람의 검토를 거치며 발견되지 않았던 취약점을 단 몇 초 만에 찾아낸 것이 바로 이를입증한사례입니다.
여러모로 이는 고전적 기계 학습의 핵심 원칙을 반영합니다. 즉, 선형 모델은 정규화가 더 쉽고, 해석하기 더 쉬우며, 오류가 발생하기 어렵기 때문에 때로는 딥 뉴럴 네트워크보다 우수할 수 있습니다.
2026년을 위한 메시지는 분명합니다:
AI 시스템이 어떻게 작동하는지 이해하지 못하고 검증할 수도 없다면, 애초에 그 시스템을 개발해서는 안 됩니다. ‘블랙박스’라는 변명은 이제 통하지 않습니다.EU AI 법과같은 규제가 본격적으로 시행되고 미국 각 주에서 엄격한 민사 책임 규정을 도입함에 따라, 조직은 이제 모든 ‘자율적’ 오류에 대해 법적·윤리적 책임을 져야 합니다. 자신이 이해하지 못하는 시스템 뒤에 숨어 있을 수는 없습니다.
AI 시대에 성공하기 위해서는 조직에 AI 시스템을 총괄하고, 예외적인 상황을 파악하며, 필요할 때 개입할 수 있는 전문가가 필요합니다.
2. 맥락 전문가의 시대
내가 방문한 각종 정상회담과 강의실에서, 모든 대화의 중심에는“내 직업의 미래는 어떻게 될까?”라는 질문이 자리 잡고 있었다. 갓 졸업한 신입사원이든 일자리를 잃은 근로자든, 디지털 세계를 자율적으로 탐색하고 자체적으로 소프트웨어를 개발할 수 있는 ‘에이전트형 AI’의 부상은 그들에게뚜렷한 두려움을 안겨주었다.
우리는 지금 실시간으로 역설적인 현상을 목격하고 있습니다. 인공지능이 미래 일자리의 기반이 되어가고 있음에도 불구하고,이번 학년도 컴퓨터 공학 전공 등록 인원은 8.1% 감소하여 모든 전공 중 가장 큰 하락폭을 기록했습니다.
왜 이런 하락세가 나타났을까요? 제 생각에는 ‘코더의 시대’가 ‘컨텍스트 전문가의 시대’로 대체되고 있기 때문입니다. 일반적인 코딩 지식은 이제 흔한 것이 되어가고 있습니다. 차별화 요소는 심도 있는 분야 전문성, 특히 에지 케이스, 제약 조건, 현실 세계의 변동성을 이해하고 검증해야 하는 ‘마지막 단계’에서의 전문성입니다. AI가 일반적인 사례를 처리함에 따라, 가장 중요한 시나리오에서 시스템이 올바르게 작동하도록 보장하는 데 있어 인간의 전문성이 결정적인 역할을 하게 됩니다.
의학, 법학, 금융과 같은 규제 대상 분야에서는 그 가치가 추측에 기반한 ‘추정’에서 결정론적 검증으로 옮겨가고 있다. 이것이 바로 제본스 역설 가 현실로 나타나는 현상입니다. AI가 기본적인 인지 작업을 더 저렴하고 빠르게 수행할수록, 우리는 일을 덜 하는 것이 아니라 기하급수적으로 더 많은 일을 만들어냅니다. 우리는 전자 스프레드시트가 도입되었던 회계 분야에서 이미 이를 목격한 바 있습니다. 많은 이들이 회계사의 필요성이 줄어들 것으로 예상했지만,결국 이 분야는 더욱 확장되었습니다. 산출물이 증가함에 따라 위험도 함께 커집니다. 그 결과 업무량이 줄어들기는커녕, 해당 업무를 검증하고, 확인하며, 궁극적으로 책임질 수 있는 고도의 전문성에 대한 수요가 증가하고 있습니다. AI는 이 과정을 지원할 수 있겠지만, 책임 소재는 자동화될 수 없습니다. 검증과 최종 승인에는 여전히 인간 전문가가 필수적입니다.
하지만 코딩이 핵심 역량으로서 사라지지는 않을 것으로 보입니다. 오히려 뛰어난 코딩 능력과 심도 있는 분야 전문 지식을 결합할 때 진정한 경쟁력이 발휘될 것입니다. 코딩과 AI는 점차 모든 학문 분야의 기초가 될 것이며, 독립된 전문 분야가 아닌 핵심 역량으로 자리 잡을 것입니다.
스포츠에서는 전문성을 속일 수 없다.
위험 부담이 너무 크고, 상황도 너무 특수한 편입니다. 새로운 진입 장벽은 단순히 기술적 역량에 그치지 않습니다. AI의 산출물을 검증하고 가치 사슬의 상위 단계에서 활동하며, 단순한 설명적 분석에서 벗어나 팀과 팬들에게 실질적인 영향을 미치는 처방적 혁신을 이끌어내기 위해 필요한 분야별 전문 지식이 바로 그 장벽입니다.
이러한 변화의 뚜렷한 사례가 우리 옵타 포럼에서 드러났습니다.
과거에는 분석가와 데이터 과학자들이 대시보드 관리와 일상적인 보고 업무에 얽매여 있었습니다. 하지만 Agentic AI의 등장으로 이러한 양상이 바뀌고 있습니다. 대시보드는 이제 검증 단계로 진화하고 있습니다. 더 이상 통찰력을 도출하는 최종 단계가 아니라, AI 시스템이 준비한 결과를 검토하고 검증하는 인터페이스로 변모하고 있는 것입니다. 전 세계 유수 구단들과의 대화에서 한 가지 공통된 주제가 드러났습니다. 바로 분석가와 데이터 과학자들이 마침내 오랫동안 해결하고 싶어 했던 문제들에 집중할 수 있게 되었다는 점입니다.
이러한 변화 덕분에 분석가들은 단순히 결과물을 관리하는 데 그치지 않고 그 결과물의 정확성을 책임지게 되었으며, 그로 인해 이전에는 손댈 수 없었던 고부가가치·고영향력 과제들의 누적된 업무에 대처할 수 있는 여력을 확보하게 되었습니다.
3. 물리적 AI와 오류 발생 시 증가하는 비용
대부분의 사람들이 물리적 AI를 떠올릴 때, 휴머노이드 로봇을 상상합니다. 로봇공학이 차세대 주요 분야로 급부상하고 있는 가운데, 이를 가능하게 하는 핵심적인 돌파구는‘월드 모델(world models)’의 개발입니다. 월드 모델은 현실 세계의 물리 법칙과 상호 작용을 점점 더 높은 정확도로 이해하고 시뮬레이션할 수 있는 AI 시스템입니다. 주로 텍스트와 이미지를 기반으로 추론하는 기존의 대규모 언어 모델(LLM) 및 대규모 시각 모델(VLM)과 달리, 월드 모델은 공유된 임베딩 공간에서 사물, 환경, 운동, 상호작용 역학을 통합적으로 표현합니다. 이러한 모델은 물리적 환경에서 지각, 추론, 계획 수립, 의사 결정을 가능하게 하는 기초가 됩니다.
수년 동안 우리는 오류가 발생하면 링크가 끊어지거나 잘못된 결과가 나오는 디지털 환경에서만 업무를 수행해 왔습니다. 하지만 현실 세계에서는 오류가 실제적인 결과를 초래합니다. 실수로 인한 대가는 훨씬 더 커집니다. 바로 이 때문에 검증 작업이 그 어느 때보다 중요해집니다.
이러한 변화를 가능하게 하는 핵심 요소 중 하나는 고성능 디지털 트윈의 활용입니다. 디지털 트윈이란 시스템이 실제 환경과 상호작용하기 전에 안전하게 훈련되고 테스트될 수 있는 가상 환경을 말합니다. 하지만 이러한 시스템의 성능은 이를 구축하는 데 기반이 되는 데이터와 가정의 질에 따라 좌우됩니다. 이를 잘 보여주는 사례로,웨이모(Waymo)가 구글의 '지니 3(Genie 3)' 모델을 활용해실제 상황에서는 포착하기 매우 어려운 현실적인 시나리오를 시뮬레이션하고있는점을 들 수 있습니다. 이러한 상황은 과거에 발생하지 않았을지라도 앞으로 발생할 가능성이 있으므로, 이러한 상황에서 어떻게 대응해야 할지 알고 있는 시스템을 갖추는 것이 안전성과 신뢰성을 확보하는 데 핵심입니다.
이는 새로운 형태의 데이터 경쟁 우위를 창출합니다. 단순히 규모뿐만 아니라 정확성과 현실 기반성을 갖춘 것이죠. 이는 심도 있는 분야 전문 지식의 필요성을 더욱 강조합니다. 즉, AI 시스템이 실제 운영 환경을 정확히 반영하도록 보장하는 과학자와 엔지니어들이 필요합니다.
AI가 현실 세계에 점점 더 가까워짐에 따라, 인간의 전문성이 차지하는 역할은 줄어들지 않고 오히려 더욱 중요해집니다. 시스템이 현실 세계에서 작동할 때, 신뢰는 더 이상 선택 사항이 아니라필수 요소이기 때문입니다.
4. 궁극적인 검증 문제로서의 스포츠
스포츠는 물리적 세계와 디지털 세계의 교차점에 위치해 있습니다.
수십 년 동안 스포츠 분야의 AI는 그래픽, 요약, 간단한 통계와 같은 정보를 제공하는 데 주로 활용되었습니다. 오늘날 팬들과 팀들은 데이터와 소통하기를 원합니다. 바로 이 지점에서 범용 AI는 한계에 부딪히며, 특정 분야에 특화된 AI가 필수적입니다. 스포츠용 AI를 구축하는 것은 단순히 범용 모델(예: 대규모 언어 모델(LLM)이나 세계 모델)을 적용하는 문제가 아닙니다. 이는 해당 경기의 데이터, 물리적 원리, 언어에 대한 깊은 이해가 필요합니다.
Stats Perform의 강점은 스포츠 분야에만 존재하는 세 가지 핵심 영역에 대한 심도 있는 전문성에서 비롯됩니다:
- 스포츠의 원장:스포츠 분야에서 신뢰할 수 있는AI를 구현하려면, 공개 웹상에는 존재하지 않는 독점적이고 포괄적이며 지속적으로 업데이트되는 데이터 커버리지가 필수적입니다. 신뢰할 수 있는 시스템을 구축하려면 초 단위 이벤트 스트림부터 상황별 메타데이터에 이르기까지, 경기를 완벽하고 심층적으로 구조화한 표현이 필요합니다. 이러한 탄탄한 스포츠 '원장'이 없다면, 아무리 진보된 범용 AI 어시스턴트라 할지라도 기본적인 사실조차 잘못 인식하거나 신뢰할 수 있는 전술적 통찰력을 제공하지 못할 수 있습니다. 바로 이 부분에서 Stats Perform이 두각을 나타냅니다. 심층적인 데이터 커버리지, 분야별 전문 지식, 그리고 스포츠를 위해 특별히 구축된 탄탄한 AI 시스템을 결합한 것이 바로 Stats Perform의 강점입니다.
- 스포츠를 위한 물리적 세계 모델:스포츠를 이해하려면 공간과 시간적 맥락을 바탕으로 해야 합니다. Stats Perform에서는 경기장의 물리적 모델을 구축하여, 영상을 실제 좌표계와 정밀하게 연동합니다. 하지만 진정한 과제는 단순히 선수들의 움직임을 추적하는 것이 아니라, 그들이 어떻게 상호작용하는지를 모델링하는 데 있습니다. 경기는 움직임, 공간, 전술에 의해 주도되는 고유한 '물리법칙'을 지니고 있습니다. 이를 통해 우리는 시야 가림 현상, 볼을 소유하지 않은 상태에서의 움직임, 그리고 숨겨진 맥락을 모두 고려하여, 완전하고 현실에 기반하며 검증 가능한 데이터를 생성합니다.
- 경기의 언어:원시 데이터만으로는 충분하지 않습니다. 스포츠에는 설명적 지표(예상 득점, 예상 위협도), 예측 모델, 전술적 맥락을 결합한 고유한 언어가 존재합니다. 우리는 AI가 전문가 수준의 정밀도로 경기를 분석할 수 있도록 하는 어휘 체계를 구축했으며, 이를 대규모로 구현해 누구나 쉽게 활용할 수 있게 했습니다.
이 기반은 당사의 3단계 시스템을 가능하게 합니다:
- 감지– “무엇”, “어디”, “누구”를 정밀하게 파악합니다.
- 언어– 다양한 사건을 스포츠의 체계적인 언어로 풀어내는 것.
- 추론– 사용자가 게임의 맥락 속에서 게임을 탐색하고, 의문을 제기하며, 이해할 수 있도록 지원합니다. 이 계층은 도메인 언어 기반으로 작동하는 일반 AI 모델과 심층적인 분석 및 예측을 위해 설계된 특화 모델이 결합되어 진정한 상호작용을 가능하게 합니다.
이러한 단계들이 바로 AI 시스템을 신뢰할 수 있게 만드는 요소입니다.
현실과 밀접하게 연결된 감각과 언어가 없다면 추론은 무너진다. 대시보드를 검증 단계로 전환함으로써 분석가들은 출력물을 생성하는 단계에서 이를 검증하는 단계로 한 단계 더 나아가게 되며, 이를 통해 더 심층적인 모델링과 혁신에 집중할 수 있는 여유를 얻게 된다.
이것은 단순히 더 빠른 도구를 만드는 문제가 아닙니다. 이는 세계에서 가장 중요한 분야 중 하나를 위한 ‘진실의 기반’을 구축하는 일입니다.
더 자세한 내용을 알고 싶으신 분들을 위해, 아래에 NVIDIA GTC와 Opta Forum에서 제가 진행한 세션 링크를 첨부했습니다.
Nvidia GTC 세션 옵타 포럼 세션







