사람의 말을 알아듣고 반응하는 ‘시리’, ‘알렉사’ 같은 음성인식 비서는 출시된 지 10년이 넘었고, 정보 검색과 작문, 번역을 순식간에 해내는 ‘챗GPT’가 전세계적 반향을 일으킨 지로도 몇 년이 지났습니다. AI의 언어능력은 앞으로도 더 진화해 나가겠지만 이제 세상은 그 다음으로 나아갈 준비에 한창입니다. 말 잘 하는 AI 그 다음은 뭘까요?
우리와 함께 실재하며 사람처럼 행동하는 ‘피지컬 AI’
젠슨 황 엔비디아 CEO는 “앞으로 물리적 AI의 시대가 열릴 것”이라고 예견했습니다. 데이터를 이해하고 처리하는 ‘인식 AI’, 데이터에서 패턴을 파악하고 콘텐츠를 생성하는 ‘생성형 AI’, 사람을 대신해 자율적으로 작업을 수행하는 ‘AI 에이전트’를 넘어선 4세대 AI가 ‘피지컬 AI’라고 일컬어집니다.
피지컬 AI는 로봇이나 기계에 탑재되어 주변 환경이나 사물, 사람과 상호작용하며 사람처럼 행동하는 것을 말합니다. AI가 스크린을 벗어나 현실 세계에서 물리적 실체로 동작하다는 의미에서 ‘신체화(Embodied·임보디드) AI’라는 용어가 쓰이기도 해요.
지금까지는 AI가 데이터 분석, 예측 모델링, 언어처리 등 디지털 환경 내에서 발달해 왔다면, 앞으로는 가상 세계와 물리 세계를 통합하여 기능하도록 개발된다는 거에요. 로봇이나 기계로 신체화된 AI가 물리적인 세계의 규칙과 인간의 행동을 이해하고, 눈에 보이는 실체로서 사람과 상호작용하면서요.
복잡한 도로 상황에서 자율주행하는 자동차, 극도로 정교하고 변수가 많은 수술을 하는 로봇을 생각하면 가장 이해하기 쉬울 것 같아요. 보조적인 수준을 훌쩍 뛰어넘어 인간의 인지와 판단 못지 않은 지능적 의사결정과 자율적인 최적화가 가능해지고, 궁극적으로는 무인화를 실현하려고 할거에요.
사람의 행동을 가르치는 ‘로봇 유치원’
이런 미래로 나아가려면 실제 환경에서 인간이 동작하는 영상 또는 데이터를 통해 로봇의 행동과 인지능력을 훈련시켜야 합니다. 지금은 많은 테크기업들이 인간의 행동 패턴을 로봇에 학습시키는데 사용할 ‘거대행동모델(Large Action Model)’을 구축하고 있는 단계예요.
텍스트를 학습한 거대언어모델(LLM), 이미지와 영상까지 학습한 멀티모달(LMM)에서 더 진화된 단계가 행동까지 학습한 LAM이고, LAM이 발전할수록 실제 사람에 가깝게 사고하고 행동하는 휴머노이드 로봇을 개발할 수 있을 것으로 예상되고 있습니다.
로봇이 사람처럼 스스로 알아서 행동하려면 물리적인 환경까지 복합적으로 인지하고 판단할 수 있어야 그 상황에 맞는 대처도 가능하기 때문에 중력, 관성, 에너지 등과 같은 물리 법칙의 이해가 선행되는 게 중요한 거에요.
공동으로 LAM을 구축하고 있는 미국 휴머노이드 기업 보스턴 다이내믹스와 일본 도요타 연구소(TRI)는 로봇에게 동작을 가르치는 과정을 ‘로봇 유치원’이라고 부른대요. 사람이 감자 깎기나 계란 풀기를 시범으로 보여주면 로봇이 이를 따라하는 모방학습을 반복해서 동작에 대한 응용력과 반응속도를 높인다고 합니다.
그러나 이런 방식은 시간과 비용이 많이 소요되기 때문에 물리법칙과 인과관계가 내재된 가상의 3D 환경에서 모의 훈련을 하거나, 물리적 로봇 없이도 디지털 트윈 기술을 활용해 로봇을 학습시키는 등 기법들이 고도화될 것으로 보입니다.
피지컬 AI도 ‘인공초지능’으로 진화하기 위한 과정
세상의 복잡성을 이해하고 사람처럼 행동할 수 있는 ‘범용인공지능(Artificial General Intelligence)’을 개발하는 것이 인류의 현재적 목표입니다. 하지만 사람들의 상상은 여기서 멈추지 않죠. 인간의 지능을 뛰어넘는 ‘인공초지능(Artificial Super Intelligence)’까지 도전하려고 합니다. 시기를 속단할 수는 없지만 언젠가는 다가오고 말 미래의 모습으로 예측되고 있어요.
유라클은 첨단 AI 기술이 어떻게 발전해 나갈지 미래를 내다보면서 기업의 현실에서 AI 기술이 가치 있고 지속가능하게 쓰일 수 있는 방법을 연구합니다.

