CES 2025에서 공개된 NVIDIA 코스모스 플랫폼 핵심 기능

CES 2025 전시회에서 많은 사람들이 NVIDIA의 최신 로봇 및 AI 기술 시연을 관람하는 모습

CES 2025에서 NVIDIA가 공개한 코스모스 플랫폼이 로봇 기술의 미래를 바꿀 전망입니다. 이 혁신적인 플랫폼은 로봇이 물리 법칙을 이해하고 인간의 명령을 자연스럽게 수행할 수 있게 해주는 기술입니다. 로봇이 실제 세계에서 어떻게 더 똑똑하게 행동할 수 있는지 자세히 살펴보겠습니다.

로봇과 AI가 물리 법칙을 이해하게 된 이유

지금까지 로봇과 자율주행차는 중력, 마찰, 관성과 같은 기본적인 물리 법칙을 제대로 이해하지 못해 실제 환경에서의 행동 예측에 큰 어려움을 겪었습니다. 코스모스 플랫폼은 이 문제를 해결하기 위해 2천만 시간에 달하는 방대한 영상 데이터로 훈련된 월드 파운데이션 모델(WFM)을 개발했습니다.

이 모델은 물체가 공중에 던져지면 떠다니지 않고 지면으로 떨어지는 것과 같은 자연스러운 물리적 상호작용을 학습했습니다. 이러한 이해를 바탕으로 로봇은 “물건을 집어 올려라”라는 단순한 명령을 받았을 때, 손의 위치를 어디에 두고 얼마나 힘을 주어야 하는지와 같은 구체적인 동작으로 변환할 수 있게 되었습니다.

이는 마치 아이가 처음으로 물리 세계의 법칙을 배우는 과정과 비슷합니다. 로봇이 세상의 기본 원리를 이해하게 되면서 훨씬 더 자연스러운 상호작용이 가능해졌습니다.

코스모스 플랫폼의 4가지 핵심 부품

코스모스 플랫폼은 네 가지 핵심 구성요소로 이루어져 있으며, 이들이 함께 작동하여 로봇의 지능을 구현합니다.

구성요소주요 기능역할
월드 파운데이션 모델(WFM)물리 법칙 이해AI의 핵심 두뇌로, 물리적 세계의 작동 원리를 이해합니다
토크나이저명령 변환인간의 텍스트 명령을 로봇이 처리할 수 있는 디지털 형식으로 변환합니다
가드레일안전 제어로봇이 안전한 범위 내에서만 행동하도록 제한하는 시스템입니다
비디오 처리 파이프라인영상 분석실시간으로 카메라 영상을 분석하여 환경을 이해합니다

이 네 가지 부품이 유기적으로 협력하면서 명령을 받고, 행동을 계획하고, 결과를 예측하는 완전한 사이클을 구현합니다. 이러한 구조는 코스모스 플랫폼이 복잡한 환경에서도 유연하게 대응할 수 있게 해주는 핵심 요소입니다.

20백만 시간의 영상 데이터로 훈련된 코스모스

코스모스 플랫폼의 가장 인상적인 부분은 실제 세계의 물리적 상호작용을 관찰한 20백만 시간 분량의 영상 데이터로 훈련되었다는 점입니다. 이 방대한 데이터셋에는 공을 던지거나 물건을 밀치는 과정에서 발생하는 동적 움직임이 포함되어 있습니다.

이렇게 다양한 상황에서의 물리적 상호작용을 학습함으로써, 코스모스 플랫폼은 예측 불가능한 상황에서도 적응할 수 있는 능력을 갖추게 되었습니다. 특히 공장처럼 통제된 환경이 아닌, 가정이나 도로와 같은 비정형 환경에서 작동해야 하는 로봇 개발에 혁신적인 변화를 가져올 것으로 기대됩니다.

이는 마치 아이가 세상을 경험하며 배우는 과정과 유사하지만, 인간의 평생 경험보다 훨씬 더 많은 데이터를 바탕으로 학습했다는 점에서 놀라운 발전입니다.

챗GPT 같은 로봇 AI가 가능해지는 기술

코스모스 플랫폼은 챗GPT와 유사한 방식으로 작동하지만, 텍스트 대신 물리적 세계를 다룹니다. 사용자가 “커피를 따라라”라는 간단한 명령을 입력하면, AI는 이를 단계별 행동 계획으로 변환합니다.

예를 들어, 컵의 위치를 확인하고, 커피 머신으로 접근하고, 적절한 물량을 조절하고, 서비스 동작을 수행하는 등의 세부 단계로 분해합니다. 기존의 로봇 시스템이 미리 프로그래밍된 단순 반복 작업에만 적합했던 것과 달리, 코스모스 플랫폼을 탑재한 로봇은 복잡한 상황에 대해 창의적인 해결책을 찾아낼 수 있습니다.

이러한 능력은 로봇이 예상치 못한 상황에서도 유연하게 대응할 수 있게 해주며, 사람이 일일이 프로그래밍하지 않아도 다양한 작업을 수행할 수 있게 합니다.

오픈 소스로 개발자들이 자유롭게 사용할 수 있는 이유

엔비디아는 코스모스 플랫폼을 오픈 소스로 공개하여 전 세계 개발자들이 자유롭게 활용할 수 있게 했습니다. 개발자들은 NGC 카탈로그나 허깅페이스와 같은 플랫폼에서 모델을 다운로드하여 자신의 필요에 맞게 수정하고 확장할 수 있습니다.

이러한 접근 방식은 로봇 개발의 진입 장벽을 크게 낮추는 혁신적인 변화입니다. 과거에는 대규모 연구소나 대기업만이 첨단 로봇 기술을 개발할 수 있었지만, 이제는 소규모 스타트업이나 심지어 개인 개발자도 자체 로봇을 개발할 수 있는 환경이 조성되었습니다.

오픈 소스 전략은 코스모스 플랫폼의 빠른 발전과 다양한 응용 분야로의 확장을 촉진할 것으로 기대됩니다. 이는 마치 리눅스가 운영체제 시장에 가져온 변화처럼, 로봇 기술 분야에 새로운 패러다임을 제시하고 있습니다.

차량과 산업용 로봇에 적용되는 실제 사례

코스모스 플랫폼은 이미 여러 산업 분야에서 실제 적용되고 있습니다. 자동차 제조업체들과 협력하여 자율주행 기술을 개선하는 데 활용되고 있으며, 차량이 급커브나 비상 정차 상황에서 물리 법칙을 기반으로 최적의 제동과 조향을 결정할 수 있게 돕고 있습니다.

또한 공장 자동화 분야에서는 로봇 팔이 부품을 정확하게 조립하는 데 코스모스 플랫폼이 사용되고 있습니다. 특히 엔비디아는 토요타와 같은 글로벌 기업과 협력하여 차량용 AI 시스템 개발을 적극적으로 진행 중입니다.

이러한 실제 적용 사례는 코스모스 플랫폼이 단순한 연구 프로젝트가 아니라, 산업 현장에서 실질적인 가치를 창출하고 있음을 보여줍니다. 앞으로 더 많은 산업 분야에서 코스모스 플랫폼을 활용한 혁신이 이루어질 것으로 예상됩니다.

비디오 처리 파이프라인이 중요한 이유

코스모스 플랫폼의 비디오 처리 파이프라인은 로봇이 실시간으로 주변 환경을 이해하는 데 핵심적인 역할을 합니다. 로봇에 장착된 카메라가 주변 환경을 촬영하면, 이 시스템은 물체의 위치, 속도, 질량 등을 즉시 계산하여 로봇의 의사 결정에 활용합니다.

예를 들어, 로봇이 구르던 공을 잡으려고 할 때, 비디오 처리 파이프라인은 공의 궤적을 예측하여 로봇이 최적의 포착 위치로 손을 이동시킬 수 있게 합니다. 이는 동적으로 변화하는 환경에서 정확한 행동 제어를 가능하게 하는 핵심 기술입니다.

고성능 GPU를 활용한 이 파이프라인은 밀리세컨드 단위의 지연 시간으로 작동하여, 거의 인간의 반응 속도에 근접한 성능을 보여줍니다. 이러한 실시간 처리 능력은 로봇이 빠르게 변화하는 환경에서도 안정적으로 작동할 수 있게 해주는 중요한 요소입니다.

엔비디아 CEO 젠슨 황이 강조한 3가지 혁신 포인트

CES 2025에서 엔비디아의 CEO 젠슨 황은 코스모스 플랫폼의 세 가지 혁신적인 측면을 강조했습니다.

첫째, 물리 AI의 대중화입니다. 기존에는 고가의 장비와 전문 지식이 필요했던 로봇 개발을 소규모 개발자들도 접근할 수 있게 만들었습니다.

둘째, 실제 세계 적용입니다. 코스모스 플랫폼은 가상 환경에서의 훈련이 아닌, 실제 물리 법칙을 학습하여 현실 세계에 적용할 수 있는 능력을 갖추고 있습니다.

셋째, 협업 생태계 구축입니다. 오픈 소스 플랫폼을 통해 글로벌 개발자 네트워크를 형성하고, 이를 통해 기술 발전을 가속화하고 있습니다.

젠슨 황 CEO는 “이제 로봇 개발이 챗GPT 사용자처럼 누구나 접근 가능한 분야가 될 것”이라고 강조하며, 코스모스 플랫폼이 로봇 기술의 민주화를 이끌 것이라는 비전을 제시했습니다.

미래를 여는 코스모스 플랫폼의 가능성

NVIDIA의 코스모스 플랫폼은 로봇 기술의 새로운 지평을 열고 있습니다. 물리 법칙을 이해하는 AI와 실시간 환경 인식 능력을 갖춘 이 플랫폼은 로봇이 더 자연스럽고 적응력 있게 작동할 수 있게 해줍니다. 앞으로 우리 일상 속에서 코스모스 플랫폼이 적용된 로봇들이 어떤 혁신을 가져올지 기대됩니다.

Leave a Reply

Your email address will not be published. Required fields are marked *