▲ 사진=픽사베이우리나라도 비전 센서, 동작·제스처, 로봇 제어· 상호작용, 시뮬레이션과 공간 데이터 등 피지컬 AI 기술 고도화에 필수적인 데이터 확보가 시급하다는 지적.
한국지능정보사회진흥원(NIA)의 ‘중국이 주도하는 AI·휴머노이드 로봇 산업 현황’ 보고서를 보면 중국의 로봇 전문가들은 데이터 기반의 학습·훈련과 AI 모델 고도화에 집중해 휴머노이드 로봇 기술의 글로벌 우위를 유지하고 있다.
텐센트 투자로 명성을 얻은 휴머노이드 로봇 스타트업 애지봇은 상하이에 대규모 데이터 수집 공장을 구축하고 고품질 실세계 데이터를 생성해 내고 있다.
애지봇은 지난 2023년 상하이에 세운 데이터 수집 공장에 로봇 약 100대를 투입해 인력 200명과 함께 하루 3만∼5만 건의 데이터를 축적한다.
애지봇은 실세계 데이터를 포함한 오픈소스 데이터셋 ‘애지봇 월드’를 지난해 공개했는데 엔비디아가 휴머노이드 로봇 개발용 파운데이션 AI 모델 ‘아이작 그루트 N1’ 학습에 쓴 실세계 데이터 80%는 이 데이터셋에서 얻었다는 조사 결과도 있다.
보고서는 “중국에서 휴머노이드 로봇 활용이 늘어나고 특히 제조 부문 공장으로 확산하면 실제와 합성 데이터를 포괄한 피지컬 AI 학습용 데이터 수집에 가속이 붙을 전망”이라며 중국 정부는 나아가 수많은 공장의 작업을 휴머노이드 로봇이 수행하는 ‘신 산업혁명’을 꿈꾼다고 분석했다.
데이터뿐 아니라 관련 인재 보유에서도 우위가 있다.
지난해 중국 대학의 로봇 관련 전공 재학생 수는 58만 명을 넘었고, 이는 전 세계 로봇 관련 전공자의 42%를 차지했다.
국내의 피지컬 AI 고도화를 위한 데이터 확보는 아직 기초적인 수준에 머물러 있다.
한국지능정보사회진흥원의 ‘피지컬 AI 글로벌 동향 및 대응 전략’ 보고서는 정부가 운영하는 AI 학습용 데이터 개방 사이트 ‘AI 허브’가 국내 로보틱스·자율주행 연구 및 서비스 개발에 활용될 수 있는 기초 인프라를 제공하고 있지만, 환경의 다양성·국제 호환성에서 제한적이고 실시간 데이터도 부족한 상황이라고 지적했다.
보고서는 자율주행·로봇·헬스케어 산업 현장에서 필요한 로봇 행동 데이터, 센서·환경 데이터 등 심층 데이터셋의 단계적 구축과 개방이 필요하다며 구축된 데이터는 항만·공항·병원·스마트 건물 등 거점의 디지털 트윈 기반 시뮬레이션 환경과 연계돼야 한다고 강조했다.