애플 인사이더(Apple Insider)의 보고서에 따르면 애플 은 로봇 시범자와 함께 인간 강사를 통합하여 휴머노이드로봇 을 훈련시키는 보다 효과적인 방법을 조사하고 있으며, 이는 회사가 ‘PH2D’라고 명명한 새로운 결합 전략이다.
이 기술 대기업이 매트릭스3D(Matrix3D)와 스트림브리지(StreamBridge) AI 모델을 공개한 지 일주일 후인 수요일에 발표된 연구 논문에 자세히 설명되어 인공 지능과 로봇 공학에 대한 지속적인 추진을 시사했다.
‘휴머노이드 정책 ~ 휴먼 폴리시’라는 제목의 연구 논문은 기존 로봇 훈련 기술의 단점을 해결하고 새롭고 확장 가능하며 비용 효율적인 솔루션을 제시한다.
논문에 따르면 로봇 시연자에만 전적으로 의존하는 전통적인 방법은 종종 노동 집약적이며 값비싼 원격 운영 데이터 수집이 필요하다고 한다. Apple의 연구는 이러한 문제를 완화하기 위해 교육 과정에 인간 강사를 통합하는 통합 접근 방식을 제안한다.
이 전략의 핵심 측면은 수정된 소비자 전자 제품을 사용하여 교육 자료를 제작함으로써 달성되는 비용 효율성이다.
구체적으로 Apple Vision Pro는 시각적 관찰을 위해 왼쪽 하단 카메라만 사용하도록 조정되었으며 Apple의 ARKit은 3D 머리 및 손 포즈를 캡처하는 데 사용되었다.
또한 ZED Mini Stereo 카메라가 장착된 개조된 Meta Quest 헤드셋을 활용하여 훈련 데이터 생성을 위한 저렴한 대안을 제공했다.
교육 과정에서 인간 강사는 이러한 개조된 헤드셋을 착용하고 물체를 잡고 들어 올리기, 액체 붓기와 같은 다양한 손 조작 작업을 수행했다.
이러한 동작이 기록될 때 청각 지침이 제공되었고, 결과 영상은 휴머노이드 로봇 훈련에 적합하도록 속도를 늦췄다.
인간과 로봇 소스에서 얻은 다양한 교육 자료를 처리하기 위해 Apple은 ‘인간-휴머노이드 액션 트랜스포머, 물리적 인간-휴머노이드 데이터(PH2D)’라는 모델을 개발했다.
HAT 모델은 ‘일반화 가능한 정책 프레임워크’ 내에서 인간과 로봇 시연자 모두의 입력을 처리하도록 설계되었습니다. Apple의 연구에 따르면 이 독특한 접근 방식은 실제 로봇 데이터만 사용하여 훈련된 접근 방식에 비해 일반화와 견고성이 향상된다.
이 연구는 이러한 결합된 훈련 전략이 상당한 이점을 제공한다는 것을 시사한다. 비용 효율성 외에도 이 방법을 사용하여 훈련된 로봇은 로봇 시연자로만 훈련된 로봇과 비교할 때 수직 물체 잡기와 같은 특정 작업에서 더 나은 성능을 보여주었다.
Apple은 향후 로봇 공학 노력에서 이 교육 방법론을 구현할 것으로 예상된다. 이 회사는 이전에 로봇 램프 프로토타입을 선보였지만 보고서에 따르면 Apple은 집안일과 간단한 작업을 수행할 수 있는 소비자를 위한 모바일 로봇도 개발하고 있다.