
마이크로소프트 리서치는 로봇이 작업할 수 있도록 하는 새로운 로봇 제어 시스템을 공개했습니다 . 동시에 사용하는 로봇을 위한 기초 모델 분야에 마이크로소프트가 진출했음을 보여줍니다
제공 하기 전에 얼리 액세스 프로그램을 통해 일부 선정된 그룹에 먼저 제공될 예정 . 기업들은 자체 데이터를 활용하여 시스템을 특정 요구 사항에 맞게 조정할 수 있습니다.
공장과 창고에서는 영원히 반복하는 대신 변화하는 환경에 대처할 수 있는 로봇을 찾고 병원에서는 적합한 기계가 필요합니다 . 생산 라인에서는 제품 배치가 매번 달라지기 때문에 기존 자동화 방식으로는 수 없는 . 마이크로소프트는 로봇이 센서를 통해 보고 듣는 것뿐만 아니라 물리적으로 느끼는 것까지 처리함으로써 이러한 요구를 충족하기 위해 Rho-alpha를 개발했습니다
오늘날 대부분의 로봇 시스템은 주변 환경을 파악하고 명령을 수행하기 위해 카메라와 마이크에 의존합니다. Rho-alpha는 여기에 촉각을 동등하게 중요하게 취급함으로써 한 단계 더 나아갑니다. 로봇 그리퍼에 압력 센서가 내장되면 얻을 수 있습니다 . 이는 소켓에 플러그를 꽂거나 부품을 조립할 때 시각만으로는 정확한 위치를 파악하기 어려운
마이크로소프트는 압력과 접촉을 감지하는 센서가 장착된 두 대의 유니버설 로봇 UR5e 팔을 사용하여 이러한 기능을 시연했습니다 로봇에게 공구 상자 안에 트레이를 넣고 닫으라고 지시했습니다 . 시스템은 변환 하고 센서가 감지한 것을 기반으로 조정했습니다. 플러그를 처음 꽂으려 할 때 실패하면 작업자 가 3D 입력 장치를 사용하여 로봇을 안내할 수 있었고, 시스템은 이러한 수정 사항을 학습했습니다.
충분한 훈련 데이터를 확보하는 것입니다. 언어 모델은 온라인에서 구할 수 있는 방대한 양의 텍스트로부터 학습할 수 있지만, 로봇 훈련에는 실제 물리적 시연을 녹화하는 데 시간과 비용이 많이 드는 자료가 필요합니다. 마이크로소프트는 이러한 문제를 해결하기 위해 Rho-alpha를 세 가지 유형의 정보, 즉 실제 물리적 시연 녹화 영상, 시뮬레이션된 연습 작업, 그리고 웹에서 수집한 질문과 답변이 담긴 대규모 이미지 데이터셋을 활용하여 훈련시켰습니다. 마이크로소프트는 Azure 서버에서 실행되는 Nvidia Isaac Sim을 사용하여 강화 학습 과정을 통해 현실적인 가상 시나리오를 생성합니다.
이 시뮬레이션 시스템은 실제 상황을 보완하는 물리적으로 정확한 훈련 상황을 생성합니다. 이러한 결합된 접근 방식을 모델은 실제 운영에서 수천 시간을 투자해야만 포착할 수 있는 특이한 사례 및 고장 상황에 대응할 수 있습니다
이 훈련 방법은 다른 로봇 공학 회사들이 사용하는 방식을 따릅니다 구글 딥마인드의 제미니 로봇 시스템, 피겨 AI의 휴머노이드 로봇용 헬릭스 모델, 그리고 피지컬 인텔리전스의 파이제로 모두 데이터 부족 문제를 해결 이러한 시스템들이 할 수 있는 모든 작업에 대한 구체적인 시연 없이도 일반적인 조작 기술을 학습할 수 있도록 도와 줍니다 .
지난 1년 반 동안 크게 성장한 로봇 공학 기초 모델 시장에 합류했습니다 N1.6 . 구글 딥마인드는 종이 접기부터 카드 조작까지 다양한 기능을 갖춘 로봇 공학 분야로 제미니 프로젝트를 확장했습니다. 피지컬 인텔리전스는 다양한 로봇 유형에 적용 가능한 다목적 시스템인 Pi-zero를 선보였습니다.
Rho-alpha는 가지 에서 두드러집니다 . 첫째, 촉각 감지에 중점을 두어 에만 의존하는 시스템이 어려움을 겪는 상황을 해결합니다 . 둘째, 이 모델은 마이크로소프트의 Phi 시리즈에서 파생되었으며, 일반 소비자용 하드웨어에서 효율적으로 작동하도록 최적화되었습니다. 이러한 배경은 클라우드 서버에 지속적으로 연결하지 않고도 로컬 장치에서 실행될 수 있음을 시사합니다. 셋째, 실제 작동 중 사용자의 수정 사항을 학습하는 데 중점을 두어 새로운 동작을 학습하기 위해 완전히 재학습해야 하는 모델과 차별화됩니다.
마이크로소프트의 사업 접근 방식은 경쟁사들과도 차별화됩니다 . 마이크로소프트는 자사의 파운드리(Foundry) 플랫폼을 통해 Rho-alpha를 인프라 형태로 제공할 계획이며, 제조업체와 시스템 통합업체는 이를 자체적인 정보를 활용하여 맞춤 설정할 수 있습니다. 이는 애저 오픈AI 서비스(Azure OpenAI Service) , 일반적인 모델보다는 특수화된 버전을 만들고자 하는 기업들을 대상으로 합니다.
제조업체와 물류 회사에게 있어 가장 시급한 기회는 현재 자동화 시스템이 부족한 반복적인 처리 작업을 찾아내는 데 있습니다 . 품질 검사대, 제품 키트 조립 작업, 소량 생산 라인 등은 Rho-alpha의 언어 이해 및 터치 감지 기능이 줄여줄 .
마이크로소프트가 발표한 얼리 액세스 프로그램은 기업들이 시스템이 적합한 방법 제공합니다 . 기업들은 이러한 평가에 참여할 때 사람의 감독이 필요할 것이라는 점을 예상하고, 초기 학습 기간 동안 운영자가 로봇을 수정하고 안내하는 워크플로우를 계획해야 합니다.
물리적 AI는 로봇에서 유연한 협력자로서의 로봇으로의 전환을 의미합니다 . 이러한 전환은 몇 달이 아닌 몇 년이 걸리겠지만, 마이크로소프트, 엔비디아, 구글에서 제시하는 기반 모델은 향후 10년간 기업용 로봇 공학을 정의할 defi
프리미엄 암호화폐 거래 커뮤니티에 30일 동안 무료로 가입하세요 - 일반적으로 월 100달러.