Nauczanie robotów: MIT wprowadza dużą zmianę w podstawie programowej

Dodane:

Przemysław Zieliński Przemysław Zieliński

Nauczanie robotów: MIT wprowadza dużą zmianę w podstawie programowej

Udostępnij:

Naukowcy MIT zaprezentowali nowy model szkolenia robotów. Standardowy zestawu skoncentrowanych danych wykorzystywanych do uczenia robotów nowych zadań został zastąpiony dużą ilością informacji wykorzystywanych do trenowania dużych modeli językowych (LLM).

Aby pomóc robotom w adaptacji

Naukowcy zauważają, że uczenie się poprzez naśladowanie – w którym agent uczy się poprzez naśladowanie osoby wykonującej zadanie – może zawieść, gdy w środowisku, w którym działa robot, pojawią się chociażby niewielkie wyzwania. Mogą to być takie rzeczy jak oświetlenie, inne ustawienie przedmiotów lub nowe przeszkody, nawet w minimalnym stopniu wpływające na funkcjonowanie robota. W takiej sytuacji maszyna, jak zauważają przedstawiciele MIT, nie mają wystarczającego zbioru danych, z których mogłyby skorzystać w celu adaptacji.

Brutalne podejście

Aby rozwiązać ten problem, zespół MIT wykorzystał modele LLM – jak na przykład GPT-4 – decydując się na „brutalne podejście”.

– W dziedzinie języka, wszystkie dane to tylko zdania – mówi Lirui Wang, główny autor nowego podejścia do kształcenia robotów. – W robotyce, biorąc pod uwagę całą heterogeniczność danych, jeśli chcemy wstępnie trenować w podobny sposób, potrzebujemy innej architektur”.

Czytaj także: Jesteśmy w trakcie największej rewolucji w historii ludzkości – wnioski z konferencji Masters&Robots 2024

Zespół wprowadził nową architekturę o nazwie Heterogeneous Pretrained Transformers (HPT), która łączy informacje z różnych czujników i różnych środowisk. Transformator został następnie wykorzystany do połączenia danych w modele szkoleniowe. Im większy transformator, tym lepsze wyniki.

Następnie użytkownicy wprowadzają projekt robota, konfigurację i zadanie, które chcą wykonać.

Skąd zdobyć mózg robota?

– Naszym marzeniem jest posiadanie uniwersalnego mózgu robota, który można by pobrać i używać dla swojego robota bez żadnego szkolenia – powiedział o badaniach profesor nadzwyczajny CMU David Held. – Chociaż jesteśmy dopiero na wczesnym etapie, będziemy nadal mocno naciskać i mamy nadzieję, że skalowanie doprowadzi do przełomu w polityce robotycznej, tak jak miało to miejsce w przypadku dużych modeli językowych.

Badania zostały częściowo ufundowane przez Toyota Research Institute. W zeszłym roku na TechCrunch Disrupt TRI zadebiutowało metodą szkolenia robotów w ciągu jednej nocy. Niedawno nawiązano przełomowe partnerstwo, które połączy badania nad uczeniem się robotów ze sprzętem Boston Dynamics.

Czytaj także: