Hugging Face zaprezentowała nowego agenta AI – Open Computer Agent. To narzędzie dostępne przez Internet, działające w środowisku wirtualnej maszyny z systemem Linux i zainstalowanymi aplikacjami, takimi jak Firefox. Użytkownicy mogą wydawać mu polecenia, np. „Użyj Map Google, aby znaleźć siedzibę Hugging Face w Paryżu”, a agent samodzielnie podejmie próbę wykonania zadania – otworzy przeglądarkę i przejdzie przez kolejne kroki.
Jak działa Open Computer Agent?
Agent radzi sobie z prostymi zadaniami, ale przy bardziej złożonych, takich jak wyszukiwanie lotów, napotyka problemy. Dodatkowo często zatrzymuje się na testach CAPTCHA, których nie jest w stanie samodzielnie rozwiązać. Korzystanie z narzędzia wymaga również cierpliwości – przed uzyskaniem dostępu użytkownik trafia do wirtualnej kolejki, której długość zależy od aktualnego zapotrzebowania i może wynosić od kilku sekund do kilku minut.
Mimo tych ograniczeń, Hugging Face nie ukrywa, że celem projektu nie było stworzenie perfekcyjnego agenta. Chodziło raczej o demonstrację postępu w dziedzinie otwartych modeli AI.
„W miarę jak modele wizyjne stają się coraz bardziej wydajne, stają się w stanie zasilać złożone przepływy pracy agentów” – napisał na platformie X Aymeric Roucher, członek zespołu agentów Hugging Face. Jak wyjaśnia, niektóre z modeli mają już zdolność do wskazywania elementów na obrazie na podstawie ich współrzędnych i klikania ich w środowisku maszyny wirtualnej.
Zainteresowanie technologią agentową stale rośnie. Według badania firmy KPMG, 65% przedsiębiorstw eksperymentuje z agentami AI. Z kolei analizy firmy Markets and Markets wskazują, że rynek ten może wzrosnąć z 7,84 miliarda dolarów w 2025 roku do ponad 52 miliardów w roku 2030.