14.03.2024, 15:00Lektura na 3 minuty

Google SIMA: Sztuczna inteligencja, która gra w gry (wszystkie)

SIMA, a w zasadzie Scalable Instructable Multiworld Agent, jest w stanie wykonywać zadania w grach wideo na podstawie otrzymanych w naturalnym języku instrukcji.


Jakub „Jaqp” Dmuchowski

Funkcjonujące w obrębie Google studio DeepMind pochwaliło się, że gry wideo już od wielu lat są swoistym obszarem treningowym dla wielu modeli sztucznej inteligencji. Mimo to powstałe do tej pory systemy AI skupiały się zazwyczaj na nauce rozgrywki w obrębie jednego tytułu, jak choćby AlphaStar mogący poszczycić się osiągnięciem poziomu arcymistrza w StarCrafcie II. SIMA ma zamiar zmienić ten stan rzeczy, jako że szkolona jest do radzenia sobie z wyzwaniami stawianymi przez jak największą pulę gier wideo.


Scalable Instructable Multiworld Agent

DeepMind nawiązało partnerstwo z ośmioma studiami developerskimi, aby jego twór mógł uczyć się na zróżnicowanych produkcjach. Do grona wspomnianych studiów zaliczają się m.in. odpowiedzialne za No Man's Sky Hello Games oraz autorzy Teardown – Tuxedo Labs. Do szkolenia SIMA wykorzystano takie produkcje, jak Goat Simulator 3, Valheim, Hydroneer, Construction Lab, Playhouse, ProcTHOR, Wobby Life, Satisfactory i wspomniane już No Man's Sky oraz Teardown.

Pierwsze badania wykazały, że Scalable Instructable Multiworld Agent jest w stanie odnaleźć się i funkcjonować w przeróżnych światach gier, wypełniając przy tym otrzymane w naturalnym języku polecenia, jak choćby „zetnij drzewo”, „znajdź wodę” lub „przeskocz ogrodzenie”.

Odpowiedzialne za SIMA studio zwraca przy tym uwagę na fakt, że w eksperymencie nie chodzi o wykręcanie jak najwyższych wyników w każdej dostępnej grze, a raczej o opracowanie modelu sztucznej inteligencji zdolnego do wypełniania poleceń w zróżnicowanych środowiskach, które nierzadko są mu obce. Twór DeepMind rejestruje, w jaki sposób język przekłada się na zachowania w grze. W początkowych fazach badania udział brały pary ludzi – jeden z nich grał, drugi z kolei obserwował jego poczynania i instruował. Następnie osoby te były instruowane, aby prowadziły swobodną rozgrywkę przy jednoczesnym nagrywaniu instrukcji, które stały za ich działaniami wewnątrz wirtualnych światów.

Obecna wersja Scalable Instructable Multiworld Agent posiada zdolność rozpoznania i wykonania około 600 różnych poleceń, poczynając od tych związanych z nawigacją (idź prosto, później skręć w prawo), przez te uwzględniające interakcje z obiektami (wsiądź do samochodu), po te korzystające z funkcji gier (otwórz mapę/przejdź do ekranu ekwipunku). Co więcej, SIMA nie potrzebuje do działania ani linijki kodu danego tytułu, zbędny jest także dostęp do API. Jedyne, co jest niezbędne do poprawnego funkcjonowania rzeczonej sztucznej inteligencji, to obraz na ekranie i wydawane przez użytkownika instrukcje. 

Ambicje DeepMind sięgają jednak znacznie dalej, a naukowcy marzą o opracowaniu sposobu na to, aby ich dzieło było w stanie wykonywać złożone czynności wymagające strategicznego planowania, jak np. zbieranie surowców celem wybudowania z nich obozu.

Więcej informacji na temat SIMA możecie znaleźć na stronie projektu. Będąc już w temacie Google, warto wspomnieć o tym, że inny czatbot firmy, Gemini, przysporzył jej nieco problemów, w związku z czym przedsiębiorstwo musiało przeprosić za jego zachowanie i obiecać wdrożenie zmian. Co więcej, gigant z Mountain View zapowiedział, że ma zamiar podjąć kroki w ramach dostosowania się do nowych unijnych przepisów – kroki, które niekoniecznie wszystkim przypadną do gustu.


Czytaj dalej

Redaktor
Jakub „Jaqp” Dmuchowski

Swoją przygodę z grami komputerowymi rozpoczął od Herkulesa oraz Jazz Jackrabbit 2, tydzień później zagrywał się już w Diablo II i Morrowinda. Pasjonat tabelek ze statystykami oraz nieliniowych wątków fabularnych. Na co dzień zajmuje się projektowaniem stron internetowych. Nie wzgardzi dobrą lekturą ani kebabem.

Profil
Wpisów872

Obserwujących2

Dyskusja

  • Dodaj komentarz
  • Najlepsze
  • Najnowsze
  • Najstarsze