1
16.02.2024, 10:30Lektura na 2 minuty

Sora: OpenAI pochwaliło się nowym AI zamieniającym tekst na wideo

Według oficjalnego opisu Sora jest modelem sztucznej inteligencji, który potrafi tworzyć realistycznie wyglądające sceny na podstawie instrukcji tekstowych.


Jakub „Jaqp” Dmuchowski

Mimo tego, że Sora jest już w pełni funkcjonalna, a możliwości sztucznej inteligencji możemy podziwiać choćby w tym miejscu, pozostaje ona niedostępna do wglądu dla zwykłych użytkowników. OpenAI przekazało, że obecnie prowadzone są działania z zakresu red teaming mające wychwycić wszelkie błędy w oprogramowaniu. Dostęp do narzędzia został przyznany także wybranym artystom, aby przedsiębiorstwo mogło zebrać opinie na jego temat i udoskonalić je przed oficjalną premierą.

Sora umożliwia tworzenie maksymalnie 60-sekundowych klipów wideo na bazie instrukcji tekstowych. Przykładowo, widoczny w załączonym powyżej tweecie materiał wideo powstał na bazie tekstu „Piękne, zaśnieżone Tokio tętni życiem. Kamera porusza się po tętniącej życiem ulicy miasta, podążając za kilkoma osobami cieszącymi się piękną śnieżną pogodą i robiącymi zakupy na pobliskich straganach. Wspaniałe płatki kwiatu wiśni unoszą się na wietrze wraz z płatkami śniegu”.

OpenAI zapewnia przy tym, że jego twór jest na tyle zaawansowany, że bez problemu poradzi sobie z wygenerowaniem złożonych scen, przez które przewija się multum postaci. Co więcej, Sora dba o szczegóły i nawet znajdujące się na drugim planie obiekty są tworzone z dbałością. Zdaje się także, że sztuczna inteligencja wreszcie opanowała umiejętność generowania dłoni i posiadają one odpowiednią liczbę palców.

Kreowanie klipów wideo na bazie tekstu nie jest przy tym jedynym zastosowaniem nowego narzędzia ze stajni OpenAI. Sona jest w stanie także zanimować statyczne obrazy, podobnie jak Lumiere autorstwa Google.

Zdaje się więc, że czasy niepokojąco wyglądających filmów wygenerowanych przez AI, do których z pewnością można zaliczyć widoczną poniżej reklamę nieistniejącej pizzerii, już wkrótce miną bezpowrotnie.

Mimo wszystko prace nad Sorą wciąż trwają, a deweloperzy ostrzegli, że obecna wersja modelu AI może mieć pewne problemy z ustaleniem specyficznej trajektorii kamery i rozpoznaniem, która część instrukcji odnosi się do szczegółów przestrzennych.


Czytaj dalej

Redaktor
Jakub „Jaqp” Dmuchowski

Swoją przygodę z grami komputerowymi rozpoczął od Herkulesa oraz Jazz Jackrabbit 2, tydzień później zagrywał się już w Diablo II i Morrowinda. Pasjonat tabelek ze statystykami oraz nieliniowych wątków fabularnych. Na co dzień zajmuje się projektowaniem stron internetowych. Nie wzgardzi dobrą lekturą ani kebabem.

Profil
Wpisów795

Obserwujących2

Dyskusja

  • Dodaj komentarz
  • Najlepsze
  • Najnowsze
  • Najstarsze