Liderul în inteligență artificială OpenAI a făcut un nou pas revoluționar odată cu lansarea lui Sora, un model IA capabil să genereze videoclipuri „realiste” și „creative” de 60 de secunde pornind de la comenzi text simple.
Conform unui articol publicat pe site-ul companiei pe 15 februarie, Sora poate crea secvențe video de până la un minut pornind de la instrucțiuni scrise, incluzând scene cu personaje multiple, mișcări specifice și detalii complexe de fundal. „Modelul nu doar înțelege ce își dorește utilizatorul, ci și cum există lucrurile respective în lumea reală”, explică postarea relatată de CNN.
OpenAI își propune să dezvolte modele IA care „să ajute oamenii să rezolve probleme ce necesită interacțiune cu lumea fizică”.
Sora reprezintă cel mai recent proiect al companiei care a lansat chatbot-ul viral ChatGPT, continuând astfel revoluția inteligenței artificiale generative. Analistul Reece Hayden de la ABI Research subliniază faptul că, deși nu este un model unic (existând deja modele text-to-video), Sora impresionează prin lungimea și acuratețea video-urilor generate.
Hayden vede un impact uriaș al acestor modele asupra divertismentului digital, prin personalizarea conținutului pe diverse canale. „Un exemplu clar este utilizarea în televiziune, pentru crearea de scene scurte care susțin narativul”, explică analistul. „Deși modelul are limite, el arată direcția în care se îndreaptă piața”.
OpenAI recunoaște că Sora este încă în dezvoltare și prezintă „puncte slabe” evidente, în special legate de aspectele spațiale din descrieri (confundând stânga cu dreapta) și relațiile de cauză-efect. De exemplu, modelul ar putea genera un videoclip cu cineva care mușcă dintr-un biscuit, dar fără a crea o urmă a mușcăturii.
Introducing Sora, our text-to-video model.
— OpenAI (@OpenAI) February 15, 2024
Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W
Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf
Compania prioritizează siguranța și intenționează să colaboreze cu experți pentru testarea modelului în zone precum dezinformare, conținut denigrant și părtinire. De asemenea, se dezvoltă instrumente pentru detectarea conținutului înșelător.
Sora va fi oferită inițial unor „red teamers” – experți în securitate cibernetică – care vor evalua riscurile și vulnerabilitățile produsului. Accesul va fi acordat și unor artiști vizuali, designeri și cineaști pentru a colecta feedback privind utilizarea creativă a modelului.
Lansarea Sora vine în contextul evoluției continue a lui ChatGPT. Săptămâna aceasta, OpenAI a anunțat testarea unei funcții ce permite utilizatorilor să controleze memoria lui ChatGPT, putând cere platformei să își amintească sau să uite conversații anterioare pentru a personaliza interacțiunile viitoare.
Fiți la curent cu ultimele noutăți. Urmăriți DCNews și pe Google News
de Val Vâlcu