SORA: A valóság határán

Bevezető

 2024. március 12. 

Sora egy olyan mesterséges intelligencia-modell, amely egészen hihetetlenül valósághű videókat tud generálni (jelenleg) akár egy perc hosszúságig, megadott prompt alapján.

 A DALL·E és GPT modellekben végzett korábbi fejlesztésekre épít, a DALL·E 3 technikáját alkalmazva.

Amellett, hogy (jelenleg) kizárólag szöveges instrukciókból tud videót generálni, a modell képes egy meglévő állóképet készíteni, és abból a legapróbb részletekre odafigyelve videót generálni. Ezen felül a modell egy meglévő videót is kiegészíthet, például kitöltheti a hiányzó képkockákat.

Ahogy fentebb már említettük, Sora maximum 1 perces videókat tud készíteni bonyolult részletekkel, összetett kameramozgással és dinamikus érzelmeket mutató karakterekkel. Ez a technológiai ugrás nemcsak az OpenAI exponenciálisan fejlődő technikai képességeit mutatja be, hanem új mércét is állít az iparág számára.

Az innováció középpontjában egy olyan technika áll, amely a vizuális adatokat könnyen érthető és kezelhető formátumba alakítja át , hasonlóan ahhoz, ahogyan a szavakat szöveges alapú alkalmazások AI-feldolgozáshoz tokenekre bontják.

Ez a folyamat magában foglalja a videóadatok könnyebben kezelhető formába tömörítését, majd foltokra vagy szegmensekre bontását. Ezek a szegmensek építőkockákként működnek, amelyeket Sora átrendezhet új videók létrehozásához.

Sora azon képessége, hogy hosszú, részletgazdag és az érzelmeket is helytállóan bemutató videókat készítsen, veszélyt jelenthet a hagyományos videó- és filmgyártásra nézve. Az a tény, hogy gyorsan és a költségek töredékéért tud tartalmat előállítani, forradalmasíthatja az ipart és idővel áthelyezheti az egyensúlyt az ember által készített alkotások helyett az AI-vezéreltek felé.

A képen szereplő féri AI által generált, a valóságban sohasem létezett.

Pozitívum, hogy a Sora új utakat nyithat meg a kreativitás előtt, lehetővé téve a filmesek és tartalomkészítők számára, hogy a hagyományos gyártás korlátai* nélkül valósítsák meg elképzeléseiket. A videókészítés demokratizálódása az innovatív tartalmak felfutásához vezethet, feszegetve a történetmesélés és a vizuális művészet határait.

*Egyelőre nem minden tekintetben.

Visszaélési lehetőségek felhasználás során

Bár képességei lenyűgözőek, aggályokat vetnek fel azzal kapcsolatban, hogy mennyire könnyű valósághű videókat készíteni. Ez kihívásokhoz vezethet a valódi és a mesterséges intelligencia által generált tartalom megkülönböztetésében, ami súlyosbíthatja a téves információval és a hamisításokkal kapcsolatos problémákat.

Arra a kérdésre, hogy az OpenAI tervezi-e a Sorát szélesebb körben elérhetővé tenni 2024-ben, az OpenAI szóvivője úgy fogalmazott, hogy a vállalat „több fontos biztonsági lépést tesz a Sora elérhetővé tétele előtt az OpenAI termékeiben”. Például már automatizált folyamatokat használnak annak megakadályozására, hogy AI modelljei szélsőséges erőszakot, szexuális tartalmat, gyűlöletkeltő képeket és valós politikusokat vagy hírességeket ábrázoljanak.

Összegzés

A technológiai innováció megjelenése jelzi, milyen gyorsan haladnak bizonyos mesterségesintelligencia-fejlődések, amelyeket több milliárd dolláros befektetés táplál – és ez az ütem egyúttal felgyorsítja a társadalmi következményekkel kapcsolatos aggodalmakat is. A Sora és hasonló eszközök sok kreatív területen emberek millióinak megélhetését veszélyeztethetik a későbbiekben. 

Centered Twitter Embed