SORA: A valóság határán
Bevezető
2024. március 12.
Sora egy olyan mesterséges intelligencia-modell, amely egészen hihetetlenül valósághű videókat tud generálni (jelenleg) akár egy perc hosszúságig, megadott prompt alapján.
A DALL·E és GPT modellekben végzett korábbi fejlesztésekre épít, a DALL·E 3 technikáját alkalmazva.
Amellett, hogy (jelenleg) kizárólag szöveges instrukciókból tud videót generálni, a modell képes egy meglévő állóképet készíteni, és abból a legapróbb részletekre odafigyelve videót generálni. Ezen felül a modell egy meglévő videót is kiegészíthet, például kitöltheti a hiányzó képkockákat.
Ahogy fentebb már említettük, Sora maximum 1 perces videókat tud készíteni bonyolult részletekkel, összetett kameramozgással és dinamikus érzelmeket mutató karakterekkel. Ez a technológiai ugrás nemcsak az OpenAI exponenciálisan fejlődő technikai képességeit mutatja be, hanem új mércét is állít az iparág számára.
Az innováció középpontjában egy olyan technika áll, amely a vizuális adatokat könnyen érthető és kezelhető formátumba alakítja át , hasonlóan ahhoz, ahogyan a szavakat szöveges alapú alkalmazások AI-feldolgozáshoz tokenekre bontják.
Ez a folyamat magában foglalja a videóadatok könnyebben kezelhető formába tömörítését, majd foltokra vagy szegmensekre bontását. Ezek a szegmensek építőkockákként működnek, amelyeket Sora átrendezhet új videók létrehozásához.
Sora azon képessége, hogy hosszú, részletgazdag és az érzelmeket is helytállóan bemutató videókat készítsen, veszélyt jelenthet a hagyományos videó- és filmgyártásra nézve. Az a tény, hogy gyorsan és a költségek töredékéért tud tartalmat előállítani, forradalmasíthatja az ipart és idővel áthelyezheti az egyensúlyt az ember által készített alkotások helyett az AI-vezéreltek felé.
A képen szereplő féri AI által generált, a valóságban sohasem létezett.
Pozitívum, hogy a Sora új utakat nyithat meg a kreativitás előtt, lehetővé téve a filmesek és tartalomkészítők számára, hogy a hagyományos gyártás korlátai* nélkül valósítsák meg elképzeléseiket. A videókészítés demokratizálódása az innovatív tartalmak felfutásához vezethet, feszegetve a történetmesélés és a vizuális művészet határait.
*Egyelőre nem minden tekintetben.
Visszaélési lehetőségek felhasználás során
Bár képességei lenyűgözőek, aggályokat vetnek fel azzal kapcsolatban, hogy mennyire könnyű valósághű videókat készíteni. Ez kihívásokhoz vezethet a valódi és a mesterséges intelligencia által generált tartalom megkülönböztetésében, ami súlyosbíthatja a téves információval és a hamisításokkal kapcsolatos problémákat.
Arra a kérdésre, hogy az OpenAI tervezi-e a Sorát szélesebb körben elérhetővé tenni 2024-ben, az OpenAI szóvivője úgy fogalmazott, hogy a vállalat „több fontos biztonsági lépést tesz a Sora elérhetővé tétele előtt az OpenAI termékeiben”. Például már automatizált folyamatokat használnak annak megakadályozására, hogy AI modelljei szélsőséges erőszakot, szexuális tartalmat, gyűlöletkeltő képeket és valós politikusokat vagy hírességeket ábrázoljanak.
Összegzés
A technológiai innováció megjelenése jelzi, milyen gyorsan haladnak bizonyos mesterségesintelligencia-fejlődések, amelyeket több milliárd dolláros befektetés táplál – és ez az ütem egyúttal felgyorsítja a társadalmi következményekkel kapcsolatos aggodalmakat is. A Sora és hasonló eszközök sok kreatív területen emberek millióinak megélhetését veszélyeztethetik a későbbiekben.
Introducing Sora, our text-to-video model.
— OpenAI (@OpenAI) February 15, 2024
Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W
Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf
FEDEZD FEL
KAPCSOLAT
ChatBoss Kft – 9022 Győr, Bisinger József sétány 18.