SORA: A valóság határán

Bevezető

2024. március 12.

Sora egy olyan mesterséges intelligencia-modell, amely egészen hihetetlenül valósághű videókat tud generálni (jelenleg) akár egy perc hosszúságig, megadott prompt alapján.

A DALL·E és GPT modellekben végzett korábbi fejlesztésekre épít, a DALL·E 3 technikáját alkalmazva.

Amellett, hogy (jelenleg) kizárólag szöveges instrukciókból tud videót generálni, a modell képes egy meglévő állóképet készíteni, és abból a legapróbb részletekre odafigyelve videót generálni. Ezen felül a modell egy meglévő videót is kiegészíthet, például kitöltheti a hiányzó képkockákat.

Ahogy fentebb már említettük, Sora maximum 1 perces videókat tud készíteni bonyolult részletekkel, összetett kameramozgással és dinamikus érzelmeket mutató karakterekkel. Ez a technológiai ugrás nemcsak az OpenAI exponenciálisan fejlődő technikai képességeit mutatja be, hanem új mércét is állít az iparág számára.

Az innováció középpontjában egy olyan technika áll, amely a vizuális adatokat könnyen érthető és kezelhető formátumba alakítja át , hasonlóan ahhoz, ahogyan a szavakat szöveges alapú alkalmazások AI-feldolgozáshoz tokenekre bontják.

Ez a folyamat magában foglalja a videóadatok könnyebben kezelhető formába tömörítését, majd foltokra vagy szegmensekre bontását. Ezek a szegmensek építőkockákként működnek, amelyeket Sora átrendezhet új videók létrehozásához.

Sora azon képessége, hogy hosszú, részletgazdag és az érzelmeket is helytállóan bemutató videókat készítsen, veszélyt jelenthet a hagyományos videó- és filmgyártásra nézve. Az a tény, hogy gyorsan és a költségek töredékéért tud tartalmat előállítani, forradalmasíthatja az ipart és idővel áthelyezheti az egyensúlyt az ember által készített alkotások helyett az AI-vezéreltek felé.

A képen szereplő féri AI által generált, a valóságban sohasem létezett.

Pozitívum, hogy a Sora új utakat nyithat meg a kreativitás előtt, lehetővé téve a filmesek és tartalomkészítők számára, hogy a hagyományos gyártás korlátai* nélkül valósítsák meg elképzeléseiket. A videókészítés demokratizálódása az innovatív tartalmak felfutásához vezethet, feszegetve a történetmesélés és a vizuális művészet határait.

*Egyelőre nem minden tekintetben.

Visszaélési lehetőségek felhasználás során

Bár képességei lenyűgözőek, aggályokat vetnek fel azzal kapcsolatban, hogy mennyire könnyű valósághű videókat készíteni. Ez kihívásokhoz vezethet a valódi és a mesterséges intelligencia által generált tartalom megkülönböztetésében, ami súlyosbíthatja a téves információval és a hamisításokkal kapcsolatos problémákat.

Arra a kérdésre, hogy az OpenAI tervezi-e a Sorát szélesebb körben elérhetővé tenni 2024-ben, az OpenAI szóvivője úgy fogalmazott, hogy a vállalat „több fontos biztonsági lépést tesz a Sora elérhetővé tétele előtt az OpenAI termékeiben”. Például már automatizált folyamatokat használnak annak megakadályozására, hogy AI modelljei szélsőséges erőszakot, szexuális tartalmat, gyűlöletkeltő képeket és valós politikusokat vagy hírességeket ábrázoljanak.

Összegzés

A technológiai innováció megjelenése jelzi, milyen gyorsan haladnak bizonyos mesterségesintelligencia-fejlődések, amelyeket több milliárd dolláros befektetés táplál – és ez az ütem egyúttal felgyorsítja a társadalmi következményekkel kapcsolatos aggodalmakat is. A Sora és hasonló eszközök sok kreatív területen emberek millióinak megélhetését veszélyeztethetik a későbbiekben.

Centered Twitter Embed

Introducing Sora, our text-to-video model.

Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W

Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf
— OpenAI (@OpenAI) February 15, 2024

Chatbotjaink | Rólunk | Kapcsolat

FEDEZD FEL

Főoldal
Megoldásaink
Innováció
Chatbotjaink
Rólunk
Kapcsolat

MIVEL FOGLALKOZUNK?

Toborzó Chatbot

Belső kommunikáció

Ügyfélszolgálati Chatbot

KAPCSOLAT

+36 70 601 6279

info@chatbossteam.com

ChatBoss Kft – 9022 Győr, Bisinger József sétány 18.

LEGFRISSEBB BEJEGYZÉSEINK:

Már hanggal is kommunikálhatunk a ChatGPT-vel

Saját GPT létrehozása az OpenAI segítségével

DALL-E 3: Képgenerátor a ChatGPT-től