OpenAI heeft een nieuw tekst-naar-video research project voorgesteld, Sora. Dat zullen jij en ik niet meteen kunnen uittesten, want het is enkel beschikbaar voor een beperkt aantal creators en beveiligingsexperts, die het grondig moeten uittesten.
Sora is gebaseerd op het diffusion model, dat ook in DALLE-E3 en GPT-4 gebruikt wordt. De AI kan vido's maken die tot 60 seconden lang zijn, en mensen die ermee aan de slag mochten gaan, hebben heel wat indrukwekkende voorbeelden online geplaatst van wat deze tool vermag.
In de technische paper over de AI, wordt vermeld dat Sora video's kan maken met een willekeurige resolutie en beeldverhouding (tot 1080p) en een reeks beeld- en videobewerkingstaken kan uitvoeren, zoals looping. video's en het veranderen van de achtergrond in een bestaande video. Sora kan ook “digitale werelden simuleren”, bijvoorbeeld een prompt met het woord “Minecraft” liet Sora een overtuigend Minecraft-achtige HUD en game weergeven.
Hieronder enkele links van echt wel indrukwekkende filmpjes die Sora gemaakt heeft.
https://openai.com/sora
https://twitter.com/rowancheung/status/1758538765331534100
https://twitter.com/minchoi/status/1758540154422055321
|