ChatGPT-Macher zeigen erstmals ihre Text-zu-Video-KI "Sora"
Die ChatGPT-Betreiber von OpenAI haben jetzt ein neues System namens Sora vorgestellt. Dabei handelt es sich um ein generatives KI-Modell, dass Texteingaben in Videos umwandeln kann, die aktuell bis zu einer Minute lang sein können.
Modell im Extrem-Test
Laut dem zugehörigen OpenAI-Forschungspapier wird das neue Sora-Modell mit "textbedingten Diffusionsmodellen auf Videos und Bildern mit variabler Dauer" trainiert, um hyperrealistische Videos aus textbasierten Aufforderungen zu erzeugen. Das Unternehmen merkte an, dass es beim KI-Training darauf Wert gelegt hat, "die physische Welt in Bewegung zu verstehen".
Sowohl in der Ankündigung als auch in der Forschungsarbeit wurden eine Reihe von Clips gezeigt, in denen das Modell vorgestellt wird. OpenAI-Chef Sam Altman nahm sogar Anfragen von Benutzern entgegen, um die Fähigkeiten des Modells zu zeigen.
Öffentlich verfügbar ist das Modell allerdings noch nicht. OpenAI wies darauf hin, dass man derzeit mit Red-Teamern zusammenarbeite, um die Grenzen des Modells zu testen und die Sicherheit zu gewährleisten. Darüber hinaus stehe man auch mit politischen Entscheidungsträgern in Kontakt, um deren Bedenken in Bezug auf die Technologie zu diskutieren.
Noch nicht öffentlich
"Wir geben unsere Forschungsfortschritte frühzeitig bekannt, um mit Menschen außerhalb von OpenAI zusammenzuarbeiten und von ihnen Feedback zu erhalten und um der Öffentlichkeit ein Gefühl dafür zu geben, welche KI-Fähigkeiten am Horizont zu erwarten sind", hieß es von Seiten des Anbieters.
Einer Reihe von bildenden Künstlern, Designern und Filmemachern wird allerdings bereits Zugang gewährt, um Rückmeldungen darüber zu erhalten, wie man das Modell so weiterentwickeln kann, dass es für Kreativschaffende am hilfreichsten ist. Es ist noch nicht klar, wann OpenAI das neue Modell der Öffentlichkeit anbieten wird und was es den Endnutzern kosten würde.
Zusammenfassung
- OpenAI stellt generatives KI-Modell Sora vor
- Texteingaben werden zu bis zu einminütigen Videos
- Sora mit "textbedingten Diffusionsmodellen" trainiert
- Hyperrealistische Videos aus Textaufforderungen generierbar
- Öffentliche Verfügbarkeit von Sora noch nicht gegeben
- Red-Teamer testen Sora's Grenzen für Sicherheit
- Kreative erhalten Zugang für Feedback zur Weiterentwicklung
- Unklar, wann Sora öffentlich verfügbar sein wird