Google stellt Veo 2 zur Verfügung: Das ist jetzt in der Gemini-App möglich


Seit dem Start von Gemini hat sich Google vor allem auf die Bilderzeugung und verschiedene Modellintegrationen konzentriert. Jetzt erweitert Google seine Fähigkeiten zur Videogenerierung, indem es den Veo 2-Generator über den KI-Chatbot für mehr Nutzer/innen zugänglich macht.
Veo 2 wurde im Dezember letzten Jahres angekündigt und versprach mehr Realismus bei der Videogenerierung durch eine verbesserte Darstellung der realen Physik und menschlicher Bewegungen sowie feinere Details im Vergleich zu früheren Modellen. Google hat nun angekündigt, dass es den Videogenerator in Gemini einführt und ihn für Gemini Advanced-Nutzer/innen mit Google-One-AI-Premium-Abonnementen sowohl auf mobilen als auch auf Web-Plattformen verfügbar macht.
Mit Veo 2, das in Gemini integriert ist, können Nutzer/innen Videos mit einfachen Textanweisungen erstellen. Das Unternehmen betont jedoch, dass das Video umso präziser wird, je detaillierter die Beschreibung ist, die in jeder Aufforderung angegeben wird. Die Funktion unterstützt verschiedene Stile und Filmgenres, einschließlich Film- und Linseneffekte.
Wie Ihr Videos in Gemini generiert
Um ein Video zu erstellen, müssen die Nutzer/innen das Modell Veo 2 aus dem KI-Modellauswahlmenü auswählen, bevor sie ihre Textaufforderung eingeben. Google weist darauf hin, dass sich die Position dieser Modellauswahl in Zukunft ändern kann. Außerdem ist die Anzahl der Videos, die ein/e Nutzer/in pro Monat erstellen kann, begrenzt, wobei Google die genaue monatliche Quote noch nicht festgelegt hat.
Jedes Video ist 8 Sekunden lang und hat eine Auflösung von 720p mit einem Seitenverhältnis von 16:9. Dies unterscheidet sich von OpenAIs Sora, das 1080p-Videos mit einer Länge von bis zu 20 Sekunden erstellen kann. Die Videos werden im MP4-Dateiformat erstellt, das die Nutzer/innen speichern können. Auf mobilen Geräten wird es ein Tool geben, mit dem die erstellten Videos einfach auf Social-Media-Plattformen wie YouTube und TikTok hochgeladen und geteilt werden können.
Google weist außerdem darauf hin, dass die von Veo erstellten Videos digitale SynthID-Wasserzeichen verwenden, ähnlich wie die Wasserzeichen bei Bildern, die von Gemini oder dem Imagen-Modell erstellt werden.
Google erweitert die Funktionalität von Veo auch auf seine experimentelle Funktion Whisk. Diese Anwendung zur Erstellung von KI-Bildern ermöglicht es den Nutzer/innen, Bilder sowohl mit Text- als auch mit Bildeingaben zu erstellen. Mit der Integration von Veo 2 können die Nutzer/innen nun die in Whisk erstellten Bilder animieren. Diese animierten Videos sind ebenfalls 8 Sekunden lang und haben das gleiche MP4-Format wie die direkt in Gemini erstellten Videos.
Das Veo 2 Modell wird derzeit auf Gemini Advanced ausgerollt und ist auf Englisch verfügbar. Es kann ein paar Tage dauern, bis das Modell für alle Abonnenten verfügbar ist.
Quelle: Google