Google Gemini: Neue KI schlägt ChatGPT in einer Reihe von Tests
Google hat mit "Gemini" ein neues KI-Modell vorgestellt, das nach eigenen Angaben ChatGPT in vielen Tests übertrifft und "fortgeschrittenes Denken" bei den verschiedenen Aufgaben zeigt. Das Update fließt ab sofort in zahlreiche Google-Produkte mit ein.
Noch keine Gemini-KI für Deutschland
Vorerst startet Gemini aber nicht in der EU - und das hat wieder einmal datenschutzrechtliche, regulatorische Gründe. Google muss noch auf die Freigabe warten. In 170 Ländern/Regionen geht es aber schon jetzt los.
In den USA geht es auch ab sofort los - und was Google zu der neuen KI sagt und zeigt, ist wirklich spannend. Demis Hassabis von Google DeepMind erläuterte, Gemini sei "das komplizierteste Projekt", an dem der Konzern je gearbeitet hat. Gemini ist von Grund auf Multimodalität ausgelegt - es kann nahtlos Texte, Bilder, Videos, Audio und Code verarbeiten.
Was kann Gemini?
Laut Google übertrifft Gemini Ultra die modernsten KI-Modelle, einschließlich GPT-4, in 30 von 32 Benchmark-Tests - unter anderem beim logischen Denken und beim Bildverständnis. Das Pro-Modell übertrifft GPT-3.5 in sechs von acht Tests.
Google hat verschiedene Videos zu den Fähigkeiten von Gemini veröffentlicht, in denen gezeigt wird, wie die einzelnen Modelle arbeiten. Dabei wird am Beispiel der Pro-Version von Gemini gezeigt, wie eine Zeichnung einer Ente analysiert wird und wie die KI beantwortet, welchen Film eine Person in einem Smartphone-Video nachspielt - in diesem Fall eine laienhafte Umsetzung der berühmten "Bullet Time"-Szene in The Matrix:
Google wies jedoch bei der Ankündigung darauf hin, dass "Halluzinationen", d. h. falsche Antworten der KI, immer noch ein Problem mit dem Modell darstellen. "Ich würde sagen, es ist immer noch ein ungelöstes Forschungsproblem", sagte Eli Collins, Produktleiter bei Google DeepMind.
Gemini Nano und Gemini Pro ab sofort
Dazu gibt es verschiedenen Leistungsstufen der KI. Gemini Pro wird in Form eines Upgrades für Googles Chatbot Bard veröffentlicht, startet als "Gemini Nano" auf dem Pixel 8 Pro und wird als Gemini Ultra im kommenden Jahr dann als erweiterte Version von Google Bard angeboten.
"Die erste Version von Gemini wurde für verschiedene Größen und Anwendungsbereiche optimiert: Gemini Ultra ist das leistungsstärkste und größte Modell für hochkomplexe Aufgaben, Gemini Pro ist auf die Skalierung eines breiten Aufgabenspektrums zugeschnitten, Gemini Nano ist das effizienteste Modell für den Einsatz auf Endgeräten", so Google in der Ankündigung.
Interessant dürfte es auf jeden Fall für Nutzer eines Pixel-Smartphones werden. Google bringt Gemini auch auf das Pixel 8 Pro. Es ist das erste Smartphone, auf dem Gemini Nano laufen wird. Es ermöglicht neue Funktionen wie die Zusammenfassung von Aufnahmen in der Rekorder-App (zunächst nur auf Englisch).
Pixel Feature Drop
Der ebenfalls heute angekündigte große Pixel Feature Drop enthält darüber hinaus über 20 neue KI-Funktionen für das Pixel 8 Pro und weitere Modelle der Pixel-Familie. Google plant, Gemini in den kommenden Monaten für weitere Kernprodukte und -dienste einzuführen, darunter Search, Ads, Chrome und Duet AI. Entwickler werden ab dem 13. Dezember über verschiedene Schnittstellen die Möglichkeit erhalten, mit Gemini zu arbeiten. Auch hier müssen Nutzer in der EU noch abwarten.
Zusammenfassung
- Google stellt KI-Modell "Gemini" vor, übertrifft ChatGPT in Tests
- Gemini startet außerhalb der EU aufgrund von Datenschutzgründen
- Gemini kann Text, Bilder, Video, Audio und Code verarbeiten
- Gemini Ultra übertrifft GPT-4, Pro-Modell schlägt GPT-3.5
- Videos demonstrieren Fähigkeiten von Gemini, z.B. Bildanalyse
- Google weist auf Problem der "Halluzinationen" bei KI hin
- Gemini Pro als Upgrade für Bard, Nano auf Pixel 8 Pro, Ultra kommt später
- Gemini Ultra für komplexe, Pro für breite, Nano für effiziente Aufgaben
- Pixel 8 Pro wird erstes Smartphone mit Gemini Nano
- Über 20 neue KI-Funktionen im Feature Drop, Gemini später in Kernprodukten