Eure persönliche Assistenz: So stark ist Googles KI auf dem Pixel 8 Pro!
In anderen Sprachen lesen:
Mit dem letzten Google Feature Drop kam auch die KI mit dem Namen Gemini Nano erstmalig auf das Google Pixel 8 Pro (Test). Verwenden könnt Ihr die kleinste Version des Large Language Models beispielsweise ab sofort in der Google-Rekorder-App, wo die künstliche Intelligenz Euch eine Zusammenfassung Eurer Tonaufnahmen erstellt. Wie das funktioniert, zeigen wir Euch jetzt.
- Weiterer Google-Tipp gefällig? So wird Euer Pixel 8 zum besten Dokumentenscanner
Google hatte noch im vergangenen Jahr etwas verzögert das letzte für 2023 vierteljährliche Pixel Feature Drop verteilt. Der Fokus liegt dabei besonders auf dem Google Pixel 8 Pro, das mit der Video-Boost-Funktion beispielsweise einen verbesserten Videomodus bekommen hat. Die KI sorgt dabei für eine bessere Bildstabilisierung, weniger Rauschen und eine optimierte Beleuchtung.
Erster Einsatz der Gemini Nano KI auf Eurem Google Pixel 8 Pro
Auch heute widmen wir uns einer Funktion, die ausschließlich auf dem Google Pixel 8 Pro verfügbar ist – auf die hauseigene KI Gemini Nano setzt. Das kleinste von Googles LLM-Modellen läuft auch offline – also ohne Internetverbindung. So erstellt Euch die künstliche Intelligenz eine Zusammenfassung von Sprachaufnahmen in Schriftform. Warum das ab sofort auch ohne Internetzugang funktioniert, erwähne ich noch einmal ganz am Ende des Beitrages. Nur soviel: Das Zauberwort heißt Android AICore.
Systemsprache English (US) einstellen
Das Ganze hat aktuell leider noch einen Haken: Das Feature ist ausschließlich in englischer (US) Sprache verfügbar. Google wird hier nach und nach weitere Sprachpakete ausliefern. Wenn Ihr also Gemini Nano einmal auf Eurem Google Pixel 8 Pro testen wollt, dann stellt Eure Systemsprache einfach auf English (US):
- Geht dazu in die Einstellungen
- Geht dann auf System
- Dann Sprachen und Systemsprachen
- Jetzt müsst Ihr (wenn nicht schon getan) das englische (US) Sprachpaket herunterladen
- Nun muss die Sprache nur noch an Position Eins verschoben werden (an den zwei Strichen packen)
- Jetzt seid Ihr bereit für Googles KI Gemini Nano
Die Google Rekorder-App
Bereits vor einem Jahr hatte Google ein Pixel Feature Drop verteilt, was der Rekorder-App die Fähigkeit verlieh, Audioaufnahmen zu transkribieren. Auch konnte die KI damals bereits mehrere Sprecher unterscheiden und die Aufnahme entsprechend als Dialog anlegen. Google fragt Euch bei der ersten Verwendung des Rekorders, ob Ihr die Sprecher-Erkennung aktivieren wollt.
Tatsächlich hat sie in meinem kleinen Test mit dem Kollegen Rubens nicht zu 100 Prozent funktioniert, da zum einen drei Sprecher erkannt wurden und zum anderen der letzte Satz " Yes, now we check it" wieder von mir (Speaker 1 & 2) kam. Zugegeben: Wir sind beide keine englischen Muttersprachler.
Erste Sprachaufnahme und Zusammenfassung
Um eine Zusammenfassung der in Text gewandelten Sprachaufzeichnung zu erhalten, sollte der Text nicht zu kurz sein. In meinem ersten Beispiel (first recording) ist der Text beispielsweise zu kurz.
Danach habe ich einige Absätze meines Tests des Amazon Echo Show 5 (2023) abgelesen. Nun wollte das Smartphone auch das Large Language Model (LLM) der Gemini Nano KI herunterladen, welches für die Zusammenfassung benötigt wird.
Jetzt kurz gewartet, und schon beginnt die künstliche Intelligenz die Zusammenfassung unseres Transcripts zu erstellen.
- Noch einen weiteren Google-Pixel-Tipp gefällig? So könnt Ihr Euer Pixel-Phone in eine Webcam verwandeln
Das LLM Gemini Nano arbeitet auf einem AICore
Gemini ist die neueste und effektivste künstliche Intelligenz von Google. Im Grunde gibt es drei Variationen:
- Gemini Ultra – Googles größtes und leistungsstärkstes Modell für hochkomplexe Aufgaben
- Gemini Pro – Googles bestes Modell für die Skalierung für ein breites Aufgabenspektrum und
- Gemini Nano – das effizienteste Modell aus Mountain View, für Aufgaben auf dem Gerät
Bei Gemini Nano kommt ein Systemdienst mit dem Namen Android AICore zum Einsatz. Er arbeitet unabhängig vom restlichen System und benötigt keinen Zugriff auf Euer Netzwerk. Das ist besonders vorteilhaft, wenn Ihr Aufgaben erledigt, welche beispielsweise wie WhatsApp eine Ende-zu-Ende-Verschlüsselung benötigen und der Datenschutz effektiv gewährleistet sein soll.
- Auch interessant: Darum hat das Google Pixel 8 Pro die beste Smartphone-Kamera
Vorschläge und Antworten von Gemini Nano verlassen also nicht Euer Smartphone und sind somit geschützt. Das war auch für "Smart Reply" im Gboard besonders wichtig. In der Developer Preview liefert hier das Pixel 8 Pro bei den Messenger-Apps Line, KakaoTalk und WhatsApp mit Hilfe von Gemini Nano qualitativ hochwertige Antwortvorschläge mit Gesprächsbewusstsein.
Und? Wer von Euch greift schon regelmäßig auf künstliche Intelligenz zurück? Welche nutzt Ihr und wofür? Schreibt uns Eure Erfahrungen gern unten in die Kommentare.
Geht das beim normalen Pixel 8 ohne Pro nicht? Ich dachte das Pro hat einfach nur ein größeres Display und eine weitere Kamera?
Nein, der/die/das Gemini Nano läuft nur auf dem Google Pixel 8 Pro und aktuell auch nur in englischer Sprache.
Mich würde mal die inhaltliche Qualität der Zusammenfassungen interessieren. Ich bekomme beruflich viele Protokolle von Besprechungen, an denen ich teilgenommen habe und wundere mich oft, was in diesen Protokollen als erfassenswert erachtet wurde und was unter den Tisch fiel. Entscheidende Ergebnisse sucht man manchmal im Protokoll vergeblich, während Nebensächlichkeiten umfangreich zusammengefasst werden, weil diese im Gespräch mehr Raum hatten. Da würde mich interessieren, ob KI hierbei einen besseren Job macht.
Wenn Du möchtest, kann ich Dir den eingesprochenen Text und die Zusammenfassung gerne mal abtippen (p&c) und hier reinpacken, wenn Dir das hilft?
Netter Vorschlag, mir stellen aber bezüglich Datenschutz / Vertraulichkeit die Haare auf 😉
Braucht es nicht, da ich lediglich den Test des Amazon Echo Show 5
https://www.nextpit.de/amazon-echo-show-5-3rd-gen-test
abgelesen habe, der ohnehin hier veröffentlicht wurde.
Ich sehe hier einen interessanten Use-Case.
Wer bei uns in der Abteilung zu spät bzw. als letzter ins Meeting kommt, ist verantwortlich für das MoM🙃