Google hatte noch im vergangenen Jahr etwas verzögert das letzte für 2023 vierteljährliche Pixel Feature Drop verteilt. Der Fokus liegt dabei besonders auf dem Google Pixel 8 Pro, das mit der Video-Boost-Funktion beispielsweise einen verbesserten Videomodus bekommen hat. Die KI sorgt dabei für eine bessere Bildstabilisierung, weniger Rauschen und eine optimierte Beleuchtung.
Erster Einsatz der Gemini Nano KI auf Eurem Google Pixel 8 Pro
Auch heute widmen wir uns einer Funktion, die ausschließlich auf dem Google Pixel 8 Pro verfügbar ist – auf die hauseigene KI Gemini Nano setzt. Das kleinste von Googles LLM-Modellen läuft auch offline – also ohne Internetverbindung. So erstellt Euch die künstliche Intelligenz eine Zusammenfassung von Sprachaufnahmen in Schriftform. Warum das ab sofort auch ohne Internetzugang funktioniert, erwähne ich noch einmal ganz am Ende des Beitrages. Nur soviel: Das Zauberwort heißt Android AICore.
Systemsprache English (US) einstellen
Das Ganze hat aktuell leider noch einen Haken: Das Feature ist ausschließlich in englischer (US) Sprache verfügbar. Google wird hier nach und nach weitere Sprachpakete ausliefern. Wenn Ihr also Gemini Nano einmal auf Eurem Google Pixel 8 Pro testen wollt, dann stellt Eure Systemsprache einfach auf English (US):
- Geht dazu in die Einstellungen
- Geht dann auf System
- Dann Sprachen und Systemsprachen
- Jetzt müsst Ihr (wenn nicht schon getan) das englische (US) Sprachpaket herunterladen
- Nun muss die Sprache nur noch an Position Eins verschoben werden (an den zwei Strichen packen)
- Jetzt seid Ihr bereit für Googles KI Gemini Nano
Die Google Rekorder-App
Bereits vor einem Jahr hatte Google ein Pixel Feature Drop verteilt, was der Rekorder-App die Fähigkeit verlieh, Audioaufnahmen zu transkribieren. Auch konnte die KI damals bereits mehrere Sprecher unterscheiden und die Aufnahme entsprechend als Dialog anlegen. Google fragt Euch bei der ersten Verwendung des Rekorders, ob Ihr die Sprecher-Erkennung aktivieren wollt.
Tatsächlich hat sie in meinem kleinen Test mit dem Kollegen Rubens nicht zu 100 Prozent funktioniert, da zum einen drei Sprecher erkannt wurden und zum anderen der letzte Satz " Yes, now we check it" wieder von mir (Speaker 1 & 2) kam. Zugegeben: Wir sind beide keine englischen Muttersprachler.
Erste Sprachaufnahme und Zusammenfassung
Um eine Zusammenfassung der in Text gewandelten Sprachaufzeichnung zu erhalten, sollte der Text nicht zu kurz sein. In meinem ersten Beispiel (first recording) ist der Text beispielsweise zu kurz.
Danach habe ich einige Absätze meines Tests des Amazon Echo Show 5 (2023) abgelesen. Nun wollte das Smartphone auch das Large Language Model (LLM) der Gemini Nano KI herunterladen, welches für die Zusammenfassung benötigt wird.
Jetzt kurz gewartet, und schon beginnt die künstliche Intelligenz die Zusammenfassung unseres Transcripts zu erstellen.
- Noch einen weiteren Google-Pixel-Tipp gefällig? So könnt Ihr Euer Pixel-Phone in eine Webcam verwandeln
Das LLM Gemini Nano arbeitet auf einem AICore
Gemini ist die neueste und effektivste künstliche Intelligenz von Google. Im Grunde gibt es drei Variationen:
- Gemini Ultra – Googles größtes und leistungsstärkstes Modell für hochkomplexe Aufgaben
- Gemini Pro – Googles bestes Modell für die Skalierung für ein breites Aufgabenspektrum und
- Gemini Nano – das effizienteste Modell aus Mountain View, für Aufgaben auf dem Gerät
Bei Gemini Nano kommt ein Systemdienst mit dem Namen Android AICore zum Einsatz. Er arbeitet unabhängig vom restlichen System und benötigt keinen Zugriff auf Euer Netzwerk. Das ist besonders vorteilhaft, wenn Ihr Aufgaben erledigt, welche beispielsweise wie WhatsApp eine Ende-zu-Ende-Verschlüsselung benötigen und der Datenschutz effektiv gewährleistet sein soll.
- Auch interessant: Darum hat das Google Pixel 8 Pro die beste Smartphone-Kamera
Vorschläge und Antworten von Gemini Nano verlassen also nicht Euer Smartphone und sind somit geschützt. Das war auch für "Smart Reply" im Gboard besonders wichtig. In der Developer Preview liefert hier das Pixel 8 Pro bei den Messenger-Apps Line, KakaoTalk und WhatsApp mit Hilfe von Gemini Nano qualitativ hochwertige Antwortvorschläge mit Gesprächsbewusstsein.
Und? Wer von Euch greift schon regelmäßig auf künstliche Intelligenz zurück? Welche nutzt Ihr und wofür? Schreibt uns Eure Erfahrungen gern unten in die Kommentare.
Kommentare
Kommentare
Beim Laden der Kommentare ist ein Fehler aufgetreten.