Eure persönliche Assistenz: So stark ist Googles KI auf dem Pixel 8 Pro!

4 Min Lesezeit 4 min 7 Kommentare 7
No Ad to show

Mit dem letzten Google Feature Drop kam auch die KI mit dem Namen Gemini Nano erstmalig auf das Google Pixel 8 Pro (Test). Verwenden könnt Ihr die kleinste Version des Large Language Models beispielsweise ab sofort in der Google-Rekorder-App, wo die künstliche Intelligenz Euch eine Zusammenfassung Eurer Tonaufnahmen erstellt. Wie das funktioniert, zeigen wir Euch jetzt.

Google hatte noch im vergangenen Jahr etwas verzögert das letzte für 2023 vierteljährliche Pixel Feature Drop verteilt. Der Fokus liegt dabei besonders auf dem Google Pixel 8 Pro, das mit der Video-Boost-Funktion beispielsweise einen verbesserten Videomodus bekommen hat. Die KI sorgt dabei für eine bessere Bildstabilisierung, weniger Rauschen und eine optimierte Beleuchtung.

No Ad to show

Erster Einsatz der Gemini Nano KI auf Eurem Google Pixel 8 Pro

Auch heute widmen wir uns einer Funktion, die ausschließlich auf dem Google Pixel 8 Pro verfügbar ist – auf die hauseigene KI Gemini Nano setzt. Das kleinste von Googles LLM-Modellen läuft auch offline – also ohne Internetverbindung. So erstellt Euch die künstliche Intelligenz eine Zusammenfassung von Sprachaufnahmen in Schriftform. Warum das ab sofort auch ohne Internetzugang funktioniert, erwähne ich noch einmal ganz am Ende des Beitrages. Nur soviel: Das Zauberwort heißt Android AICore.

Systemsprache English (US) einstellen

Das Ganze hat aktuell leider noch einen Haken: Das Feature ist ausschließlich in englischer (US) Sprache verfügbar. Google wird hier nach und nach weitere Sprachpakete ausliefern. Wenn Ihr also Gemini Nano einmal auf Eurem Google Pixel 8 Pro testen wollt, dann stellt Eure Systemsprache einfach auf English (US):

No Ad to show
  • Geht dazu in die Einstellungen
  • Geht dann auf System
  • Dann Sprachen und Systemsprachen
Zuerst einmal die Sprache auf English (US) umstellen. / © nextpit
  • Jetzt müsst Ihr (wenn nicht schon getan) das englische (US) Sprachpaket herunterladen
  • Nun muss die Sprache nur noch an Position Eins verschoben werden (an den zwei Strichen packen)
  • Jetzt seid Ihr bereit für Googles KI Gemini Nano
Aktuell läuft Gemini Nano nur in der englischen Sprache./ © nextpit

Die Google Rekorder-App

Bereits vor einem Jahr hatte Google ein Pixel Feature Drop verteilt, was der Rekorder-App die Fähigkeit verlieh, Audioaufnahmen zu transkribieren. Auch konnte die KI damals bereits mehrere Sprecher unterscheiden und die Aufnahme entsprechend als Dialog anlegen. Google fragt Euch bei der ersten Verwendung des Rekorders, ob Ihr die Sprecher-Erkennung aktivieren wollt.

Tatsächlich hat sie in meinem kleinen Test mit dem Kollegen Rubens nicht zu 100 Prozent funktioniert, da zum einen drei Sprecher erkannt wurden und zum anderen der letzte Satz " Yes, now we check it" wieder von mir (Speaker 1 & 2) kam. Zugegeben: Wir sind beide keine englischen Muttersprachler.

So ganz funktioniert die Personenerkennung noch nicht. / © nextpit

Erste Sprachaufnahme und Zusammenfassung

Um eine Zusammenfassung der in Text gewandelten Sprachaufzeichnung zu erhalten, sollte der Text nicht zu kurz sein. In meinem ersten Beispiel (first recording) ist der Text beispielsweise zu kurz.

No Ad to show
Diese Sprachaufzeichnung war wohl für die KI zu kurz. / © nextpit

Danach habe ich einige Absätze meines Tests des Amazon Echo Show 5 (2023) abgelesen. Nun wollte das Smartphone auch das Large Language Model (LLM) der Gemini Nano KI herunterladen, welches für die Zusammenfassung benötigt wird.

Ist die Audio-Aufzeichnung – und entsprechend auch das Transcript – dann erstellt Euch Gemini Nano drei Stichpunkte mit einer Zusammenfassung Eurer Datei. © nextpit

Jetzt kurz gewartet, und schon beginnt die künstliche Intelligenz die Zusammenfassung unseres Transcripts zu erstellen.

Das LLM Gemini Nano arbeitet auf einem AICore

Gemini ist die neueste und effektivste künstliche Intelligenz von Google. Im Grunde gibt es drei Variationen:

No Ad to show
  • Gemini Ultra – Googles größtes und leistungsstärkstes Modell für hochkomplexe Aufgaben
  • Gemini Pro – Googles bestes Modell für die Skalierung für ein breites Aufgabenspektrum und
  • Gemini Nano – das effizienteste Modell aus Mountain View, für Aufgaben auf dem Gerät
Der Android AICore verwaltet Modell-, Laufzeit- und Sicherheitsfunktionen. / © Google

Bei Gemini Nano kommt ein Systemdienst mit dem Namen Android AICore zum Einsatz. Er arbeitet unabhängig vom restlichen System und benötigt keinen Zugriff auf Euer Netzwerk. Das ist besonders vorteilhaft, wenn Ihr Aufgaben erledigt, welche beispielsweise wie WhatsApp eine Ende-zu-Ende-Verschlüsselung benötigen und der Datenschutz effektiv gewährleistet sein soll. 

Vorschläge und Antworten von Gemini Nano verlassen also nicht Euer Smartphone und sind somit geschützt. Das war auch für "Smart Reply" im Gboard besonders wichtig. In der Developer Preview liefert hier das Pixel 8 Pro bei den Messenger-Apps Line, KakaoTalk und WhatsApp mit Hilfe von Gemini Nano qualitativ hochwertige Antwortvorschläge mit Gesprächsbewusstsein.

Und? Wer von Euch greift schon regelmäßig auf künstliche Intelligenz zurück? Welche nutzt Ihr und wofür? Schreibt uns Eure Erfahrungen gern unten in die Kommentare.

nextpit erhält bei Einkäufen über die markierten Links eine Kommission. Dies hat keinen Einfluss auf die redaktionellen Inhalte, und für Euch entstehen dabei keine Kosten. Mehr darüber, wie wir Geld verdienen, erfahrt Ihr auf unserer Transparenzseite.
No Ad to show
>
No Ad to show
MEHR ANZEIGEN

Kommentare

Kommentare

Beim Laden der Kommentare ist ein Fehler aufgetreten.

No Ad to show