Google verwandelt jetzt Dokumente in KI-Podcasts


Google hat in letzter Zeit seine Schlagzahl neuer Gemini-Erweiterung hochgefahren. Nach der Einführung neuer Modelle führt das Unternehmen jetzt zwei neue Funktionen ein: Audio Overview, das Dokumente und PDFs in podcastähnliche Diskussionen verwandelt, und Canvas, ein kollaborativer Arbeitsbereich für nahtlose KI-gestützte Interaktionen.
Audio Overview wird von Googles NotebookLM-Modell angetrieben, einem spezialisierten KI-Assistenten mit fortschrittlicheren Dokument- und Webanalysefunktionen als Gemini. Dieses Modell treibt auch Spotifys 2024 Recap an.
Audio Overview dehnt sich auf Deep Research aus
Google hat Audio Overview letztes Jahr mit Daily Recap eingeführt. Damit können Nutzer/innen KI-gestützte Zusammenfassungen im Podcast-Stil aus Webquellen und Artikeln erstellen. Jetzt wird die Funktion mit Deep Research, das vor kurzem in Gemini integriert wurde, auf Dokumente, einschließlich PDFs und Forschungsarbeiten, ausgeweitet.
Nutzer/innen können auf die Audio-Übersicht von Deep Research direkt in der Gemini-App auf dem Handy zugreifen. Nachdem Ihr eine Studie oder ein Forschungsdokument erstellt habt, tippt Ihr auf die Datei und wählt im Menü "Audio Overview erstellen" aus, um die Funktion zu aktivieren. Die gleiche Funktion ist auch über Deep Research im Internet verfügbar.
Zurzeit ist die Erstellung von Audio Overview aus Dokumenten auf Deep Research auf dem Handy und im Web beschränkt. Wir haben die Funktion in der Gemini-App getestet, aber sie funktionierte nicht vollständig, obwohl eine Meldung anzeigte, dass ein Audio Overview erstellt wurde. Es ist wahrscheinlich, dass Google die Unterstützung in naher Zukunft erweitern wird. Die Funktion wird bereits für Nutzer von Gemini und Gemini Advanced eingeführt, ist aber zurzeit nur auf Englisch verfügbar.
Gemini wird kollaborativ
Canvas ist eine wichtige Ergänzung zu Gemini, einem kollaborativen Arbeitsbereich, der für die Bearbeitung von Dokumenten in Echtzeit, interaktive Codierung und KI-gestützte Vorschauen entwickelt wurde.
Bei textbasierten Projekten können die Nutzer/innen Dokumente entwerfen und bearbeiten und dabei die Feinabstimmungswerkzeuge von Gemini nutzen, mit denen sie den Tonfall anpassen, Sätze kürzen und den Stil ändern können. Außerdem bietet Gemini Bearbeitungsvorschläge, um die Qualität des Textes zu verbessern. Canvas-Ausgaben können auch für die Zusammenarbeit über Google Docs freigegeben werden.

Mit Canvas erweitert Google auch die Codierungsfunktionen von Gemini. Der Arbeitsbereich ermöglicht es Nutzern, Code direkt zu generieren, in der Vorschau zu betrachten und zu testen, sodass keine separaten Simulatoren oder Coding-Apps mehr benötigt werden. Zu den unterstützten Formaten gehören Webanwendungen wie HTML und React, Python-Skripte, Spiele und andere Simulationen.
Außerdem kann Canvas ein wertvolles Werkzeug für das Erlernen von Code sein, da es in Echtzeit Einblicke und Erklärungen zu bestimmten Code-Strings und -Snippets liefert. Canvas ist jetzt auf Gemini Web sowohl für Basic- als auch für Premium-Nutzer verfügbar. Es unterstützt alle Sprachen, in denen Gemini-Apps derzeit angeboten werden.
Während die neuen Gemini-Upgrades die KI flexibler machen, erhöhen sie auch die Komplexität des Gesamterlebnisses, sodass es sich im Vergleich zu einem einzelnen Chatbot wie ChatGPT weniger schlank anfühlt. Nichtsdestotrotz bringen diese Features wertvolle Funktionen mit sich. Aber was denkt ihr? Wir würden gerne wissen, was ihr über diese neuen Funktionen denkt!
Quelle: Google