OmniRom: Hotwords frei nach Laune vergeben
Die Sprachsteuerung des Android-Handys über “Ok, Google” ist ein tolles Feature, steckt aber noch in den Kinderschuhen. Warum nicht eigene Hotwords zur Aktivierung wählen oder den Aktivierungschritt einfach gleich streichen? Dank des Custom-ROMs OmniRom ist das so gut wie Realität.
Hier ist ein gutes Beispiel dafür, wie Custom-ROMs doch häufig die Originalfunktionen der Hersteller verbessern. Google bietet uns mit “Google Now” die Möglichkeit, das Smartphone anzusprechen, sodass es die Öhrchen spitzt und auf Kommandos wartet. Auf dem Moto X geht dies sogar aus dem Schlaf heraus. Aktuell ist man jedoch an Googles sprachliche Formatvorgabe gebunden. Das ist keine Schande, selbst auf dem Raumschiff Enterprise muss der Bordcomputer mit der fixen Formel “Computer” angesprochen und aufgeweckt werden.
Was die Ingenieure des 24. Jahrhunderts angeblich nicht konnten, schafft der Android-Entwickler Guillaume Lesniak im 21. Dank seiner Arbeit wird es OmniRom-Nutzern bald möglich sein, die Hotwords, mit denen sie ihr Smartphone aufwecken, frei zu wählen. Aber nicht nur das. Mit den jeweiligen Hotwords können direkte Aktionen assoziiert werden, wie Lesniak in dem Video unten demonstriert. So könnte ein “Hallo Kamera” nicht nur das Smartphone wecken, sondern gleichzeitig die Kamera-App starten.
Link zum Video
Zukunftsfähig ist das allerdings eher weniger, vor allem, wenn wir uns eine Zukunft vorstellen, in der jeder andauernd mit seinem Smartphone spricht. Da wird eine fixe universelle Formel unumgänglich sein, sodass das technologische “Selbstgespräch” immer und für jeden klar abgegrenzt ist von Anreden und anderen, echten kommunikativen Akten.
Noch ist die Hotword-Personalisierung scheinbar nicht frei erhältlich, jedoch sollte sie schon sehr bald via Nightlies nutzbar werden. Was haltet Ihr von der Idee?
Via: Android Authority Quelle: Twitter
"Da wird eine fixe universelle Formel unumgänglich sein, ..." - Ich sehe das genau anders herum. Eine individuelle Eingabe wird unumgänglich sein. Stell dir mal vor alle stehen sie in der Bahn nebeneinander und dann sagt jemand: OK Google, stelle den Wecker auf 13:00 Uhr. Und zack haben die 5 Leute neben dir einen unerwünschten Wecker eingestellt.
Beim Moto X funktioniert die Personenkennung schon ganz gut, wenn auch noch nicht perfekt. Mittlerweile kann nur ich das Gerät aufwecken. Egal ob Mann oder Frau, nur bei mir lauscht mein Moto X den Befehlen welche ich gebe. Hat aber etwas gedauert. Aber nach etwa 1 Woche Nutzung hat sich das Gerät offenbar auf mich eingestellt.
Sehe ich genauso. Allerdings wird eine individuelle Eingabe nur auf Basis eines eigenen Keywords auch nicht sinnvoll sein - Sprecher-Erkennung ist wirklich ein Muss, wenn´s massentauglich sein soll.
Ich denke auch, dass Motorola mit dem Moto X die Richtung vorgegeben hat, und nun geht es daran all das zu verbessern, auszubauen und massentauglich zu machen.
Denn auch beim Moto X hängt es offenbar von der Stimme der Person ab. Ein Freund hat den Fall, dass sein Sohn eine sehr ähnliche Stimme hat und hier das Moto X meist auch den Sohn erkennt.
Natürlich müssen hierzu die Mikrophone noch viel sensibler werden.
> Natürlich müssen hierzu die Mikrophone noch viel sensibler werden.
Vor allem muss die Stimmerkennungssoftware in dieser Richtung weiterentwickelt werden - aber Du hast Recht, ohne ordentliche Mikrofone, die die Stimme in HD (oder mehr) aufnehmen und entsprechend saubere Signale an den DSP liefern können, braucht man sich über Sprecher-Unterscheidungen kaum Gedanken zu machen.
@Marius: Wie schon von anderen gesagt: Die Erkennung der individuellen Stimme habe ich jetzt mal als künftige Technologie vorausgesetzt. Ohne die geht es natürlich nicht, da hast du recht. Aber wie gesagt, das Moto X gibt die Marschrichtung ja schon vor.
OK, ich wusste nicht das das scheinbar schon so gut funktioniert.
@Marius: Naja, NOCH ist es meiner Kenntnis (und unseren Tests) nach weit von ausgereift. ABer immerhin hat Motorola schon mal den Versuch unternommen, seinem Smartphone die Fähigkeit zu geben, auch zwischen Stimmen zu unterscheiden. Von daher wird das sicherlich auch weiter entwickelt und, so würde ich vermuten, zum Standard werden.
Ich hab grad "OK Google, öffne AndroidPIT" benutzt um hier her zu kommen. Und dann das
Den letzten Absatz kann ich auch überhaupt nicht nachvollziehen. Ist doch nur noch Spekulation in Reinstform.
@Shay Ode: Würde ich gar nicht mal sagen. Siehe meinen Kommentar zu oleg g. Denk mal drüber nach.
Den letzten Absatz kann ich nicht unterschreiben. Schon heute ist es möglich Stimmen zu personifizieren (dringender James Band Nachholbedarf bei AP!)... Nein ernsthaft, wenn es massentauglich gemacht wird wird es auch nicht speziell teuer werden. Dafür müssen lediglich die Mikrophone noch ein bisschen besser werden und die Software adaptiert werden.... Kann mir das für highend Geräte in 2-3 Jahren durchaus vorstellen :-)
@oleg g. Ich weiß jetzt nicht genau, worauf du anspielst (kein Fan des modernen Bonds ;->). Aber da du von "Stimmenpersonifizierung" sprichst (ich vermute, du meinst Personalisierung?): Mir ging es in dem Absatz auch nicht darum, dass nur bestimmte Personen bestimmte Geräte ansprechen können. Es ging mir darum, dass wir in der Lage sein müssen in der Öffentlichkeit die eine "Kommunikation" (mit dem Smartphone) von der anderen Kommunikation (mit der Umwelt) abzugrenzen. Niemand soll verwirrt sein, komisch gucken oder sich angesprochen fühlen müssen, wenn ich mit meinem Smartphone spreche. Wenn es ein für jeden sofort erkennbares Hotword gibt (sagen wir "Ok Google"), dann wird sich die Allgemeintheit daran gewöhnen, dass dieses die folgenden Worte auf eine andere Ebene hebt.
Es ist wie Textlinks. Wenn ich als erfahrener Internet-Leser einen Text lese in dem steht "... wie wir hier erklärt haben...", und das "hier" ist verlinkt, dann gucke ich nicht mehr komisch und suche in dem Satz nach dem, worauf sich das "hier" bezieht. Ich habe mich dran gewöhnt, dass ein farblich abgehobener Text, der auf etwas Unsichtbares zu verweisen scheint, eine Meta-Ebene markiert.
Oder wenn jemand mit einem Handy am Ohr mit einem "Unsichtbaren" spricht, dann verwirrt das heute auch niemanden mehr, weil es einen visuellen Marker gibt (das Handy). So muss das mit der Kommunikation mit dem Smartphone selbst auch werden. Und das erfordert in der Praxis wahrscheinlich eine Art universelles, akustisch identifizierbares Signal, ein Hotword. Wenn jeder wahllos und auf individuelle Art mit dem Handy spricht, kann sich die Gesellschaft daran nicht so einfach gewöhnen und diese Art Kommunikation in ihr Leben integrieren, weil der Marker fehlt (es sei denn, du willst das Gerät wirklich immer direkt vor den Mund halten, aber das muss ja nicht sein)
Ich sehe genau einen Sinn in Voice-Steuerungsverfahren: Autofahren und damit bezogen Navigation! Das ganze muss nur soweit gehen, dass man das Handy gar nicht mehr anfassen muss. Für Telefonieren klappt das zB ja schon ganz gut ...
Beim Moto X ist das großteils schon Realität. Ich kann mit dem Moto X Anrufe tätigen auch wenn ich in 2m Entfernung zum Gerät bin. Auch der Lautsprecher wird aktiviert und so kann ich bequem telefonieren. Auch SMS oder Neuigkeiten vorlesen lassen sich so realisieren.
ich nutze das vor allem zu hause wenn ich mit den Kindern "beschäftigt" bin und schnell mal Nachrichten checken oder einen Anruf tätigen möchte.
ich finde die Idee echt gut. vorallem weil "Ok, Google" nicht wirklich persönlich klingt.
Ich würde zb viel lieber "Ok, Z1" o.a. als Hotword haben wollen xD
Habe zwar bisher immer alles sprachbezogene deaktiviert, stelle es mir aber lustig vor in der Bahn zu sitzen und jemand aktiviert recht laut seinen mp3 Player und plötzlich schallt es aus allen Ecken... höhö flashmobbing ungewollt
Jetzt sprechen wir schon mit unseren Telefonen