Nvidias KI macht aus Gekritzel fotorealistische Bilder
Nvidia hat eine neue KI vorgestellt, die aus einfachen Linien und Flächen fotorealistische Landschaften basteln kann. Die ist in einem simplen Programm verpackt, dass den Charm von Microsoft Paint hat. Ihr könnt dem neuesten Gekritzel Eures Kindes nichts abgewinnen? Dann lasst doch eine herzlose KI aus der wunderschönen Erinnerung etwas Sehenswertes machen.
Doch gleich vorweg: Nvidias KI kann nicht aus jedem noch so abstrakten Gekritzel eine schöne Landschaft machen. Die Künstliche Intelligenz geht hier nach einer bestimmten Methode vor. Zunächst bekommt der "Künstler" am Computer eine weiße Leinwand, auf der er mit Strichen und Füllwerkzeugen im Paint-Stil zeichnen kann. Die Linien und einzelnen Segmente versteht die KI als Anleitung für die Komposition und verwandelt je nach gewählten Farben die Striche und Flächen in eine fotorealistische Abbildung.
Dafür wurde das von Nvidia entwickelte neuronale GAN-Netzwerk (GauGAN) mit Millionen von Landschaftsaufnahmen aus der Fotoplattform Flickr gefüttert. Doch die KI setzt hier nicht etwas einzelne Bildausschnitte zusammen, sondern erschafft eine eigene Komposition und damit von Grund auf neue Bilder.
Damit das gelingt, hat die KI typische Zusammenhänge aus den Trainingsdaten extrahiert. So zeigt sich auf einem stillen See die Reflexion der Berge dahinter und bei einer schneebedeckten Landschaft, erscheint der Himmel eher gräulich und die Bäume tragen keine Blätter.
Schneller Rechner von Vorteil
Auch wenn die KI-App an eine noch rudimentärere Variante von Microsoft Paint erinnert, braucht sie doch einiges an Rechenpower. Nvidia nutzt hier eine Tensor-Recheneinheit und eine RTX-Titan-Grafikkarte. Sie lässt sich zwar auch auf schwächeren Rechnern einsetzen, benötigt dann aber deutlich länger für die Berechnung.
Natürlich hat Nvidia nicht vor, einen KI-Maler ins Leben zu rufen. GauGAN soll in Zukunft eine Erleichterung bei der Entwicklung virtueller Welten sein und aus Entwürfen von Architekten und anderen Zeichnungen erste Basis-Modelle für Spielewelten erstellen oder Trainingsumgebungen für selbstfahrende Autos kreieren. Eine öffentlich verfügbare Version soll es bald geben.
Quelle: Nvidia
Hmm... sieht einfach aus als versuche das System in die Farbflächen die Grundzüge eines Landschaftsbildes hineinzuinterpretieren, um dann anschließend mit entsprechenden Texturen/Generatoralgorithmen ein passendes zu basteln. Das mag mit den Methoden maschinellen Lernens trickreicher/besser gehen als mit anderen, aber ich bilde mir ein sowas im Prinzip schon vor etlichen Jahren mal gesehen zu haben. Noch ganz ohne "KI". Wobei das aktuelle Verfahren, auch wenn experimentell, sicherlich leistungsfähiger ist :)
Ja, man kann viele Probleme, die man bereits mit anderen Mitteln bearbeitet hat, auch mit Methoden des maschinellen Lernens angehen. Kann sinnvoll sein und bessere Ergebnisse liefern, oder auch nicht. Und nachdem heutzutage immer leistungsfähigere Hardware verfügbar ist und für komplexe Probleme der Mustererkennung Lösungswege gesucht werden, werden in vielen Bereichen heute Ansätze mit Methoden des maschinellen Lernens gesucht bzw. solche genutzt. Ob das dann immer zweckmäßig ist sei dahingestellt, aber sicherlich kommt es auch zu interessanten neuen Lösungen.
Nur dass der Begriff "KI" jetzt überall bei Endverbrauchern rumgeistert ist dann doch eher ein Erfolg der Marketing- denn der Entwicklungsabteilungen.
Solange die KI mir nicht Helene Fischer zeigt, wenn ich Frankenstein kritzel , ist alles perfekt.😁
Oder umgekehrt 😆
Oder genauer: Frankensteins Monster. Denn Viktor Frankenstein selbst war gar nicht so hässlich.