globalise

Atreus is a globalise brand

Globalise – The Global Interim Management Group – enables you to solve tough business challenges. Individually selected from our managed network of thousands of experts worldwide, our managers will rapidly and accurately understand your situation and achieve your specific goals: quickly, reliably and always successfully. Wherever you are in the world and whatever it takes.

// Find out more
globalise
0
‹ Zurück
© www.fotolia.com, high_resolution
Deepmind:
Google-KI kann jetzt
auch Lippen lesen

Das Atreus Online Magazin für Interim Management
Ausgabe 21 | Dezember 2016

Die Google-Tochter Deepmind konzentriert sich ausschließlich auf den Bereich der Künstlichen Intelligenz. Dabei hat sie bereits mehrmals beeindruckende Beispiele für die Fortschritte der intelligenten Algorithmen geliefert. Googles Künstliche Intelligenz kann nun auch Lippen lesen und hat dabei eine erstaunlich hohe Trefferquote.  

Besonders hervorgehoben hatte sich Deepmind vor allem durch den Sieg gegen den AlphaGo-Weltmeister. Aber auch das Senden der Kühlungskosten von Googles Rechenzentren oder die Imitation der menschlichen Stimme ließen von sich hören.

In einem weiteren Projekt hat man die Künstliche Intelligenz nun gegen Lippenleser antreten lassen und hat diese deutlich in den Schatten gestellt: Mit einem Training von „nur“ etwa 5.000 Stunden Videomaterial haben die Algorithmen das Lippenlesen gelernt und konnten danach fast jedes zweite Wort korrekt erkennen. Selbst Experten auf diesem Gebiet kamen nur auf eine sehr viel niedrigere Erkennungsrate und konnten gerade einmal ein Viertel von Deepminds Erkennungsrate erreichen. Nach dem Training beherrschte das System gut 17.500 Wörter.

Trainiert wurden die Systeme mit 5.000 Stunden Videomaterial der BBC, in denen Menschen direkt in die Kamera sprechen – wie etwa beim Frühstücksfernsehen oder Nachrichten. Nach diesem Training hat man dem System dann andere Folgen vorgesetzt, und es konnten 46,2 Prozent aller gesprochenen Wörter korrekt erkannt werden – und das völlig ohne Audiospur.

Foto links: © www.fotolia.com, sakkmesterke; Foto rechts:© www.fotolia.com, Christos Georghiou, Foto HAL9000 rechts: Von Grafiker61 - Eigenes Werk, CC-BY-SA 4.0, commons.wikimedia.org

Damit hat die KI selbst in einem so frühen Stadium gezeigt, dass sie dem Menschen in so sensiblen Bereichen schnell überlegen sein kann.

Beeindruckend ist aber nicht nur die Erkennungsrate, sondern auch die Tatsache, dass sich die KI diese Fähigkeit komplett selbst beigebracht und nur mit passendem Bild- und Tonmaterial trainiert hat. Dies erforderte allerdings noch einige Vorarbeit der Entwickler, denn die Tonspuren der Originale waren um einige Millisekunden verschoben und sorgten so für falsche Ergebnisse. Nach dieser Behandlung war das Material aus den Jahren 2010 bis 2015 dann für die KI nutzbar.

Mit dieser Trefferquote stellt Deepminds Technologie aber nicht nur die Menschen in den Schatten, sondern auch alle bisherigen Bemühungen anderer Forschungseinrichtungen wie der Uni Oxford mit ihrem LipNet-Programm. Mit diesem erreicht man eine Trefferquote von über 93 Prozent – allerdings mit einem Wortschatz von gerade einmal 51 Wörtern. Deepmind hingegen kommt im Selbst-Training auf über 17.000 Wörter und hat dadurch eine deutlich höhere Quote. 

 

Google Deepmind


© Handelsblatt GmbH. Alle Rechte vorbehalten.   

DIESER ARTIKEL IST IN DER FOLGENDEN GESAMTAUSGABE DER A.NETWORK „Künstliche Intelligenz“ ERSCHIENEN

Künstliche Intelligenz

Während Unternehmen ihren Weg in die digitale Transformation suchen und sich alles um Industrie 4.0 dreht, kündigt sich bereits die nächste Revolution an, der Aufbruch in die Ära der künstlichen Intelligenz (KI) – das Schlüsselthema in der nahen Zukunft. Lesen Sie hierzu die aktuelle A.network Ausgabe.

Während Unternehmen ihren Weg in die digitale Transformation suchen und sich alles um Industrie 4.0 dreht, kündigt sich bereits die nächste Revolution...