A·network 21 - Künstliche Intelligenz

Von Grafiker61 - Eigenes Werk, CC-BY-SA 4.0, commons.wikimedia.org Besonders hervorgehoben hatte sich Deepmind vor allem durch den Sieg gegen den AlphaGo-Weltmeister. Aber auch das Senden der Kühlungskosten von Googles Rechenzentren oder die Imitation der menschlichen Stimme ließen von sich hören. In einem weiteren Projekt hat man die künstliche Intelligenz nun gegen Lippenleser antreten lassen und hat diese deutlich in den Schatten gestellt: Mit einem Training von „nur“ etwa 5.000 Stunden Videomaterial haben die Algorithmen das Lippenlesen gelernt und konnten danach fast jedes zweite Wort korrekt erkennen. Selbst Experten auf diesem Gebiet kamen nur auf eine sehr viel niedrigere Erkennungsrate und konnten gerade einmal ein Viertel von Deepminds Erkennungsrate erreichen. Nach dem Training beherrschte das System gut 17.500 Wörter. Trainiert wurden die Systeme mit 5.000 Stunden Videomaterial der BBC, in denen Menschen direkt in die Kamera sprechen – wie etwa beim Frühstücksfernsehen oder Nachrichten. Nach diesem Training hat man dem System dann andere Folgen vorgesetzt, und es konnten 46,2 Prozent aller gesprochenen Wörter korrekt erkannt werden – und das völlig ohne Audiospur. Damit hat die KI selbst in einem so frühen Stadium gezeigt, dass sie dem Menschen in so sensiblen Bereichen schnell überlegen sein kann. Beeindruckend ist aber nicht nur die Erkennungsrate, sondern auch die Tatsache, dass sich die KI diese Fähigkeit komplett selbst beigebracht und nur mit passendem Bild- und Tonmaterial trainiert hat. Dies erforderte allerdings noch einige Vorarbeit der Entwickler, denn die Tonspuren der Originale waren um einige Millisekunden verschoben und sorgten so für falsche Ergebnisse. Nach dieser Behandlung war das Material aus den Jahren 2010 bis 2015 dann für die KI nutzbar. Mit dieser Trefferquote stellt Deepminds Technologie aber nicht nur die Menschen in den Schatten, sondern auch alle bisherigen Bemühungen anderer Forschungseinrichtungen wie der Uni Oxford mit ihrem LipNet-Programm. Mit diesem erreicht man eine Trefferquote von über 93 Prozent – allerdings mit einem Wortschatz von gerade einmal 51 Wörtern. Deepmind hingegen kommt im Selbst-Training auf über 17.000 Wörter und hat dadurch eine deutlich höhere Quote. • www.deepmind.com © www.fotolia.com, Christos Georghiou © www.fotolia.com, sakkmesterke ·content ·network ·challenge ·robotxmassong ·donation ·editorial ·disruption ·robolawyer ·ethics ·history ·personalrobot ·newera zurück vor drucken ·feedback impressum ·deepmind

RkJQdWJsaXNoZXIy MTY4OTg4MA==