15 Oktober 2013

Spracherkennung und Big Data

In einem TED-Video (1) zeigen Eric Berlow und Sean Gourley, wie sich auf YouTube veröffentlichte TED-Vorträge auf gemeinsame Ideen, Themen und Konzepte durchsuchen lassen, Gemeinsamkeiten und Verbindungen herausgefunden, analysiert und angezeigt werden können. Zur Transkription der Vorträge wird Spracherkennung verwendet, die zumindest die wesentlichen Schlagwörter findet. Die solcherart ausgewerteten Vorträge können dann nach verschiedenen Kriterien visualisiert werden - Themen, Interessenten, Gemeinsamkeiten und Verbindungen zwischen Themengruppen, zentralen Vorträgen zu einem Thema und Außenseitern, sogar nach Geschlecht und Alter der Interessenten.

Der Link zu Video stammt aus dem Blog einer Marketing-Agentur. War ja klar, dass den Leuten als erstes einfällt, dass sie uns mit Hilfe von Big Data noch mehr verkaufen können.

Geauso interessant ist, dass sich Privatsphäre im Internet als ein wesentliches Thema der letzten Zeit hearuskristallisiert - zwar wenig überraschend, doch zeigt diese Methode der Datenauswertung, wie viel heute an Wissen aus scheinbar verstreuten, heterogenen Quellen zusammengetragen werden kann, und dass von einer "virtuellen Privatsphäre" im Netz nicht mehr die Rede sein kann. Schon die Metadaten, d.h. die reinen Aussagen über die Verbindungen, können unabhängig vom Inhalt ausreichen, potentielle Verdächtige einzukreisen. Dass Spracherkennung dann potentiell auch zur Überwachung eingesetzt werden kann, habe ich ja schon beschrieben.


(1) Wer TED nicht kennt: Die Website verspricht (zu Recht) "Ideas worth spreading" und zeigt zahlreiche wissenschaftliche Vorträge zu aktuell relevanten Themen aus so ziemlich allen Gebieten. Die jährliche Konferenz ist inzwischen ein Riesen-Event geworden, das in Stunden ausverkauft ist - trotz astronomischer Eintritte, zu denen ja auch noch die Anreise kommt. Dafür erhält man Einblick in Themen, die jetzt schon gesellschaftlich, politisch oder technisch relevant sind, oder es demnächst werden, oder die neue Entwicklungen aufzeigen und forcieren - nichts, was man auf der Arbeit aufrufen sollte also.

Keine Kommentare: