Der Vortrag stellt fortgeschrittene linguistische Methoden des politisch motivierten Internetmonitorings vor. Er gibt keine Anleitung, wie man sich der Überwachung wirkungsvoll entziehen kann, denn das ist ohnehin zwecklos.
Nach den Enthüllungen von Edward Snowden träumten nicht wenige Netzaktivisten davon, mit Hilfe eines "Keyword-DDoS" das Überwachungssystem der NSA unbrauchbar machen zu können. Durch das wahllose Einfügen von Wörtern in E-Mails, die beim Monitoring als Indikatoren für relevante Inhalte verwendet werden, sollte das Überwachungssystem des amerikanischen Auslandsgeheimdienstes überlastet werden. Solche Pläne zeigen, dass die Vorstellung verbreitet ist, die Suche nach für die Nachrichtendienste Interessantem funktioniere vorwiegend über eine Schlagwortsuche. Dabei gibt es längst sehr viel mächtigere Methoden aus dem informatischen Information Retrieval und Text Mining, um große Textmengen effizient nach Inhalten zu durchsuchen. Einige davon möchte ich in meinem Vortrag vorstellen. Zunächst werde ich einige grundlegende computerlinguistische Analysekategorien einführen (Kollokationen, n-Gramme, semanitsche Taxonomien etc.) und dann an ausgewählten Beispielen ihre Anwendung zur Identifizierung von Personen, Themen, Ideologien und Überzeugungsgraden illustrieren.