Die Federal Computer Week berichtet in
Rutgers will lead DHS-financed info research über ein weiteres Data-Mining Projekt, das neben der Analyse von E-Mails, Agenturmeldungen, Chatlogs auch auf die Überwachung und Analyse von Weblogs zielt. Das Projekt wird laut der
Ankündigung des U. S. Heimatschutzministeriums (DHS) vom 25. Juli über die nächsten drei Jahre mit insgesamt 10,2 Millionen US$ gefördert.
Die ersten drei Millionen gehen dieses Jahr an die Rutgers Universität, die bereits seit 2002 intensive Sicherheitsforschung im Rahmen der
Rutgers University Homeland Security Research Initiative (RUHSRI) betreibt, die ihrerseits durch Forschungsgelder der National Science Foundation (NSF) aufgrund des
Knowledge Discovery and Dissemination (KDD) Programms finanziert wurde.
Das KDD Programm ist ein Bestandteil einer
ganzen Reihe von Forschungsprojekten, die seit 2002/2003 in Zusammenarbeit mit allen US-Geheimdiensten durchgeführt werden, um u. a. Anwendungen für die Geheimdienste zu entwicklen, die dem Monitoring, dem Data-Mining und der Analyse aller Publikationen und Kommunikationen im und über das Internet dienen.
Das
Center for Discrete Mathematics and Theoretical Computer Science (DIMACS) der Rutgers Universität wird aufgrund seiner jahrelangen Erfahrungen zur Durchführung des DHS-Programms ein Forschungskonsortium führen, das Wissenschaftler der Texas Southern University, des Rensselaer Polytechnic Institute, der AT&T Labs, der Bell Labs und der Princeton University umfasst. Daneben werden neben der Rutgers Universität an drei weiteren Universitäten Forschungszentren eingerichtet.
Begleitet wird das Forschungsprogramm vom
Institute for Discrete Sciences des Heimatschutzministeriums und den angeschlossenen militärischen Forschungseinrichtungen, an dem in Projekten wie
A Multi-Agent architecture for Streaming Text Analysis mittels Clustering, Parallel Computing, statistischen Methoden und Textanalytik ebenfalls neue Methoden und Techniken für Überwachungs- und Data-Mining-Anwendungen erforscht werden.
Zu den Zielen des Forschungsprogramms heißt es im FCW Artikel und den Pressemitteilungen, dass damit neue Techniken entwickelt werden sollen, um in riesigen und sich schnell verändernden Datenbeständen öffentlicher Quellen wie Nachrichtenmeldungen und Weblogs Muster und Beziehungsgeflechte zu erkennen, die auf terroristische Aktivitäten der Teilnehmer hindeuten oder als Indikatoren für terroristische Aktivitäten dienen können. Dazu zählt auch die Identifizierung und das Profiling wichtiger Autoren und die Zuordnung ihrer Inhalte, die sich über verschiedene Quellen verteilen. In der eigenen
Pressemitteilung erklärt das DIMACS zum Forschungsprogramm und dem Konsortium:
This group will develop computing technologies that find patterns and relationships in data, such as news stories, open-source web logs, and other accessible information, to quickly identify emerging indicators of possible terrorist activity, and rate the consistency and reliability of the sources. Such information could give officials more lead time to investigate and potentially thwart terrorist plans.
"The challenge involved in this endeavor is not only the massive amount of information out there, but also how quickly it flows and how fast the sources of information change," said Fred Roberts, director of DIMACS. "We will develop real-time streaming algorithms to find patterns and relationships in communications, such as among writers who may be hiding their identities, and to rate information sources for their reliability and trustworthiness."
Die beiden interessantesten DIMACS NSF-KDD Forschungsprojekte, deren Ergebnisse wohl in das DHS-Programm einfließen werden, sind die Programme
Authorship Attribution (AUTHOR-ID) und
Monitoring Message Streams: Retrospective and Prospective Event Detection (MMS).
Bei AUTHOR-ID geht es darum, speziell die Autoren hinter anonymen Quellen und Dokumenten zu identifizieren, also z. B. auch die Personen, die anonym Weblogbeiträge (oder Kommentare) verbreiten oder anonyme Weblogs führen:
Das MMS Programm dient dazu, alle Publikations- und Kommunikationsformen bei hohem Datenverarbeitungsaufkommen, inklusive Weblogs, automatisch auszuwerten, um Beziehungs-, Kommunikations- und Meinungsmuster, gebildete
Gruppierungen und sich ankündigende Ereignisse auszufiltern und zu detektieren, die für die Geheimdienste von Interesse sind. Die meisten Dokumente zu MMS sind öffentlich nicht zugänglich und die zugänglichen Dokumente beziehen sich immer nur auf E-Mail Datenströme, die überwacht werden sollen. Das dem nicht so ist, zeigt eine
bestimmte Präsentation zu MMS, aus der ich einige Folien wiedergebe:
Damit soll es mit der Vorstellung von Data-Mining und Monitoring Programmen zur Überwachung und Kontrolle von Weblogs und sozialen Netzen auch gut sein, denn wie aktuelle und ähnliche Programme (siehe
SMS Spionage,
Web 2.0 Überwachung in Europa,
Weblogs auf dem Informationsradar,
Immer wieder TIA,
Big Brothers und das Web 2.0) klar und eindeutig erkennen lassen, steht die gesamte Welt der Weblogs und sozialen Netzwerke spätestens seit 2001 unter Beobachtung und Überwachung, die umso massiver wird, je weiter technische und wissenschaftliche Fortschritte zu verzeichnen sein werden. Die Einflußnahme und Kontrollmöglichkeit staatlicher Datenschützer bei Programmen, die praktisch fast ausschließlich in der Sphäre der Geheimdienste angesiedelt sind, halte ich für äußerst gering.
Für Blogger, die nur über ihre Katzen schreiben, mag das noch zu ignorieren sein (obwohl auch die den Datenverarbeitungsprozess in den Zentren der Sicherheits- und Geheimdienstbehörden durchlaufen und dann halt in Datenbanken für Subjekte und Inhalte von sekundärem Interesse landen), nicht aber für alle Personen und Blogger, die politische oder gesellschaftskritische Themen bearbeiten und Positionen vertreten, die gegen den Mainstream und politischen Konsens stehen. Deshalb ist es auch geboten, über den
Schutz der Openness-Welt vor dem Datenhunger der Antiterrorkrieger intensiv nachzudenken.
Bevor man jemanden "abholen" kann, muss man wissen, wen man abzuholen hat.
Dazu passend:
Kieler Justizminister kritisiert Anonymisierungsdienst AN.ON / JAP. Der gleiche Angriff richtet sich damit auch gegen Tor, Remailer und alle anderen anonymisierenden Plattformen.
Nicht nur Bürger, Universitäten, Unternehmen, derzeitige Geheimdienste und Militärs sind für das Data-Mining des Internets und der Medien zwecks Antiterrorkampf zuständig, sondern auch altgediente Pensionäre und Veteranen, die sich in der klandestinen Ver
Tracked: Nov 26, 12:29