Shane Harris berichtet im National Journal Artikel
Terrorist Profiling, Version 2.0 über das TANGRAM System, dessen Entwicklung vom US-Verteidigungsministerium im Oktober 2006 gestartet wurde. Die im Artikel erwähnten Dokumente wurden bei Cryptome bereits am 26. September auf der Seite
TANGRAM Intelligence Program veröffentlicht.
Auf der Seite der vergebenen Aufträge des US-Verteidigungsministeriums
vom 25. September wird TANGRAM kurz als "vollautomatisches, kontinuierlich arbeitendes Analsysesystem für Geheimdienstinformationen" beschrieben.
An die Firma Booz Allen Hamilton ist für TANGRAM ein Zuschlag über 6613354 US$ ergangen. Booz Allen Hamilton war einer der Vertragspartner des
Total / Terrorist Information Awareness (TIA) Forschungsprojekts und wurde von der CIA und dem U. S. Handelsministerium damit
beauftragt, beim SWIFT Programm eine "Datenschutzaufsicht" auszuüben. Laut des Harris-Artikels wurden für TANGRAM bis jetzt Aufträge über 12 Millionen US$ vergeben, die neben Booz Allen Hamilton an
SRI International und
21st Century Technologies gingen – die Gesamtkosten wurden mit 49 Millionen US$ veranschlagt.
Auf der Auftragseite steht weiter, dass die Ausschreibungen für TANGRAM im September 2005 begannen und im September 2006 abgeschlossen wurden. Die Verträge werden wiederum mit dem Air Force Research Laboratory (AFRL) abgeschlossen, dessen
Informationsabteilung regelmäßig an der Entwicklung von Data-Mining Programmen beteiligt ist, wie aus den
Pressemiteilungen zu Auftragsvergaben hervorgeht. Die Arbeiten zu TANGRAM sollen 2010 vollendet sein.
In dem
Informationspaket für Unternehmen (
Quelle), die sich an TANGRAM beteiligen wollen, wird in der Einführung auf die vorangegangenen Data-Mining Projekte und ihre Erfolge eingegangen. Darunter das AQUAINT (Advanced Question Answering for Intelligence) und
NIMD (Novel Information for Massive Data) Programm der
ARDA / DTO Forschungseinrichtung der US-Geheimdienste und
TOPSAIL, die als Fortsetzungen und Weiterentwicklungen des TIA Projkets eingeschätzt werden.
Als letzte größere Anstrengung vor TANGRAM zur Entwicklung von Data-Mining Programmen, die dazu dienen, vielfältige Datenquellen und große Datenvolumen auszuwerten, um darin mit verschiedenen Analysealgorithmen Muster zu finden, die Terrorverdächtige, Terrornetzwerke und ihre Führer erkennen sollen, nennt das Informationspaket das "Evidence Assessment, Grouping. Linking and Evaluation" Projekt oder kurz EAGLE, das im Jahr 2005 abgeschlossen wurde und neuartige Algorithmen und Methoden hervorgebracht habe, um Personen, Aktivitäten und Verhaltensmuster nach dem "guilt-by-association" Modell in Verbindung zu bringen.
Das Modell geht von Personen aus, die über vorherige Ermittlungen und Analysen eindeutig als Terroristen oder Terrorverdächtige identifiziert wurden (sogenannte "seed entities"), ermittelt und analysiert dann alle Verbindungen, die diese Person zu anderen Personen aufweist, weist dann nach Typ und Grad der Verbindung zur "seed entity" den Personen Schätzwerte zu, die wiedergeben, wie verdächtig sie sind, um so Terrornetzwerke und Terrorverdächtige zu identifizieren.
Im Abschnitt "Forschung zur Schließung der Informationslücken - Bereiche von Interesse" werden die Probleme aufgezeigt, mit denen bisherige Data-Mining Programme nach dem obigen Modell zu kämpfen haben.
Sie sind zum Beispiel noch nicht in der Lage, aus den analysierten Daten Information zu gewinnen, die akkurat normale Verhaltensmuster von scheinbar normalen Verhaltensmustern bei Personen unterscheiden und Aussagen zulassen, dass eine Verhaltensänderung normal, unnormal, verdächtig oder auf bewuste Täuschung ausgelegt ist. Da viele Systeme von zuvor definierten, statischen Verhaltensmustern ausgehen, die "typisch" sein sollen, ist es schwer, überhaupt Verhaltensänderungen als solche zu erkennen, wenn sie nicht vom statischen Raster erfasst werden oder das System nicht in der Lage ist, selbstständig neue Verhaltenmuster zu "erlernen".
Es ist ihnen nahezu unmöglich, "neue Terroristen" zu erkennen, die zuvor noch nie in Erscheinung getreten sind und auch keine Verbindungen zu bereits bekannten "seed entities" und deren Kontakten aufweisen. Anders ausgedrückt, können sie im Extremfall nicht aus der Mehrheit der Gesamtbevölkerung, die keiner terroristischen Gruppierung zugeordnet werden kann und bisher ein unverdächtiges und "normales" Leben führt, die Terroristen und Terrorverdächtigen "extrahieren".
In vielen Data-Mining Systemen gehen Informationen unter, weil ihre zeitliche Entwicklung nicht verfolgt wird oder weil sie als Fragmente (z. B. bei Hinweisen aus der Bevölkerung) zwar im System gespeichert werden, aber dort isoliert verbleiben und nicht miteinander oder mit anderen Informationen abgeglichen werden.
Wie die Autoren des Informationspakets anmerken, resultiert aus der Vielzahl von Problemen auch eine Vielzahl von unterbliebenen oder falschen Erkennungen von Personen, wodurch natürlich unschuldige und unverdächtige Personen ebenfalls als Terroristen oder Terrorverdächtige kategorisiert werden.
Hinzu kommt die miserable Performance und Skalierbarkeit der bisherigen Systeme, die dazu führen, dass "
aktuell die gesamte Zeitdauer zur Verarbeitung bis zur Ausgabe einer einzelnen Antwort in Tagen und Wochen gemessen wird".
Mit TANGRAM strebt man bei den US-Geheimdiensten deshalb folgende Ziele an:
- Mit Tangram sollen Analyseergebnisse in Stunden oder Minuten vorliegen und Zehntausende von Analyseanfragen simultan zu verarbeiten sein. Dazu sollen die Verarbeitungskapazitäten zur Verringerung des Zeitaufwands zur Konfiguration des Systems und zur Erkennung von verdächtigen Personen, Ereignissen und Verhaltensmustern vervielfacht werden.
- Tangram generiert kontinuierlich und automatisch Hypothesen über Absichten, logistische Aktivitäten und mögliche Ziele von Terrorverdächtigen, die auf den Verhaltensmustern, Beziehungsgeflechten und gewonnenen Daten des Terrorverdächtigen basieren. Menschliches "Feedback" durch Geheimdienstanalysten wird automatisch integriert und zur Anpassung der Hypothesen verwendet.
- Tangram erkennt selbsttätig, welche Algorithmen, Datentypen und Hardwareressourcen benötigt werden, um optimal die benötigte Antwort zu liefern und soll sich folglich selbst konfigurieren können.
- Tangram soll auch isolierten, einzelnen Informationsfragmenten, die zunächst bedeutunglos erscheinen, einen Schätzwert zuordnen können, um die wichtigsten "noch unbekannten" Terrorverdächtigen aufzuspüren.
- Mit Tangram sollen neue Methoden für "collective inferencing" Techniken erprobt werden, die im Gegensatz zum obigen Modell theoretisch in der Lage seien, aus großen Datensammlungen simultane Schlußfolgerungen und Einschätzungen über jede Person und ihre Kontakte in großer Anzahl abzuleiten.
- Tangram erkennt Informationslücken über die Hyptothesen und Szenarien, die berechnen, welche Informationsgewinne zu erwarten wären, wenn dem System die fehlenden Informationen vorliegen würden.
- Mit Tangram soll ein weiterer Fortschritt bei der Lösung der Probleme erzielt werden, die oben skiziiert wurden, d. h. eine bessere und automatisierte Erkennung und Analyse von Verhaltensmustern, Verhaltensänderungen und persönlichen Beziehungen bei bekannten Terroristen, Terrorverdächtigen bis hin zur "normalen Gesamtbevölkerung".
Das Diagramm zu Arbeitszielen und -ansätzen verschafft einen Eindruck, wie umfassend das TANGRAM Projekt ist:
Es ist also mehr als verständlich, dass Shane Harris in seinem aktuellen Artikel, wie zuvor in
zwei weiteren Artikeln, eine enge Verbindung zwischen TANGRAM und TIA sieht. Auch deshalb, weil sich aus den ehrgeizigen Ziele ergibt, dass man sich für TANGRAM wie bei TIA jeden verfügbaren Informationshappen und die Daten aller denkbaren Datenbanken verschaffen will und muss.
Harris hat ergänzend zum Inforamtionspaket den Datenschutzbeauftragten des Direktoriums für die US-Geheimdienste Tim Edgar zu TANGRAM befragt. Seinen Aussagen nach sei TANGRAM ein Forschungs- und Entwicklungsprogramm und es sei sicher gestellt, dass es nicht parktisch in Betrieb gehe. Für die Erprobungen und Tests würden künstliche Daten und geheimdienstliche Daten aus dem Ausland verwendet wie bei anderen Projekten und keine anonymisierten Daten von US-Bürgern.
Wie aus den Informationen zum EAGLE Projekt im Informationspaket hervorgeht, hatte man für EAGLE einen Generator für künstliche Testdaten mit der Bezeichnung "Performance Evaluation (PE) Lab" verwendet, der von dem Unternehmen
Information Extraction and Transport hergestellt wurde. Zu den künstlichen Datensets und den Genratoren heißt es im Informationspaket:
The existing PE Lab is capable of creating a variety of social networks that are consistent with existing social network theory of large populations. However, the data sets it produces do not reflect the social networks that existing intelligence data sources portray, which look more like a patchwork of holes.
Presuming the Data Characterization research task is successful; a new synthetic data generator will be required to produce unclassified data sets with the known characteristics of classified data sources.
Moreover, by generating validated synthetic data sets the Tangram program will have the ability to test and catalog new and existing algorithms in an unclassified environment; the consequence being faster delivery of proven detection methods to operational environments.
Für die als gut befundenen Algorithmen und Methoden zur Erkennung denkt man bereits durchaus an einen praktischen Einsatz. Wie bei der verdeckten Weiterentwicklung der TIA Komponenten wird auch TANGRAM immer wieder auftauchen, sollte es den US-Politikern einfallen, dem Projekt Schranken zu setzen, seien sie auch nur als Show gedacht, um die Medien und die Bevölkerung zu beruhigen.
Der amerikanische Geheimdienst FBI rührt gerade die Werbetrommel, um seine "Lost in Translation" Probleme zu lösen, denn wie jeder andere Geheimdienst sucht auch das FBI immer noch händeringend nach Geheimdienstanalysten, die in mehreren Sprachen fit sind
Tracked: Nov 07, 18:46
Nicht nur Bürger, Universitäten, Unternehmen, derzeitige Geheimdienste und Militärs sind für das Data-Mining des Internets und der Medien zwecks Antiterrorkampf zuständig, sondern auch altgediente Pensionäre und Veteranen, die sich in der klandestinen Ver
Tracked: Nov 26, 12:29
Warum überrascht mich die heute veröffentlichte "Grundsatzrede" Gesamtstaatliche Sicherheit aus Sicht der Bundesregierung von Bundesinnenminister Schäuble im Rahmen der Veranstaltungsreihe "Gesamtstaatliche Sicherheit" nicht? Weil er sie bereits in minima
Tracked: Dec 13, 17:36