Mit Interesse habe ich den Artikel
Pentagon sets its sights on social networking websites des New Scientist gelesen und etwas amüsiert beobachtet, wie der Artikel einen Großteil der Blogosphäre und der Web 2.0 Community aufgeschreckt und aufgeregt hat.
Dabei ist es mitnichten ein Geheimnis oder ein Novum, dass sich die U. S. Geheimdienste und das U. S. Verteidigungsministerium verstärkt um das Datamining von Websites und Weblogs bemühen – nicht zuletzt zur Identifizierung sozialer Netzwerke und Beziehungen zwischen einzelnen Personen.
Deshalb ist es nur folgerichtig und logisch, dass man sich in Zukunft auch verstärkt dem widmet, was mit "semantischem Web", "Web 2.0" oder "sozialen Webdiensten" umschrieben wird. In diesem Zusammenhang ist das Aufspüren der ARDA gesponsorten Forschungsarbeit
Semantic Analytics on Social Networks bedeutsam.
Alle Quellen, die sich in Webangeboten und -diensten finden, für "Information Exploitation" auszuwerten, um neben interessanten Inhalten die dahinterstehenden Personen und ihre Beziehungen zu anderen Personen zu identifizieren – das waren schon bei den DARPA Total Information Awareness Programmen Ziele, die u. a. als
Topsail / Basketball genauso weiterleben wie die zum
Disruptive Technology Office (DTO) umbenannte ARDA Behörde. Sie finden sich auch in anderen Forschungsarbeiten wie z. B.
Mining Web Documents for Unintended Information Revelation wieder.
Bereits anhand von Äußerungen des Direktors des neuen
Open Source Centers (OSC) des Direktorats für Nationale Sicherheit (DNI) und des Deputy Assitant Direktors für Open Source Intelligence des Direktorats wurde deutlich, dass zu den neuen Betätigungsfeldern des OSC auch Weblogs gehören, wie die Washington Times im April 2006 in
CIA mines 'rich' content from blogs berichtete. Einen ähnlich großen Widerhall wie der Artikel des New Scientist fand damals der Artikel nicht in der Blogosphäre.
"A lot of blogs now have become very big on the Internet, and we're getting a lot of rich information on blogs that are telling us a lot about social perspectives and everything from what the general feeling is to ... people putting information on there that doesn't exist anywhere else"
Douglas J. Naquin, OSC Direktor.
Das im November 2005
angekündigte und im CIA Hauptquartier angesiedelte
Open Source Center und das
Direktorat für Nationale Sicherheit steht bei der Ausbeutung sozialer Netzwerke und Weblogs viel mehr im Mittelpunkt als die NSA selbst. Warum? Weil aus einem DTO
Informationsdokument zum ARDA / DTO Unterprogramm
Video Analysis and Content Extraction (VACE) des Forschungsschwerpunktes
Information Exploitation (InfoEx) hervorgeht, dass ARDA mit der Umbenennung in das DTO zugleich nicht mehr eine Unterorganisation der NSA ist, sondern als DTO direkt der Abteilung National Intelligence for Science and Technology (ADNI/S&T) im DNI untersteht. Nur am Rande –
VACE ist neben der Verwendung zur Videoüberwachung auch für die Auswertung von Videoquellen bei YouTube, MySpace oder Google Video von Interesse.
ARDA was a research organization that was jointly established in December 1998 by the U.S. Department of Defense (DoD) (
http://dod.gov/) and the U.S. Intelligence Community (IC) (
http://www.intelligence.gov/). ARDA was organizationally part of the National Security Agency and its mission was to incubate revolutionary, disruptive research and development (R&D) activities within the broad field of Information Technology. While its mission remains the same, ARDA, renamed the DTO, has become an organization under the Director of National Intelligence (DNI). The DNI, itself, was established on 21 April 2005 to serve as the head of the U.S. Intelligence Community. The DTO falls directly under the aegis of the Associate Director of National Intelligence for Science and Technology (ADNI/S&T).
The DTO's individual research programs are organized around broad research topics called research focuses. One of these research focus areas is Information Exploitation (InfoEx), and under InfoEx is the VACE program. In all cases, DTO's research focus areas and programs have been established and executed for the shared benefit of the DoD and IC. In order to satisfy this mission, DTO, in close cooperation with its DoD and IC partners, originates and manages advanced research and development (R&D) programs...
Über das Open Source Center ist außer der Ankündigung und einzelnen Presseartikeln wie dem
Telepolisartikel wenig bekannt. Wer auf den Link zum OSC geklickt hat, sieht, dass man nur mit einem Account an die Angebote kommt. Der Datenverkehr läuft über das abgeschottete INTELINK Netzwerk des Verteidigungsministeriums, Informationen werden über die jeweiligen, ebefalls abgeschotteten Netzwerke der U. S. Behörden wie dem Secret Internet Protocol Router Network (SIPRNET) oder dem Joint Worldwide Intelligence Communications System (JWICS) an die angeschlossenen Behörden ausgeliefert.
Im März 2006 berichtete das der Geheimdienstcommunity nahestehende SIGNAL Magazin etwas ausführlicher in
Intelligence Center Mines Open Sources über das OSC.
Demnach ist das OSC nicht so neu, denn eigentlich handelt es sich bei dem OSC um den "alten" CIA
Foreign Broadcast Information Service (FBIS), der seit 1941 existierte und sich auf die Auswertung ausländischer Medien beschränkte. Neben Institutionen wie dem
USNORTHCOM für das US-Militär oder dem
National Counterterrorism Center (NCTC) bedient das OSC die gesamte U. S. Geheimdienstcommunity mit geheimdienstlich relevanten Informationen aus öffentlich zugänglichen Quellen (OSINT) und hat zur Aufgabe, eine gemeinsame Infrastruktur für alle Geheimdienste für die Erhebung, den Austausch und die Analyse von OSINT aufzubauen. Das OSC Personal rekrutiert sich aus allen Geheimdiensten und Strafverfolgungsbehörden, umgekehrt werden OSC Agenten landes- und weltweit in verschiedenen U. S. Behörden eingesetzt. Die Größe des Personals soll ein paar Hundert Personen betragen und bis 2009 verdoppelt werden.
Neben der eigentlichen Schnüffelarbeit unterhält das OSC eine Akademie, an der in zwei Dutzend Kursen auch Angehörige ausländischer "Partnerdienste" das Datamining und die Analyse öffentlicher Quellen beigebracht wird. Außerdem wird im OSC zu neuen Techniken für Data Mining und Analyse geforscht, wo dann Ämter wie das DTO wieder ins Spiel kommen, aber auch zahlreiche privatwirtschaftliche Unternehmen und Universitäten, die für das OSC Anwendungen und Tools für Data Mining und Analyse entwickeln. Der Artikel nennt dazu einen alten Bekannten – die CIA Venturekapitalfirma
In-Q-Tel, die für das OSC "topaktuelle Techniken herbeischaffe, die nocht nicht einmal kommerziell verfügbar seien".
Entgegen der Abschottung des OSC wirkt es etwas belustigend, dass über 98% der Informationen aus nicht als geheim klassifizierten Daten bestehen soll, aber schließlich soll auch nicht öffentlich werden, welche Quelle von wem zu welcher Fragestellung ausgeschürft wird oder welche Datenbestände kommerzieller Datenbankanbieter integriert sind. Jeden Monat produziert das OSC 30 Analyseanwendungen und die Filteranwendungen übersetzen 30 Millionen Wörter. Zur Finanzierung sagt der Signalartikel nichts. Dafür findet sich im launigen oss.net Kommentar
Open Source Intelligence (OSINT), Foundation for IO/IC die Summe von 100 Millionen US$ – allerdings insgesamt bis 2009, wie man bei oss.net bemängelt.
Einen aktuellen und visuellen Überblick zu den Aktitivitäten des OSC bietet die "OSINT" Präsentation
Open Source Enterprise – We’re all a part of it! (wie wahr) vom 4. April 2006 des Defense Technical Information Center. Ein paar Slides:

Schwarz und Weiß - Die offenen Quellen für das OSC Intelligence Data Mining.

Der Geheimdienstkomplex und seine Kunden.

Weltweite Zuarbeit für das OSC.
Wer sich einmal unterhaltsam anschauen möchte, wie eines der Interfaces im OSC und den vernetzten Behörden aussehen könnte, sollte sich einmal die
Flashtour zu
Silobreaker anschauen – dem "web-based current awareness service".
Wegen der kommenden oder bereits laufenden Ausbeutung des "Web 2.0" durch Geheimdienste und Strafverfolgungsbehörden alle "Web 2.0" Dienste oder gar das W3C allgemein zu verteufeln, weil es von der NSA Spenden bekommen hat, wie es in einigen Weblogs anklingt, halte ich für genauso naiv und kindisch, wie dem "Web 2.0" stets alle Daten anzuvertrauen oder ihm mit der realen Identität zu begegnen. Auch die individuelle Risiko-Nutzen Abschätzung dürfte stark variieren. Wie bei vielen Diensten und Techniken mit mehreren Gesichtern kommt es halt immer auf das Brain 2.0 an, das vor dem Web 2.0 hockt.
Nachtrag:
Neben der von der DTO / ARDA mitfinanzierten Forschungsarbeit gibt es bei WWW 2006 noch drei weitere Forschungsarbeiten, bei denen ein geheimdienstliches Sponsoring zwar nicht erkennbar ist, die aber trotzdem von Interesse sind, wenn es um Data Mining für oder gegen "Web 2.0" Dienste zum Erkennen und Extrahieren sozialer Netzwerke und der Identifizierung von Themenschwerpunkten und Hierarchien innerhalb dieser Netze geht:
- Probabilistic Models for Discovering E-Communities
The increasing amount of communication between individuals in e-formats (e.g. email, Instant messaging and the Web) has motivated computational research in social network analysis (SNA). Previous work in SNA has emphasized the social network (SN) topology measured by communication frequencies while ignoring the semantic information in SNs. In this paper, we propose two generative Bayesian models for semantic community discovery in SNs, combining probabilistic modeling with community detection in SNs. To simulate the generative models, an EnFGibbs sampling algorithm is proposed to address the efficiency and performance problems of traditional methods. Experimental studies on Enron email corpus show that our approach successfully detects the communities of individuals and in addition provides semantic topic descriptions of these communities.
- An integrated method for social network extraction
In this paper, we propose combined method to extract social network. A social networking service (SNS) that manages and stores social networks can become bases for information infrastructure in the future. For that purpose, we propose a method which combine three ways to extract social network. It can realize extraction of social networks that are not biased and provide a simple means to register social networks for users. We develop a system using our method. This paper describes a method of extracting social networks for communities and analyzes the multiple extracted social networks on the same community; user-registered knows network, Web-mined network, and face-to-face meets network.
- POLYPHONET: An Advanced Social Network Extraction System from the Web
Social networks play important roles in the Semantic Web: knowledge management, information retrieval, ubiquitous computing, and so on. We propose a social network extraction system called POLYPHONET, which employs several advanced techniques to extract relations of persons, detect groups of persons, and obtain keywords for a person. Search engines, especially Google, are used to measure co-occurrence of information and obtain Web documents.
Several studies have used search engines to extract social networks from the Web, but our research advances the following points: First, we reduce the related methods into simple pseudocodes using Google so that we can build up integrated systems. Second, we develop several new algorithms for social networking mining such as those to classify relations into categories, to make extraction scalable, and to obtain and utilize person-to-word relations. Third, every module is implemented in POLYPHONET, which has been used at four academic conferences, each with more than 500 participants. We overview that system. Finally, a novel architecture called Super Social Network Mining is proposed; it utilizes simple modules using Google and is characterized by scalability and Relate-Identify processes: Identification of each entity and extraction of relations are repeated to obtain a more precise social network.
Ich habe mir gerade einen Nymaccount eingerichtet und dabei wieder festgestellt, wie umständlich und schwierig das ist. Dabei stehen mir schon unter Windows grafische Tools wie Quicksilver und das alte PGP CKT 6.5.8 zur Verfügung, dass bei der breiten Ver
Tracked: Jun 15, 08:10
Ein Blogger namens Zulugrid hat einen (bis dato) webbasierten Fakename-Generator online gestellt, der 487861706 gefälschte (amerikanische) Identitäten – inklusive Vor- und Nachnamen, Straße, Ort, PLZ, Telefonnummer, Geburtsdatum und Geburtsnamen der
Tracked: Jun 19, 21:46
Ein Bild sagt mehr als tausend Worte nicht wahr? Ein wenig Text ist leider auch dabei. In Anlehnung an RFID und CCTV Überwachung in der Stadt der Zukunft zwei Abbildungen und ein paar Zitate aus der Frühjahrsausgabe des Magazins "The Edge" der MITRE Orga
Tracked: Jun 28, 21:46
Interesant, einer der unkritischsten Befürworter und Unterstützer von geheimdienstlichen OSINT Maßnahmen – oss.net (zuletzt erwähnt in Big Brothers und das Web 2.0) und sein Gründer, der ehemalige CIA Offizier Robert David Steele, hat in die englisc
Tracked: Jul 06, 11:13
Die Washington Post schreibt in A Fight Against Terrorism – and Disorganization lang und breit über die Rangeleien zwischen den US-Geheimdiensten und den neuen, 160-seitigen und bisher geheimen "National Implementation Masterplan" für die Geheimdien
Tracked: Aug 09, 12:33
Die Times berichtet in Spies trawl Friends Reunited for terror whispers über OSINT und HUMINT Aktivitäten seitens der drei britischen Geheimdienste GCHQ, MI5 und MI6 sowie der NATO, die wie z. B. das Open Source Center (OSC) der CIA / DNI oder das U. S. A
Tracked: Aug 10, 10:41
Die Federal Computer Week berichtet in Rutgers will lead DHS-financed info research über ein weiteres Data-Mining Projekt, das neben der Analyse von E-Mails, Agenturmeldungen, Chatlogs auch auf die Überwachung und Analyse von Weblogs zielt. Das Projekt wi
Tracked: Aug 22, 12:44
Als Ergänzung zur Heise Meldung Software zur Entdeckung negativer Berichte über die USA gewünscht, die ich gerade auch an die infowar Mailingliste gepostet habe, weil im Zusammenhang mit der "Software" auch die Rede vom Total Information Awareness Program
Tracked: Oct 05, 19:49
Das neue Open Source Intelligence (OSINT) Suchportal von Deep Web Technologies soll jedem einen freien Zugang zu nicht unter Geheimhaltung stehenden Informationen und Dokumenten bieten, die sich um die "Nationale Sicherheit" drehen. Mehr noch soll das De
Tracked: Oct 10, 10:08
Shane Harris berichtet im National Journal Artikel Terrorist Profiling, Version 2.0 über das TANGRAM System, dessen Entwicklung vom US-Verteidigungsministerium im Oktober 2006 gestartet wurde. Die im Artikel erwähnten Dokumente wurden bei Cryptome bereits
Tracked: Oct 21, 12:46