Als "nette" Ergänzung zum
Data-Ming Programm zum Aufspüren von internationalen Nachrichten, die kritisch über die USA berichten (und allen anderen Web 2.0 Data-Mining Programmen und Projekten), hat das Weblog
Defense Tech ein weiteres, kommerzielles Data-Mining Angebot für die US-Geheimdienste und Militärs aufgespürt. Im Beitrag
Spyboys Go Web 2.0 wird das
Broadcast Monitoring System des Unternehmens BBN Technologies vorgestellt.
In das System werden kontinuierlich internationale TV-Kanäle eingespeist und der Audioanteil automatisch ins Englische übersetzt. Es ist kein Zufall, dass vom System besonders System Arabisch, Chinesisch und Spanisch als Quellsprachen unterstützt werden. Wie bei allen automatischen Übersetzungsprogrammen ist die Qualität der Übersetzung abhängig von der Qualität der eingesetzten Algorithmen, um nicht zu sagen ähnlich der bekannten Programme und Dienste wie z. Babelfish, reicht aber für die einfache Keywordanalyse.

Benutzeroberfläche des BMS.
Abbildung: BBN.
Der Videostream wird genauso automatisch neu codiert und in einer Datenbank abgespeichert. Aus beiden Daten wird ein Archiv gebildet, das jeden aufgezeichneten und übersetzten TV-Beitrag 30-Tage für den Benutzer zwischenspeichert. Der Benutzer bedient das Archiv über eine Webbrowseroberfläche. Über die Eingabe von Schlüsselwörtern in der Originalsprache oder in Englisch werden die Originaltexte und Übersetzungen im Archiv nach enstprechenden Fundstellen durchsucht, die dann in beiden Texten durch ein Icon markiert werden. Klickt der Benutzer auf das Icon, wird das enstpechende Segment des TV-Beitrags abgespielt und dazu synchron der enstprechende Text angezeigt. Für Berichte und Präsentationen können die Fundstellen als MPEG Datei, JPG Datei von Standbildern und Text aus dem System extrahiert werden.
Wie Defense Tech schreibt, wird das System von militärischen Einheiten bereits genutzt, darunter die Special Forces und das U. S. Central Command. Zu welchen Zwecken ist klar: Die Benutzer wollen wissen, wie über die USA, insbesondere amerikanische Militäreinsätze, in den entsprechenden Ländern berichtet wird, wer sich als Sprachrohr für Gruppierungen betätigt, die von den USA als terroristisch eingestuft werden, wie die Stimmungslage im Land aussieht, um enstprechende Desinformations- und PsyOp-Operationen zu starten, welche Örtlichkeiten und Persönlichkeiten werden oft und in einem negativen Kontext in den Beiträgen bedacht, weshalb sie potentielle Angriffsziele darstellen könnten.
Neben dem BMS für TV-Beiträge hat BBN noch andere Data-Mining Lösungen im Programm:
Die
AVOKE Sprache-zu-Text Software, die auch beim BMS zum Einsatz kommt und darüber hinaus in Call-Centern, bei Telefonieprovidern und von den Geheimdiensten verwendet werden kann, um automatische Textübersetzungen zu produzieren:

Abbildung: BBN
Das
Audio Indexing System, zuständig für die Indizierung der übersetzten Audioaufnahmen und Separierung der verschiedenen Sprecher. Dient beim BMS der Schlüsselwortsuche und der Hervorhebung aufgefundner Schlüsselbegriffe.
Der
IdentiFinder analysiert jede Form elektronischer Texte, um die Namen von Personen, Orten, Unternehmen, Nummerfolgen (z. B. Telefonnnummern oder IP-Adressen), Datumsangaben oder anderen, selbstdefinierten Katgorien in den Texten zu lokalisieren, die dann über das obige System zur Indizierung weiter verareitet werden. Neben den übersetzten Audiostreams der TV-Beiträge im BMS könnte der IdentiFinder mit Sicherheit auch auf übersetzte VoIP Gespräche und Podcasts oder direkt auf E-Mails und Weblogbeiträge angesetzt werden.
Beim IdentiFinder ist die Definition von Regeln zur Lokalisierung durch den Anwender unnötig, da das System sich automatisch selbst trainiert (man denke zur Veranschaulichung an die Bayes oder SpamAssassin basierten Spamfilter).
Wie man sieht, fließen in das BMS alle anderen Produkte von BBN ein.
Wie man auch wieder anhand des Beispiels BBN sieht, ist jede Form der ungeschützten Kommunikation und Publikation unabhängig vom Datentyp generell einer Überwachung und Kontrolle per Data-Mining Lösungen zugänglich.
Auch IBM ist u. a. höchst engagiert, was automatische Übersetzungen angeht, wie die Netzeitung in
USA wollen in Kriegen PCs dolmetschen lassen berichtet. Die automatische Übersetzung (und die damit zwangsläufig verbundene Analyse) war auch ein Ziel des
TIA Projekts TIDES und der BABYLON / SYMPHONY Geräte. So kommt und fügt sich zusammen, was zusammen gehört.
Nicht nur Bürger, Universitäten, Unternehmen, derzeitige Geheimdienste und Militärs sind für das Data-Mining des Internets und der Medien zwecks Antiterrorkampf zuständig, sondern auch altgediente Pensionäre und Veteranen, die sich in der klandestinen Ver
Tracked: Nov 26, 12:29