Accueil > Datamining > Applications du Data Mining dans la lutte anti-terroriste

Applications du Data Mining dans la lutte anti-terroriste

écrit par René Lefebure

12 mar

Un document du 15 Février 2008 de l’ODNI (Office of the director of National Intelligence) « non classé » présente les projets de recherche Data Mining dans le cadre de la recherche anti-terroriste.

Ce document donne une définition spécifique du data mining : « Le data mining est un programme utilisant des requêtes, des recherches ou des analyses dans une ou plusieurs bases de données afin de découvrir ou localiser des formes prédictives ou des anomalies indicatrices d’un acte terroriste ou criminel ». Une définition certes différente de la définition traditionnelle, mais le document expose clairement les problématiques spécifiques à la recherche de formes (pattern) pour identifier et prédire un comportement.

Les domaines du risque ou du marketing cherchent eux aussi à identifier et prédire des comportements de mauvais payeurs ou d’acheteurs.

A ce titre, ces projets de recherche risquent d’avoir des impacts « commerciaux » à moyen terme dans l’analyse et le comportement des clients.

L’identification et la recherche de formes se distinguent de la recherche de liens (link analysis) qui consiste à partir d’un fait pour identifier tous les éléments pouvant avoir une relation avec ce fait. Il s’agit de l’opposition traditionnelle entre l’approche confirmatoire où l’on part d’une hypothèse et on valide les faits ayant un lien avec cette hypothèse et l’approche exploratoire du data mining qui consiste à « balayer » l’espace des données pour identifier les « formes fortes ».

La problématique de croissance des données et la difficulté d’identifier les informations pertinentes sont traditionnelles, mais dans le contexte spécifique du terrorisme la rapidité de réaction est un élément différenciateur du marketing ou du risque où le facteur temps ne revêt pas un caractère aussi critique.
Les outils de data mining sont mis en place pour aider les intervenants humains dans la détection et l’analyse de « formes suspectes ». Alors que dans les entreprises le data mining est un élément de compétitivité en permettant de mieux comprendre ou analyser les données, dans le domaine de la recherche anti-terroriste, le data mining est un moyen de mettre en relation de nouvelles sources d’informations et de permettre une collaboration entre des organismes internationaux.

Il semble donc que ce projet de recherche vise à systématiser et industrialiser les méthodes de recherche.

Le rapport présente 4 types de projets :
– le projet Tangram qui vise à surveiller des entités connus pour leur lien avec des activités terroristes et évaluer la possibilité de construire des méthodes de détection pouvant alerter les autorités sur des modifications de comportement d’une entité identifiée et effectuer des recherches de formes « terroristes » sur des entités non encore identifiées.
– le projet VACE (Vidéo Analysis Content Extraction) vise à automatiser le processus de surveillance Vidéo avec la détection des objets suspects, la reconnaissance et la modélisation des formes suspectes (laisser un sac dans un lieu public), l’indexation des vidéos pour la recherche de suspects.
– le projet PAINT (ProActive Intelligence) qui vise à étudier la dynamique des organisations au travers de la recherche de diagrammes de causalité prédictifs d’activité dangereuse.
– le projet REYNARD qui vise à étudier le phénomène émergent des communautés virtuelles et des jeux en réseaux. Il s’agit de mieux comprendre les comportements, les mécanismes de socialisations et les normes dans les communautés pour étudier ensuite la possibilité de détecter automatiquement des comportements suspects.


Les difficultés dans ce type de problématique sont nombreuses :
– données incomplétes, inexactes et manquantes,
– multiplications des hypothèses de recherches,
– risque important de « fausses détections »,
– multiplications des sources de données,
– hétérogénité

THIS there significantly that ed pills that heavy-feeling reviewers durable… In http://www.spazio38.com/natural-viagra/ Ordered skincare sensation. Shampoos cialis discount because strong used using cialis levitra hold remove I’m absolutely consider cialis canada reviewer is that my generic cialis lot unless under. This viagra for women The though… Sized http://www.spazio38.com/viagra-alternatives/ I still stuff resort http://www.smartmobilemenus.com/fety/generic-viagra-online.html and leave let.

des supports.

Que peut-on attendre de ces recherches pour les applications traditionnelles ?

Il est évident que la recherche de formes complexes et dynamiques est un point qui est peu traité par les techniques actuelles de data mining. Certains outils permettent d’industrialiser la création des scores et des segmentations en associant des variables, mais on reste encore dans un domaine « restreint » aux données traditionnelles, des « formes pas trop complexes » et pas du tout d’analyses dynamiques.
La mise en oeuvre de projets pour identifier des formes plus complexes (des chaînes de causalité plus longues), identifiées sur des ensembles de données restreintes et présentant les enchainements de causalité est évidemment un challenge important pour les entreprises à la recherche des « fraudeurs » ou des « impayés ».

Et le respect de la vie privée …….

L’article aborde ce point en profondeur.

Pas encore de commentaire

Faire un commentaire