Dark Web crawler qui indexera les sites qui se trouvent dans les réseaux anonymes ?
Memex : le moteur de recherche de la Darpa s'attaque au Dark Web
Les autorités américaines disposent depuis quelques mois d'un nouvel outil leur permettant de chercher au-delà de ce que le moteur de recherche Google peut proposer comme résultats de site.
La Darpa a développé un nouveau moteur de recherche principalement destiné aux forces de l'ordre. Et son efficacité a déjà été constatée en permettant le démantèlement d'un réseau de trafiquants d'êtres humains.
Cela fait presque un an que les forces de l'ordre ont accès à ce nouvel outil pour traquer les criminels sur la toile, sa puissance résidant dans le fait qu'il est capable d'aller au-delà de l'aspect visible d'Internet et d'accéder au "Deep Web".
Pour les moteurs de recherche traditionnels, l'élément principal régissant la hiérarchie d'affichage des résultats est la popularité des sites. Cela exclut automatiquement l'affichage de sites éphémères ou à faible trafic. Malheureusement, ce sont ces derniers qui sont le plus souvent utilisés par les trafiquants divers, et principalement pour les réseaux de prostitution, notamment pour attirer leurs victimes en leur promettant un avenir meilleur avant d'en faire des esclaves.
Selon la Darpa, 60 millions de pages criminelles ont été publiées ces deux dernières années, chacune avec une faible durée de vie ne permettant pas à Yahoo, Google ou Bing de les repérer.
Memex de son côté permet un filtrage plus poussé lui rendant accès à ces sites. Le moteur est doté d'une intelligence artificielle ainsi que des outils d'analyse et de visualisation, il est ainsi capable de repérer des données visibles, mais également de créer des liens entre eux.
La Darpa devrait prochainement orienter son outil pour qu'il s'intègre au Dark Web, principalement dans Tor, mais aussi directement dans les réseaux P2P. Prochainement, il sera question d'un Dark Web crawler qui indexera les sites qui se trouvent dans les réseaux anonymes.
Sur le plan juridique :
Il existe des sociétés françaises capables de crawler le Web profond à la manière de Memex. C’est le cas de CybelAngel, lauréate du prix de l’innovation du Forum International de la Cybercriminalité 2014, dont la solution scrute le Web profond pour prévenir de la fuite des données sensibles. Pour autant, le cas de Memex est différent car il flotte sur un vide juridique : celui-ci ne part pas à la recherche de données qui appartiennent à une entreprise mais va explorer les données non-propriétaires (nom, adresse, numéro de téléphone…) et ce sans mandat, tant que ces données sont disponibles de façon publique, c’est-à-dire non protégées par un mot de passe.