Le Big data semble être un bon moyen de mieux surveiller les phénomènes de radicalisation en ligne. À condition d'avoir la collaboration de Facebook, Twitter et autres.

À quoi peut servir le big data ?
À quoi peut servir le big data ? © Maxppp / M. Weber

Les fans y verront un semblant de Minority report. Lundi 10 octobre, un colloque du forum SAS était dédié à la "détection en amont du risque de radicalisation" en ligne, grâce à l’utilisation massive des données disponibles sur internet – également appelé "Big data". Le principe est simple : en utilisant des algorithmes, il est possible de déterminer des individus potentiellement radicalisés, ou en cours de radicalisation, en analysant la sémantique de leur discours sur les réseaux sociaux.

Un procédé qui peut se heurter à la position de Facebook ou encore Apple (et demeure relativement intrusif en ce qui concerne l'utilisation de nos données sur le web). Pourtant, cet aspect intéresse vivement chercheurs et entreprises spécialisées.

Un projet universitaire pour observer les marqueurs sociaux de la radicalisation

Au Royaume-Uni, l’Université de Bath a d’ailleurs lancé fin juillet un projet d’étude : "comment le Big data peut permettre de comprendre la radicalisation en ligne". Dirigé par Laura Smith, professeur d'université en psychologie sociale, ce projet vise à récolter et analyser des données disponibles publiquement en ligne, sur Twitter notamment, pour déterminer des marqueurs, tels que les mots clés et les iconographies utilisées, mais aussi la façon dont s’expriment les personnes radicalisées.

"Nous allons regarder comment ces marqueurs évoluent en fonction du stade de radicalisation d’un individu" explique la chercheuse, contactée par e-mail, qui dispose d’un échantillon riche d’utilisateurs radicalisés (et actifs sur les réseaux sociaux) et d’une base de données déjà fournie de mots clés indiquant des affinités avec des groupes radicalisés.

Grâce à ces analyses (le projet court jusqu'en août 2017), les chercheurs vont pouvoir mieux comprendre les liens entre les différents protagonistes qui mènent à la radicalisation d'un individu, mais aussi, de mieux cerner les mécanismes psychologiques mis en œuvre.

Les conclusions serviront à améliorer d'ici quelques mois un logiciel, Chorus, spécialement conçu pour l’analyse massive de données sur Twitter et disponible gratuitement au téléchargement. Avec pour objectif de renforcer encore la fiabilité des analyses réalisées à l'avenir.

Les géants du web joueront-ils le jeu ?

Ce genre de projet possède une limite forte : il dépend du bon vouloir des réseaux sociaux. Si Twitter permet un accès facilité à ses données publiques grâce à une API disponible pour quiconque sait s’en servir, Facebook ou Google ne sont pas aussi disposés à fournir les leurs. Et pour d'autres réseaux prisés, tels que Signal ou Telegram, la justice commence à peine à déverrouiller les accès.

Cela ne signifie pas qu’ils ne prennent pas en compte la lutte contre le terrorisme , mais ils préfèrent recourir à leurs propres outils et méthodes pour conserver le contrôle sur leur fond de commerce.

Après la mort en direct sur Facebook, en juin dernier, d’un couple de policiers français à Magnanville, Facebook et Youtube (Google) avaient annoncé la mise en place d’algorithmes pour supprimer automatiquement les vidéos de propagande djihadiste. Mais encore une fois, avec leurs propres moyens, et sans aucunement donner accès plus largement à leurs données.

Ce contenu n'est pas ouvert aux commentaires.