Big Data : C'est une révolution qui va bouleverser notre système de santé, transformer les méthodes de soins et aura à terme une influence sur notre politique de santé publique.

Baies de stockage à distance
Baies de stockage à distance © Claranet France

L'enquête intégrale d'Anne Brunel à écouter ci-dessous (Émission Secrets d'Info du samedi 10 septembre 2016 - 37')

Vidéo : Les géants du numérique vont-ils régir notre santé ?

Des masses énormes de données

On n'a pas toujours idée de la quantité de données que, chaque jour, chaque minute, on produit, la plupart du temps sans s'en apercevoir.
"Avec le mobile je sais mètre par mètre, seconde par seconde, partout où vous avez été si je suis un opérateur télécom. On sera bientôt capable de savoir non seulement où mais qui vous êtes" rappelle Benoît Thieulin, le directeur de l’agence d’innovation la Netscouade et ancien président du Conseil National du Numérique. Et il nous alerte : "On ferait bien de rester vigilant sur les données que l’on diffuse sans même le savoir"

Pourquoi cette mise en garde ? Tout simplement parce qu'au milieu de toute cette masse de données produite au fil du temps, celles qui concernent notre santé ne sont vraiment pas anodines : ce sont des informations d’ordre intime.
Lorsque l’on fait une radio : la donnée, c’est le cliché de nos poumons, de notre hanche… Quand le docteur nous ausculte : la donnée c’est notre rythme cardiaque, c’est le chiffre de notre tension.
Vous êtes diabétique ? La donnée c’est la mesure multi quotidienne de votre taux de sucre dans le sang. Vous avez fait un test de dépistage ? La donnée c’est le résultat : positif ou négatif.. Des infos qu'on veille en général à ne pas laisser traîner.
Pendant des décennies ces données étaient conservées dans des chemises en carton : à domicile, chez le médecin, à l'hôpital... Et puis avec le temps, la modernisation des outils d'organisation, la bureautique, on a archivé sur des disquettes, dans des ordinateurs, ça restait éparpillé, il y avait encore des fichiers carton, des dossiers papiers...

Des perspectives vertigineuses

CHU de Nantes
CHU de Nantes © Radio France / Anne Brunel

Le récent changement c’est l'informatisation systématique de toutes ces données, imposé par la Loi "hôpital numérique" de 2012, et leur unification et centralisation (Loi "Santé" de 2015). Cette masse énorme de données de santé représente des dizaines de terra octets, c’est le volume de dizaines de milliers de CD Rom. Elles transitent par des ordinateurs, elles circulent dans des réseaux, et elles peuvent aussi être expédiées vers des serveurs de stockage, ultra sécurisé comme en France, ou ailleurs dans ce qu’on appelle le « cloud ». C'est là le matériau de base du BigData - ou mégadonnées. On peut désormais en faire l'analyse globale grâce aux algorithmes, nouveaux outils de calcul et d’analyse informatique . C'est ce que l'on appelle le "BigData" appliqué à la santé.

Et cela va ouvrir des possibilités immenses pour la recherche. C’est ce que perçoit en tous cas Benoît Thieulin.

La rencontre du BigData et de la santé ouvre un cycle d’innovations sans précédent. On est dans le même type de saut vertigineux que la découverte des antibiotiques.

Très concrètement, la révolution médicale qui se prépare grâce au Big Data, c'est la médecine prédictive : un total renversement dans l'approche des maladies. Cédric Cartau, le patron de la Sécurité informatique du CHU de Nantes, prendre la mesure de nouvelle notion.

Aujourd'hui on fait essentiellement du curatif, c'est-à-dire qu'on soigne les gens quand ils sont malades. On saura faire du prédictif à partir de l'analyse des profils de patients, de leur paramètres physiologiques, en fonction de leur historique médical personnel sur des dizaines d'années. Même le meilleur médecin du monde ne pourrait réussir à faire de telles corrélations à trente ans d'écart !

La récolte des données désormais facilitée

Depuis peu, on voit se multiplier les objets connectés. Le médecin confie à son patient un appareil de mesure qu'il utilisera à son domicile, et qui enverra les données recueillies par Internet au praticien. Le docteur Nicolas Postel-Vinay, spécialiste de l’hypertension artérielle à l’hôpital Pompidou (Paris) a créé le site web auto-mesure.com afin d'ajuster, à distance, le traitement de ses patients qui eux, prennent jusqu'à 48 mesures de leur tension sur plusieurs jours pour obtenir une vraie pertinence de résultats.

Si l'on conjugue cela avec le fait que les systèmes informatiques permettent de croiser ces données, qu'elles soient recueillies par les malades eux-mêmes ou compilées par les médecins dans les dossiers médicaux, avec les données génétiques, on sera capable de fire de la médecine personnalisée. Cet exercice de prospective enthousiasme Benoît Thieulin :

Avec le BigData, on va de plus en plus en savoir sur vous et moi Il va nous permettre de nous différencier de manière extrêmement précise. L’ADN, il y a 15 ans, ça coûtait 1 milliard à décoder. Aujourd’hui on est quasiment en dessous de 1000€ et dans 5 ans, ce sera quelques dizaines d’euros. On sera en mesure de connaître le code génétique de chaque être humain. Et on pourra dire «[ce médicament] marche pour telle personne pour telle raison parce qu’elle a tel code génétique ».

Une révolution pour la recherche

L'analyse BigData des données de santé a ceci d'extraordinaire qu'elle peut faire émerger, au fil du processus algorithmique, des phénomènes qui auraient été strictement indécelables par des calculs statistiques classiques. On appelle cela des "signaux faibles" car ils ne deviennent visibles que par la mise en évidence de corrélations facilitées par la masse énorme de données traitées. On peut ainsi y voir "clignoter" les effets indésirables de médicaments, aussi rares soient-ils, ou les mauvais usages de médicaments. Mieux encore, on pourra éviter, ou en tous cas minimiser des scandales sanitaires comme celui du Médiator. C’est ce qu’affirme le docteur Paul Mandelbrojt. Il est président de la société Technique Logiciel Médical, et médecin de l’hébergeur de données de santé CLARANET e-Santé.

Avec le BigData, l’Assurance Maladie se serait aperçue d'une part que des gens non-diabétiques prenaient du Médiator alors que c’est un médicament qui ne sert qu’au diabète, et d'autre part qu’au bout d’un certain nombre d’années il y a des problèmes de valve cardiaque chez les patients.

Et nous ne sommes avec le Big Data qu’au tout début de ces observations et à l’aube de nombreuses découvertes. Le DocteurMandelbrojt s’est lui-même livré à une analyse des données ouvertes de la Sécurité Sociale, Open Medic, et il est arrivé à des résultats surprenants.

Docteur Paul Mandelbrojt
Docteur Paul Mandelbrojt © Radio France / Anne Brunel

J’ai travaillé sur la base de données de l’Assurance Maladie, Open Medic, qui est ouverte sur la consommation des médicaments. On s’est aperçus que des médicaments qui servent exclusivement pour l’hypertrophie de la prostate, une maladie qui touche les hommes dans la maturité, étaient prescrits à des enfants ou à des femmes, ce qui est contrintuitif. Ça a beaucoup surpris le directeur de l’Assurance Maladie de s’apercevoir qu’il ne remboursait pas loin d’1 million d’euros ces médicaments.

Autrement dit, le BigData appliqué à la santé permet de mieux soigner, de stimuler la recherche... et aussi de faire des économies !

Une révolution très risquée

Si tout cela annonce de vrais progrès, on ne saurait masquer le fait que ce n'est pas sans risque. Les données de santé sont en effet soumises - et tout particulièrement en France - à un régime de confidentialité extrêmement strict, protection qui leur donne une très grande valeur. Du coup elles attirent la convoitise et constituent la nouvelle cible du piratage. Vincent Trély, président-fondateur de l’APSSIS, Association pour la Sécurité des Systèmes d’information, décrit cette nouvelle forme de cybercriminalité.

Il y a un cours de la donnée, cet intérêt vers les données médicales s’est déplacé par rapport à la saturation en données bancaires. Aujourd’hui les banques sont de plus en plus protégées donc il est de plus en plus difficile de les pirater, donc le marché du piratage se déporte vers de nouvelles sources d’opportunités financières, et la donnée de santé en est une.

Ce trafic alimente plusieurs types d'activité délinquante : en premier lieu l’usurpation d’identité, en plein développement, transfrontières, où le vol de données de santé a toute sa place. Il y a même un véritable marché, qui comme d'autre trafics, prend place dans les bas fonds du web "le dark web" ou "deep web". L'expert en sécurité informatique qu'est Vincent Trély y enquête régulièrement :

Sur le darkweb, l’underground d’internet, le dossier médical a une valeur, sa cotation de la semaine est aux alentours de 17$. Si vous êtes à la tête d’une base de données que vous avez subtilisée à un établissement d’une centaine de milliers de dossier médicaux, vous avez potentiellement entre 2 et 3 millions de dollars.

Si cela représente de telles fortunes, on peut craindre que les hôpitaux ne deviennent la cible des pirates informatiques. C'est déjà le cas. Et c’est le second volet de cette nouvelle cybercriminalité : le rançonnage. Vincent Trély n'est pas avare d'anecdotes. Il relate comment le laboratoire d'analyses biologiques LABIO s’est fait voler des prescriptions et a subi un chantage de type : "si vous nous versez pas telle somme d’argent, une vingtaine de milliers d’euros, nous publions ces données sur internet". Le laboratoire a prévenu les autorités en demandant l’aide de l’Agence Nationale de la Sécurité et des Systèmes d’Informations, et ils n’ont pas payé. Certains résultats ont été publiés sur internet et y sont restés un certain temps.

Autre exemple, en janvier 2016, en Californie, la base de données de patients du Presbyterian Hospital de Hollywood s’est retrouvée complètement cryptée, inaccessible, pendant 10 jours. La clef de déchiffrement informatique n’a pu être obtenue qu’en échange d’une rançon de près de 20 000 $.

Une sécurité coûteuse

En France, la réglementation est extrêmement stricte sur le stockage des données de santé. Il y a une obligation de ne déposer ce genre de données que chez des hébergeurs agréés de données de santé, et l’agrément n’est délivré que si des conditions très strictes de confidentialité, de sécurisation, de disponibilité, sont remplies.

Un « hébergeur agréé de données de santé », c’est très encadré, très surveillé. Imaginez des « Datacenter » de très grande dimension, avec d’innombrables étagères - on appelle ça des baies - et des machines noires posées dessus, des gros fils de connexion qui relient ces machines entre elles. Tout est doublé, « redondé » selon le jargon informatique, car la panne est interdite : une panne de serveurs peut se traduire par des morts à l’hôpital... Les serveurs diffusent une intense chaleur, il y a donc une ventilation permanente, et tout le monde n'y a pas accès, c’est très sécurisé. Par contre, ce n’est pas gratuit, ça coûte même cher ! Denis Correia explique pourquoi. Il est directeur du marché e-santé de la société CLARANET, l’un des plus gros hébergeurs de données de santé en France.

Pour un seul serveur les tarifs peuvent varier de 300 à 1000€ par mois, selon la complexité de la machine. S'il s’agit d’héberger les données de tout un hôpital, ça peut monter à plusieurs dizaines de milliers d’euros par mois : un hôpital qui à besoin de 40 machines héberger, ça fera 40 000 € et on ajoute tous les services associés.

Les services associés, c'est à dire l’entretien, l’antivirus, la surveillance 24h/24, et le conseil adapté au client, peuvent faire doubler le tarif, ce qui peut nous amener à près de 100 000 € mensuels pour l’hébergement des données d’un grand hôpital. Certains médecins ne peuvent pas payer une telle somme, et le regrettent amèrement car cela freine leurs projets de recherche. C’est le cas du Docteur Nicolas Postel-Vinay, médecin à l’hôpital Pompidou à Paris, qui a conçu le site automesure.com : "_Nous avons écrit un algorithme que nous avons fait intégrer par un constructeur, il y aurait la possibilité de stocker dans des serveurs. Mais pour être en conformité avec la CNIL, et garantir la confidentialité des données, il nous faudrait des serveurs sécurisés. Nous n’avons pas les budgets. L’inconvénient c’est que nous aimerions bien pouvoir stocker ces données pour faire de la recherche notamment._ ".

Le coût de l’hébergement sécurisé est donc un obstacle, mais dans les hôpitaux il y a d’autres problèmes. Même si les données sont placées dans des coffres-forts chez des hébergeurs agréés, il reste que l’hôpital souffre d’une carence de personnel qualifié en matière de sécurité informatique. Vincent Trély estime qu'il y a entre 50 et 80 personnes au fait du sujet et mobilisées à temps plein sur la sécurité numérique pour l'ensemble du territoire français, soit pour 6000 établissements de santé. C’est un point sur lequel il cherche à alerter.

L’hôpital en France est dans un environnement contraint avec des plans d’économie et il n’est pas évident de dire : il faudrait qu’on recrute 300 experts pour les dispatcher au cœur du système sur le domaine de la cyber-sécurité. Il y a un manque cruel de ressources sur le sujet en ce moment.

On observe que du côté du personnel médical, ce n’est pas beaucoup mieux. Il peut y avoir des pratiques négligentes, Vincent Trély peut en témoigner : "Lorsque l’on dit à un professionnel de santé qui depuis 10 ans a l’habitude de se connecter à l’ordinateur le plus proche, « à partir de demain c’est terminé, il faut mettre un identifiant avec un mot de passe », ça ne se passe pas bien. La tendance naturelle c’est de dire que c’est embêtant, ça fait perdre du temps, autant que l’ordinateur soit allumé en plein milieu du service, ce qui pose des problèmes de confidentialité".

Et mes données d'appli... elles vont où ?

Les risques de cet usage massif des données de santé sont donc multiples, elles peuvent être piratées, elles peuvent mettre en danger le fonctionnement des hôpitaux, mais ce n’est pas tout… Les données ne sont pas seulement chez le médecin ou à l’hôpital, il y a aussi toutes celles que l’on envoie via les objets connectés, ou les applications que l’on achète de notre propre initiative.

L’échelle du risque est toute différente quand on achète des applications et des objets connectés qui échappent au droit français. Il faut savoir qu’il existe plus de 150 000 applis de santé sur les stores en ligne Appstore, GooglePlay et autres : 80 000 pour les médecins, et près de 60 000 pour les patients.

Mais où vont les données d'une application qui mesure notre tension ou qui compte nos pas ? Cédric Cartau,responsable de la sécurité informatique au CHU de Nantes, raconte comment il va chaque dimanche faire un footing équipé de son cardio-fréquence-mètre. Lorsqu’il rentre, il connecte l’objet sur son ordinateur et décharge ainsi ses données sur le site auquel il est abonné en achetant l’appareil. De la sorte il suit sa progression, son kilométrage, l’évolution de ses pulsations cardiaques au fil de ses entraînements.

Une pulsation cardiaque, corrélée à des paramètres comme mon âge, mon poids, la fréquence de mes entraînements, ma géocalisation, c’est une donnée de santé. Une donnée qui permet de déterminer mon état physique, et de remonter à moi. Elle va être déversée sur un site en dehors du territoire européen, qui ne respecte pas le décret hébergeur de données de santé. Sans faire attention j’ai coché la case « oui je suis d’accord avec les conditions générales » et la donnée se retrouve quelque part dans un Data Center au Texas.

Si ce contrôle très fin de l’état de santé permet des nouveautés formidables, ces données non protégées pourraient aussi, à terme, permettre à certains de prendre le contrôle de notre vie… Cette circulation incontrôlée des données comportementales pourrait bien se retourner contre nous. Cela constitue un des principaux dangers, un renversement que décrit Benoît Thieulin en imaginant un appel téléphonique : « Ecoutez madame, on a regardé, vous avez arrêté de faire du sport depuis 2 mois, votre cœur fonctionne un peu moins bien donc de deux choses l’une, ou bien vous vous remettez à faire du sport très vite, ou bien on va augmenter votre police d’assurance de 10%. »

Est-ce que je pourrais vraiment vous dire que dans les années qui viennent, si on n’encadre pas davantage légalement ces pratiques, ça peut ne pas se produire ? Si, ça peut absolument se produire.

Les compagnies d'assurance embusquées

Est-on vraiment proche de ce risque-là en France ?
Une chose est sûre, dans l’assurance, il y a de vrais experts en BigData. Leur spécialité est biel et bien de calculer un risque à partir de paramètres. Ils sont tout naturellement passés de la statistique au Bigdata. Par exemple, Stéphane Chappellier, associé RPC France, un mathématicien qui fabrique des algorithmes pour l’assurance, explique qu'il existe différents dispositifs pour récolter des données comportementales de conduite automobile : "soit ils se branchent dans la prise de diagnostic de l’automobile, soit vous avez aussi sur votre smartphone, puisqu’il y a plein de capteurs dans le smartphone qui permettent de capturer le fait que vous allez rapidement ou que vous prenez des virages serrés. Une fois que vous avez capturés ces indicateurs, il y a un algorithme qui va s’appliquer sur ces données, pour identifier que vous avez un comportement plus ou moins nerveux dans votre conduite".

Toutes les compagnies d’assurance y voient un intérêt financier, mais chacune à sa façon. Il y en a certaines, comme la MAIF, qui en profitent pour faire de la pédagogie. Thomas Ollivier, responsable des pratiques émergentes à la MAIF, explique qu'ils exploitent les données des clients pour sensibiliser l'individu sur sa conduite et donner des conseils : "C'est aussi pour avoir des leviers pour animer une communauté de sociétaires MAIF qui s’intéressent ensemble à une conduite vertueuse. On est accompagné par des partenaires dont Code Rousseau qui, avec l’accord de nos sociétaires, regarde les données de conduite, et du coup pousse les bons conseils de conduite au bon moment, à la bonne personne, ce qui permet d’agir de façon ludique sur le comportement de conduite."

Les compagnies d'assurance se servent aussi de l'open data, les bases de données publiques qui sont donc ouvertes pour identifier en un potentiel client qui voudrait par exemple une assurance auto : "Quand vous voulez un tarif Auto et que vous arrivez sur Axa.fr, vous avez à peu près une quarantaine de questions, c’est un peu indigeste donc on doit réduire ce nombre de questions pour apporter un tarif rapidement. Ça nous amène à utiliser le « fast quote », la tarification rapide. L'internaute rentre seulement son immatriculation, et nous on se branche à une base de données externe pour rapatrier les informations sur votre véhicule. Il s'agit du fichier des immatriculations, distribué par le ministère de l’Intérieur, et mis à la disposition d’acteurs notamment des assureurs. Donc nous on en a fait l’acquisition, de manière à pouvoir faciliter l’expérience client de nos internautes sur Axa.fr".

AXA France
AXA France © Radio France / Anne Brunel

Et puis, dans ce secteur de l’assurance, une très grande attention est portée depuis longtemps à la récolte des données. Autrement dit, pour faire du BigData, on peut acheter des BDD, on peut recourir à l’OpenData, mais on a besoin d’abord et avant tout des données de ses propres clients.

Dans d’autres compagnies, l’exploitation des données conduit directement à renchérir les primes d’assurance. Stéphane Chappellier observe le même phénomène dans le secteur de l’assurance habitation, avec des capteurs d'ouverture/fermeture des portes, des capteurs qui détectent la fumée ou la température, ou qui peuvent identifier notre présence ou notre absence.

En contextualisant les données d'occupation de la maison avec le calendrier des vacances scolaires ou d’autres paramètres, vous pouvez identifier quel usage vous faites de votre maison, usage qui a un impact sur le risque, et donc sur le montant de la prime que l’assureur va vous demander.

Le risque d'une assurance à la carte

On sent bien qu’il ne faudrait qu’un tout petit pas pour que ces méthodes, qui ont cours dans l’assurance auto et l’assurance habitation, ne viennent s’appliquer à l’assurance santé, à nos mutuelles. Cela ce ferait d'autant plus facilement qu’au sommet des pratiques de collectes de données numériques on trouve les géants, les GAFAM : Google, Apple, Facebook, Amazon, Microsoft. Ils pourraient très bien alimenter les assureurs et les mutuelles en données pour nous cerner de plus près encore, car ils possèdent des montagnes d’informations sur notre santé… bâties à partir de données apparemment sans rapport. C’est précisément la crainte de l’ancien président du Conseil National du Numérique, Benoît Thieulin.

Avec votre carte de fidélité du supermarché, je vais être capable de savoir combien il y a de personnes chez vous, de vous dire si vous consommez plus de sucre que les recommandations de l’OMS. Etes-vous certain que quelqu’un d’autre ne pourrait pas utiliser ces données ? Il faut qu’on soit vigilant parce que sinon ça pourrait arriver.

Ce qui se profile, c’est donc une sorte d’assurance à la carte, qui changerait en fonction de notre comportement. Cette menace, même les médecins les plus impliqués dans la médecine connectée, comme le Docteur Postel-Vinay, la redoutent.

Le danger, c’est perdre le modèle social que nous avons dans notre pays, qui est la mutualisation des risques : que vous soyez à haut ou faible risque médical, tout le monde est protégé pareil. C’est un modèle exceptionnel, juste, équitable, et qui est menacé, parce qu’il est très tentant, à l’heure où il faut faire des économies, que des personnes disent « moi je ne veux plus payer pour des personnes qui n’ont pas ces bonnes conduites ».

Cette société se profile réellement. Il suffit de jeter un œil chez nos voisins. Depuis le printemps dernier, en Angleterre, un accord a été conclu entre la célèbre firme Google et le National Health Service (le système de santé publique britannique). La suite c’est le Docteur Paul Mandelbrojt, qui la raconte : "L’objectif de ce logiciel, c’est de repérer plus tôt que les médecins, les cas d’insuffisance rénale, pour les prendre en charge rapidement. Il va regarder tous les dossiers médicaux de ceux qui sont insuffisants rénaux et de ceux qui ne le sont pas, et il va essayer de déterminer quelles sont les causes qui différencient ces types de dossiers médicaux. Il y a des causes que les médecins connaissent, mais il y en a peut-être qu’ils ne connaissent pas".

Au fond, les géants du numérique aident le système de santé britannique, c’est plutôt positif… mais on peut aussi se demander : qui a le pouvoir désormais ? Qui définit les politiques de santé publique ?
Si ce sont les principaux détenteurs du « cloud », qui se mettent aussi à travailler sur les données médicales des Etats, alors c’est tout simplement un changement de société, au niveau mondial, qui se prépare. Selon Cédric Cartau, le marché de la prochaine décennie, ce sera le service offert à des professions médicales, d’analyses de données et du conseil sur du traitement de pathologies. Il donne un exemple déjà en cours : Monsanto, qui "est capable de dire que dans tel champ, à telle période de l’année, il vaut mieux planter du colza plutôt que du blé. Il le sait parce qu’il a compilé des données énormes sur la pluviométrie, les rendements à l’hectare, la quantité d’engrais qu’il fallait utiliser. Il a fait du BigData sur le secteur de l’agriculture.Les agriculteurs vont devenir, si on ne fait rien, les ouvriers de Monsanto".

Il ne faudrait pas que le corps médical européen finisse par devenir les employés de GAFAM. Il y a un enjeu énorme de société derrière ça.

Si on résume, c’est peut-être bien là qu’est le pouvoir : les géants du numérique ont à leur disposition quasiment toutes nos données, ils ont la puissance de calcul, ils ont la puissance financière de mener des recherches extrêmement poussées, plus aisément que la recherche publique.

►►► Voir la page de l'émission "Secrets d'Info" en cliquant ici.

Programmation musicale :
"La grippe" de Jacques Higelin et Brigitte Fontaine (1973)

A lire aussi :

Une infographie sur les principales cybermenaces en 2014
Mosaïque d’exemples de piratage de données de santé, TéléSantéCentre, Groupement de Coopération Sanitaire
Santé connectée : comment protéger les données ? France Culture, Raphaël Godet

Ce contenu n'est pas ouvert aux commentaires.