🎤 Interview Data School - Bastien Rance

Date
8 juillet 2021
Rédacteur
Lang Apolline
Editeur
Lang Apolline

 


 

🎤 Qui es-tu ?

 

Je suis Bastien, professionnellement je suis maître de conférence et praticien hospitalier à l'hôpital Georges Pompidou à Paris  et je suis chercheur dans  une équipe affiliée à l’Inserm et à l’Inria, à la fois côté santé et côté informatique. Le sujet de l’équipe c’est l’interface entre l’informatique et le biomédical, ce qui m'intéresse c’est la réutilisation du texte et de la donnée pour créer de l’intelligence artificielle. Plus généralement j’aime beaucoup l’informatique que j’ai apprise en autodidacte étant ado, j’ai un contact ancien avec l’informatique et la donnée. J’ai d’abord programmé sur ma calculatrice TI85, puis sur un Pentium 700 overclocké : en bricolant un peu on pouvait améliorer les processeurs.


 

🎤Comment expliquerais-tu ton métier à un enfant de 10 ans ?

 

Pour une partie, je suis enseignant-chercheur dont j'enseigne à l’université l’informatique pour la santé  -initiation à la programmation pour des médecins, des aspects sur la donnée, la modélisation etc.-  disons l’informatique au service du médical. L’autre partie de mon métier à l'hôpital c’est un service à la communauté médicale. Je suis au service du médecin qui est au service du patient. On génère beaucoup de données à l'hôpital, toutes les notes des médecins par exemple. Mon équipe est spécialisée dans la réutilisation de l'entrepôt de données de l'hôpital pour faire de la recherche pour mieux soigner. On cherche aussi à avoir de meilleurs outils pour soigner. Des outils comme Excel sont très utilisés mais très basiques, on les aide à avoir de meilleurs outils. On a toujours une obsession avec la vie privée et la sécurité des données, et éviter que la donnée ne se promène dans un fichier Excel. Par exemple, on ne travaille que sur des données dé-identifiées, anonymisées.


 

🎤Comment participes-tu à la Data School ?

 

J’ai participé sur deux aspects : intervenant dans un Voyage Apprenant “Dans les coulisses de la data” en tant qu’expert de la donnée médicale, et lors d’un atelier sur la visualisation de données, comment partager la donnée médicale dans des publications scientifiques par exemple. 


 

🎤 Quel a été ton moment coup de cœur de cette Data School ? 

 

Cela m’a conduit à relire un certain nombre de choses, notamment un livre de 1983 d’Edward Tufte The Visual Display of Quantitative Information et c’est hallucinant parce qu’il avait déjà identifié des problèmes et des concepts qu’on voit encore aujourd’hui. On se dit qu’il y a encore des choses à apprendre quatre décennies plus tard alors qu’à l’époque il n’y avait pas d’ordinateurs partout. Mettre la compréhension de la donnée à la portée de tous est aussi l’étincelle de départ qui m’a bien séduit.

 

🎤Quel.le expert.e de la Data, quel.le collaborateur.trice t’a inspiré le plus ?

 

Ce serait plutôt une mosaïque d’experts. Je travaille à un niveau académique qui fait que je rencontre beaucoup de gens très avancés dans leur travail, en informatique aussi avec des parcours d’autodidactes.

Un chercheur américain, Isaac Kohane, racontait que son premier chef, un pédiatre, en relevant une petite inflexion dans une courbe de croissance, a permis de détecter ensuite une tumeur au cerveau. C’est inspirant parce que c’est quelque chose qu’il a construit de sa connaissance médicale et de la donnée. Et sinon, ma chef Anita Burgun à l'hôpital, mon ancien chef… tous ces gens m’ont apporté beaucoup.


 

🎤Quelle place prend la “data” dans ton quotidien ? 

 

La data est omniprésente dans mon quotidien: je la manipule, j'en parle tout le temps. Au niveau personnel, je vais lire des choses, j’aime bien les jeux de société, les jeux vidéo, j’ai quand même une certaine connaissance de ce que ça recouvre et du coup je vois de la donnée partout ! J’ai eu à lire il y a quelques années un rapport d’accidentologie sur le ski, et ce que ça racontait sur la montagne, ses dangers, c'était assez fascinant. Au départ je pensais faire de la biologie mais je me suis rendu compte que l’informatique m’ouvrait sur un tas de sujets. Le fait d'être hospitalo-universitaire alors que je ne suis pas médecin, c’est grâce à la donnée. Et je suis convaincu qu'il faut avoir une double compétence pour être pertinent. 


 

De ton point de vue, donne nous un grand enjeu lié à la data ? 

 

C’est cette notion de lettrisme de la donnée que les gens voient et manipulent de la donnée sans le savoir. Par exemple, dans la crise du Covid, des données brutes hors contexte peuvent générer du mensonge. Cette culture générale de la donnée à disposition de tous me semble capitale, ce qui peut y contribuer m’intéresse. Il faut savoir lire la donnée, l'évaluer. Par exemple, des choix de finances publiques se basent sur une évaluation finalement assez obscure. Il y a besoin de plus de connaissance de la donnée pour tous. Le terme de donnée masque aussi une certaine variété … la donnée dans un tableur, la donnée comportementale, la donnée générée non structurée, jusqu’à l’espionnage de masse par des agences gouvernementales. Les téraoctets collectés par la NSA c’est pas la même chose que la data à l'hôpital ! Connaître le fonctionnement d’un ordinateur c’est aussi important que de connaître les principes de la donnée. Savoir que ce n’est pas magique, et savoir ce qu’on peut faire à partir de la donnée, c’est également important.



 

Quelle est ta data préférée ? qui t’es le plus utile ? que tu aimes partager ? Pourquoi ?

 

J’ai un faible pour les données textuelles qu’on manipule pas mal à l'hôpital parce que c’est compliqué. La donnée textuelle contient plus d’humanité, c’est le bazar, il y a les fautes d'orthographe, les acronymes, les doutes, les hésitations, tout un tas d’histoires qui sont racontées et sur lesquelles on essaye de créer des méthodes, des algorithmes, les techniques s'améliorent d’année en année mais parfois c’est compliqué. J’ai une vraie fascination pour le traitement de la donnée texte. On n’y pense pas toujours mais une grande partie de la data à l'hôpital se trouve dans les comptes-rendus médicaux. Il y a le parcours, l'hypothèse médicale, le médecin qui ne va pas dire la même chose selon l’état d’acceptation de la maladie par le malade… et nous, côté analyse, on doit retrouver la même chose que les données directes. 


 

📱🎶💻 Dataplaylist !

 

Si la Data School était une série, quel serait son générique, sa bande originale ?

Joker (Alt and catch fire, une série sur les débuts de l'informatique)

 

Ta playlist télétravail ? (3 titres incontournables)

 

Je travaille beaucoup avec de la musique classique. La Symphonie n°9 de Chostakovitch qui a une histoire fascinante avec le pouvoir soviétique, entre le succès populaire et le risque de se retrouver au goulag chaque matin. J’écoute aussi la Symphonie n°7 de Beethoven qui est une merveille, ou, dans la bande originale de la série Ovni, Zero Gravity, de Jean-Michel Jarre et Tangerine Dream remixé par Above and Beyond.


 

Pour finir, un site, un livre, un magazine, un podcast, un influenceur… inspirant sur la data ? Pourquoi ?

 

Le Code a changé”, de Xavier de la Porte, sur France Inter, est une réussite absolue. Ça parle du rapport entre le numérique et la société. Xavier de la Porte vient plutôt du monde littéraire et il a un recul sur ces questions qui est phénoménal. Il y a aussi un podcast américain que j’aimais bien “Reply all” sur les frontières inattendues entre internet et le monde réel, mais elle n’avait pas cette dimension de réflexion de chercher les rapports entre l’humain et le numérique.