Une occasion unique pour travailler sur une recherche de pointe

Auteure
Prof. Sihem Amer-Yahia
Membre du comité de direction du PNR 75 “Big Data”

Sihem Amer-Yahia a été nouvellement élue au comité de direction du PNR 75. Nous lui avons posé quelques questions sur ses recherches, le PNR 75 et Big Data en général.

Vous êtes membre du comité de direction. Quelles sont vos attentes vis-à-vis du PNR 75 ?

Le PNR 75 reconnaît la nécessité de soutenir la recherche dans la construction d’infrastructures Big Data, mais aussi l’importance d’aborder l’impact sociétal du Big Data en finançant deux axes complémentaires : les questions juridiques et les domaines d’application. Le PNR 75 constitue une occasion unique pour les data scientists, les experts dans un domaine d’application et les juristes, pour travailler ensemble sur une recherche de pointe. Les attentes du PNR 75 sont de continuer à financer les trois axes et d’encourager la fertilisation croisée entre les axes par le partage des données et des meilleures pratiques en Big Data.

Que manquerait-il si le PNR 75 n’existait pas ?

Si le PNR 75 n’était pas là, les chercheurs et les praticiens continueront à être financés uniquement dans leur propre discipline. L’enrichissement mutuel nécessaire au succès de la recherche sur le Big Data n’aura probablement pas lieu, ou elle aura lieu dans des projets privés et non partagés.

Pouvez-vous nous expliquer ce que Big Data signifie pour vous ?

L’avènement du Big Data a placé la Data Science au centre de grandes initiatives dans divers domaines. De plus en plus de programmes de Master offrent aujourd’hui un programme mixte avec une formation qui combine les disciplines de Data Science et l’expertise dans un domaine particulier comme le management et la santé. Le Big Data est en train de brouiller les frontières entre les responsabilités et les compétences des membres d’un projet, et cla constitue une nouvelle opportunité pour développer une expertise dans des domaines divevers. Par exemple, de plus en plus de data scientists développent une expertise médicale et de plus en plus de médecins deviennent compétents dans l’utilisation des infrastructures et librairies Big Data.

Quel est l’impact le plus important, selon vous ? Qu’est-ce qui n’a pas de sens ?

L’impact le plus important sera obtenu par des projets impliquant des data scientists, des experts d’un domaine et des juristes. Ces trois facettes du Big Data ne peuvent être réalisées qu’avec la participation de chercheurs et de praticiens qui sont prêts à consacrer le temps nécessaire à des disciplines en dehors de leur domaine d’expertise. De plus, les chercheurs ont la responsabilité de promouvoir la recherche et les méthodologies d’autres disciplines dans leur communauté de recherche. Dans la recherche en informatique (data management, data mining, machine learning), nous assistons à la création de filières spécialisées qui acceptent des articles présentant un mélange d’expertises sous la forme de « use cases » ou de « Experimental and Analyses ». C’est un bon signe et il faudrait encourager davantage d’efforts de ce type pour promouvoir les collaborations interdisciplinaires. Ce serait absurde et contre productif de confiner le travail de chaque discipline et de ne pas écouter les besoins et les avancées dans les autres disciplines.

Parlons un peu de vos recherches : Lors de la Research Day du PNR 75, vous avez parlé de « Fairness in Online Labor Markets ». Quelle était votre question de recherche spécifique ? Pourquoi avez-vous choisi cette question ?

Les marchés de l’emploi en ligne gagnent en popularité en tant qu’intermédiaires pour embaucher des gens qui accomplissent des tâches en ligne. Des exemples sont les plates-formes telles que Qapa et MisterTemp’ en France, et TaskRabbit et Fiverr aux États-Unis. Sur ces plates-formes, les individus peuvent trouver des emplois temporaires dans le monde physique (par exemple, la recherche d’un plombier), ou sous la forme de « micro-gigs » virtuels tels que « l’aide avec HTML, JavaScript, CSS, et Jquery ». Les personnes cherchant un travail sont classées et triées par algorithmes en fonction de leur qualification pour l’emploi. Cela pose naturellement la question de la fairness dans la sélection des individus. Cette question est essentielle car de plus en plus de personnes comptent sur les plateformes en ligne pour trouver un emploi.

Quelles sont les conclusions ?

Les principales conclusions de mon travail sont la nécessité d’étendre l’étude à plusieurs plateformes et de comparer la manière dont les personnes sont traitées par exemple sur TaskRabbit, et sur Google Search (Google a récemment introduit les offres de travail dans les résultats de recherche). Ce type de travail ne peut être mené que dans le cadre d’une collaboration entre les spécialistes des données et des spécialistes en sciences sociales, en particulier avec des juristes. Plusieurs autres questions doivent encore être résolues, notamment celle de savoir quel cadre juridique est applicable, et comment remédier à la discrimination.

Merci beaucoup pour cet entretien intéressant.

Sur le PNR 75