Big Data: Applications

Les applications du big data offrent des possibilités dans de nombreux domaines. Leur développement nécessite néanmoins un travail important: établir des partenariats avec les parties prenantes, assurer l’accès technique et légal aux données, développer des modèles analytiques et valider les applications auprès des usagers et usagères.

Le PNR 75 a développé des applications basées sur le big data dans des domaines tels que la santé, la durabilité, la socio-économie et la recherche scientifique. Ils ne représentent qu’un petit sous-ensemble des secteurs qui explorent ou intègrent le big data. Ils vont des domaines avec une numérisation avancée, tels que la banque, le marketing et la santé, à des secteurs commençant à intégrer les données, comme l’agriculture, le journalisme ou le gouvernement.

Les projets financés par le programme ont amélioré les méthodologies existantes et en ont développé de nouvelles pour des applications dans certains domaines. Ils ont mis en évidence les avantages potentiels du big data pour la société et l’économie, comme pour la médecine personnalisée, la planification des transports, le déploiement intégré des énergies renouvelables, ou l’évaluation de l’effet des politiques socio-économiques.

Les diverses applications du PNR 75 ont atteint différents stades de développement, depuis de premiers modèles et prototypes jusqu’à des systèmes avancés. Cette diversité fait écho aux opportunités et aux défis liés à la création d’applications pratiques du big data.

Améliorer et personnaliser les soins de santé

De nombreuses approches veulent adapter les soins aux caractéristiques et aux besoins spécifiques des individus et des groupes de population. Les applications du big data ont un impact important sur la recherche, l’éducation et les soins de santé dans les institutions médicales ainsi qu’à domicile.

Soutenir la durabilité

Le développement d’une société durable demande d’optimiser les interactions entre les nombreuses composantes des systèmes d’énergie, de transport, d’approvisionnement ou d’alimentation.

Analyser les interactions socioéconomiques

Le fait que davantage de données soient collectées offre néanmoins de nombreuses opportunités pour l’évaluation et l’amélioration de mesures politiques

Accélérer la recherche

Le big data soutient également l’innovation par son rôle croissant dans la recherche fondamentale. Ce fait est visible notamment dans les très grandes collaborations internationales telles que le CERN à Genève, des projets d’astronomie, d’observation par satellite ou de génomique.

Messages clés

Attention à la hype

Les médias, l’industrie et les thinktanks décrivent parfois le big data comme une baguette magique: il suffit de trouver les données, d’ajouter un peu d’apprentissage automatique, d’entraîner les algorithmes et de construire une application pour être en mesurer de bouleverser les pratiques professionnelles et des secteurs économiques entiers. Cette vision trop simpliste cache de nombreux obstacles conceptuels, techniques, juridiques, collaboratifs et organisationnels.

La mise en place d’une application big data exige des efforts considérables: créer des partenariats avec les parties prenantes, identifier les sources de données, évaluer leur qualité, les stocker de manière sécurisée, les préparer pour l’analyse, trouver les algorithmes appropriés et les adapter ou en créer de nouveaux, évaluer leur performance et fiabilité, créer des interfaces pour utiliser les résultats et, finalement, intégrer la nouvelle application dans les procédures existantes.

La célébration excessive du big data obscurcit des questions très profondes, même si elles semblent évidentes. Les données existent-elles vraiment? Sont-elles accessibles? Sont-elles correctement décrites par des métadonnées? La vie privée peutelle être préservée et les réglementations respectées? Les utilisateurs finaux ont-ils réellement besoin de l’application prévue? Ces questions doivent être envisagées dès le départ afin d’évaluer de manière réaliste le travail à accomplir.

Votre domaine est-il prêt pour le big data?

Les applications du big data peuvent être développées de manière relativement linéaire lorsqu’elles s’appuient sur des prototypes existants (Potentiel des énergies renouvelables, Gestion des transports) ou lorsque des données de haute qualité et standardisées sont disponibles comme en météorologie ou biologie (Éruptions solaires, Genetic big data). Les efforts peuvent alors se concentrer principalement sur les questions techniques, telles qu’établir un pipeline pour accéder aux données en temps réel, concevoir les algorithmes ou créer des interfaces interactives conviviales. Les projets du PNR 75 ont fait des avancées importantes dans la conception, la mise en oeuvre et l’évaluation d’approches pratique de l’ingénierie des données, notamment pour la gestion, l’analyse, la visualisation, l’évaluation, l’audit, l’intégration et l’exploration des données.

À l’inverse, il est bien plus difficile de créer des applications du big data dans des domaines moins numérisés, manquant une culture des données et peu enclins à les partager (Pig data, Cartographie de l’innovation). Dans ce cas, il faut consacrer beaucoup d’efforts à des questions non techniques, comme la mise en place de partenariats entre des parties prenantes potentiellement réticentes. La disponibilité et la qualité des données doivent être évaluées dès le début, ce qui peut conduire à réviser les objectifs de l’application.

L’interdisciplinarité est nécessaire

La gestion de jeux de données à l’échelle du pétaoctet exige beaucoup de temps, de main-d’oeuvre et d’efforts collaboratifs afin de résoudre de nombreux problèmes techniques ou juridiques. Créer une application qui a un impact nécessite le plus souvent une approche interdisciplinaire pour aborder avec les parties prenantes tous les problèmes potentiels dès le début, y compris la manière dont la solution imaginée sera utilisée concrètement (Pig data, Détection d’inondation). Les scientifiques, les spécialistes du domaine et les partenaires privés ou publics doivent interagir fréquemment pour garantir l’acquisition et le partage de données de haute qualité et s’assurer que les applications répondent aux besoins concrets. Les scientifiques du PNR 75 ont exploré de nouvelles façons d’interagir efficacement avec les différentes parties prenantes. Faire participer les usagères et usagers dès le début améliore la conception des applications (Détection d’inondation). Ces expériences contribuent à consolider une recherche universitaire à même de développer rapidement des applications concrètes lorsque nécessaire.

Le monde réel est plus complexe que les données d’entraînement

Les algorithmes d’apprentissage automatique peuvent échouer sur le terrain, avec des conséquences potentiellement graves lorsqu’il s’agit de santé ou de véhicules autonomes. C’est un problème qui touche l’apprentissage supervisé lorsque les données d’apprentissage sont incomplètes, imprécises ou trop homogènes. Le recours à un apprentissage non supervisé plus frugal pourrait déboucher sur des systèmes plus robustes (Détection d’inondation).

Penser au «privacy-by-design» dès le départ

Les questions liées au respect de la vie privée et à la réglementation doivent être traitées avec soin, notamment avec l’aide de spécialistes juridique. Les approches de type «privacy-by-design» doivent être envisagées et mises en oeuvre le plus tôt possible. Il convient alors d’examiner attentivement les principes généraux tels que la limitation des objectifs, la transparence et la proportionnalité, ainsi que la minimisation, l’exactitude et la sécurité des données (Soins intensifs, Modèles numériques urbains). Le partage d’expériences, au sein d’un domaine ou entre plusieurs secteurs, favorise l’établissement de bonnes pratiques.