Conclusions
Le big data et l’intelligence artificielle eauront un impact considérable sur la société et des avantages potentiels dans tous les secteur. Le PNR 75 a exploré des pistes variées pour accélérer le développement de nouvelles technologies et applications du big data, et aborder les défis sociétaux associés. Garder la maîtrise de cette évolution représente un défi majeur pour nos institutions publiques et privées, qui exige des efforts ciblés dans de nombreuses directions, de l’éducation à la réglementation, en passant par des initiatives sectorielles et des débats publics. Les conclusions du Comité de direction du PNR 75 ont été formulées sur la base des connaissances acquises au cours des cinq années de recherche ainsi que de réflexions collectives.
Ces conclusions ont pour but de promouvoir des développements appropriés et de soutenir les mesures déjà en cours. Il revient aux parties prenantes de décider comment – ou si – les transformer en actions concrètes. Elles explicitent les besoins et perspectives identifiées du point de vue de la recherche sur le big data. Ce condensé a été élaboré par les membres du Comité de direction sur la base des résultats des projets de recherche et de leurs propres connaissances et leurs expérience.
La recherche scientifique peut apporter des éléments de réponse aux questions soulevées par le big data. Ils peuvent néanmoins faire apparaître un manque de compatibilité entre les différentes approches. Il n’appartient pas aux scientifiques d’évaluer les priorités et les équilibres sociétaux, cette tâche revenant à la politique et aux processus démocratiques.
Le résumé du programme et ses conclusions représentent une contribution de la communauté scientifique à la formation de l’opinion, au débat politique et professionnel ainsi qu’à la planification des stratégies et mesures visant à développer des applications et des réglementations du big data. Il s’adresse notamment aux institutions qui définissent et façonnent l’espace suisse des données.
Favoriser un environnement approprié pour le développement du big data
(1) Améliorer la formation au big data
Utiliser efficacement les technologies du big data exige de nouvelles connaissances et compétences. Les spécialistes de l’informatique, même formés il y a une dizaine d’années seulement, peuvent éprouver des difficultés face à des thèmes tels que l’utilisation responsable de grandes quantités de données, leur intégration et analyse, l’apprentissage automatique ou la visualisation. Il y a une pénurie de personnel qualifié tout au long de la chaîne de valeur du big data, ainsi qu’une concurrence intense dans le monde universitaire, les grandes entreprises informatiques et les start-ups pour recruter les meilleurs talents. Pour tirer parti des avantages du big data dans les entreprises, la société et la recherche, il est recommandé d’étendre l’enseignement du big data dans les formations scolaire, universitaire et continue.
Les universités et hautes écoles spécialisées doivent enrôler davantage d’étudiantes et étudiants en informatique et proposer des programmes d’études axés sur le big data aux niveaux bachelor, master et doctorat. Des cours sur ses aspects pertinents doivent être proposés dans les domaines faisant fréquemment appel au big data. Cela pourrait accroître la diversité dans le domaine IT puisque le big data recouvre un domaine plus large que l’informatique et nécessite des compétences interdisciplinaires qui englobent également les aspects sociétaux, commerciaux et juridiques.
Il est important d’élargir les offres de formation continue sur les mégadonnées en couvrant tout le pipeline du big data, comme la collecte des données, leur préparation, intégration, nettoyage et mise en relation. Se former aux nouvelles bibliothèques opensource, qui évoluent rapidement, est nécessaire afin d’utiliser de manière qualifiée les infrastructures de stockage, de gestion et de valorisation des données. Il est important d’être en mesure d’utiliser des outils de visualisation de données. Enfin, le personnel doit être en mesure d’appréhender les questions juridiques, réglementaires et éthiques liées au big data, notamment en se formant dans des programmes interdisciplinaires.
Comme les développements rapides du big data toucheront tout le monde, l’éducation au big data doit être intensifiée et continuellement modernisée dans les écoles, les lycées et la formation professionnelle. Elle doit inclure la science des données et les questions sociétales.
(2) Soutenir le conseil juridique et éthique pour les projets de R&D en big data
De nombreux projets de recherche et de développement ont besoin de conseils juridiques et éthiques sur des points tels que le droit d’utiliser ou de partager des données. Les responsables de projet peuvent être mis au défi de communiquer efficacement et de convaincre que la base légale et éthique de leurs travaux est solide. Ceci peut être facilité par des conseils compétents et des audits disponibles à un coût abordable.
Cette problématique touche notamment les hautes écoles et les institutions de recherche publiques. Des recherches prometteuses ne sont pas menées et les formations perdent de leur attrait. La situation est exacerbée par le risque d’une couverture médiatique négative et une protection du personnel limitée. Les responsables de projet pourraient tirer profit d’un service interne ou de l’administration publique leur fournissant des conseils compétents, dignes de confiance et fiables sur les questions juridiques, éthiques et de communication.
Comment s’assurer que des activités sont conformes à la loi et à l’éthique? Quelles sont les raisons d’éventuelles limitations? Comment communiquer sur des activités de manière transparente, en particulier au sujet de thèmes controversés? Un service pourrait fournir des conseils sur ces questions, des directives pour accompagner la mise en oeuvre pratique, ainsi que des explications faciles à comprendre sur les considérations juridiques et éthiques. Il pourrait proposer des audits de l’utilisation et du partage des données, menés par des spécialistes qualifiés et certifiés.
(3) Permettre la certification des applications du big data
Les applications du big data ont le potentiel d’améliorer un large éventail de processus, notamment dans l’administration publique et le secteur privé. Dans certains cas, les applications soulèvent des questions d’équité, de biais, de discrimination, de normes éthiques, ou encore de confidentialité. Il est recommandé de mettre à disposition des moyens de certifier les propriétés pertinentes des applications du big data afin de rendre leur adoption possible. Il s’agit à la fois de spécifier les propriétés pertinentes et de proposer des procédures pour certifier qu’une application les satisfait.
De nombreuses applications du big data sont utilisées dans des domaines non sensibles, offrant une amélioration des performances, de l’efficacité et des coûts. Des avantages considérables sont également attendus dans des contextes sensibles, comme les services sociaux, de santé ou de police. Des processus pour la conformité réglementaire et la certification de la conformité existent déjà dans des domaines importants tels que l’énergie, la construction ou le commerce. Il est recommandé de les étendre afin qu’ils incluent également les propriétés spécifiques aux applications du big data.
Intégrer le big data dans les organisations publiques et privées
(4) Accroître l’exploitation des technologies du big data dans le secteur de la santé
La santé est un excellent exemple de secteur dans lequel le potentiel du big data est largement reconnu par les parties prenantes tout en restant loin d’être complètement exploité. Mettre l’accent sur une gestion et une prise de décision fondées sur les données pourrait transformer les pratiques actuelles et potentiellement améliorer la transparence, qualité, sécurité, efficacité et coordination des soins, tout en renforçant les compétences des patientes et des patients en matière de santé. Ce potentiel ne doit pas rester inexploité. Les aspects juridiques et éthiques doivent être abordés afin que le big data puisse être utilisée plus largement dans le secteur de la santé.
La Suisse a mis en place le dossier électronique du patient (DEP) ainsi que des mesures de qualité dans le secteur de la santé, ce qui démontre la possibilité d’initiatives fédérales dans ce domaine. Dans sa forme actuelle, le DEP se résume à une collection non structurée de documents scannés. Il lui manque des résumés et des index structurés, des formats de données harmonisés, une interopérabilité sémantique et une terminologie standardisée. Il manque de compatibilité avec une analyse automatisée des données et des directives de standardisation. Le DEP a néanmoins un énorme potentiel si une couche d’anonymisation est introduite afin de permettre des analyses collectives des données médicales. Des technologies de protection de la vie privée peuvent être utiles, comme les enclaves, dans lesquelles les données sont uniquement traitées sans être accessibles directement de l’extérieur, ou encore l’analyse fédérée, qui peut traiter des données distribuées sans compromettre leur sécurité. Ces technologies doivent être davantage développées et ont besoin de comités compétents sur le plan éthique, juridique, scientifique et statistique pour la supervision de l’utilisation des données.
(5) Renforcer l’élaboration et l’évaluation des politiques grâce au big data
Renforcer l’élaboration et l’évaluation des politiques grâce au big data Les possibilités accrues de collecte et d’analyse des données établissent une base solide pour renforcer une élaboration de politiques qui se base sur les faits. Il est possible de quantifier davantage les problèmes sociaux et économiques et d’évaluer l’efficacité des politiques et des réglementations. Ce potentiel doit être exploité d’une manière à la fois responsable et bénéfique.
En contrepartie, les données utilisées pour la conception et l’évaluation des politiques devraient être accessibles au public, ce qui nécessite à nouveau de considérer les questions de confidentialité et d’anonymisation. Dans l’ensemble, les entités administratives concernées doivent être soutenues afin de pouvoir gérer la charge croissante de travail et la communication. Les procédures et les mécanismes nécessaires à la mise en oeuvre de telles coopérations doivent être développés et établis.
(6) Promouvoir la collecte partagée des données, l’open-source et les benchmarks
Des infrastructures librement accessibles vont accélérer la création de valeur à partir des données. Il est recommandé d’affiner les politiques en matière de publication des données afin d’augmenter le volume de l’open data. Un meilleur soutien à la création de benchmarks et de cas d’usage pour les applications dans différents domaines scientifiques se justifie. Les logiciels open-source représentent souvent une alternative intéressante aux produits commerciaux onéreux. Il est recommandé d’allouer des fonds supplémentaires au développement de logiciels open-source afin de permettre des fonctionnalités et capacités open-source nouvelles et incluant par exemple des infrastructures informatiques de nouvelle génération et des outils d’apprentissage automatique.
Le développement des applications peut être accéléré par des benchmarks englobant des ensembles de données anonymes et des cas d’usage représentant des scénarios courants dans les domaines ciblés. Ces références sont utiles pour le développement et le test des applications ainsi que pour améliorer la précision et les prédictions des algorithmes. Elles peuvent faciliter le déploiement et la validation à grande échelle des applications du big data.
Les logiciels open-source peuvent accélérer la création de valeur à partir de données. Il est recommandé de mettre en place des incitations au partage des outils sous forme de logiciels open-source. Par exemple, l’évaluation des carrières académiques devrait considérer l’impact sur la société d’une adoption à grande échelle de logiciels libres développés par des scientifiques, au même titre que leur nombre de citations. De telles initiatives constitueraient un service public important, contribueraient à attirer des talents internationaux en Suisse, et constitueraient un élément-clé de la numérisation de la Suisse.
Actualiser et créer des réglementations adéquates
(7) Poursuivre une réglementation proactive du big data
Alors que les technologies du big data sont déployées à un rythme rapide, leur réglementation n’en est qu’à ses débuts et accuse un retard considérable sur les développements technologiques. Le manque de réglementation peut avoir des effets négatifs, notamment sur la démocratie, la santé mentale des jeunes, la concurrence ainsi que l’innovation, par exemple, en raison de biais ou d’une concurrence limitée. Il est recommandé de déployer des efforts généralisés pour accélérer les processus réglementaires, ceux-ci pouvant jouer un rôle important pour éviter les effets négatifs et d’encourager la création de valeur basée sur le big data.
La fracture numérique s’étend au big data et décrit une relation asymétrique entre les institutions qui collectent, stockent et analysent les mégadonnées et les personnes qui y sont sujettes. Elle est une conséquence inévitable d’une société valorisant la liberté et la diversité. Au lieu de tenter d’éliminer cette fracture, il est recommandé que la législation identifie les préjudices qui peuvent en résulter et élabore des garanties juridiques pour les personnes désavantagées.
Le succès des applications du big data repose sur la confiance. Lors de la mise en place des cadres dans lesquels les données peuvent être collectées, analysées et utilisées, il convient non seulement d’insister sur la création de normes (en autorégulation) équilibrant les intérêts des entreprises et de leur clientèle, mais aussi de donner à celle-ci les moyens de prendre des décisions en connaissance de cause.
Dans l’ensemble, il est important de développer des garanties juridiques pour compenser les préjudices causés par la fracture du big data, à l’aide de normes pour la collecte, le partage et l’analyse des données, et pour protéger les groupes vulnérabilisés par le déploiement du big data.
(8) Assurer la confidentialité des données et la souveraineté numérique
Le déploiement d’applications basées sur le big data comporte des risques pour la vie privée et les droits connexes des personnes. Même si des cadres juridiques de base existent en Suisse (nouvelle loi sur la protection des données à caractère personnel) et dans l’UE (règlement général sur la protection des données, RGPD), la conformité aux règles peut représenter un défi. Il est recommandé de sensibiliser aux questions de confidentialité et aux règles de protection des données les scientifiques et les ingénieur·es travaillant avec le big data, les propriétaires de données et les responsables de la protection des données. Il est également recommandé d’élaborer des normes complètes sur le respect de la vie privée et d’accorder une attention accrue à la sécurité des infrastructures numériques.
Un programme national de protection des droits liés aux données implique des acteurs et thèmes variés. Il est important d’encourager la création de liens solides entre les nombreuses parties prenantes dans les disciplines concernées. Il est recommandé d’élaborer des méthodologies pour établir les meilleures pratiques en matière de collecte et d’anonymisation des données, de stockage sécurisé et d’analyse préservant la vie privée. Par exemple, le développement d’enclaves de données offre une option intéressante pour garantir la confidentialité. Le concept de consentement éclairé devrait être complété par des mécanismes de protection spécifiques.
La recherche développe des techniques de préservation de la confidentialité, mais leur déploiement prend du temps. Certaines d’entre elles peuvent contribuer à une stratégie nationale de protection des droits liés aux données, par exemple la nomination d’administrateurs protégeant les données personnelles des individus, ou l’implémentation de critères d’équité dans l’analyse des mégadonnées afin d’éviter la discrimination. Le traitement quotidien des questions liées à la vie privée pourrait être facilité par l’élaboration de lignes directrices en matière de protection des données, ou par la création d’un centre de compétences spécialisé (par exemple au sein du Centre national pour la cybersécurité) en tant que service public chargé des questions juridiques liées à la vie privée lors du déploiement du big data.
(9) Renforcer l’harmonisation transnationale des réglementations
Les données traversent souvent les frontières. L’accès aux données de l’étranger ainsi que le déploiement international de services basés sur le big data sont courants. Une perspective purement nationale sur l’application et la réglementation du big data est insuffisante. Il est nécessaire d’observer et de s’engager au niveau international. En raison des nombreuses organisations internationales ayant leur siège en Suisse, le pays se trouve dans une position unique pour soutenir les activités d’harmonisation par les institutions d’orientation transnationale. La Suisse a la possibilité de démontrer son engagement et son expertise dans les organisations internationales ainsi que dans la législation nationale.
Alors que la Suisse s’engage activement dans les négociations, un soutien supplémentaire est recommandé. Il est fortement recommandé que la Suisse apporte sa contribution à l’élaboration en cours du Guide OCDE sur le devoir de diligence pour une conduite responsable des entreprises (CRE). La Suisse a joué un rôle important en tant que promoteur du Forum de l’ONU sur la gouvernance de l’Internet à Genève. Compte tenu des tensions accrues dans le monde numérique, il est recommandé que la Suisse fournisse des efforts pour contribuer à éviter la fragmentation dans la réglementation de l’économie basée sur les données.