Big Data in Sozialwissenschaften

Le big data en pratique: sociologie, sciences des données et journalisme

Auteure
Prof. Sophie Mützel
Université de Lucerne

Entretien avec la responsable du projet PNR 75 «Faire face au Big Data: méthodes et compétences pour une sociologie du XXIe siècle»?

Quels sont les principaux messages de votre projet «Faire face au Big Data: méthodes et compétences pour une sociologie du XXIe siècle»?

Les méthodes, les outils et les compétences sont essentiels au développement des disciplines scientifiques, qu’elles soient nouvelles ou existantes. L’apprentissage des méthodes joue un rôle déterminant non seulement pour la formation de praticiennes et de praticiens compétents, mais aussi pour le développement d’une identité disciplinaire et professionnelle.

Comme l’ont montré nos recherches sur l’évolution des sciences des données et du journalisme de données, la diversité des expertises et le travail au-delà des frontières disciplinaires et professionnelles sont indispensables à l’innovation. Les méthodes, les outils et même les visualisations font partie des compétences transversales qui permettent l’échange et le développement de domaines de connaissances au-delà de ces frontières.

Les méthodes, outils et compétences sont essentiels. Mais ils ne suffisent pas à relever les défis et à saisir les opportunités de l’ère numérique. Seules des approches transdisciplinaires, qui associent les connaissances en sciences sociales et humaines à des connaissances techniques, peuvent permettre d’acquérir des connaissances sur la manière dont le social est structuré, sur la manière d’interpréter le contenu des modèles obtenus par algorithme à partir de données issues par exemple d’interactions sociales en ligne, et sur la manière de remédier aux distorsions structurelles immanentes aux ensembles de données. Nous attribuons à la sociologie une fonction primordiale de traductrice entre les données, les analyses, les interprétations et les répercussions éventuelles.

Quelles sont les implications selon vous?

La science des données est un domaine interdisciplinaire entre l’industrie, l’économie, la politique et la science, qui requiert des compétences transversales. Le journalisme des données est lui aussi interdisciplinaire et combine une grande variété d’expertises. Cela implique que l’émergence des domaines doit être considérée comme un développement interdisciplinaire, basé sur une diversité d’expertises et d’acteurs qui peuvent se concurrencer, mais également coopérer.

Quelles sont vos recommandations?

En raison de l’évolution des données et des méthodes, les nouvelles compétences nécessaires exigent une adaptation des domaines spécialisés, ainsi que le développement et le perfectionnement des compétences transversales. Toutefois, pour remédier au manque de compétences en matière de données, de visualisation, de modélisation et de raisonnement par ordinateur, il ne faut pas seulement développer et proposer des programmes en ingénierie et en informatique. Le Big Data et les méthodes nécessaires à son analyse requièrent des compétences transversales qui dépassent les frontières disciplinaires. L’expertise sociologique, par exemple sur la structuration du social, sur les pièges des distorsions inscrites dans les ensembles de données et sur l’interprétation des modèles identifiés, peut servir de pont entre les disciplines.

Une autre recommandation est de continuer à promouvoir la connaissance ouverte et le partage des données. Il ne s’agit pas seulement de l’accès ouvert aux publications et de la disponibilité des ensembles de données dans des référentiels, mais de l’idée globale d’un partage des connaissances pour la science. Une idée à laquelle les décideuses et décideurs devraient prêter une attention particulière.

Et qu’en est-il des sciences sociales en particulier?

Pour les chercheuses et chercheurs en sciences sociales, un problème récurrent est celui de l’accès aux données des médias sociaux lorsqu’ils ne font pas partie des équipes de recherche des grandes entreprises high tech. Twitter offre un accès à son API aux chercheuses et aux chercheurs, et Facebook divulgue des ensembles de données très limités sur des thèmes choisis pour la recherche. Mais dans l’ensemble, la collaboration avec les entreprises est difficile. L’accès aux données dépend souvent de postes privilégiés au sein des entreprises ou de l’accès à ceux-ci. Certaines chercheuses et certains chercheurs en sciences sociales, qui s’intéressent aux ensembles de données actuels, cherchent des solutions de contournement dans des cadres expérimentaux ou développent leur propre logiciel pour collecter des données en ligne. Des directives pourraient d’ailleurs aider les chercheuses et chercheurs à accéder aux données dans les archives et les entreprises.

A propos du projet

La thèse de doctorat «Données. Science. Société», dans laquelle Philippe Saner couvre le domaine des sciences des données du projet PNR75, a reçu le prix Ulrich Teichler 2021 de la Gesellschaft für Hochschulforschung (GfHf): «Lors de la remise du prix en ligne, le Dr Roland Bloch, membre du comité de la GfHf et président du jury, du Centre de recherche en éducation et formation de l’Université Martin Luther de Halle-Wittenberg, a salué la thèse de Saner en ces termes: «Avec l’émergence des sciences des données en Suisse, cette thèse traite d’un sujet d’actualité qui se situe à l’interface de la recherche universitaire et scientifique. Le travail de Philippe Saner est à la fois passionnant, minutieux et innovant.»

Liens supplémentaires