Une présentation fascinante de Kate Crawford, chercheuse principale chez Microsoft Research, à la conférence Strata 2013 examine de plus près les mégadonnées et ce qu'elles signifient, en explorant certaines de ce que Crawford appelle les «illusions algorithmiques» et les limites des solutions de données à grande échelle qui sont adoptés dans de nombreuses parties du monde des affaires.
En utilisant une analogie fondamentale avec une illusion d'optique impliquant un chat en rotation, Crawford démontre que même si les mégadonnées sont essentielles pour de nombreuses applications commerciales, il existe plus d'une façon d'interpréter de nombreux résultats d'ensembles de données qui peuvent sembler objectifs aux décideurs humains. .
"Les choses peuvent être vues différemment", a déclaré Crawford, citant un article dans lequel elle et son co-auteur David Boyd réfléchissent sur certains principes majeurs de l'utilisation des mégadonnées, y compris ce que Crawford appelle "la mythologie", ou la croyance que les mégadonnées apportent une vérité absolue et objectivisme à un projet. Les dirigeants, a-t-elle déclaré, associent souvent directement les mégadonnées à une vision objective, tout en ignorant ce qu'elle a appelé les trois limitations ou considérations fondamentales qui peuvent affecter cette objectivité de manière clé: biais, signal et échelle.
En partant d'un parti pris, Crawford utilise des exemples d'inondations en Australie et aux États-Unis pour montrer que les mégadonnées ne correspondent pas toujours à la réalité de la rue. Elle relie le deuxième principe, signal, illustrant davantage comment les ensembles de données peuvent refléter des réalités cachées qui peuvent fausser fortement les résultats. À titre d'exemple, Crawford a cité les multiples types de cartes du monde qui ont été développées dans le but de montrer une vue objective de la taille relative des continents et des nations.
"Les cartes ne sont pas neutres", a déclaré Crawford. "Nous faisons des choix chaque fois que nous décidons de représenter nos données."
Pour illustrer davantage le principe, Crawford utilise l'exemple d'une application qui signale les nids-de-poule à Boston aux responsables de la ville, suggérant que ces types d'applications qui fonctionnent sur les smartphones et les appareils mobiles peuvent finir par faire ressembler les rapports globaux aux cartes de recensement indiquant l'âge relatif et les revenus dans une ville ou une municipalité.
"Nous courons le risque de renforcer encore certains types particuliers d'inégalité sociale", a déclaré Crawford, pointant du doigt ceux qui pourraient être exclus d'un ensemble de données volumineuses donné en raison des différences d'utilisation de la technologie.
"Que se passe-t-il si vous vivez dans l'ombre des ensembles de Big Data?" dit-elle.
En outre, Crawford parle également de recherches menées il y a des années qui se demandaient si les informations de haut niveau représentaient toujours des données plus granulaires et si un "panorama objectif" fonctionnait toujours comme une représentation plus précise que les données à plus petite échelle. Crawford demande également aux auditeurs de penser non seulement aux mégadonnées, mais aux «données avec profondeur». Par cela, elle entend des données qui guident vraiment les lecteurs vers la réalité objective, plutôt que de passer sous silence les détails avec une approche plus globale qui, bien que plus facile à comprendre, peut laisser de côté des éléments clés de ce qui existe réellement.