Données massives et trajectoires algorithmiques: l’impasse de la décontextualisation des données
À l’ère des données massives, de l’utilisation étendue des systèmes algorithmiques et d’un certain virage scientifique et public en faveur des données ouvertes, les possibilités de propriété, de contrôle et de possession des données ayant trait à sa propre personne ou sa propre communauté se font de plus en plus limités, et les enjeux portant sur ce thème se font particulièrement saillants pour les communautés autochtones et les populations historiquement et socialement marginalisées (Russo Carroll et al., 2021; Abebe et al., 2021).
Effectivement, alors que les données massives générées par nos actions et existence numériques sont constamment transformées, par des systèmes algorithmiques, en résultats statistiques dissociés du contexte d’origine des données dont ils sont issus, la question de la traçabilité des trajectoires empruntées par ces données à l’intérieur des systèmes algorithmiques se heurte à un discours posant ces systèmes comme des «boîtes noires» qui seraient inéluctablement indéchiffrables et dont l’intérieur, ou le fonctionnement, ne sauraient être compris (Seaver, 2017). Ce mythe contemporain de la boîte noire algorithmique impose ainsi l’idée que le lien entre les données entrantes (les données d’input) ayant passé «à travers» un système algorithmique et les données ou résultats (output) sortant de ce système serait intraçable, et que les données d’input seraient donc résolument dissociées de leur contexte d’origine suite à leur traitement algorithmique.
Ceci se révèle être problématique pour différentes raisons. Premièrement, la dissociation des données de leurs contextes sociaux, culturels et historiques s’avère porter atteinte à leur qualité et à la scientificité de toute compréhension du monde pouvant en être issue: les résultats ou outputs de systèmes algorithmiques, dont les contours méthodologiques et d’origine seraient inscrutables, inidentifiables et incritiquables, ne pourraient guère se targuer d’offrir une représentation du monde réellement appréciable (Walter et Suina, 2019; Abebe et al., 2021).
Deuxièmement, il se fait saillant de remarquer que la décontextualisation des données qu’engendrerait leur traitement par système algorithmique implique la dépossession des individus les ayant générées du capital culturel, informationnel, épistémique et économique qu’elles représentent. Un système sociotechnique oppressant de donnéification (Milan et Treré, 2019), au sein duquel des pouvoirs corporatifs multinationaux prédateurs adoptent des pratiques extractives – que Couldry et Mejias (2019) décrivent comme un colonialisme de la donnée et que Ricaurte (2019) dénomme la colonialité du savoir – nourrit en effet les plus grands joueurs du capitalisme informationnel contemporain alors même qu’il dépossède les individus générant ces données de l’information les concernant et de la possibilité qu’ils devraient avoir d’y accéder, d’en bénéficier, de contrôler leur utilisation, et de se les approprier (Dhinakaran, 2021; Russo Carroll et al., 2021).
Cette injustice épistémique à saveur coloniale construit ses défenses d’une part dans une rationalité capitaliste justifiant rhétoriquement l’extraction des données comme la collecte d’une ressource naturellement générée et prête à être exploitée (Couldry et Mejias, 2019), et, d’autre part, dans l’opacification technico-discursive des processus algorithmiques dissociant les données d’output de leurs contextes d’origine.
Ces pratiques de décontextualisation des données perpétuent des violences symboliques générant des injustices empiriques qui sont tout particulièrement préjudiciables aux individus et communautés combattant déjà au quotidien des systèmes coloniaux portant atteinte à leur souveraineté identitaire, informationnelle, juridique et symbolique.
Bien que plusieurs critiques s’élèvent depuis quelques années contre le «colonialisme de la donnée» et que des initiatives d’agentivité numérique (Gentelet et Bahary-Dionne, 2021) et de souveraineté des données (Lovett et al., 2019; Russo Carroll et al., 2021) se développent au sein de différentes communautés afin de favoriser l’autodétermination informationnelle et de combattre l’extractivisme numérique, le discours mythico-contemporain dépeignant les systèmes algorithmiques comme des processus inscrutables et présentant la décontextualisation des données entrantes comme un sort inéluctable semble constituer une impasse majeure pour ces mouvements.
Il semblerait donc que l’heure a sonné d’ouvrir ces soi-disant «boîtes noires» algorithmiques, d’y relier les fils coupés et d’y tisser les fragments d’explicabilité nécessaires à l’instauration d’une justice épistémique au sein des processus de mise en données sociétales.
Références citées
Abebe, Rediet, Aruleba, Kehinde, Birhane, Abeba, Kingsley, Sara, Obaido, George, Remy, Sekou L. et Sadagopan, Swathi. (2021). «Narratives and Counternarratives on Data Sharing in Africa», dans Conference on Fairness, Accountability, and Transparency (FAccT ’21). New York, ACM, 12 p.
Couldry, Nick et Mejias, Ulises A. (2019). «Data Colonialism: Rethinking Big Data’s Relation to the Contemporary Subject». Television & New Media 20 (4): 336-349.
Dhinakaran, Aparna. (2021). «If Data Is The New Oil, What’s Happening To Its Precious New Source?». Forbes. En ligne: forbes.com/sites/aparnadhinakaran/2021/05/06/if-data-is-the-new-oil-what-happening-to-its-precious-new-source/?sh=6ecd55305fee
Gentelet, Karine et Bahary-Dionne, Alexandra. (2021). «Stratégies des Premiers Peuples au Canada concernant les données numériques : décolonisation et souveraineté». tic&société 15 (1): 189-208.
Lovett, Raymond, Lee, Vanessa, Kukutai, Tahu, Cormack, Donna, Carroll Rainie, Stephanie et Walker, Jennifer. (2019). «Good data practices for Indigenous data sovereignty and governance», dans Daly, A., Devitt, K., et Mann, M., Good Data. Amsterdam, Institute of New Cultures: 26-36.
Milan, Stefania et Treré, Emiliano. (2019). «Big Data from the South(s): Beyond Data Universalism». Television & New Media 20 (4): 319-335.
Ricaurte, Paola. (2019). «Data Epistemologies, The Coloniality of Power, and Resistance». Television & New Media 20 (4): 350-365.
Russo Carroll, Stephanie, Herczog, Edit, Hudson, Maui, Russell, Keith, et Stall, Shelley. (2021). «Operationalizing the CARE and FAIR Principles for Indigenous data futures». Scientific Data 8: Article 108.
Seaver, Nick. (2017). «Algorithms as culture: Some tactics for the ethnography of algorithmic systems». Big Data & Society 4 (2): 1-12.
Walter, Maggie et Suina, Michele. (2019). «Indigenous data, Indigenous methodologies and Indigenous data sovereignty». International Journal of Social Research Methodology 22 (3): 233-243.