Les biaiscréent des préjudices et des discriminations à l’encontre de certains groupes ou personnes. Des préjudices peuvent également résulter de l’exploitation intentionnelle des biais(des consommateurs) ou de l’exercice d’une concurrence déloyale, telle que l’homogénéisation des prix par le biais de la collusion ou d’un marché non transparent. L’utilisation des données recueillies par les réseaux sociaux pourrait contribuer à exacerber une telle situation, principalement en constituant des ensembles de données biaisées. Cela pourrait se produire, par exemple, en raison d’une collecte inadéquate des données produites par les personnes concernées. “Les données issues des médias sociaux peuvent être difficiles à vérifier – les utilisateurs peuvent mentir sur leur âge, leur localisation, leur emploi ou tout autre caractéristique. Les chercheurs doivent être conscients de ce problème et aborder cette difficulté le cas échéant. Il n’est pas conseillé de comprendre les utilisateurs comme le “grand public”, en raison des inégalités d’accès à internet, et les chercheurs devraient envisager comment favoriser la diversité (le cas échéant) dans leur échantillon.”[1] Il peut également arriver que des données déduites ou dérivées créent de tels biais en raison de leurs propres problèmes techniques. Si ces données biaisées alimentent le profilage ou la prise de décision automatisée, cela pourrait avoir des conséquences sociales inacceptables. Bien entendu, si la recherche implique l’utilisation de l’IA, cela augmentera probablement le risque lié aux biais (voir la sous-section “Licéité, loyauté et transparence” de la section “Concepts principaux” de la partie II des présentes lignes directrices).
Afin d’éviter un tel scénario, une évaluation critique de la provenance des données est nécessaire. À cette fin, des mesures organisationnelles doivent être mises en œuvre pour garantir la précision et la fiabilité des données collectées, tout en s’en remettant en fin de compte au droit des utilisateurs de ne pas divulguer des informations privées (par exemple, en confirmant si un enregistrement est exact ou non). En outre, la réalisation d’un audit consacré à la détection des biais dans les données brutes ou dans les ensembles de données déduites ou dérivées est nécessaire, en particulier lorsque les responsables du traitement utilisent des ensembles de données produits via les réseaux sociaux.
- Université de York, Guidelines for the Use of Social Media Data in Research, à l’adresse : https://www.york.ac.uk/staff/research/governance/research-policies/social-media-data-use-research/. ↑