Compréhension des données
Home » IA » Étape par étape » Compréhension des données

“La phase de compréhension des données commence par une collecte initiale des données. L’analyste procède ensuite à une familiarisation accrue avec les données, à l’identification des problèmes de qualité des données, à la découverte des premiers aperçus des données, ou à la détection de sous-ensembles intéressants pour former des hypothèses sur des informations cachées. La phase de compréhension des données comporte quatre étapes, à savoir la collecte des données initiales, la description des données, l’exploration des données et la vérification de la qualité des données”.[1]

Description

À ce stade, la collecte initiale des données a lieu et une première étude des données est réalisée. Elle comporte quatre tâches séquentielles :

  • Collecter les données initiales
  • Décrire les données
  • Analyser les données
  • Vérifier la qualité des données.

Toutes ces tâches visent à identifier les données disponibles. À ce stade, les développeurs doivent être conscients des données avec lesquelles ils auront à travailler et commencer à prendre des décisions sur la manière dont les grands principes liés à la protection des données seront mis en œuvre.

Principales mesures à prendre

À ce stade, un très grand nombre de questions fondamentales liées à la protection des données personnelles doivent être abordées. En fonction des décisions prises, des principes tels que la minimisation des données, la protection de la vie privée dès la conception ou par défaut, la licéité, la loyauté et la transparence, etc. seront réglés de manière adéquate:

 

  1. Shearer, C. (2000) ‘The CRISP-DM model : the new blueprint for data mining’, Journal of Data Warehousing 5(4) : 13-23, p. 15. Disponible à l’adresse : https://mineracaodedados.files.wordpress.com/2012/04/the-crisp-dm-model-the-new-blueprint-for-data-mining-shearer-colin.pdf (consulté le 15 mai 2020).

 

Liste de contrôle : compréhension des données

☐ Les responsables du traitement ont mis en œuvre des mesures techniques et organisationnelles appropriées pour garantir que, par défaut, seules les données à caractère personnel qui sont nécessaires pour chaque finalité spécifique du traitement sont traitées.

☐ Les responsables du traitement ont mis en place des politiques qui minimisent la quantité de données personnelles collectées, l’étendue de leur traitement, la période de leur stockage et leur accessibilité. Ces mesures garantissent que, par défaut, les données à caractère personnel ne sont pas rendues accessibles sans l’intervention de l’individu à un nombre indéfini de personnes physiques.

☐ Les responsables du traitement ne collectent pas de données inutiles. Si des données sont déjà stockées, ils ont pris des mesures visant à supprimer les éléments de données inutiles.

☐ Les responsables du traitement ont limité la résolution des données à ce qui est minimalement nécessaire aux fins poursuivies par le traitement.

☐ Les responsables du traitement ont choisi la base juridique qui reflète le mieux la véritable nature de leur relation avec la personne et la finalité du traitement.

☐ Les responsables du traitement ont soigneusement analysé si le traitement implique la désanonymisation de données anonymisées et la création de nouvelles informations personnelles qui n’étaient pas contenues dans l’ensemble de données d’origine et prennent des mesures adéquates pour faire face à ces défis.

☐ Les responsables du traitement se sont assurés que la fusion des ensembles de données ne crée pas de problèmes éthiques ou juridiques concernant les droits et libertés des personnes concernées.

Aller au contenu principal