Preparación de los datos
Home » IA » IA: el proceso paso a paso » Preparación de los datos

“La fase de preparación de datos abarca todas las actividades para construir el conjunto de datos final o los datos que se introducirán en la(s) herramienta(s) de modelización a partir de los datos brutos iniciales. Las tareas incluyen la selección de tablas, registros y atributos, así como la transformación y limpieza de los datos para las herramientas de modelización. Las cinco etapas de la preparación de datos son la selección, la limpieza, la construcción la integración y el formateo de los datos.”

Descripción

Esta etapa incluye todas las actividades necesarias para construir el conjunto de datos final que se introduce en el modelo, a partir de los datos brutos iniciales. Comprende las cinco tareas siguientes, que no se realizan necesariamente de forma secuencial.

  1. Seleccionar los datos. Decidir los datos que se utilizarán para el análisis, basándose en la pertinencia de los objetivos de la minería de datos, la calidad y las restricciones técnicas, como los límites del volumen o los tipos de datos.
  2. Limpiar los datos. Elevar la calidad de los datos hasta el nivel requerido, por ejemplo, seleccionando subconjuntos limpios de los datos, insertando valores por defecto y estimando los datos que faltan mediante modelización.
  3. Construir datos. La construcción de nuevos datos mediante la producción de atributos derivados, nuevos registros o valores transformados para los atributos existentes.
  4. Integrar datos. Combinar datos de varias tablas o registros para crear nuevos registros o valores.
  5. Formatear los datos. Realizar modificaciones sintácticas en los datos que pueda requerir la herramienta de modelización.

Principales acciones a abordar

Lista de control: Preparación de los datos

☐ Los responsables del tratamiento se han asegurado de que los datos sean exactos, es decir, correctos y actualizados.

☐ Si se prevé la elaboración de perfiles o la toma de decisiones automatizada:

☐ Los responsables del tratamiento han enviado a las personas un enlace a su declaración de privacidad cuando han obtenido sus datos personales de forma indirecta.

☐ Los responsables del tratamiento han explicado cómo las personas pueden acceder a los detalles de la información que han utilizado para crear su perfil.

☐ Los responsables del tratamiento han comunicado a los interesados que les proporcionan sus datos personales y cómo pueden oponerse a la elaboración de perfiles.

☐ Los responsables del tratamiento han introducido procedimientos para que los clientes puedan acceder a los datos personales introducidos en sus perfiles, de modo que puedan revisar y editar cualquier problema de exactitud.

☐ Los responsables del tratamiento han implantado controles adicionales en sus sistemas de elaboración de perfiles/toma de decisiones automatizada para proteger a cualquier grupo vulnerable (incluidos los niños).

☐ Los responsables del tratamiento se han asegurado de que solo recogen la cantidad mínima de datos necesaria y tienen una política clara de conservación de los perfiles que crean.

☐ Los responsables del tratamiento han llevado a cabo un EIPD para considerar y abordar los riesgos cuando inician cualquier nueva toma de decisiones o elaboración de perfiles automatizados.

☐ Los responsables del tratamiento han implicado al DPD correspondiente en estas actividades.

☐ Los responsables del tratamiento han considerado los requisitos del sistema necesarios para apoyar una revisión humana significativa desde la fase de diseño. En particular, los requisitos de interpretabilidad y el diseño eficaz de la interfaz de usuario para apoyar las revisiones e intervenciones humanas.

☐ Los responsables del tratamiento han diseñado e impartido la formación y el apoyo adecuados a los supervisores humanos.

☐ Los responsables del tratamiento han dado al personal que participa en el tratamiento la autoridad, los incentivos y el apoyo adecuados para abordar o escalar las preocupaciones de los individuos y, si es necesario, anular la decisión del sistema de IA.

☐ Los responsables del tratamiento se han asegurado de que los equipos encargados de seleccionar los datos que se integrarán en los conjuntos de datos estén compuestos por personas que garanticen la diversidad que se espera que muestre el desarrollo de la IA.

☐ Los responsables del tratamiento se han asegurado de que se corrigen los factores que dan lugar a inexactitudes en los datos personales y se minimiza el riesgo de errores.

☐ Los responsables del tratamiento han implementado herramientas destinadas a prevenir los efectos discriminatorios sobre las personas físicas por razón de su origen racial o étnico, sus opiniones políticas, su religión o sus creencias, su pertenencia a un sindicato, su situación genética o sanitaria o su orientación sexual, o que den lugar a medidas que tengan ese efecto

 

Ir al contenido