Por qué la analítica no es una ciencia exacta

0
269

Lisa Morgan, de InformationWeek, escribió recientemente : “Los profesionales de negocios tradicionalmente han visto el mundo en términos concretos y, a veces, incluso en números redondos. Esa perspectiva heredada es en blanco y negro en comparación con los tonos de gris que produce la ciencia de datos. En lugar de producir un resultado de un solo número, como el 40 por ciento, el resultado es probabilístico, combinando un nivel de confianza con un margen de error “. O, para decirlo de manera más sucinta, la ciencia de datos no es una ciencia exacta.

Hay varias razones por las que este es el caso, que incluyen:

Los datos

Es posible que una empresa no tenga todos los datos necesarios para responder una pregunta en particular. Incluso con un conjunto de datos completo, si hay algún problema con la calidad de los datos, es muy probable que el análisis esté sesgado o sesgado. 

Esto subraya la importancia de invertir en una plataforma fundamental sólida que pueda abordar los problemas de calidad de los datos y garantizar que tanto los datos externos como los internos sean limpios, coherentes y estén preparados para producir los resultados deseables.

La pregunta

Como dice Morgan, “Se ha dicho que si uno quiere mejores respuestas, debe hacer mejores preguntas. Las mejores preguntas provienen de los científicos de datos que trabajan junto con expertos en el dominio para enmarcar el problema “. Las suposiciones preexistentes, los recursos disponibles, las limitaciones, los objetivos y las métricas de éxito son otras consideraciones que pueden afectar la forma en que se plantea la pregunta y, a su vez, la respuesta resultante.

La expectativa

Quienes trabajan en el campo comprenden que la ciencia de datos, el aprendizaje automático y la inteligencia artificial tienen limitaciones importantes. Otros más alejados del día a día suelen tener un punto de vista diferente, y estas expectativas poco realistas a menudo pueden generar desafíos.

El contexto

El contexto juega un papel importante en el éxito o el fracaso de una iniciativa analítica: un modelo puede funcionar perfectamente en un escenario y producir resultados decepcionantes en otro. Morgan afirma: “Incluso dentro del mismo caso de uso, un modelo de predicción puede ser inexacto. Por ejemplo, un modelo de abandono basado en datos históricos podría dar más importancia a las compras recientes que a las compras anteriores o viceversa “.

Etiquetas

El reconocimiento de imágenes se alimenta de datos etiquetados, pero no siempre es fácil etiquetar todo el contenido. La clasificación de imágenes puede variar según las diferencias culturales, las normas sociales y los eventos actuales. Morgan explica: “De manera similar, si una red neuronal está entrenada para predecir el tipo de imagen que proviene de un teléfono móvil, si ha sido entrenada con canciones y fotos de un teléfono iOS, no podrá predecir el mismo tipo de contenido procedente de un dispositivo Android y viceversa “.