Hay tres tipos de análisis de datos que podemos realizar: descriptivo, predictivo y prescriptivo. Veamos en qué consiste cada uno de ellos y cómo combinarlos.
Índice
Análisis Descriptivo
El análisis descriptivo se ocupa de estudiar el pasado. Como el nombre indica, el análisis descriptivo se usa para describir lo que ha pasado. Hay varias formas de describir el pasado:
- Usando estadísticas fáciles de entender, en plan: mínimo, máximo, media, mediana, cuartiles, desviación típica, los 10 mejores / peores. La misma información se puede dar agrupada. Por ejemplo, estadísticas de las ventas de una multinacional agrupadas por país.
- Usando gráficos que resuman los datos. Hay varios tipos de gráficos que pueden ser útiles. Por ejemplo, evolución de ventas, beneficios y costes como serie temporal. O también de distribución de datos; por ejemplo, histogramas con la edad de los clientes.
- Las tablas también son un aspecto fundamental del análisis descriptivo. Si habéis visto el balance de una empresa a final de año, sabes de qué estoy hablando.

Análisis Predictivo
El análisis predictivo se refiere al uso de aprendizaje automático supervisado. A efectos prácticos, normalmente consta de estos pasos:
- Decidir qué es lo que queremos predecir en el futuro. Por ejemplo, predecir la probabilidad de que un cliente haga click en un anuncio de Internet.
- Decidir en qué datos van a estar basadas estas predicciones (atributos relevantes). Por ejemplo, historial de compras, productos que ha buscado, productos que normalmente se compran juntos, etc.
- Darle a la Inteligencia Artificial datos históricos. Debemos incluir tanto los atributos relevantes como el resultado que obtuvimos.
- Como estamos interesados en predecir, tenemos que estar seguros que la IA no haya aprendido los datos de memoria. Es importante estar seguros que «ha entendido» los datos. Esto quiere decir que ha extraído un modelo que refleja la relación entre los datos de entrada y los resultados a predecir. Para estar seguros tendremos que medir la generalización del modelo y realizar un análisis de errores.
- Una vez que tenemos un modelo de IA del que nos podemos fiar, sólo nos queda usarlo para predecir. Siguiendo el ejemplo anterior, podemos calcular la probabilidad de que un usuario haga click en varios anuncios. Después podemos ordenar los anuncios, de mayor a menor probabilidad, y mostrar los más probables.
Si quieres profundizar en las fases del proceso del análisis predictivo, puedes consultar este artículo.
Como resumen, quédate con que en el análisis predictivo, lo más importante es la calidad de la predicción.
Análisis Prescriptivo
Con el análisis prescriptivo intentamos cambiar el futuro. Es decir, vamos a usar Inteligencia Artificial para descubrir qué tenemos que hacer para obtener los resultados que queremos.
Una forma de realizar análisis prescriptivo es usando modelos de inteligencia artificial explicables. Por «explicables» quiero decir que podamos entender cómo el modelo de machine learning está realizando su predicción. Actualmente los modelos de machine learning que mejor resultados dan para predecir, son difíciles de interpretar. Por ejemplo, esto le pasa a las redes neuronales profundas (deep learning) y a los bosques aleatorios (random forests).
Por ejemplo, para realizar el análisis de las noticias de portada de menéame, usé regresión logística. La regresión logística es un modelo fácilmente interpretable. Así que podemos inspeccionar lo que ha aprendido y cómo los datos de entrada influyen en los resultados.
Si conseguimos encontrar qué causa los resultados que queremos … entonces ya sabremos lo que tenemos que hacer. Aunque con cuidado.
Tenemos que tener cuidado cuando inspeccionamos los modelos de machine learning. Aunque un modelo sea muy bueno prediciendo, podría haber aprendido los datos de memoria. Primero hay que asegurarse de que el modelo generaliza bien.
También ayuda mucho la Inteligencia Humana (IH). Nosotros podemos en muchos casos validar lo que nos está diciendo la IA, especialmente si tenemos una mente abierta y sentido común.
Experimentos aleatorios (randomized tests)
Después de usar una IA explicable, asegurarnos que generaliza bien y usar nuestra inteligencia humana … el último paso es realizar experimentos aleatorios (randomized tests). Estos experimentos se usan mucho en farmacia. Son el estándar para demostrar la efectividad de un medicamento. También se usan mucho para la optimización de sitios web y marketing. En este contexto se les llama tests A/B.
Ejemplo de test aleatorio
Por ejemplo, creamos un modelo de machine learning para predecir cuánto tiempo un usuario va a visitar un sitio web. Usamos un modelo de machine learning explicable y nos damos cuenta que unos de los factores principales es el tamaño de letra de la página que visitan.
Podríamos concluir que lo que tenemos que hacer es aumentar el tamaño de letra de todos los artículos. Pero hay otros factores que no estamos considerando. Por ejemplo, a lo mejor los distintos tamaños de letra corresponden a las preferencias de los autores de los artículos. Así que, en este casos, los visitantes del sitio web tendrían preferencia por el autor, en lugar de por el tamaño de letra.
Para estar seguros tendríamos que realizar un experimento aleatorio. Conforme vayan llegando usuarios, aleatoriamente les daríamos una de dos versiones: una en la que todas las páginas tienen una fuente mayor, y otra en la que la fuente es normal. Al medir los resultados de este experimento podríamos saber realmente si un tamaño de letra mayor es una causa del tiempo en el sitio web.
Resumen
En este artículo hemos visto las diferencias entre los análisis descriptivo, predictivo y prescriptivo. Una resumen rápido sería:
- Análisis Descriptivo: describe lo que ha pasado con estadísticas, gráficos, tablas e informes.
- Análisis Predictivo: realiza predicciones que van a ser útiles en el futuro. La calidad de la predicción es lo más importante
- Análisis Prescriptivo: ayuda a entender qué tenemos que hacer para obtener los resultados que queramos en el futuro