Market Basket Analysis: Big Data y Machine Learning en Retail

by Andrés González

Recientemente hemos terminado un proyecto con una de las cadenas de supermercados líderes en España. Nos solicitaron que hiciéramos un análisis de los datos de los tickets de compra de una tienda de un periodo de 3 meses para saber qué artículos se compran habitualmente juntos. Es lo que en el ámbito del Machine Learning se conoce como Association Discovery y que aplicado al mundo del retail se denomina Market Basket Analysis, o análisis de la cesta de la compra.

Qué es el Association Discovery

El Association Discovery trata de descubrir patrones de compra en grandes volúmenes de datos. A diferencia de otras técnicas de Machine Learning, encuentra asociaciones entre valores, no sólo entre variables.

basket-analysis-machine-learning

Visto en Kdnuggets

En el caso que nos ocupa hemos encontrado más de 500 asociaciones de compra que indican que la compra de un producto está “conectada” con la compra simultánea de otro. Cada asociación corresponde a un emparejamiento de patrones de compra de dos o más productos. Por ejemplo, una asociación nos podría decir que la compra de atún en lata está fuertemente relacionada con la compra de salsa de mayonesa. Evidentemente eso no quiere decir que siempre que se compra atún también se compra mayonesa, pero sí nos indica que el atún y la mayonesa se compran juntos de una forma más frecuente que otros productos. Serían dos productos que están, de alguna forma, conectados.

Este tipo de información basada en datos puede ser utilizada por parte de las unidades de negocio para maximizar los objetivos de negocio. Veamos cómo.

Por qué es importante para el negocio

Saber qué productos se compran simultáneamente sirve para mejorar las ventas en varios ámbitos. Por ejemplo, si sabemos que cuando se compra pan y hamburguesa, también se compra kétchup, podemos aumentar las ventas de kétchup si ponemos estos tres productos en la misma sección o estantería del supermercado. Además el cliente estará más satisfecho porque no tendrá que recorrer pasillos buscando los productos.

Aplicaciones de negocio

La aplicación práctica de nuestro cliente va más allá del posicionamiento de productos en la tienda. Nuestro trabajo junto con el equipo de negocio de la cadena de supermercados nos ha abierto la perspectiva a otras aplicaciones para maximizar las ventas basadas en:

  • El posicionamiento de los productos en el lineal. Colocar juntas la cerveza y las patatas fritas si se ha determinado que se compran simultáneamente, maximiza la venta de ambos productos.
  • Las mejoras de las ofertas “trade”. En el sector del retail habitualmente se hacen ofertas de paquetes de compra de 2 o más productos. La búsqueda de asociaciones permite la selección de estos productos para maximizar la atención del cliente y, finalmente, las ventas de los paquetes.
  • La selección del surtido para las tiendas. En las tiendas no caben todos los productos de los que dispone el supermercado. El análisis de los productos que se compran simultáneamente en la tienda más grande de la cadena ayuda en la selección del surtido de las tiendas.
  • La venta cruzada (o “cross-selling”) de productos complementarios en caja. Ofrecer un producto a todos los clientes que pasan por caja es una buena estrategia para vender más. Pero, ¿qué pasaría si pudiéramos hacer una oferta personalizada en función del ticket de compra del cliente, en lugar de ofrecer siempre el mismo producto, sea cual sea el cliente? Si sabemos que el arroz está asociado a la compra simultánea de tomate frito, ofrezcamos el tomate a ese cliente que ha comprado arroz, en lugar de un refresco de cola.

Consideraciones sobre las asociaciones

Las asociaciones de productos no ocurren porque están “naturalmente” conectadas, sino por diferentes factores. Uno de los factores más importantes es el posicionamiento de los productos en las estanterías (o “lineal”).

Otros factores que influyen en las asociaciones son la época del año (en navidad se compran productos distintos que en verano), las tiendas que tiene la competencia en los alrededores, el tipo de barrio en el que está situada la tienda (barrio comercial, turístico, de negocios…) o las ofertas disponibles en el periodo de análisis.

Por otro lado, un número no despreciable de asociaciones son “evidentes” (por ejemplo, la compra simultánea de champú y acondicionador de pelo). Para eliminar estos resultados triviales, es necesario seguir estrategias de análisis diferencial, comparando tiendas, periodos del año, clientes, barrios, etc.

En este sentido, si se observa una asociación en una tienda pero no en el resto, significa que hay algo interesante en esa tienda. De la misma forma, si una asociación se produce en todas las tiendas excepto en una, significa que hay algo especial para investigar.

Conclusiones

El análisis de la cesta de la compra basado en datos permite optimizar las estrategias enfocadas en maximizar las ventas en el sector del retail. El Machine Learning puede ayudar en tareas como posicionar los artículos en las tiendas, seleccionar el surtido en las tiendas o en preparar recomendaciones como recurso de venta de último producto en caja. En definitiva, ayuda a mejorar la eficiencia en la toma de decisiones, a aumentar las ventajas competitivas y a optimizar los esfuerzos a la hora de conseguir los objetivos de negocio.

En CleverData pensamos que el momento para empezar a sacarle valor a los datos es ahora. La tecnología lo permite, los costes son infinitamente más bajos comparados con hace apenas 5 años y los datos están a nuestro alcance. La estrategia que aprovecha los datos para tomar decisiones de negocio no es ajena a la transformación digital de los negocios. Más bien al contrario, el uso de los datos para aumentar la eficiencia de los procesos y la relación con el cliente forma parte intrínseca de las empresas que destacan en el ámbito de la transformación de los negocios apoyada en las tecnologías digitales. Y ha llegado el momento de poner los datos a trabajar para nosotros.