En una reciente conferencia, Danny Lange – director de Machine Learning de Uber – deja clara su opinión: el Machine Learning debe llevarse a todos los rincones de la empresa. No en vano dirigió al equipo de Machine Learning en Amazon. Recordemos que Amazon ha llevado el Machine Learning a todas sus áreas para hacer cosas tan interesantes como predicción de la demanda de sus productos, fijar su precio, hacer recomendaciones personalizadas, optimizar las rutas de distribución, mejorar la visión computarizada o detectar fraude. El año pasado dieron un paso más y crearon una plataforma en la nube para acercar las capacidades del Machine Learning a todas las empresas.
Merece la pena revisar el vídeo de arriba si quieres saber qué están haciendo en estos momentos las grandes compañías punteras en el uso de datos. Estas empresas se han llamado «Data Driven«, es decir, que toman decisiones basadas en datos y en muchos casos automatizadas (por ejemplo, el precio del clic en los anuncios de Google se calcula con subastas mundiales en tiempo real basadas en la oferta y la demanda instantánea). Se trata de compañías que principalmente nacieron en Internet, como Google, Amazon, Facebook o el propio Uber.
Uno de los principales obstáculos que estamos viendo en la implementación de Machine Learning en las empresas es, precisamente, que no tienen claro cómo empezar a usarlo y muchas veces tampoco entienden las ventajas que supone. Este último punto se despeja cuando mostramos ejemplos y explicamos lo más didácticamente posible la tecnología. En cambio el primero, cómo empezar a integrarlo en la empresa, es más complicado porque supone poner los pies en el suelo y empezar a trabajar con una tecnología innovadora. La innovación tiene sus riesgos, pero estamos convencidos de que el Machine Learning ha llegado para quedarse y que va a revolucionar las sociedades tanto como lo ha hecho el móvil.
Lo que sigue a continuación es una guía inicial sobre cómo empezar a trabajar con Machine Learning en la empresa. Nuestro punto de vista se aproxima mucho al de Danny Lange y se basa en los siguientes principios.
1. Empieza por algo sencillo
Hay empresas, incluso grandes, que no están prediciendo por ejemplo qué clientes se van a dar de baja de sus servicios (lo que en inglés se conoce como churn). Estas compañías centran sus esfuerzos en conseguir más nuevos clientes que los que se van, sin darse cuenta de que tienen suficientes datos como para predecir quién se va a ir a la competencia. El cambio de paradigma es de mucho valor: el coste económico de mantener a un cliente es muy inferior al coste de conseguir uno nuevo. La predicción de bajas es, sin lugar a dudas, una buena forma de empezar. El objetivo de estos proyectos iniciales es tener quick-wins que ayuden por un lado al negocio a entender las posibilidades que se les abren y por otro que las áreas tecnológicas empiecen a valorar cómo integrarlo en sus sistemas.
En CleverData hacemos este tipo de proyectos con una duración media de 3 semanas.
2. Empieza por Machine Learning supervisado
El Machine Learning supervisado permite hacer predicciones de una forma sencilla usando datos históricos. La palabra «supervisado» no tiene nada que ver con que haya un humano «revisando» el algoritmo predictivo, sólo es una de las técnicas posibles de Machine Learning. Con Machine Learning supervisado se puede:
- Predecir la demanda (qué cantidad de producto se va a comprar la semana que viene)
- Predecir la fuga de clientes (qué clientes se van a ir a la competencia el mes que viene)
- Detectar fraude (qué compras o transacciones son fraudulentas)
- Predecir cancelaciones (de reservas de hotel, mesas en restaurantes)
- Prevenir la morosidad (predecir si un cliente va a dejar de pagar)
Las ventajas principales del Machine Leaning supervisado frente a otras técnicas radican en que es más fácil de entender, responde a preguntas concretas (como las del párrafo anterior) y dispone de potentes métodos para evaluar la calidad de los algoritmos antes de ponerlos en producción. No hay duda: es la técnica ideal para iniciarse en la empresa.
3. No empieces con Big Data
Trabajar con Big Data es muy costoso, además de que muchas empresas todavía no tienen una infraestructura adecuada para almacenar una cantidad enorme de información. El procesamiento del Big Data tarda horas por su alto volumen. Pero para usar Machine Learning no es necesario tal cantidad ingente de información. Basados en nuestra experiencia, las empresas tienen actualmente más que suficiente cantidad de datos para crear algoritmos predictivos de muy alta calidad. Es más importante tener buenos datos que muchos datos.
Nos solemos encontrar con empresas que están en plena vorágine de almacenamiento de datos. El Big Data está de moda (aunque esta moda ya empieza a estar obsoleta) y recolectan cuantos más datos mejor; «luego ya veremos lo que hacemos con ellos». Nosotros pensamos que este enfoque es erróneo. Las empresas disponen ya hoy de suficientes datos para hacer proyectos muy interesantes y que aportan valor al negocio, sin tener que esperar a grandes infraestructuras de almacenamiento de inmensas cantidades de datos.
Un ejemplo: los datos con los que trabajamos en CleverData en proyectos de introducción de Machine Learning en la empresa no superan los 30 megabytes.
4. Utiliza Machine Learning en la nube
Desde el punto de vista tecnológico más friki, lo que está más de moda es hacer Machine Learning programando en Python o en R. Nosotros pensamos que es un error. Los motivos son numerosos, aunque aquí sólo destacaremos tres. En primer lugar, es necesario contar con profesionales altamente especializados en tareas de programación y algoritmia. Normalmente se trata de personas que no están lo suficientemente cerca del negocio como para atender las necesidades de los clientes. En segundo lugar, los algoritmos programados en estos lenguajes son de complicada puesta en producción y difícilmente reutilizables (cualquier programador sabe que reutilizar el código que ha escrito otro programador es muy complejo). Por último, las plataformas en la nube disminuyen los costes de forma espectacular.
Las plataformas en la nube con sistemas basados en API facilitan la reutilización de los algoritmos al residir en un único lugar y con acceso a sus funcionalidades, no a su código.
Las grandes empresas como Facebook, Amazon o Uber están implementando ya sistemas de Machine Learning en la nube internamente como una infraestructura más de la empresa. De la misma forma que hace años las empresas disponen de un servicio de bases de datos al alcance de cualquier departamento (o programador), los sistemas de Machine Learning se están incorporando como motores accesibles a cualquier empleado.
5. Y sobre todo, empieza ya
Tu competencia puede estar aprovechando ya sus ventajas competitivas. Es tiempo de ponerse en marcha con Machine Learning. Las ventajas en ámbitos como el turismo, retail, banca o seguros son indiscutibles y todavía no sabemos todas las posibilidades que tiene en los negocios. No importa en qué sector esté tu empresa. Lo que sí tenemos claro es que no es necesario esperar a tener miles de millones de datos para crear aplicaciones de alto valor para el negocio.
Por otro lado, el coste se ha reducido de forma estrepitosa desde que se dispone de plataformas en la nube. En CleverData somos partners de dos de las principales empresas que tienen las herramientas más avanzadas de Machine Learning en la nube: AzureML de Microsoft y BigML. Lo que hacen las grandes empresas tecnológicas (Apple, Amazon, Facebook), como predecir qué clientes se van a ir el mes que viene o la demanda de productos, ya está al alcance de todas las empresas. ¿Empezamos ya?