Hace tan solo cinco años, el big data era algo ajeno a la mayoría de las empresas del planeta. Hoy, es uno de los campos de mayor crecimiento y demanda.
En Orange, más de 200 personas trabajan desarrollando la inteligencia de los datos. Todos se agrupan en un equipo independiente de análisis de datos. Se hacen llamar los Data Freaks. ¿A qué se dedican? ¿Qué objetivos persiguen? ¿Cómo ha cambiado el negocio a través del business intelligence? Francisco Escalona, líder del equipo de Data Science and Artificial Intelligence de Orange y miembro de estos Data Freaks, analiza la actualidad de los datos masivos en Orange.
[hde_related]
¿Qué hacéis los Data Freaks?
Hace dos años y medio, Orange decidió montar un equipo de datos interno con dos objetivos fundamentales. Uno era poner orden en los datos de la empresa montando un data warehouse único, un lugar donde se guardan los datos de ventas y de clientes. Orange es una fusión de muchas empresas y tenía esos datos distribuidos. El objetivo era montar un data warehouse unificado para tener los datos operativos en un mismo sitio independientemente de la empresa de origen. La segunda iniciativa era desarrollar proyectos de big data e inteligencia artificial (IA). Empezar a ver qué se podría conseguir con estas tecnologías.
[hde_quote author=»Francisco Escalona» position=»líder del equipo de Data Science and Artificial Intelligence de Orange»] Contribuimos a la distribución de las antenas, la mejora de las ventas o la reducción de la fuga de clientes. En total, llevamos más de 20 proyectos en paralelo [/hde_quote]
Esto empezó hace dos años y medio con 14 personas y ahora somos más de 200. Estas dos siguen siendo las iniciativas principales. Lo que hacemos, en el área de data warehouse, es tener en un solo sitio todos los datos operativos de la empresa y hacer el reporting de la actividad. Que, por ejemplo, los datos de ventas o de clientes salgan del mismo sitio sin ser la suma de marcas diferentes. Y en el equipo de big data hacemos proyectos para cualquier departamento de la empresa.
¿En qué áreas de negocio utiliza Orange la inteligencia de datos?
Nosotros somos un área independiente que no depende de ninguna de las áreas de negocio de Orange. El objetivo es poder dar servicio a los equipos de redes, de sistemas de información, de ventas o de marketing. Podemos darles servicios a todos y priorizar los proyectos de las peticiones que nos hacen de forma equitativa. No tenemos ningún tipo de presión.
Digamos que las áreas de negocio nos hacen peticiones al área de big data y nosotros valoramos la viabilidad de estas solicitudes y el retorno que le daría a la empresa. En función de eso, vemos si lo hacemos o no. Ayudamos a todas las áreas. Contribuimos a la distribución de las antenas, la mejora de las ventas o la reducción de la fuga de clientes. En total, llevamos más de 20 proyectos en paralelo.
Millones de clientes, millones de dispositivos conectados… ¿qué volumen de datos manejáis?
Hablamos y medimos en petas. Manejamos petabytes, miles de terabytes. El volumen es muy alto.
¿Cuáles son los desafíos de su tratamiento?
El principal desafío que tenemos todas estas áreas es aportar valor a la empresa. El tema no es tanto el volumen de datos que tengas, sino utilizar los datos para aportar valor. Uno de los grandes errores que se dan hoy en día en la industria con respecto al big data es hacer pruebas de concepto sin llegar a industrializar. Nosotros no lo hacemos. El objetivo no es hacer pruebas de concepto. Es aportar a la empresa.
Esto parece obvio, pero hay muchas empresas que no lo hacen. Hacen pruebas con los datos, ven que se obtienen cosas resultonas, pero luego no lo aplican a sus procesos. Así que el principal desafío sigue siendo poder aportar valor aplicando el big data a los procesos existentes de la empresa.
[hde_quote author=»Francisco Escalona» position=»líder del equipo de Data Science and Artificial Intelligence de Orange»] Para el tratamiento del lenguaje, Orange ya cuenta con asistentes virtuales y está integrada con los principales asistentes como Google o Alexa [/hde_quote]
El fin último es transformar la empresa en función de los nuevos datos. A día de hoy, los datos mejoran los procesos existentes. El futuro pasa por que los procesos se hagan en función de los datos. Convertirnos en lo que se llama una empresa data-driven.
¿Qué ventajas concretas habéis generado para Orange?
Hemos generado mucho valor económico para Orange. Básicamente, cada euro que se invierte en big data e inteligencia artificial te produce un retorno de x10. Es decir, cuanto más se invierta, mayor será el retorno. A nivel procesos, los procesos core de la empresa muy trabajados se pueden hacer hasta un 20% más eficientes.
¿Qué hacéis en concreto desde el equipo de Data Science e Inteligencia Artificial que tú diriges?
Dentro del área de datos, tenemos un chief data officer, Óscar Caballero, y dos equipos principales, uno de data science e inteligencia artificial y otro de data engeneering. En temas de big data, los ingenieros de datos tienen como objetivo el de tratar los datos para que sean legibles y que se pueda trabajar con ellos. Cogen datos de diferentes fuentes, desde tuits hasta datos de los equipos de red, y los transforman a un formato utilizable. Es decir, llevan a cabo lo que se llama la ingestión, el procesamiento y el almacenado de los datos.
Una vez que están ahí, llegan los científicos de datos. Sobre esos datos, construimos modelos matemáticos para mejorar las operaciones de la empresa. Por ejemplo, cómo ayudamos al despliegue de las antenas. Los datos de dónde están situadas hoy y los datos de la topografía de España los cogen los ingenieros y hacen la ingesta y el tratamiento. Como resultado, nos dan una base de datos con la información detallada de todas las antenas que hay en España. Sobre eso, los científicos hacen modelos matemáticos para ver dónde hay que poner las antenas.
¿Cómo planea Orange sacar partido a la revolución de la inteligencia artificial?
Nosotros, los científicos de datos, ya hacemos inteligencia artificial. Los modelos matemáticos que desarrollamos son todos algoritmos de machine learning que entrenamos y utilizamos. En la inteligencia artificial hay varias patas. Una es usar el aprendizaje automático para mejorar procesos, que es lo que ya estamos haciendo. Otra es usar la inteligencia artificial para el tratamiento del lenguaje y una tercera para el tratamiento de la imagen.
Los algoritmos para la optimización de los procesos ya los venimos desarrollando desde hace tiempo. Para el tratamiento del lenguaje, Orange ya cuenta con asistentes virtuales y está integrada con los principales asistentes como Google o Alexa. Y, en el futuro, va a lanzar su propio altavoz inteligente, Djingo. El uso de IA para el tratamiento de imagen está menos desarrollado en Orange, porque en nuestro día a día no existen casos de uso con un retorno confirmado para la empresa.
Imágenes | Orange