El data science es una profesión o habilidad que las empresas demandan cada vez más. Su objetivo primario es generar información útil para las empresas. Para ello, combina matemática, programación, estadística, visualización de datos y otras disciplinas. Con esta información, las marcas obtienen ventaja a la hora de competir.
Si tu empresa busca predecir (anticipar) el éxito de un producto, o quiere revisar sus históricos para optimizar la compañía hacia una flagship, entonces necesita de la ciencia de datos. Sin embargo, no siempre es fácil acercarse a esta disciplina desde el pequeño comercio, y parece relegada a las grandes empresas.
Diferencias entre data science y big data
El big data está muy de moda. Con una digitalización todavía en proceso, está, de hecho, más de moda que de actualidad. A menudo se confunde big data, data mining y data science, aunque se trata de técnicas distintas y complementarias.
- El big data es el proceso de recolección de grandes volúmenes de datos, su almacenado y un análisis en tiempo real en búsqueda de patrones. Suelen ser datos estructurados de los que conocemos el formato. Podemos compararlo a un pozo petrolífero abierto.
- El data mining engloba una serie de técnicas orientadas al análisis. Nos ayuda a comprender el contenido de una base de datos, filtrarlo, depurarlo y eliminar aquello que no aporta. Sería el equivalente a la extracción de gas natural separándolo del crudo.
- El data science es el último eslabón a la hora de convertir datos en información. Usa para ello grandes cantidades y varias bases de datos, algunas derivadas de procesos de data mining. En nuestra metáfora, el data science es una refinería de última generación.
Ocurre que la materia prima de la ciencia de datos no son únicamente bases de datos estructuradas. También trabaja con datos incompletos y desordenados, y combina en ocasiones cientos de fuentes. Además, su objetivo no solo es el de extraer información, sino el de mostrarla comprensible para el usuario.
¿Necesita mi empresa un data scientist?
En un mundo en aceleración continua, disponer de información es un recurso económico que conviene valorar. Se suele asociar la figura del data scientist con las grandes empresas, pero son las pymes y autónomos las que, usando su flexibilidad, pueden sacarles más partido. En comparación, las grandes empresas son lentas y tienen más complicado algunos usos.
Pero ocurre que son precisamente esas pymes las que no pueden permitirse contratar un científico de datos para su marca. Es aquí donde entran las consultoras y sus informes. En este espacio hemos destacado varios informes sobre ello: uno de franquicias a nivel mundial y otro de las cinco áreas beneficiadas por el IoT.
Gracias a estos informes, los empresarios pueden ponerse al día de las tendencias de distintos sectores. Los datos ya han sido recogidos, filtrados y analizados por otros, y aparecen en sencillos gráficos autoexplicativos. Además, suele ser contenido gratuito. Sin embargo, es poco profundo, con más conclusiones de encuestas que data science como tal.
Si buscamos información de último minuto de nuestro modelo de negocio, sector o micronicho, tendremos que recurrir a revistas especializadas. Estas suelen ser costosas, pero aportan mucha luz sobre el futuro de nuestra profesión.
En el caso de las grandes empresas, no hay excusa para dejar atrás el data science. De hecho, las profesiones STEAM y en concreto las especializaciones de científico de datos y responsable de RPA son necesarias.
¿Qué aporta el data scientist para una marca?
Si hay un área en la que este rol cobra especial relevancia es la segmentación de marketing. No todos los clientes buscan la misma aproximación, ni todos los sectores hacen uso del mismo canal de comunicación. ¿A mis clientes, qué les interesa más? ¿Un email, una red social activa, un buen canal de LinkedIn?
El análisis de datos, tanto en tiempo real como en la anticipación de tendencias, puede aportarnos información realmente útil. Un ejemplo sencillo lo dan los hashtags de Twitter. Conocer hora a hora las palabras clave nos ayuda colocarnos en la cresta de la ola de la información. Pero tomar el pulso al mercado no es tan sencillo como usar las palabras clave de una lista.
Otro espacio en el que el data science es clave es el diseño de estrategias de productos y servicios. En el ejemplo clásico del diseño de una aplicación, ¿la hago de pago, que sea gratuita, que sea freemium (gratuita con contenido prémium de pago)? ¿Cual de estas opciones está mejor aceptada? ¿Con cuál tengo más oportunidades de éxito?
El data scientist es capaz de localizar las fuentes necesarias para un análisis de este tipo y otros complementarios. Siguiendo con el último ejemplo, una buena forma de ‘construir un pozo’ sería el de almacenar todos los comentarios sobre aplicaciones de la competencia en una única base de datos. Esto es el big data.
Como data mining, podríamos separar los comentarios que no contengan palabras clave como “euro”, “moneda”, “pago”, “free”… Ahora tenemos un conjunto de comentarios útiles relacionados con nuestra temática. Hemos conseguido nuestra materia prima.
Como último paso (aquí ocurre la magia), podemos programar distintos contadores que analicen palabras positivas y negativas de los comentarios. De esta forma podemos analizar si existen reticencias al pago o si los usuarios están conformes. Esto no es fácil, es data science y requiere una formación elevada.
Por Marcos Martínez (euklidiadas)
Imágenes | iStock/ALLVISIONN, iStock/DragonImages