By Orange
- Empresa

¿Conoces los efectos del Dirty Data?

26 julio, 2017

En los últimos años se ha hablado mucho del big data, esas cantidades masivas de información que generan las empresas y que requieren de sistemas potentes que los sepan ordenar, analizar y visualizar. Se suele decir que una compañía que maneje con criterio este maremagnum informativo tendrá mucha ventaja sobre sus competidores, porque podrá conocer al instante los cambios de gusto de sus clientes o las áreas que todavía están por explotar, por ejemplo.

Información incorrecta, incompleta, desactualizada…

Pues bien, además del big data, ahora tenemos también el dirty data, que podríamos traducir de forma intuitiva por “datos sucios”. Sin embargo, y para ser más precisos, el dirty data hay que entenderlo como un compendio de información residente en las bases de datos de las empresas y que es incorrecta, incompleta, desactualizada y que está trufada de duplicados.

Antonio Camacho, fundador de Hocelot, una startup de capital español especializada en la verificación de información de personas físicas en tiempo real, dice que con el auge del big data “las empresas desarrollaron algoritmos muy potentes para recabar y procesar información, pero dejaron en el olvido la necesidad de verificar toda esa gran masa de datos que reúnen”. Camacho asegura que más de la mitad de los usuarios aportan al menos un dato falso entre la información que ceden a las compañías.

Esto lleva, según él, a que el 25% de la información en manos de las empresas pueda llegar a ser falsa. Por ejemplo, casi uno de cada cuatro usuarios asegura que ha falseado su fecha de nacimiento de forma ocasional. Además, muchos usuarios no solo falsean un campo de información, sino que suelen ser dos o más. “El dirty data es, por tanto, un nuevo reto que las empresas deben afrontar si quieren reducir los riesgos por pérdidas relacionadas con el fraude de identidad”, advierte el fundador de Hocelot.

Verificar y valorar los datos

Por todo esto, los sistemas de big data que analizan y gestionan grandes volúmenes de información en el menor tiempo posible, ahora también deberán supervisar otras dos variables: la veracidad y el valor de la información.

Las compañías no solo deben identificar la información personal falsa, sino también deben conocer los motivos que han llevado a sus clientes a falsearla. Camacho asegura que el fraude de identidad supone pérdidas para las compañías de 1.600 millones de euros.

Pero ¿dónde se suele acumular esta suciedad informativa? Según Camacho, se extiende por todas las áreas de las empresas, pero hay departamentos donde la situación es crítica. Hablamos de marketing, recursos humanos y financiero. El primero ve claramente reducido el éxito de sus campañas de e-mailing debido a que los datos con los que cuentan sus profesionales no son verídicos. Además, llegado el momento de realizar una segmentación, la fiabilidad queda en entredicho.

Por otra parte, en el departamento de personal, el dirty data afecta especialmente a los procesos de selección, ya que no cuentan con métodos fiables para la verificación de la información aportada por los candidatos, especialmente el currículum. Finalmente, el departamento financiero de las compañías está afectado, lo que complica principalmente la concesión de créditos o la financiación de compras.

Por Juan I. Cabrera

martagamez

Ver más artículos del autor