Forbes México.
Tendencia en análisis de datos: la aniquilación del dirty data
Por Antonio Camacho*
Este término ser refiere a todos aquellos datos incorrectos, incompletos, desactualizados o duplicados, y en su mayoría generados por los usuarios -por ejemplo, al llenar una encuesta, solicitar una prueba de servicio, o completar un formulario, incluso un simple error tipográfico, intencionado o no- que podrían falsear la información e interfieren con un exitosos análisis de datos.
La existencia de dirty data puede llegar a tener un impacto negativo económico y de reputación, ya que provoca un desconocimiento del cliente. Las mermas podrían resultar billonaria, y es especialmente crítico cuando hablamos de sectores como el de banca, finanzas, hipotecas o seguros, en donde las pérdidas ascienden a cuantiosas sumas por temas de morosidad y fraude.
De acuerdo con datos propios, más de la mitad de los usuarios mexicanos aporta al menos un dato falso a las organizaciones con las que interactúa, por lo que, 85% de la información con la que cuentan las empresas locales podría ser inexacta.
Frente a este problema, se han detectado 4 claves que ayudarán a las compañías a identificar y eliminar el dirty data de sus empresas y poner en valor datos reales.
Nuevos métodos para recabar información. Hoy en día, cualquier dispositivo es capaz de recabar datos. La información en redes sociales u otras plataformas nos arroja una actualización de datos constante y agrega un valor diferencial con el uso de variables distintas a las tradicionales. Tener una solución digital y analítica que permita lo anterior, proporcionará, no importando el sector, un elemento estratégico, pero sobre todo, una ventaja competitiva.
Evitar pedir datos innecesarios o sensibles. Por experiencia, los usuarios ocultan su información real con temas sensibles como domicilio o fecha de nacimiento, y terminan completando con inexactitudes todos los campos. Se debe evitar solicitar más información de la que la estrategia amerite, ya que hacerlo podría ser la puerta de entrada para obtener más datos falsos.
Lee también: Mujeres usan el Big Data para cerrar brecha de género en las empresas
Limpieza de datos, ¡ya! Los procedimientos de limpieza de datos buscan preservar la información de los múltiples errores que pueden tener. Soluciones tecnológicas de nueva generación permite, por ejemplo, conocer la existencia y exactitud de una dirección, o proporcionar una correlación entre el nombre, los apellidos y un documento de identificación; o los verificadores de contactabilidad que posibilitan saber si un correo o teléfono es válido y está vigente.
Actualizaciones constantes en tiempo real y con datos dinámicos. Algoritmos de nueva generación y planteamientos más creativos al momento de crear perfiles, permitirán que las organizaciones cuenten con más variables dinámicas y verificadas, por lo que el análisis de datos corresponderá realmente a la realidad, ya que será capaz de analizar información de fuentes tan actuales como las redes sociales.
Si a lo anterior agregamos otras tecnologías como smart data, deep learning, inteligencia artificial o machine learning, las compañías podrán contar con un análisis de datos que les permita tener nuevas y mejores ventajas frente a sus competidores.
Para este 2020 y en los próximos años, entender los datos que genera el negocio, determinar pautas y patrones de comportamiento, o ser conscientes de qué datos son fiables, contrastados y dinámicos, será el valor diferencial de cualquier compañía. De esta manera, nada impedirá que el big data continúe ofreciendo un potencial enorme, mejorando procesos, dándonos una visión total del cliente y maximizando la eficiencia de nuestros procesos de negocio, y es por eso que las empresas deben contar con el más consistente, coincidente y veraz.
Contacto:
LinkedIn: Antonio Camacho
*El autor es Fundador y Director Global de Hocelot
Las opiniones expresadas son sólo responsabilidad de sus autores y son completamente independientes de la postura y la línea editorial de Forbes México.
Tendencia en análisis de datos: la aniquilación del dirty data
Invitado Forbes
Publicar un comentario