Salta al contenido principal

Datos que se Vuelven Oro

Datos que se Vuelven Oro

de Carlos Fabian Isco Ipia -
Número de respuestas: 0

Es muy importante conocer de donde vienen los datos que utilizamos, y sobretodo los que va a utilizar alguna IA. Muchas veces nos centramos en recolectar grandes volúmenes de datos, pero si en ellos existe un pequeño error puede resultar un gran problema, por ello es importante garantizar la calidad e los datos.

¿Y donde radica su calidad? Su calidad radica en que sean precisos, coherentes, completos, que provengan de una fuente confiable, que en ellos no exista ningún tipo de sesgo, con estos datos podemos asegurar que los resultados que salgan son correctos, brindando así información confiable, asegurando la veracidad de nuestra marca o proyecto.

Uno de los principales problemas son los Datos Duplicados, estos tipos de datos nos pueden dar resultados distorsionados, Un nombre en un banco podría aparecer dos veces, lo cual seria un resultados erróneo y puede ser un gran problema. Y ¿Como hacemos para solucionar este tipo de problema? Podemos detectar del problema de dos maneras, manualmente; donde organizamos la información y buscamos coincidencias, variaciones sutiles para que luego sean eliminadas o podemos utilizar algún software como Pandas en Python o Excel.

Existen Otros tipo de problemas que pueden dar un resultado erróneo, son los Outliers, Los Outliers son valores que se alejan significativamente del resto de datos, manualmente podemos utilizar un diagrama de caja para detectarlo y luego eliminarlo, o podemos hacer un programa se encargue de detectar estos valores atípicos como lo haría Boxplot.

Aquí nos damos cuenta como un mínimo problema puede convertirse en un gran problema, en el área de la salud, la duplicación de historias clínicas puede generar diagnósticos erróneos o que se formulen dos exámenes, esto seria un desperdicio de recursos y una molestia innecesaria para el paciente. Y referente a la área de las finanzas, se pueden generar valores de ingresos y egresos que pueden afectar Balances y reportes, o el pagar dos veces puede generar perdidas.

En clusion, es de suma importancia el revisar minuciosamente los datos, el poder identificar los errores y solucionarlos, se debe garantizar una calidad de datos, el que exista un dato erróneo puede generar perdidas como lo vimos en el área financiera, o incluso aun mas grave, se genere un mal diagnostico que ponga en peligro la vida de una persona por un mal diagnostico.