Libro beta sobre tratamiento previo de los datos

Aunque el objeto de este blog es el análisis y comunicación de datos cuantitativos hoy me voy a permitir un pequeño off-topic.

Quienes nos dedicamos al análisis de datos tenemos normalmente una formación en el área de las Matemáticas o la Estadística. Los planes de estudio de estas disciplinas no han prestado tradicionalmente gran atención a la tarea de recogida, almacenamiento y procesamiento previo de los datos. Sin embargo, los analistas de datos nos encontramos en muchas ocasiones con la necesidad de enfrentarnos a estas tareas: montañas de datos sin un formato claro deben ser ordenadas, almacenadas adecuadamente y revisadas en busca de errores e inconsistencias internas. Al fin y al cabo, si entra basura sale basura y nadie quiere que el resultado de su trabajo sea considerado poco valioso.

Como nadie se presta a hacerlo -y por un cierto prurito profesional- los analistas de datos, dotados de herramientas poco adecuadas -limitadas muchas veces a una hoja de cálculo- y una escasa formación especifica -derivada normalmente de la experiencia y el autoaprendizaje- nos enfrentamos con más voluntad que capacidad a esa tarea previa que nos es ajena pero necesaria.

Leyendo uno de mis blogs favoritos me he encontrado con este post en el que se presenta una versión beta de un libro de Paul Murrell sobre tratamiento previo de datos de título Introduction to Data Technology.

He ojeado el documento -que está disponible en pdf- y me ha parecido que puede ser de interés para analistas de datos con un perfil estadístico-matemático y no informático. Le echaré un vistazo en los próximos días.

3 respuestas a Libro beta sobre tratamiento previo de los datos

  1. Miren dice:

    Pues para ser un offtopic tampoco se desvía tanto… o al menos eso es lo que me parece desde mis limitadísimos conocimientos sobre estos temas 😉

  2. Mikel dice:

    Y de hecho, la cuestión de la entrada de datos informáticos en formatos estandar no es sólo cuestión de los analistas de datos… también influye a los diseñadores gráficos, por ejemplo. Yo mismo, tuve que maquetar un documento con una tabla con más de 700 entradas (películas españolas con presencia femenina en cuadros de dirección de los últimos 20 años), y me tuve que dedicar a transformar unos 20 archivos en formato Office Word (elaborados por personas distintas, y algunos sin coherencia interna) en un archivo CSV decente para posteriormente poder automatizar la maquetación del documento en InDesign lo más posible. Lástima me dan los que maquetan catálogos como los del Lidl y similares!!!

  3. jjgibaja dice:

    Acabo de terminar de leer el libro. Si ya me había dado buena sensación al ojearlo ahora ya sí que no tengo dudas. Es un must para cualquiera que se dedique profesionalmente al análisis de los datos -y no estaría de más que lo leyeran los que se dedican a la investigación-. Esperaré impaciente a la versión definitiva.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: