Periodismo de datos: la recopilación de datos para su historia

Video: Periodismo de Datos 1

Una pieza de periodismo de datos es sólo tan bueno como los datos que lo soporta. Para publicar una historia convincente, debe encontrar datos convincentes sobre la cual construir. Esto no siempre es fácil, pero es más fácil si usted sabe cómo utilizar raspado y autofeeds a su ventaja.

Video: Periodismo de datos: historias, contexto y calidad

raspado de datos

Web raspado implica la creación de programas automatizados para fregar y extraer los conjuntos de datos exactos y personalizados que necesitas directamente de la Internet para que no tenga que hacerlo usted mismo. Los datos se genera a partir de este proceso se le llama comúnmente raspada datos. La mayoría de los periodistas de datos raspan datos de origen de sus historias porque es la forma más eficiente para obtener conjuntos de datos de historias únicas. Los conjuntos de datos que son fácilmente accesibles por lo general ya han sido explotados y extraídos por equipos de periodistas de datos que estaban buscando historias. Para generar fuentes de datos únicos para su historia basada en datos, raspar los datos por sí mismo.

Video: Periodismo de datos en sencillo

Si encuentras datos de fácil acceso, ten en cuenta que la mayor parte de las historias de ese conjunto de datos, probablemente, se les ha dicho por un periodista que descubrió que los datos antes.

Para ilustrar la forma en que tendría que utilizar los datos de raspado en el periodismo de datos, imaginar el siguiente ejemplo: Eres un periodista datos de vivir en un estado EE.UU. que limita directamente con México. Usted ha oído rumores de que la selección de la biblioteca local de libros para niños en español es lamentablemente inadecuada. Se llama a la biblioteca, pero su personal teme publicidad negativa y no compartir ninguna estadística con usted sobre el tema.

Puesto que la biblioteca no se mueve en sus actividades de intercambio de datos, uno se ve obligado a raspar catálogo en línea de la biblioteca para obtener los datos de origen que necesita para apoyar esta historia. Su herramienta de raspado se personaliza para repetir todas las búsquedas posibles y realizar un seguimiento de los resultados. Después de raspar el sitio, se descubre que el 25 por ciento de los libros para niños en la biblioteca son libros en lengua española. De habla hispana representan el 45 por ciento de la población- de la escuela primaria es esta diferencia lo suficientemente importantes como para formar la base de una historia? Tal vez tal vez no.

Para profundizar un poco más y posiblemente descubrir una razón detrás de esta diferencia, decide raspar el catálogo una vez a la semana durante varias semanas, y luego comparar los patrones de endeudamiento. Cuando usted encuentra que una mayor proporción de libros españoles están siendo desprotegido, esto indica que hay, de hecho, una gran demanda de libros para niños en español. Este hallazgo, junto con los resultados de su sitio de roce anterior, le dan todo el apoyo que necesita para elaborar un artículo convincente en torno al tema.

Configuración de alertas de datos

Para generar historias calientes, periodistas de datos deben tener acceso a los datos más recientes, comunicados más frescos que vienen de las organizaciones más creíbles. Para estar al tanto de lo que los conjuntos de datos están siendo liberados en donde, periodistas de datos suscribirse para alertar a los sistemas que envían las notificaciones cada vez que se libera datos potencialmente importante. Estos sistemas de alerta menudo emitir notificaciones a través de los canales RSS o por correo electrónico. También es posible configurar una aplicación personalizada como DataStringer para enviar notificaciones push cuando se hacen modificaciones significativas o cambios a las bases de datos de origen.

Video: Periodismo de Datos - Taller

Después de suscribirse a alertas de datos y forman una idea sólida sobre el horario de liberación de datos, puede comenzar a planificar para la publicación de datos con antelación. Por ejemplo, si está haciendo periodismo de datos en el nicho de análisis de negocios y saber que un informe trimestral particularmente interesante es que sea lanzado en una semana, puede utilizar el tiempo que tiene antes de su lanzamiento para formular un plan sobre cómo va a analizar los datos cuando no estén disponibles.

Muchas veces, después de que haya alertado a nuevas e importantes publicaciones de datos, usted todavía tiene que raspar el sitio de origen con el fin de obtener esos datos. En particular, si usted está tirando de datos de un departamento gubernamental, es muy probable que tenga que raspar el sitio de origen. Aunque la mayoría de las organizaciones gubernamentales en los países occidentales están legalmente obligados a conocer los datos, que no están obligados a liberarlo en un formato que es fácil de consumir. No hay que esperar a que sea fácil para que usted pueda obtener los datos que necesita para contar una historia sobre sus operaciones.

Artículos Relacionados