Skip to content

Latest commit

 

History

History
404 lines (312 loc) · 20.1 KB

File metadata and controls

404 lines (312 loc) · 20.1 KB

Lección 2: Usar Datos Abiertos

Contenidos

Descripción general

En esta lección aprenderás a descubrir, evaluar y citar un conjunto de Datos Abiertos. Empieza explorando los repositorios y aprendiendo sobre los problemas y consideraciones para buscar conjuntos de datos. Después, aprenderás a determinar si el conjunto de datos es adecuado para su uso y aprenderás qué revisar en la documentación, las licencias y los formatos de archivo. La lección concluye con una discusión sobre la importancia de citar los conjuntos de datos y cómo leer y seguir las instrucciones de citación.

Objetivos de aprendizaje

Al finalizar esta lección deberías ser capaz de:

  • Seleccionar fuentes de datos y usar técnicas de búsqueda para descubrir Datos Abiertos.
  • Evaluar si un conjunto de datos incorpora elementos de Acceso Abierto que garantizan que sean fácilmente reusados.
  • Explicar la importancia de citar Datos Abiertos, y encontrar y seguir las instrucciones de citación.

Introducción

Los Datos Abiertos no siempre son fáciles de usar en tu investigación. A veces hay varias versiones del mismo conjunto de datos, así que aprender a descubrir y evaluar y luego usar los Datos Abiertos te ayudará a ahorrar tiempo.

Como ejemplo, veamos los datos mensuales promedio de dióxido de carbono del Observatorio "Mauna Loa" en Hawaii. Se trata de un conjunto de datos fundacionales para el cambio climático. No sólo es uno de los primeros conjuntos de datos de observación que claramente mostraron impactos antropogénicos en la atmósfera de la Tierra, sino que también constituye el registro más largo de mediciones directas de dióxido de carbono en la atmósfera. Estas observaciones fueron iniciadas por el trabajo de C. David Keeling de la Institución de Oceanografía "Scripps" en marzo de 1958 en una instalación de la Administración Nacional Oceánica y Atmosférica [Keeling, 1976].

Si deseas hacer este gráfico tú mismo, o usar los datos para algún otro fin, primero deberás encontrar los datos. Si buscas este conjunto de datos, o cualquier dato, es posible que encuentres varias fuentes diferentes. ¿Cómo decides qué datos usar?

Si comienzas con Google y buscas "datos de dióxido de carbono de Mauna Loa", encontrarás muchos resultados. Aquí se presentan algunos de ellos:

¿Cómo decidirás cuál usar? En esta lección cubriremos cómo encontrar, evaluar la relevancia y usar Datos Abiertos.


Descubrir Datos Abiertos

Los Datos Abiertos se pueden descubrir accediendo a los repositorios de datos, los portales de búsqueda y las publicaciones. Una gran variedad de estos recursos están disponibles. Un paso clave es identificar los términos de búsqueda adecuados para tu solicitud. Aprender la nomenclatura y los estándares específicos de la comunidad puede acelerar tu búsqueda.

Donde comenzar tu búsqueda

Hay múltiples caminos para encontrar datos de investigación, y deberías tener práctica en todos.

Personas que conoces (¡en línea o en persona!)

¿Cuál es la primera y mejor forma de encontrar los datos de investigación? Pregunta a tu comunidad, incluyendo a quien te asesora en la investigación, colegas, miembros del equipo y personas en línea. Conocer dónde encontrar datos fiables es tanto una habilidad y arte como cualquier técnica de laboratorio. Aprendes este juego de habilidades trabajando con profesionales de tu campo. No hay una sola fuente, ni un único método.

Fuente de la imagen: NASA, Hart Dominic 2023


Publicaciones

Los conjuntos de datos a menudo se adjuntan a publicaciones especializadas en forma de material complementario. Los motores de búsqueda de publicaciones pueden permitir el descubrimiento de publicaciones relevantes que se pueden usar para encontrar datos de una publicación en particular.

Portales de búsqueda de datos

Los datos también se pueden encontrar usando una amplia variedad de portales de búsqueda, incluyendo:

Selecciona cada pestaña para obtener más información.

PORTALES DE DATOS GENÉRICOS ☑ PORTALES DE BÚSQUEDA DE DATOS POR DISCIPLINA ESPECÍFICA PORTALES NACIONALES E INTERNACIONALES DE DATOS

Los portales de búsqueda de datos genéricos permiten el descubrimiento de una gran variedad de datos. No están construidos para disciplinas específicas, sirven a un público más amplio. Este tipo de portal de búsqueda recolecta y hace que los datos sean fáciles de encontrar. No son fuentes de información científica. Se trata de servicios de agregación que hacen hincapié en la cantidad, no necesariamente de calidad. Aquí es donde las personas que hacen ciencia ciudadana suelen acudir para encontrar datos y, para los no profesionales, es una gran manera de involucrarse en la ciencia.

Los ejemplos incluyen:

PORTALES DE DATOS GENÉRICOS PORTALES DE DATOS ESPECÍFICOS POR DISCIPLINA ☑ PORTALES NACIONALES E INTERNACIONALES DE DATOS

Los portales de búsqueda de datos específicos de una disciplina permiten el descubrimiento de tipos específicos de datos. Generalmente, están diseñados para satisfacer las necesidades de esa comunidad.

Los ejemplos incluyen:

PORTALES DE DATOS GENÉRICOS PORTALES DE DATOS ESPECÍFICOS POR DISCIPLINA PORTALES NACIONALES E INTERNACIONALES DE DATOS ☑

Los portales de búsqueda de datos nacionales e internacionales permiten el descubrimiento de datos producidos o financiados por organizaciones nacionales e internacionales.

Los ejemplos incluyen:

Repositorios

Una forma común de compartir y encontrar Datos Abiertos es a través de repositorios de datos. Muchos repositorios albergan Datos Abiertos con identificadores persistentes, licencias claras y directrices de citación, y metadatos estándar.

Ten en cuenta que algunos de nuestros portales de búsqueda de ejemplo también son repositorios, pero no siempre. Algunos de los portales de búsqueda son simplemente catálogos de información sobre los datos, en lugar de ubicaciones de almacenamiento de los datos.

Selecciona cada pestaña para obtener más información.

REPOSITORIOS GENERALES ☑ REPOSITORIOS DE DOMINIO ESPECÍFICO REPOSITORIOS INSTITUCIONALES REPOSITORIOS NACIONALES

Los repositorios generales no están diseñados para una comunidad específica y son accesibles para todos.

Los ejemplos incluyen:

Mira el cuadro comparativo de repositorios generalistas - una herramienta para repositorios y guías adicionales. Dataverse también ha publicado (en inglés) una revisión comparativa de ocho repositorios de datos.

REPOSITORIOS GENERALES REPOSITORIOS DE DOMINIO ESPECÍFICO ☑ REPOSITORIOS INSTITUCIONALES REPOSITORIOS NACIONALES

Los repositorios especializados (normalmente para datos de temas específicos) ofrecen apoyo e información sobre los estándares requeridos para metadatos y más.

Algunos ejemplos son:

REPOSITORIOS GENERALES REPOSITORIOS DE DOMINIO ESPECÍFICO REPOSITORIOS INSTITUCIONALES ☑ REPOSITORIOS NACIONALES

Muchas universidades y organizaciones apoyan la gestión de datos y de software de investigación con repositorios, conocidos como repositorios institucionales, para ayudar a las personas investigadoras con los requisitos que deben cumplir.

REPOSITORIOS GENERALES REPOSITORIOS DE DOMINIO ESPECÍFICO REPOSITORIOS INSTITUCIONALES REPOSITORIOS NACIONALES ☑

Los repositorios nacionales recopilan datos y los ponen a disposición del público.

Los datos almacenados en estos repositorios generalmente son producidos por el gobierno.

Los ejemplos incluyen:

Desafíos de los repositorios de datos

  • Ningún repositorio, motor de búsqueda o buscador de publicaciones tendrá acceso a todos los Datos Abiertos disponibles.
  • Los términos de búsqueda pueden no ser consistentes en todas las fuentes o campos de la ciencia.
  • Es esencial familiarizarse con la nomenclatura estándar y con los términos de metadatos apropiados.
  • No existe una receta infalible. Es posible que debas probar numerosos términos y fuentes de datos antes de encontrar datos relevantes.

Actividad 2.1: Descubrir Datos Abiertos

Unir el tipo de repositorio con la definición correcta.

Repositorios generales Diseñados para todas las comunidades y de fácil acceso para todas las personas
Repositorios específicos de dominio Repositorios que habitualmente se destinan a datos específicos
Repositorios institucionales Repositorios gestionados por universidades y organizaciones
Repositorios nacionales Repositorios financiados por el gobierno

Evaluar los Datos Abiertos

El uso de Datos Abiertos para un proyecto depende de una serie de factores, como la calidad de los datos, las condiciones de acceso y reúso, la facilidad para encontrar los datos, etc. Algunos elementos esenciales para evaluar la pertinencia y utilidad de los conjuntos de datos son (adaptado del curso GODAN Action Open Data, en inglés):

Preguntas prácticas

  • ¿Están bien descritos los datos?
  • ¿Es clara la razón por la que se recogen los datos? ¿Es claro el uso que hace el editor de los datos?
  • ¿Existen otros usos de los datos descritos?
  • ¿Son accesibles los datos?
  • ¿Los datos están actualizados o tienen fecha?
  • ¿Estarán disponibles los datos durante al menos un año?
  • ¿Se actualizarán los datos periódicamente?
  • ¿Existe un proceso de control de calidad?

Preguntas técnicas

  • ¿Están disponibles los datos en un formato adecuado al contenido?
  • ¿Se dispone de los datos desde una ubicación consistente?
  • ¿Están los datos bien estructurados y pueden ser leídos de manera automatizada?
  • ¿Se describen los términos y acrónimos complejos que aparecen en los datos?
  • ¿Usan los datos un esquema o estándar de datos?
  • ¿Hay alguna API disponible para acceder a los datos?
  • ¿Qué herramientas o programas informáticos se necesitan para usar estos datos?

Preguntas Sociales

  • ¿Existe una comunidad de usuarios de los datos?
  • ¿Se trata de datos en los que ya confía un gran número de personas?
  • ¿Están los datos respaldados oficialmente?
  • ¿Existen acuerdos de nivel de servicio para los datos?
  • ¿Está claro quién mantiene los datos y con quién se debe contactar?

Fuente: Mooc de Datos Abiertos en agricultura y nutrición de GODAN Action (en inglés)

Muchas de estas preguntas pueden responderse consultando la documentación y los metadatos de un conjunto de datos, así como su formato y licencia, aspectos que se tratarán con más detalle en la próxima lección "Hacer Datos Abiertos".

Usar Datos Abiertos

La importancia citar

Los agradecimientos y las citas contribuyen a fomentar una cultura de intercambio de datos sin temor a que se roben ideas o reconocimientos. Si una persona investigadora puede confiar en que su trabajo será citado y usado para impulsar el desarrollo de la ciencia, la idea de abrir los datos resulta más atractiva y beneficiosa para ambas partes. Se recomienda el uso de prácticas de citación estándar para garantizar el debido reconocimiento.

Citar los datos también contribuye a la transparencia del uso que se hace de ellos. Al citar los datos, las personas autoras originales y los nuevos equipos de investigación pueden seguir fácilmente cómo se usan los datos para responder a diferentes preguntas.

Revisar las pautas de citación

Muchos conjuntos de datos y repositorios especifican cómo deben ser citados. La cita suele incluir:

  • Las personas autoras y sus instituciones
  • Título
  • ORCID
  • DOI
  • Versión
  • URL
  • Fecha de creación
  • También se pueden especificar campos adicionales

Este es un sencillo ejemplo de archivo CITATION.cff. Fuente: GitHub


La mayoría de los conjuntos de datos exigen (como mínimo) que al citarlos se indique la persona responsable de los datos, el nombre del archivo que los alberga, el nombre del conjunto de datos, la fecha del conjunto de datos y el DOI.

Citar Datos Abiertos: Ejemplos

Ejemplo de un Centro de Archivo Activo Distribuido (DAAC) de la NASA

Matthew Rodell and Hiroko Kato Beaudoing, NASA/GSFC/HSL (08.16.2007), GLDAS CLM Land Surface Model L4 3 Hourly 1.0 x 1.0 degree Subsetted,version 001, Greenbelt, Maryland, USA:Goddard Earth Sciences Data and Information Services Center (GES DISC), Accessed on July 12th, 2018 at doi:10.5067/83NO2QDLG6M0

Ejemplo del Sistema de Datos Planetarios (SDP) de la NASA

Justin N. Maki. (2004). MER 1 MARS MICROSCOPIC IMAGER RADIOMETRIC

RDR OPS V1.0 [Conjunto de datos]. Sistema de datos planetarios de la NASA. https://doi.org/10.17189/1520416

Lección 2: Resumen

Conclusiones principales de esta lección:

  • Los datos relevantes pueden encontrarse en diversos lugares y puede ser necesario recurrir al método de ensayo y error para encontrarlos.
  • Es necesario evaluar cuidadosamente los datos antes de usarlos.
  • Citar los datos es importante cuando son usados.

Lección 2: Evaluación

Responde las siguientes preguntas para poner a prueba lo que has aprendido hasta ahora.

Pregunta

01/03

¿Cuál o cuáles de los siguientes métodos pueden usarse para encontrar datos?

  • Uso de términos de búsqueda apropiados
  • Investigar datos identificados por DOI en publicaciones
  • Identificar los repositorios de datos relevantes
  • Todas las anteriores

Pregunta

02/03

¿Cuál o cuáles de los siguientes son puntos a considerar al evaluar si se puede usar un conjunto de datos?

  • ¿Están bien descritos los datos?
  • ¿Están los datos bien estructurados y pueden ser leídos de manera automatizada?
  • ¿Existe una comunidad de personas usuarias de los datos?
  • ¿Qué herramientas o programas informáticos se necesitan para usar estos datos?
  • ¿Se actualizarán los datos periódicamente?
  • ¿Es claro el uso que hace el editor de los datos?
  • Todas las anteriores

Pregunta

03/03

¿Qué información se encuentra comúnmente en una cita?

  • Los autores y sus instituciones
  • Título
  • ORCID
  • DOI
  • Versión
  • URL
  • Fecha de creación
  • Todas las anteriores