Ir al contenido principal

Datos de investigación. Español

¿Qué son los datos de investigación?

Los datos de investigación son aquellos materiales generados o recolectados durante el transcurso de una investigación. 

  • Sirven para validar los resultados obtenidos en la investigación
  • Son aceptados por la comunidad científica para poder refutar o comprobar nuevo conocimiento.
  • Pueden tener formatos variados y múltiples orígenes dependiendo de la disciplina científica de donde procedan.

En este tipo de datos se incluyen estadísticas, resultados de experimentos, cuadernos de campo, cuestionarios, etc.

Se denomina dataset al conjunto de datos reunidos durante la ejecución de un proyecto de investigación.
 

 

Los datos se clasifican en:

  • Brutos o procesados, según su nivel de procesamiento. Muchas veces existen las dos versiones de un conjunto de datos.
  • Generados o reutilizados, según la procedencia de los datos. Los generados también se pueden diferenciar según estén creados por el personal del proyecto o bien por la ciudadanía. Este último caso se engloba dentro de la llamada ciencia ciudadana.
  • Cuantitativos o cualitativos. Los datos cuantitativos son numéricos, los cualitativos se representan con palabras.
  • Estructurados o no estructurados. Los datos estructurados tienen un formato con unos campos fijos pero los no estructurados carecen de él.
  • Abiertos o cerrados. Según su grado de apertura se distinguen los abiertos, los embargados o los restringidos.
  • Según la disciplina y la metodología emplegada pueden ser observacionales, experimentales, de simulación, computacionales...
  • Según su dimensión: los big data son datasets de grandes dimensiones, recogidos masivamente muchas veces de manera automatizada. Los small data son conjuntos más pequeños de datos. Dentro de estos últimos, encontramos los long-tail data, muchas veces más difíciles de localizar o que no están publicados.
  • Los datos personales se agrupan en ordinarios e sensibles. Hay que proteger estos datos de acuerdo con la normativa española y europea. Los datos sensibles están sometidos a normas de tratamiento específicas. Las persoas delegadas de protección de datos y los comités de ética de las universidades serán las referencias en cada institución para guiar al personal investigador. Estos son:
    • datos sobre el origen racial o étnico, las opiniones políticas, convenciones religiosas o filosóficas.
    • la afiliación sindical
    • datos genéticos y biométricos.
    • datos sobre a salud
    • datos sobre la vida sexual o la orientación sexual.
  • Los datos de referencia son datos revisados, curados y aceptados como referenciales por la comunidad científica de una determinada disciplina.

Gestión de datos de investigación

La Gestión de datos de investigación abarca las tareas de organizar, estructurar, almacenar, preservar y difundir los datos utilizados.

La correcta gestión y documentación de los datos a lo largo de su ciclo vital permitirá:

  • Ahorrar tiempo y hacer un uso eficiente de los recursos disponibles sin duplicar esfuerzos.
  • Reutilizar los datos al mantenerse exactos, completos, auténticos y fiables .
  • Proteger y preservar los datos en repositorios apropiados, permitiendo que puedan servir a nuevas investigaciones y descubrimientos en el futuro.
  • Cumplir los requisitos de los organismos financiadores que exigen la presentación de planes de gestión de datos y/o el depósito en repositorios. Horizonte Europa e os programas estatais de I+D+I exixen a publicación dos datos.

Buenas prácticas en la gestión de los datos

Infografía sobre buenas prácticas en la gestión de los datos de investigación, elaborada por el Servei de Biblioteques, Publicacións i Arxius de la  Universitat Politècnica de Catalunya y traducida en la Sección de Información y Referencia del Servicio de Biblioteca de la Universidade da Coruña.

Principios FAIR

Los datos de investigación se deben poder compartir y reutilizar de forma legal en nuevas investigaciones, de forma que otros investigadores puedan tener acceso a los mismos. 

Los principios FAIR hacen referencia a cómo deben tratarse los datos de investigación para que sean localizables, accesibles, interoperables y reutilizables (Findable, Accessible, Interoperable, Reusable).

  • Localizables: asignándoles un identificador único y permanente (DOI, handle...). Describiéndolos con metadatos enriquecidos. Registrándolos e indexándolos en recursos de búsqueda.
  • Accesibles: utilizando protocolos estandarizados de comunicación que sean abiertos y gratuitos. Cuando los datos no puedan ser abiertos por razones de seguridad, privacidad o intereses comerciales, se deben garantizar procedimientos de autenticación y autorización. Los metadatos estarán accesibles, aunque los datos no estén disponibles.
  • Interoperables: los metadatos deben utilizar lenguajes accesibles, compartidos y estandarizados, vocabularios que sigan los principios FAIR, e incluir referencias cruzadas y enlaces entre datos y metadatos. 
  • Reutilizables: los metadatos contendrán un licencia clara y accesible sobre la reutilización de los datos.

Hay herramientas que permiten valorar si los datos son FAIR, es decir, localizables, accesibles, interoperables y reutilizables. Algunos ejemplos son:

Universidade da Coruña. Servizo de Biblioteca Universitaria. Campus de Elviña, Edificio Xoana Capdevielle, 15071, A Coruña. infoguías.biblioteca@udc.es     Licenza de Creative Commons