Ir ao contido principal

Datos de investigación

Que son os datos de investigación?

Os datos de investigación son aqueles materiais xerados ou recollidos durante o transcurso dunha investigación.

  • Serven para validar os resultados obtidos na investigación
  • Son aceptados pola comunidade científica para poder refutar ou comprobar novo coñecemento.
  • Poden ter formatos variados e múltiples orixes dependendo da disciplina científica de onde procedan.

Neste tipo de datos inclúense estatísticas, resultados de experimentos, cadernos de campo, cuestionarios, etc.

Denomínase dataset ao conxunto de datos reunidos durante a execución dun proxecto de investigación.

 

Os datos clasifícanse en:

  • Brutos ou procesados, segundo o seu nivel de procesamento. Moitas veces existen as dúas versións dun conxunto de datos.
  • Xerados ou reutilizados, segundo a procedencia dos datos. Os datos xerados tamén se poden diferenciar segundo estean creados polo persoal do proxecto ou ben pola cidadanía. Este último caso englóbase dentro da chamada ciencia cidadá.
  • Cuantitativos ou cualitativos. Os datos cuantitativos son numéricos, os cualitativos represéntanse con palabras.
  • Estruturados ou non estruturados. Os datos estruturados teñen un formato cuns campos fixos mais os non estruturados carecen del.
  • Abertos ou pechados. Segundo o seu grao de apertura se distinguen os abertos, os embargados ou os restrinxidos.
  • Segundo a disciplina e a metodoloxía empregada poden ser observacionais, experimentais, de simulación, computacionais...
  • Segundo a súa dimensión: os big data son datasets de grandes dimensións, recollidos masivamente moitas veces de xeito automatizado. Os small data son conxuntos máis pequenos de datos. Dentro destes últimos atopamos os long-tail data, moitas veces máis difíciles de localizar ou que non están publicados.
  • Os datos persoais agrúpanse en ordinarios e sensibles. Hai que protexer estes datos de acordo coa normativa española e europea. Os datos sensibles están sometidos a normas de tratamento específicas. As persoas delegadas de protección de datos e os comités de ética das universidades serán as referencias en cada institución para guiar o persoal investigador. Estes son:
    • datos sobre a orixe racial ou étnica, as opinións políticas, convencións relixiosas ou filosóficas.
    • a afiliación sindical
    • datos xenéticos e biométricos.
    • datos sobre a saúde
    • datos sobre a vida sexual ou a orientación sexual.
  • Os datos de referencia son datos revisados, curados e aceptados como referenciais pola comunidade científica dunha determinada disciplina.

Xestión de datos de investigación

A Xestión de datos de investigación abarca as tarefas de organizar, estruturar, almacenar, preservar e difundir os datos utilizados.

A correcta xestión e documentación dos datos ao longo do seu ciclo vital permitirá:

  • Aforrar tempo e facer un uso eficiente dos recursos dispoñibles sen duplicar esforzos.
  • Reutilizar os datos ao manterse exactos, completos, auténticos e fiables 
  • Protexer e preservar os datos en repositorios apropiados, permitindo que poidan servir a novas investigacións e descubrimentos no futuro.
  • Cumprir os requisitos dos organismos financiadores que esixen a presentación de plans de xestión de datos e/ou o depósito en repositorios. Horizonte Europa e os programas estatais de I+D+I exixen a publicación dos datos.

Boas prácticas na xestión dos datos

Infografía sobre boas prácticas na xestión dos datos de investigación, elaborada polo Servei de Biblioteques, Publicacións i Arxius da  Universitat Politècnica de Catalunya e traducida na Sección de Información e Referencia do Servizo de Biblioteca da Universidade da Coruña.

 

Principios FAIR

Os datos de investigación débense poder compartir e reutilizar de forma legal en novas investigacións, de forma que outros investigadores poidan ter acceso aos mesmos. 

Os principios FAIR fan referencia a como deben tratarse os datos de investigación para que sexan localizables, accesibles, interoperables e reutilizables (Findable, Accessible, Interoperable, Reusable).

  • Localizables: asignándolles un identificador único e permanente (DOI, handle...). Describíndoos con metadatos enriquecidos. Rexistrándoos e indexándoos en recursos de busca.
  • Accesibles: utilizando protocolos estandarizados de comunicación que sexan abertos e gratuítos. Cando os datos non poidan ser abertos por razóns de seguridade, privacidade ou intereses comerciais, débense garantir procedementos de autenticación e autorización. Os metadatos estarán accesibles, aínda que os datos non estean dispoñibles.
  • Interoperables: os metadatos deben utilizar linguaxes accesibles, compartidas e estandarizadas, vocabularios que sigan os principios FAIR, e incluír referencias cruzadas e enlaces entre datos e metadatos. 
  • Reutilizables: os metadatos conterán unha licenza clara e accesible sobre a reutilización dos datos.

Hai ferramentas que permiten valorar se os datos son FAIR, é dicir, localizables, accesibles, interoperables e reutilizables. Algúns exemplos son:

 

 

Importancia dos datos FAIR

Os datos deben ser FAIR para que as persoas interesadas os poidan reutilizar; tamén deben ser reproducibles, aspecto este que poden exixir en ocasións as axencias de financiación. Se son reproducibles cumplirán coa transparencia e a ética. Os datos faranse públicos, sempre dependendo da máxima "tan abierto como sea posible, tan cerrado como sea necesario".

Leis que apoian os datos FAIR

O Plan Estatal de Investigación Científica y Técnica y de Innovación (PEICTI) 2024-2027, aprobado o 7 de maio de 2024, establece que un dos seus obxectivos específicos é "Garantizar el cumplimiento de los principios de ciencia abierta". Este obxectivo enténdese como unha Condición Marco que debe estar presente nas actuacións dos distintos programas e subprogramas de financiación. Establece a obligatoriedade de realizar un plan de xestión de datos como parte integral dos proxectos de investigación financiados con fondos públicos que permitirá apoiar o libre acceso e a xestión dos datos xerados pola investigación.

Universidade da Coruña. Servizo de Biblioteca Universitaria. Campus de Elviña, Edificio Xoana Capdevielle, 15071, A Coruña. infoguías.biblioteca@udc.es     Licenza de Creative Commons