Danmarks Forskningsportal
Om Data & Dokumentation

I den Globale Database importeres data fra de tre globale kommercielle dataleverandører: Clarivate (WoS), Digital Science (Dimensions) og Elsevier (Scopus og Scival). 

Alle publikationer fra 2011 og frem som har landekoden Danmark.

Data fra alle tre dataleverandører importeres omkring d. 20. hver måned, hvorefter data bearbejdes, beriges og kvalitetssikres. Nye data er typisk tilgængelige i den Globale Database i begyndelsen af hver måned. 

 

Data fra de tre dataleverandører importeres ved forskellige metoder:

Clarivate

  • Hver måned importeres nye og opdaterede publikationsmetadata inkrementelt fra citationsdatabasen Web of Science.
  • Rådata indsamles via API inklusiv de strukturerede forbedringer, som er foretaget af Clarivate, fx affiliationer.
  • En til to gange årligt foretages en fuld import af data fra 2011 og frem for at sikre at alle metadata opdateres.


Digital Science

  • Publikationsmetadata importeres ved at benytte citationsdatabasen Dimensions.
  • Et fuldt datasæt fra 2011 og frem til alle datatyper (publikationer, patenter, clinical trials, bevillinger, datasæt og policy dokumenter) importeres hver måned via API.
  • Indtil videre vises publikationer og inden længe patenter i Forskningsportalen. 

 

Elsevier

  • Hver måned leveres nye og opdaterede publikationsmetadata inkrementelt fra Elsevier i et XML datadump.
  • Data er henholdsvis fra citationsdatabasen Scopus, med yderligere informationer om affiliering fra Elseviers interne affiliationsdatabase OrgDB, samt  emne- og citationsdata fra analyseværktøjet SciVal.
  • To gange årligt opdateres databasen fuldstændigt med data fra 2011 og frem for at sikre at alle metadata opdateres.

Den Globale Database er en fælles indgang til søgning på tværs af de tre databaser, der bygger på data fra globale dataleverandører i forskningsportalen. Servicen gør det muligt at udføre én søgning og få præsenteret et samlet overblik. 

Søg i publikationer med tilknytning til Danmark fra 2011 og frem.

  • Across All Data – Søg på tværs af data fra alle de globale dataleverandører
    eller søg specifikt i:
  • Clarivate Data (Web of Science)
  • Digital Science Data (Dimensions)
  • Elsevier Data (Scopus)

 

En publikation, der er indekseret i flere af de kommercielle databaser, optræder kun  én gang i default-søgningen ‘Across All Data’ i Den Globale Database. Versionerne af publikationsmetadata er samlet i én publikationspost, på en måde hvor det tydeligt ses, hvilke databaser der har bidraget til indholdet.

 

Ved at klikke på henholdsvis ‘Clarivate’, ‘Elsevier’ og ‘Digital Science’ ses publikationsposten med de metadata, vi har hentet fra den enkelte globale dataleverandør. Der er ligeledes links tilbage til den oprindelige kilde samt posten hos den kommercielle globale dataleverandør i højremenuen på posten.

Fra dit søgeresultat i de individuelle databaser; Clarivate Data, Elsevier Data og Digital Science Data i den Globale Database kan du downloade publikations-Id’er tilhørende de globale dataleverandører (Eid, WoS ID, Dimensions ID). Id’erne kan benyttes til videre behandling hos den pågældende dataleverandørs database eller analyseservice.

For at sikre at publikationer, der findes i en eller flere af de individuelle databaser, bliver identificeret og matchet korrekt, er der udviklet en matchingalgoritme, som sammenstiller publikationsposter fra de tre dataleverandører. Algoritmen bygger på en række fintunede regler som bestemmer, hvorvidt der er tale om én og samme publikation. Disse regler tager hensyn til forskellige forhold, hvor særligt metadata i form af PID’er (Persistente Identifikatorer såsom DOI, PMID, ISSN etc.) spiller en central rolle.

 

Læs mere om matchingalgoritmen der forbinder publikationer i databasen baseret på globale data her i den tekniske dokumentation.

Udover matching af publikationer fra de globale dataleverandører, matches publikationer fra den Globale Database med de tilsvarende publikationsposter i den Lokale Database og dermed etableres et link til og fra de to databaser – find disse oplysninger på den enkelte publikationspost eller i filteret ‘Matching Records in’ . Læs mere om denne matchingalgoritme i den tekniske dokumentation.

NORA-Enhancements er en generel betegnelse for standardiserede navne, der bruges på tværs af alle Forskningsportalens databaser. Standardiseringen foretages for at sikre ensartet og struktureret data, som dels gør det nemmere at søge og dels danner udgangspunkt for grupperinger af særlig analytisk interesse. Metadataelementer indsamlet fra forskellige dataleverandører indeholder ofte flere og forskellige navnevarianter, der beskriver den samme værdi.

I den Global Database standardiseres (mappes eller grupperes) følgende metadataelementer:

 

Danske affiliationer og grupperinger
Alle danske affiliationsnavne mappes til hhv. ét standardiseret navn og én gruppering. Navnene ‘University of Copenhagen’ og ‘Copenhagen University’ mappes fx begge til det standardiserede affiliationsnavn: ’KU University of Copenhagen’ og grupperingen Universities’ (find disse i filteret Danish Affiliations). 

 

Samarbejdslande/regioner
De øvrige lande som danske forfattere sampublicerer med (samarbejdslande) grupperes i regioner af analytisk interesse. Norge’ grupperes fx i regionerne Europe’, ‘Non-EU’, ‘Nordic’ og ‘OECD’ (find disse i filteret Collaboration – Regions).

 

Emneklassifikationer
Emneklassifikationerne fra de forskellige dataleverandører mappes og beriges så de fremstår ensartet på tværs af den Globale Database og de individuelle globale databaser. Følgende emneklassifikationer standardiseres:

 

1. Danske hovedforskningsområder

Det danske klassifikationssystem Danske hovedforskningsområder er udviklet i forbindelse med de danske forskningsindikatorer (BFI, OAI) og består af 4 kategorier, der opdeler dansk forskning inden for de overordnede kategorier: Videnskab/Teknologi, Sundhedsvidenskab, Samfundsvidenskab og Humaniora. Da der er tale om en national klassifikation mappes data fra de tre globale kommercielle dataleverandører til kategorierne baseret på en NORA berigelse.

 

2. DK Grøn klassifikation (pt. kun i databasen baseret på Elsevier data)

Uddannelses- og Forskningsministeriet (UFM) har fastlagt en overordnet definition af grøn forskning, udvikling og innovation inklusiv syv undertemaer til anvendelse på tværs af UFM i strategier, analyser, kortlægninger, monitorering og andre tiltag i forbindelse med den grønne omstilling. Databasen baseret på Elsevier data beriges med denne klassifikation (DK Green Classification) baseret på 6 ud af disse 7 temaer.

 

3. FN’s verdensmål for bæredygtig udvikling

FN’s 17 mål for bæredygtig udvikling (SDG) oversættes fra de tre globale dataleverandørers SGD-kategorisering af forskningspublikationer til NORAs standardiserede navneformer.

 

4. OECD

OECD FORD emneklassifikation, også kendt under navnet Frascati, oversættes fra de tre globale dataleverandører til Fields of Research and Development (FORD) classification (2015) som dermed benyttes som standardiseret navneform i  den Globale Database.

 

5. AU/NZ FoR

FoR-klassifikationen (Fields of Research) er en af komponenterne i det australske og newzealandske Standard Research klassifikationssystem (ANZSRC). FoR klassifikationer fra de tre globale dataleverandører mappes til FoR version 2.0 fra 2020 som dermed benyttes som standardiseret navneform i Globale Data.

 

Open Access kategorier
De globale kommercielle dataleverandørers forskellige definitioner af Open Access er mappet til seks kategorier; Al Open Access, Grøn, Gylden, Gylden-Hybrid, Free-to-Read, Ubestemt.

 

Læs mere om NORA-Enhancements i den tekniske dokumentation.

Den Globale Database har nogle generelle problematikker, som er værd at være opmærksom på:

  • Data høstes som det er defineret, struktureret og registreret af den enkelte kommercielle dataleverandør. 
  • Der kan være forskel på, hvad den enkelte kommercielle dataleverandør opfatter som en dansk affiliation. Fx defineres bogkapitler med dansk affilierede redaktører som danske bidrag af nogle leverandører, mens de af andre ikke opfattes som danske.  

 

Under Driftsstatus kan du desuden finde en oversigt over nuværende opdateringsspecifikke problemer med fx data og høst.