I den Globale Database importeres data fra én global kommerciel dataleverandør: Elsevier (Scopus og Scival).
Alle publikationer fra 2011 og frem som har landekoden Danmark.
Data leveres omkring d. 20. hver måned, hvorefter data bearbejdes, kvalitetssikres og matches med de Lokale Data. Nye data er typisk tilgængelige i den Globale Database i begyndelsen af hver anden måned.
Data importeres ved følgende metode:
Elsevier
- Hver måned leveres nye og opdaterede publikationsmetadata inkrementelt fra Elsevier i et XML datadump.
- Data er henholdsvis fra citationsdatabasen Scopus, med yderligere informationer om affiliering fra Elseviers interne affiliationsdatabase OrgDB, samt emne- og citationsdata fra analyseværktøjet SciVal.
- To gange årligt opdateres databasen fuldstændigt med data fra 2011 og frem for at sikre at alle metadata opdateres.
Den Globale Database er indgangspunkt til søgning efter publikationer relateret til Danmark fra 2011 og frem, baseret på metadata fra Elsevier (Scopus).
Publications Global Data er standardsøgningen og inkluderer alle tilgængelige data fra Elsevier.
Da Elsevier er den eneste globale dataleverandør, er det ikke nødvendigt at vælge mellem flere kilder. Alle filtre og søgeresultater er baseret på Elsevier-data.
Fra dit søgeresultat i den Globale Database kan du downloade publikations-Id’er tilhørende den globale dataleverandører (EID). Id’et kan benyttes til videre behandling hos den pågældende dataleverandørs database eller analyseservice.
For at sikre en præcis identifikation og sammenkobling af publikationer blev der oprindeligt udviklet en sofistikeret matching-algoritme til at sammenstille publikationsposter fra tre globale dataleverandører. Algoritmen bygger på en række fintunede regler som bestemmer, hvorvidt der er tale om én og samme publikation. Disse regler tager hensyn til forskellige forhold, hvor særligt metadata i form af PID’er (Persistente Identifikatorer såsom DOI, PMID, ISSN etc.) spiller en central rolle.
Da der nu kun er én global dataleverandør, er dette første trin i matching-processen ikke længere relevant.
Den anden del af matching-processen er fortsat fuldt ud relevant. Publikationer fra den Globale Database matches med deres tilsvarende publikationsposter i den Lokale Database, hvorved der etableres en kobling mellem de to databaser. Disse oplysninger kan findes på den enkelte publikationspost eller i filteret ‘Matching Records in’ . Læs mere om denne matchingalgoritme i den tekniske dokumentation.
NORA-Enhancements er en generel betegnelse for standardiserede navne, der bruges på tværs af alle Forskningsportalens databaser. Standardiseringen foretages for at sikre ensartet og struktureret data, som dels gør det nemmere at søge og dels danner udgangspunkt for grupperinger af særlig analytisk interesse. Metadataelementer indsamlet fra forskellige dataleverandører indeholder ofte flere og forskellige navnevarianter, der beskriver den samme værdi.
I den Global Database standardiseres (mappes eller grupperes) følgende metadataelementer:
Danske affiliationer og grupperinger
Alle danske affiliationsnavne mappes til hhv. ét standardiseret navn og én gruppering. Navnene ‘University of Copenhagen’ og ‘Copenhagen University’ mappes fx begge til det standardiserede affiliationsnavn: ’KU University of Copenhagen’ og grupperingen ‘Universities’ (find disse i filteret Danish Affiliations).
Samarbejdslande/regioner
De øvrige lande som danske forfattere sampublicerer med (samarbejdslande) grupperes i regioner af analytisk interesse. ‘Norge’ grupperes fx i regionerne ‘Europe’, ‘Non-EU’, ‘Nordic’ og ‘OECD’ (find disse i filteret Global Collaboration – Regions).
Emneklassifikationer
Emneklassifikationerne fra Elsevier mappes og beriges så de fremstår ensartet på tværs af den Globale Database. Følgende emneklassifikationer standardiseres:
1. Danske hovedforskningsområder
Det danske klassifikationssystem Danske hovedforskningsområder er udviklet i forbindelse med de danske forskningsindikatorer (BFI, OAI) og består af 4 kategorier, der opdeler dansk forskning inden for de overordnede kategorier: Videnskab/Teknologi, Sundhedsvidenskab, Samfundsvidenskab og Humaniora. Da der er tale om en national klassifikation mappes data fra den globale kommercielle dataleverandør til kategorierne baseret på en NORA berigelse.
2. DK Grøn klassifikation (pt. kun i databasen baseret på Elsevier data)
Uddannelses- og Forskningsministeriet (UFM) har fastlagt en overordnet definition af grøn forskning, udvikling og innovation inklusiv syv undertemaer til anvendelse på tværs af UFM i strategier, analyser, kortlægninger, monitorering og andre tiltag i forbindelse med den grønne omstilling. Databasen baseret på Elsevier data beriges med denne klassifikation (DK Green Classification) baseret på 6 ud af disse 7 temaer.
3. FN’s verdensmål for bæredygtig udvikling
FN’s 17 mål for bæredygtig udvikling (SDG) oversættes fra Elsevier’s SGD-kategorisering af forskningspublikationer til NORAs standardiserede navneformer.
4. OECD
OECD FORD emneklassifikation, også kendt under navnet Frascati, oversættes fra den globale dataleverandør til Fields of Research and Development (FORD) classification (2015) som dermed benyttes som standardiseret navneform i den Globale Database.
5. AU/NZ FoR
FoR-klassifikationen (Fields of Research) er en af komponenterne i det australske og newzealandske Standard Research klassifikationssystem (ANZSRC). FoR klassifikationer fra Elsevier mappes til FoR version 2.0 fra 2020 som dermed benyttes som standardiseret navneform i Globale Data.
Open Access kategorier
De forskellige definitioner af Open Access er mappet til seks kategorier; Al Open Access, Grøn, Gylden, Gylden-Hybrid, Free-to-Read, Ubestemt.
Læs mere om NORA-Enhancements i den tekniske dokumentation.
Den Globale Database har en generel problematik, som er værd at være opmærksom på:
- Data høstes som det er defineret, struktureret og registreret af den enkelte kommercielle dataleverandør.
Under Driftsstatus kan du desuden finde en oversigt over nuværende opdateringsspecifikke problemer med fx data og høst.