Registerbaseret forskning på DST

Hvem er denne guide til, og hvad vil du lære?

Published

July 21, 2026

Denne vejledning er til alle, der arbejder med registerbaseret forskning på Danmarks Statistik (DST).

Forudsætninger Eksemplerne forudsætter, at dine registre er gemt som parquet, og de anbefaler fastreg til at læse et register via navn (read_register("bef")). Er dine data stadig i SAS, så konvertér dem én gang - se Fase 4 - Konvertér SAS til parquet. Bruger du ikke fastreg? De samme parquet-filer åbnes med open_dataset() (arrow), som vises ved siden af hele vejen.

Hvor starter du?

Ny i registerforskning?

Start ved fase 1 og følg faserne i rækkefølge - lidt R-erfaring gør starten lettere.

→ Begynd ved fase 1

Kender allerede R?

Spring de indledende faser over og gå direkte til serveren, filerne og udtrækkene.

→ Hop til fase 3

Arbejder på DARTER?

Særlige setup-trin og projektspecifik vejledning.

→ DARTER - oversigt og pipeline

Leder du efter noget bestemt? Brug søgefeltet øverst til højre på siden - det søger på tværs af hele guiden.

Faserne i guiden

Guiden er bygget som 14 faser. Roadmappet viser den naturlige vej igennem fra planlægning til hjemsendelse; tabellen under giver et hurtigt overblik. Du behøver ikke læse alt i rækkefølge - opslagssiderne (funktioner, faldgruber, register-overblik m.m.) kan du springe til undervejs.

%%{init: {
  "themeVariables": {
    "fontSize": "24px"
  },
  "flowchart": {
    "nodeSpacing": 23,
    "rankSpacing": 40
  }
}}%%
flowchart LR
    S1["①  Kom i gang<br>1 · 2 · 3"] --> S2["②  Hent data<br>4 · 5 · 6 · 7 · 8"] --> S3["③  Byg studiet<br>9 · 10"] --> S4["④  Udtræk variable & saml<br>11 · 12"] --> S5["⑤  Analysér & afslut<br>13 · 14"]
    O1["Funktioner: oversigt"] ~~~ O2["Formateringstabeller"] ~~~ O3["Faldgruber på DST"] ~~~ O4["Register-overblik"] ~~~ O5["God kode-praksis"]
    O6["Algoritmer & specialpakker"] ~~~ O7["Læringsressourcer"] ~~~ O8["DARTER - Projekt 708421"]
    classDef stage fill:#eaf2fb,stroke:#4a78b5,stroke-width:1px,color:#173a5e;
    classDef ref fill:#f6f6f6,stroke:#aaaaaa,color:#555555;
    class S1,S2,S3,S4,S5 stage
    class O1,O2,O3,O4,O5,O6,O7,O8 ref

Fase	Indhold
1 - Planlæg dit studie	Forskningsspørgsmål, nøglebegreber og datamodel
2 - R: det allermest nødvendige	Det minimum af R du skal kunne for at gå i gang
3 - Log ind på DST	Adgang til serveren og det første overblik
4 - Filtyper og indlæsning	Parquet og SAS - formater og konvertering
5 - Udtræk trin for trin	Det universelle udtræksmønster: read_register/open_dataset → filter → collect
6 - Første udtræk	Dit første rigtige udtræk med syntetiske data
7 - Inspicér din data	Tjek struktur, typer og fordelinger før analyse
8 - Find dine registre	Find de rigtige registre til eksponering, udfald og kovariater
9 - Forstå LPR	LPR2/LPR3 og ICD-koder - 9a forstå · 9b udtræk
10 - Byg din studiepopulation	Kohorte, index-dato, in-/eksklusion, censurering og specielle designs
11 - Udtræk variable	Udtræk udfald, socioøkonomi og komorbiditet - filtreret til kohorten
12 - Saml & klargør datasættet	Joins, pivots og håndtering af manglende data
13 - Analyse	Tabeller, figurer, regression, time-to-event, rater og sensitivitetsanalyser
14 - Eksport og hjemsendelse	Få dine resultater sikkert ud af DST

Opslag - brug undervejs

Disse sider er ikke en del af den nummererede gennemgang - spring hertil, når du står med et konkret spørgsmål.

Side	Brug den når du vil…
Funktioner: oversigt	slå en enkelt funktion op - hvad gør `filter()`, `collect()`, `%>%`, `left_join()`?
Formateringstabeller	oversætte koder til tekst (kommune-, uddannelses- og beskæftigelseskoder) med DST’s SAS-formatfiler
Faldgruber på DST	tjekke de fejl der oftest koster tid og giver uinformative fejlmeddelelser
Register-overblik	finde de bekræftede kolonnenavne, typer og join-nøgler for hvert register
God kode-praksis	struktur, navngivning og reproducerbar kode
Algoritmer & specialpakker	færdige algoritmer (OSDC, NMI) til at udlede variable
Læringsressourcer	finde kurser, bøger og opslagsværker til R, epidemiologi og statistik