%%{init: {
"themeVariables": {
"fontSize": "24px"
},
"flowchart": {
"nodeSpacing": 23,
"rankSpacing": 40
}
}}%%
flowchart LR
S1["① Kom i gang<br>1 · 2 · 3"] --> S2["② Hent data<br>4 · 5 · 6 · 7 · 8"] --> S3["③ Byg studiet<br>9 · 10"] --> S4["④ Udtræk variable & saml<br>11 · 12"] --> S5["⑤ Analysér & afslut<br>13 · 14"]
O1["Funktioner: oversigt"] ~~~ O2["Formateringstabeller"] ~~~ O3["Faldgruber på DST"] ~~~ O4["Register-overblik"] ~~~ O5["God kode-praksis"]
O6["Algoritmer & specialpakker"] ~~~ O7["Læringsressourcer"] ~~~ O8["DARTER - Projekt 708421"]
classDef stage fill:#eaf2fb,stroke:#4a78b5,stroke-width:1px,color:#173a5e;
classDef ref fill:#f6f6f6,stroke:#aaaaaa,color:#555555;
class S1,S2,S3,S4,S5 stage
class O1,O2,O3,O4,O5,O6,O7,O8 ref
Registerbaseret forskning på DST
Hvem er denne guide til, og hvad vil du lære?
Denne vejledning er til alle, der arbejder med registerbaseret forskning på Danmarks Statistik (DST).
Forudsætninger Eksemplerne forudsætter, at dine registre er gemt som parquet, og de anbefaler fastreg til at læse et register via navn (read_register("bef")). Er dine data stadig i SAS, så konvertér dem én gang - se Fase 4 - Konvertér SAS til parquet. Bruger du ikke fastreg? De samme parquet-filer åbnes med open_dataset() (arrow), som vises ved siden af hele vejen.
Hvor starter du?
Ny i registerforskning?
Start ved fase 1 og følg faserne i rækkefølge - lidt R-erfaring gør starten lettere.
Kender allerede R?
Spring de indledende faser over og gå direkte til serveren, filerne og udtrækkene.
Arbejder på DARTER?
Særlige setup-trin og projektspecifik vejledning.
Leder du efter noget bestemt? Brug søgefeltet øverst til højre på siden - det søger på tværs af hele guiden.
Faserne i guiden
Guiden er bygget som 14 faser. Roadmappet viser den naturlige vej igennem fra planlægning til hjemsendelse; tabellen under giver et hurtigt overblik. Du behøver ikke læse alt i rækkefølge - opslagssiderne (funktioner, faldgruber, register-overblik m.m.) kan du springe til undervejs.
| Fase | Indhold |
|---|---|
| 1 - Planlæg dit studie | Forskningsspørgsmål, nøglebegreber og datamodel |
| 2 - R: det allermest nødvendige | Det minimum af R du skal kunne for at gå i gang |
| 3 - Log ind på DST | Adgang til serveren og det første overblik |
| 4 - Filtyper og indlæsning | Parquet og SAS - formater og konvertering |
| 5 - Udtræk trin for trin | Det universelle udtræksmønster: read_register/open_dataset → filter → collect |
| 6 - Første udtræk | Dit første rigtige udtræk med syntetiske data |
| 7 - Inspicér din data | Tjek struktur, typer og fordelinger før analyse |
| 8 - Find dine registre | Find de rigtige registre til eksponering, udfald og kovariater |
| 9 - Forstå LPR | LPR2/LPR3 og ICD-koder - 9a forstå · 9b udtræk |
| 10 - Byg din studiepopulation | Kohorte, index-dato, in-/eksklusion, censurering og specielle designs |
| 11 - Udtræk variable | Udtræk udfald, socioøkonomi og komorbiditet - filtreret til kohorten |
| 12 - Saml & klargør datasættet | Joins, pivots og håndtering af manglende data |
| 13 - Analyse | Tabeller, figurer, regression, time-to-event, rater og sensitivitetsanalyser |
| 14 - Eksport og hjemsendelse | Få dine resultater sikkert ud af DST |
Opslag - brug undervejs
Disse sider er ikke en del af den nummererede gennemgang - spring hertil, når du står med et konkret spørgsmål.
| Side | Brug den når du vil… |
|---|---|
| Funktioner: oversigt | slå en enkelt funktion op - hvad gør filter(), collect(), %>%, left_join()? |
| Formateringstabeller | oversætte koder til tekst (kommune-, uddannelses- og beskæftigelseskoder) med DST’s SAS-formatfiler |
| Faldgruber på DST | tjekke de fejl der oftest koster tid og giver uinformative fejlmeddelelser |
| Register-overblik | finde de bekræftede kolonnenavne, typer og join-nøgler for hvert register |
| God kode-praksis | struktur, navngivning og reproducerbar kode |
| Algoritmer & specialpakker | færdige algoritmer (OSDC, NMI) til at udlede variable |
| Læringsressourcer | finde kurser, bøger og opslagsværker til R, epidemiologi og statistik |