Distribuce datové sady
Základní informace
Pro umožnění analýzy reprodukčních a zdravotních událostí žen (porody, potraty, úmrtí), onemocnění a očkování proti COVID-19 vznikla datová sada popisující jednotlivé události v řádkových datech.
Datová sada vzniká v souladu s národní metodikou tvorby otevřených dat a je dostupná v národním katalogu.
Obsah datové sady zahrnuje základní údaje o ženě a konkrétní události (rok narození kategorizovaný do desetiletí, kategorizovaný věk ženy v době události, typ, pořadí a rok události) a následně další specifikace jednotlivých událostí (diagnóza úmrtí; stáří plodu při samovolném potratu; informaci, zda umělý potrat byl proveden s nebo bez zdravotních důvodů; četnost porodu; pořadí a typ očkovací dávky a pořadí infekce COVID-19).
Z technického hlediska se jedná o údaje z NRRZ, blíže viz dokumentace Národního registru reprodukčního zdraví; údaje z LPZ, blíže viz dokumentace Listu o prohlídce zemřelého a údaje z ISIN, blíže viz dokumentace Informačního systému infekční nemoci.
Interpretace a informační hodnota a limitace
Datová sada vychází z dat Národního registru reprodukčního zdraví (NRRZ), Listu o prohlídce zemřelého (LPZ) a Informačního systému infekční nemoci (ISIN).
Cílem datové sady je poskytnout informace o reprodukčních a zdravotních událostech žen a o onemocnění a očkování těchto žen proti COVID-19.
Z důvodu ochrany osobních údajů fyzických osob je limitována úroveň detailu popisných charakteristik (uveden je pouze rok narození kategorizovaný do desetiletí a nejsou blíže specifikovány další demografické údaje). Zahrnuty jsou pouze ženy starší 15 let. V případě reprodukčních událostí (porody a potraty) jsou pak zahrnuty pouze ženy ve věku 15–55 let. Věk je kategorizován do dvou kategorií: do 34 let a nad 35 let včetně. Zahrnuty jsou události od roku 1994 až do posledního uzavřeného roku.
Sloupec s kategorizovanou hodnotou věku ženy v době dané události hodnotu obsahuje pouze tehdy, pokud jej bylo možné určit z dostupných dat. V případech, kdy byl znám pouze rok narození, ale ne celé datum, nebyl věk dopočítáván (typicky pro očkování a onemocnění COVID-19), jelikož by šlo pouze o orientační rozdíl mezi roky, nikoli o přesný věk v době dané události. Pokud však byl věk v datech již uveden (např. vypočtený z kompletních dat o narození a události), zůstal zachován a byl následně kategorizován.
U části žen rok narození v datech zcela chybí, a proto u těchto záznamů nelze určit věk ani jej nijak dopočítat. Tyto případy zůstaly v datové sadě zachovány, protože i přes neúplné informace o věku mohou poskytovat důležité údaje o výskytu a načasování jednotlivých událostí.
Data obsahují sloupec s názvem unikatni_overene_RC. Jde o sloupec nesoucí informaci, zda bylo u dané ženy možné ověřit unikátní rodné číslo. Pokud toto ověření možné nebylo (hodnota 0 ve sloupci unikatni_overene_RC), nelze s jistotou určit, zda dané ID odpovídá pouze jedné unikátní ženě.
Příklady použití
Typickým příkladem využití datové sady je analýza vztahů mezi reprodukčními a zdravotními událostmi, výskytem onemocnění COVID-19 a očkováním proti COVID-19. Datová sada umožňuje zkoumat, jak se tyto různé typy událostí časově prolínají, zda na sebe nějak navazují, a jak se jejich rozložení mění v čase nebo mezi různými skupinami žen (např. generacemi žen podle roku narození).
Díky tomu, že každý řádek představuje konkrétní událost přiřazenou jedné ženě a že jednotlivé události jsou chronologicky seřazeny, lze data využít i pro analýzy průběhu života žen. To umožňuje například sledovat sled událostí (např. očkování → těhotenství → porod) nebo vytvářet přehledové statistiky o výskytu jednotlivých typů událostí a jejich vzájemných souvislostech.
Ochrana osobních údajů
Datová sada je připravována v souladu se zákonem 372/2011 Sb. (Zákon o zdravotních službách a podmínkách jejich poskytování) §73 odst. 8 a zákonem 110/2019 Sb. §16.
Data jsou anonymizovaná a pro propojení řádků mezi sebou (identifikace jednotlivých žen) jsou využity uměle vytvořené identifikátory.
Klíčová slova
NRRZ, Národní registr reprodukčního zdraví, LPZ, List o prohlídce zemřelého, ISIN, Informační systém infekční nemoci, úmrtí, porod, potrat, asistovaná reprodukce, COVID-19, očkování
Klasifikace dle EuroVoc
státní zdravotní služba, porodnost, očkování, nemoc
Popis parametrů
| Název | Název parametru v CSV | Popis parametru |
| ID ženy | id_zeny | unikátní ID popisující jednu konkrétní ženu v datech |
| Unikátní ověřené rodné číslo | unikatni_overene_RC | číselná hodnota určující, zda je dané id_zeny možné brát jako unikátní, na základě ověřeného rodného čísla |
| Desetiletí narození | desetileti | desetiletí roku narození ženy; např. hodnota 1980 odpovídá rokům narození 1980–1989 apod. |
| Věk | vek | kategorizovaný věk ženy v době události vycházející Číselníku věkových skupin NZIS |
| Událost | udalost | typ události |
| Pořadí události | poradi_udalosti | pořadí, v jakém se daná událost vyskytla u dané ženy |
| Rok události | rok_udalosti | rok, v jakém se daná událost vyskytla u dané ženy |
| Úmrtí – diagnóza | umrti_diagnoza | hlavní diagnóza úmrtí dle MKN-10 kódu v délce 3 znaků |
| Samovolný potrat – stáří plodu v týdnech | s_potrat_stari_plodu_v_tydnech | stáří plodu v týdnech při samovolném potratu |
| Umělý potrat – s/bez zdravotního důvodu | u_potrat_s_bez_zdrav_duvodu | typ umělého potratu |
| Porod – četnost | porod_cetnost | počet narozených dětí při daném porodu |
| Porod – gestační stáří | porod_gestacni_stari | gestační stáří v týdnech |
| COVID-19 očkování – pořadí dávky | covid_ocko_poradi_davky | pořadí očkovací dávky u dané ženy |
| COVID-19 očkování – typ | covid_ocko_typ | typ COVID-19 očkování |
| COVID-19 onemocnění – pořadí infekce | covid_onemoc_poradi_infekce | pořadí infekce COVID-19 onemocnění u dané ženy |