Portál KAV poskytuje priestor pre spoluprácu analytických jednotiek, dáta a nástroje
KAV – prínosy, požiadavky ciele
Implementácia konceptu „Data-driven state“ – štátu, ktorý funguje na základe využívania dát prinesie:
- spoluprácu analytických jednotiek,
- sprístupnenie vybraných datasetov a dátových zdrojov,
- zdieľanie a publikovanie analytických údajov (voľne alebo s kontrolovaným prístupom),
- úložisko analytických údajov a výstupov,
- prepojenie údajov na úrovni mikrodát,
- spracovanie údajov (využitie BI nástrojov, , … ),
- podpora metód anonymizácie a pseudonymizácie,
- publikovanie výsledkov analýz a výstupov vo forme otvorených údajov.
Prostredníctvom KAV je možné realizovať:
- Univerzálne možnosti dátovej integrácie – zdrojové dáta pre KAV pochádzajú z rôznych systémov a v rôznych formátoch
- Jednoduché užívateľské prostredie ETL/ELT bez nutnosti kódovania
- Efektívne uchovávanie surových zdrojových dát namiesto zložitej transformácie ešte pred vstupom do úložiska
- Prístup k surovej podobe dát pre analytikov, keďže účel ich použitia zatiaľ nie je definovaný (umožniť data exploring a ML)
- Selektívna konsolidácia dát na základe požiadaviek a ich ďalšie modelovanie a viacvrstvová architektúra dátového úložiska
- Variabilita možnosti práce s dátami podľa požiadaviek/znalostí analytikov (SQL, Python, R)
- Príprava datasetov na ich ďalšie spracovanie/export/vizualizáciu
- Možnosti zdieľania reportov/dashboardov pre ďalšie skupiny používateľov (v rámci KAV, mimo KAV)
- Analytický sandbox pre jednotlivých používateľov, resp. skupiny používateľov s možnosťou pripájania vlastných datasetov
- Jednoduchý manažment prístupu k dátam na tej najnižšej úrovni
- Zabezpečenie biznis pravidiel anonymizácie/ pseudonymizácie/data maskingu
- Spoločné užívateľské prostredie pre analytikov s možnosťou implementácie ďalších služieb (komunikácia a kolaborácia, odkazy, videá,…)
- Príprava datasetov s charakterom osobných údajov a ich poskytovanie pre projekt OD 2.0
- Zabezpečenie logovania práce s dátami
- Naplnenie požiadaviek analytických jednotiek pri potrebe dynamicky a krátkodobo škálovať výkon pri náročnejších analýzach.
Nástroje:
- Azure Data Lake Storage (ADLS): Údaje z OVM môžete ukladať do Azure Data Lake Storage. Táto služba umožňuje ukladanie veľkého množstva štruktúrovaných a neštruktúrovaných dát.
- AzureDataFactory: Azure Data Factoryslúži na extrakciu, transformáciu a načítanie (ETL) dát. Pomocou tejto služby môžete definovať a plánovať tok údajov z OVM do úložiska ADLS.
- SQL Database: Azure SQL Database ako cloudova služba podporuje vytváranie datovych modelov a relačné dátové štruktúry. Tiež umožňuje jednoduché škálovanie zdrojov podľa potreby. Môžete zvýšiť alebo znížiť výpočtový výkon alebo úložisko podľa aktuálnych požiadaviek.
- PowerBI: Na vizualizáciu dát môžete použiť Power BI, ktorý je súčasťou Azure Cloud Solution. S Power BI vytvoríte interaktívne vizualizácie a prezentácie dát z jednotlivých OVM a iných dátových zdrojov a registrov.
Ak si prajete získať ďalšie informácie, kontaktujte nás prosím prostredníctvom emailu na adrese: kav@mirri.gov.sk