Žodynas¶
Duomenų kontekste, žodynas yra tiesiog pavadinimų rinkinys, kuriais vadinami
objektai ir objektų savybės. Iš mūsų countries.csv
pavyzdžio, duomenų
šaltinis naudoja vienokius laukų pavadinimus, tačiau importuojant duomenis
nurodome kitokius pavadinimus.
Aprašant duomenų struktūras nebūtina laikytis vieningo žodyno. Jei naudojami
pavadinimai yra ne iš žodyno, tada prieš pavadinima turi būti rašomas taško
simbolis (.
). Po taško galima naudoti lygiai tokius pačius laukų pavadinimas
arba bet kokius kitus pavadinimus. Tačiau vieningas atvirų duomenų portale
naudojamas žodynas padeda geriau suvaldyti duomenis ir didina atvertų duomenų
brandos lygį.
Tikriausiai iškyla klausimas, kas sudaro žodynus ir kaip žinoti kokie
pavadinimai yra naudojami atvirų duomenų portalo žodyne? Mūsų countries.csv
pavyzdyje duomenų aprašo tipas yra dataset
, yra dar vienas duomenų aprašo
tipas pavadinimu model
. Mūtend model
aprašuose ir aprošomi atvirų duomenų
portalo žodyno pavadinimai. Štai pavyzdys, kaip toks aprašas atrodo:
type: model
name: geografija/salis
properties:
kodas:
type: string
pavadinimas:
type: string
Dažniausiai visi model
aprašai saugomi models/
kataloge ir failas iki YAML
failo atitinka modelio pavadinimą, tai šuo atveju šis modelis turūtų būti
išsaugotas models/geografija/salis.yml
faile. Toks katalogas padeda langviau
naviguoti tarp modelių aprašų ir naudoti tuos pačius pavadinimus aprašant
duomenų šaltinius.