SIP: XML cz.1: XML i XSD w GIS – wprowadzenie

XML Schema - schemat elementów w pliku .XSD

W Geograficznych Systemach Informacji wprowadzono standard wymiany danych oparty na standardach XML i XML Schema, które doczekały swoich „geograficznych” rozwinięć.

XML – (ang. Extensible Markup Language) to rozszerzalny  język, który posługuje się znacznikami i który został zaprojektowany do przesyłania i przechowywania danych. XML Schema –  to schemat (wzorzec) rozszerzalnego języka znaczników XML, który opisuje strukturę dokumentu. XML Schema wykorzystuje składnię języka XML.

Oba standardy zostały opracowane przez Konsorcjum W3C (World Wide Web Consortium).XML jako język znaczników jest podobny do HTML (HyperText Markup Language), przy czym XML to „narzędzie” do przenoszenia informacji, a HTML odpowiada jedynie za jej wyświetlenie.

Celem XML Schema jest zapewnienie, aby dokumenty XML, tworzone na jego podstawie, wytworzone na podstawie reguł konwersji, były poprawne. Dokumenty zawierające reguły i definicje XML Schema  zapisywane są w plikach z rozszerzeniem .XSD i są wyznacznikiem do tworzenia plików przenoszących informacje, zapisywanych z rozszerzeniem .XML

Dokument .XML zawiera elementy, które mogą mieć atrybuty. Elementem XML jest wszystko to, co znajduje się między znacznikiem początkowym a znacznikiem końcowym. Atrybuty dostarczają dodatkowych informacji o elementach.

Element może zawierać inne elementy, tekst, atrybuty lub wszystkie wymienione.

Są podstawowe zasady dotyczące składni dokumentu .XML:

– musi zaczynać się od deklaracji XML,
– musi mieć unikalny element główny (tzw.root), który jest nadrzędny dla pozostałych elementów; dla każdego dokumentu .XSD elementem głównym jest <schema>;
– znaczniki początkowe (otwierające) muszą posiadać odpowiadające im znaczniki końcowe (zamykające),
– znaczniki rozróżniają małe i wielkie litery,
– wszystkie elementy muszą być zamknięte,
– wszystkie elementy muszą być odpowiednio zagnieżdżone,
– wartości atrybutów musza być ujęte w cudzysłów,

Elementy pliku XML muszą stosować się do następujących zasad nazywania:

– nazwy mogą zawierać litery, liczby i inne znaki,
– nazwy nie mogą rozpoczynać się od liczby lub znaku przestankowego ( . , : ; „ ‘ ? – ),
– nazwy nie mogą rozpoczynać się od liter xml (lub XML, Xml itp.),
– nazwy nie mogą zawierać spacji.

XML Schema (plik .XSD) definiuje:

– elementy i atrybuty, które mogą pojawić się w dokumencie – pliku XML,
– które są elementami unikalnymi głównymi (root), a które są elementami pozostałymi („dziećmi”),
– kolejność – porządek i liczbę elementów „dzieci” ,
– czy element jest pusty, czy może zawierać tekst,
– typy danych dla elementów i atrybutów,
– wartości domyślne i stałe dla elementów i atrybutów

XML Schema (plik .XSD) może zawierać:

– elementy proste (simpleType), które zawierają tylko tekst, nie mogą zawierać żadnych innych elementów i atrybutów,
– elementy złożone (complexType) to takie, które zawierają inne elementy i/lub atrybuty.

Elementem głównym („root”em – korzeniem )każdego dokumentu XML Schema (pliku .XSD) jest zawsze element oznaczy <schema>. Może on zawierać atrybuty. Elementy, które są bezpośrednio „dziećmi” elementu <schema>, to schematy globalne. Elementy lokalne są elementami zagnieżdżonymi wewnątrz innych elementów.

Fizycznie pliki .XSD mogą być pojedynczym dokumentem (plikiem) schematu lub może być podzielony na kilka oddzielnych dokumentów (plików) .