2010. február 21., vasárnap

Geokódolás

A geokódolás során egy címhez koordinátát rendelünk hozzá azért, hogy meg tudjuk jeleníteni a térképen. Ezt a funkciót - amely a webes térképeken és a navigációs rendszerekben is elérhető - címkeresésnek vagy utcakeresésnek hívjuk.

Ahhoz, hogy a geokódolás folyamatát megértsük néhány kérdésre választ kell kapnunk:

  • Mit tekintünk címnek?
  • Milyen a jó térkép?
  • Milyen a jó geokódoló alkalmazás?

A kérdésekre adott válasz meghatározó mert a geokódolás eredményessége/minősége is ettől függ, azaz:

  • a megadott cím minőségétől/pontosságától,
  • a használt térképek és referencia-adatbázisok minőségétől és
  • az alkalmazott geokódolási technológiától.

Mit tekinthetünk címnek?

A felhasználó szempontjából minden cím, amivel egy hely vagy objektum helyzetét a térben leírja. A geokódolás eredményessége szempontjából viszont bizonyos címalkotási szabályokat be kell tartani. A cím minőségét elsősorban részletessége/mélysége határozza meg, de nem szabad elfeledkeznünk a helyes írásmódról sem.

Magyarországon a címeknek alapesetben a következő elemeket kell tartalmazniuk:

  • település,
  • irányítószám,
  • közterületnév és -jelleg,
  • házszám (amennyiben nincs úgy helyrajzi szám),

Ha ezek az adatok rendelkezésünkre állnak, akkor még csak magához az épülethez jutottunk el, de sok esetben innen is tovább bontható a cím:

  • épület (ha létezik),
  • lépcsőház (ha létezik),
  • emelet,
  • ajtó.

A fenti szerkezettől sok esetben eltérnek a címek, így találkozhatunk:

  • településrészekkel, földrajzi nevekkel
  • úthálózat szelvényszámával (pl. M3 13+000),
  • külterületi helyekkel (pl.:tanya, gátőrház, vasútállomás)
  • egyedi objektumokkal, POI-kal (pl. Mamut), vagy akár
  • helyrajzi számokkal
megadásával címadatként.

A cím, ahogy megadjuk

Ha már van címünk, az sem mindegy, milyen formában és módon áll rendelkezésünkre. Bár nem látszik, de a geokódolás folyamata két részből áll:

  • az első részben megkeressük a közterület, amelyen a cím található,
  • majd a második részben elhelyezzük rajta magát a címet.

A kettő közül az első lépés a fontosabb, és egyben a nehezebb is. Nem lenne probléma, ha mindenki helyesen – a referencia-adatbázisnak megfelelően – írná le a címeket, mert akkor csak azt kellene megvizsgálni, hogy az adott közterület megtalálható-e az adatbázisban, és utána már csak meg kell találni rajta a címet. A tapasztalatok alapján azonban „ahány ember, annyi szokás”, így a címet tartalmazó adatbázisokban sok hiba található. Néhány jellemző hiba / elírás, ami a nap, mint nap előfordul a címekben:

  • településrész nevének megadása településnév helyett (pl.: Gárdony-Agárd)
  • településnév elírása (pl.: Hídvég helyett Hidvég)
  • közterület név elírása (pl.: Bajcsy-Zsilinszky Endre utca helyett Bajcsi Zsilinszky utca)
  • régi közterület név megadása (pl.: Felszabadulás tér a Ferenciek tere helyett)
  • hibás irányítószám,
  • rövidítések a közterület névben (pl.: u., krt., sgt.)

A létező, de rosszul megadott címeken kívül a felhasználói címadatbázisban lehetnek a valóságban nem, vagy már nem létező címek is. Ezek előfordulásának számos oka lehet, ilyen:

  • a közterület megszűnése, vagy átnevezése,
  • a településrész kiválása és önálló településsé válása,
  • a közterületet újraszámozása.
A címkeresés eredményét a címekben rejlő hibákon kívül még egy dolog befolyásolja, nevezetesen az, hogy mit is keresünk a térképen. Minél újabb keletű, vagy speciálisabb a cím, amit keresünk, annál nagyobb a jelentősége annak, hogy milyen a térkép amit használunk.

Térkép, amin keresünk

A legtöbb térkép a települések központi belterületére koncentrál, de mi a helyzet ezeken túl? Fontos, hogy geokódolásra olyan térképi adatbázist használjunk, amelyik "ismeri" a múltat és a jelent. A múlthoz tartozik, hogy követi a megváltozott közterület neveket, a településszerkezeti változásokat (pl.: tömbrehabilitáció, új utca nyitása), a jelenhez pedig, hogy vezeti a területszervezési változásokat, (pl.: új települések létrejötte), az új beépítéseket, beruházásokat.

Mindenki arra törekszik, hogy naprakész legyen a térképe, de mindig van olyan közterület/utca, amelyik hiányzik a térképről. Érdemes olyan térképet választani, amelyet folyamatosan, és ismert időközökben frissítenek. (A Google Maps térképvel pl. az a legnagyobb probléma, hogy nem tudjuk – mert a Google nem adja meg –, hogy mi és mikor frissült a térképén. Az űrfelvétek frissítéséről ugyan kapunk infromációt, de arról is mindig utólag. Hasonló a helyzet a Bing Map esetében is.)

Cím, amit a térképen találunk

A címekben rejlő hibák és a megfelelő térkép szükségességének ismeretében lássunk néhány példát címkeresés eredményére a Bing Map (világtérkép), a Google Maps (világtérkép), illetve a GeoXRaszter (Magyarország térkép) térképeinek felhasználásával, az alábbi "kényes" területekre:

  • lakóparkok,
  • üdülőterületek,
  • ipari területek,
  • külterületi lakott helyek.

1. Dunakeszi, Lehár Ferenc utca, mely a Toldi lakópark egy utcája.

Eredmény a Bing Map térképen (nem tartalmazza a lakóparkot sem)

Eredmény a GoogleMaps térképen (nem tartalmazza a lakóparkot sem)


Eredmény a GeoXRaszter térképen (lakópark teljes úthálózattal)

2. Balassagyarmat, Nyírjes, Tópart utca, mely egy üdülőterületi rész Balassagyarmat külterületén.

Eredmény a Bing Map térképen (csak az úthálózat ismert)

Eredmény a GoogleMaps térképen (csak a bekötőút neve ismert)


Eredmény a GeoXRaszter térképen (valamennyi közterület neve ismert)

3. Székesfehérvár Repkény utca, mely az Alba Ipari park egy utcája.

Eredmény a Bing Map térképen (néhány közterület neve ismert)

Eredmény a GoogleMaps térképen (csak a bekötőút neve ismert)

Eredmény a GeoXRaszter térképen (valamennyi közterület neve ismert)



Kinek fontos, hogy az eredmény pontos legyen?

Valószínű mindenkinek! A kérdés csak az, hogy mennyire elégszünk meg a majdnem pontos eredménnyel. A közigazgatás, a szolgáltatás területén jelentősen megkönnyíti a nyilvántartást, ügyintézést, ha az ügyféladatbázis pontos, kiszűrhetők a nem létező, vagy duplikált címek. A geokódolás ebben is segít. Minden olyan felhasználónak, akinek nagy mennyiségű címadata van, szüksége van adatai időszakos ellenőrzésére, rendezésére. A teljesség igénye nélkül néhány példa, ahol a geokódolás a hatékonyságot növelheti:
  • bank / biztosítás (geomarketing, potenciális "hideg" címek keresése)
  • közművek (víz-, gáz, áramszolgáltatás), hulladékkezelés (nyilvántartások, ügyfélszolgálatok támogatás)
  • postai szolgáltatások (geomarkating)
  • távközlés (ügyfelek nyilvántartása, ügyfeészolgálatok, egyedi "helyfüggő" ajánlatok)
  • védelem (ügyfélszolgálat, védett objektumok nyilvántatása)

Módszerek, melyekkel az eredmény javítható

A címek tisztítása a hatékony geokódoláshoz elengedhetetlen folyamat. A címek tisztítására, azaz a megfelelő közterület megtalálására más-más megoldást használnak az egyes térinformatikai szoftverek (ArcGIS Desktop, MapInfo) és a webes – gyakorlatilag a Google Maps API-n alapuló– megoldások.

A térinformatikai szoftverek geokódoló megoldásaira elmondható, hogy angol nyelvi környezetre fejlesztették, így nem támogatják a magyar nyelvet. A Google Maps API viszonylag jól elboldogul az angolon kívül más nyelvekkel is, bár legjobbnak mindig az adott nyelve – esetünkben a magyarra – kifejlesztett alkalmazások bizonyulnak.

A geokódolás során fontos, hogy visszajelzést kapjunk arról, milyen pontosan sikerült az adott címet elhelyezni a térképen. A geokódolás hatékonyságának mérésére valamennyi geokódoló algoritmus alkalmaz mérőszámokat. A mérőszámok/minőségkódok használatának célja, hogy megmutassa a felhasználónak, hogy az összes bemeneti cím közül mennyi került pontosan geokódolásra, illetve a nem pontosan geokódolt címeket hogyan sikerült elhelyezni a térképen. A tipikus osztályok a nem pontosan geokódolt címek esetében:

  • „x” házszám eltéréssel geokódolt cím a referencia-adatbázisban szereplő legnagyobb házszámhoz képest (Pl. a beépítés folytatódott az utcában, de a felmérése még nem történt meg, és nem jelenik meg a térképen.)
  • közterület szinten geokódolt cím, (Pl. a geokódolásra megadott címből hiányzik a házszám vagy használt térképen nincsenek házszámok az adott közterületen)
  • település szinten geokódolt cím, (Ez az eset akkor fordul elő, ha a megadott címben olyan közterület szerepel, ami nem létezik a településen.)
  • nem geokódolható cím esetén még a település sem ismerhető fel a megadott címből.

Nincsenek megjegyzések:

Megjegyzés küldése