2010. február 21., vasárnap

Geokódolás

A geokódolás során egy címhez koordinátát rendelünk hozzá azért, hogy meg tudjuk jeleníteni a térképen. Ezt a funkciót - amely a webes térképeken és a navigációs rendszerekben is elérhető - címkeresésnek vagy utcakeresésnek hívjuk.

Ahhoz, hogy a geokódolás folyamatát megértsük néhány kérdésre választ kell kapnunk:

 • Mit tekintünk címnek?
 • Milyen a jó térkép?
 • Milyen a jó geokódoló alkalmazás?

A kérdésekre adott válasz meghatározó mert a geokódolás eredményessége/minősége is ettől függ, azaz:

 • a megadott cím minőségétől/pontosságától,
 • a használt térképek és referencia-adatbázisok minőségétől és
 • az alkalmazott geokódolási technológiától.

Mit tekinthetünk címnek?

A felhasználó szempontjából minden cím, amivel egy hely vagy objektum helyzetét a térben leírja. A geokódolás eredményessége szempontjából viszont bizonyos címalkotási szabályokat be kell tartani. A cím minőségét elsősorban részletessége/mélysége határozza meg, de nem szabad elfeledkeznünk a helyes írásmódról sem.

Magyarországon a címeknek alapesetben a következő elemeket kell tartalmazniuk:

 • település,
 • irányítószám,
 • közterületnév és -jelleg,
 • házszám (amennyiben nincs úgy helyrajzi szám),

Ha ezek az adatok rendelkezésünkre állnak, akkor még csak magához az épülethez jutottunk el, de sok esetben innen is tovább bontható a cím:

 • épület (ha létezik),
 • lépcsőház (ha létezik),
 • emelet,
 • ajtó.

A fenti szerkezettől sok esetben eltérnek a címek, így találkozhatunk:

 • településrészekkel, földrajzi nevekkel
 • úthálózat szelvényszámával (pl. M3 13+000),
 • külterületi helyekkel (pl.:tanya, gátőrház, vasútállomás)
 • egyedi objektumokkal, POI-kal (pl. Mamut), vagy akár
 • helyrajzi számokkal
megadásával címadatként.

A cím, ahogy megadjuk

Ha már van címünk, az sem mindegy, milyen formában és módon áll rendelkezésünkre. Bár nem látszik, de a geokódolás folyamata két részből áll:

 • az első részben megkeressük a közterület, amelyen a cím található,
 • majd a második részben elhelyezzük rajta magát a címet.

A kettő közül az első lépés a fontosabb, és egyben a nehezebb is. Nem lenne probléma, ha mindenki helyesen – a referencia-adatbázisnak megfelelően – írná le a címeket, mert akkor csak azt kellene megvizsgálni, hogy az adott közterület megtalálható-e az adatbázisban, és utána már csak meg kell találni rajta a címet. A tapasztalatok alapján azonban „ahány ember, annyi szokás”, így a címet tartalmazó adatbázisokban sok hiba található. Néhány jellemző hiba / elírás, ami a nap, mint nap előfordul a címekben:

 • településrész nevének megadása településnév helyett (pl.: Gárdony-Agárd)
 • településnév elírása (pl.: Hídvég helyett Hidvég)
 • közterület név elírása (pl.: Bajcsy-Zsilinszky Endre utca helyett Bajcsi Zsilinszky utca)
 • régi közterület név megadása (pl.: Felszabadulás tér a Ferenciek tere helyett)
 • hibás irányítószám,
 • rövidítések a közterület névben (pl.: u., krt., sgt.)

A létező, de rosszul megadott címeken kívül a felhasználói címadatbázisban lehetnek a valóságban nem, vagy már nem létező címek is. Ezek előfordulásának számos oka lehet, ilyen:

 • a közterület megszűnése, vagy átnevezése,
 • a településrész kiválása és önálló településsé válása,
 • a közterületet újraszámozása.
A címkeresés eredményét a címekben rejlő hibákon kívül még egy dolog befolyásolja, nevezetesen az, hogy mit is keresünk a térképen. Minél újabb keletű, vagy speciálisabb a cím, amit keresünk, annál nagyobb a jelentősége annak, hogy milyen a térkép amit használunk.

Térkép, amin keresünk

A legtöbb térkép a települések központi belterületére koncentrál, de mi a helyzet ezeken túl? Fontos, hogy geokódolásra olyan térképi adatbázist használjunk, amelyik "ismeri" a múltat és a jelent. A múlthoz tartozik, hogy követi a megváltozott közterület neveket, a településszerkezeti változásokat (pl.: tömbrehabilitáció, új utca nyitása), a jelenhez pedig, hogy vezeti a területszervezési változásokat, (pl.: új települések létrejötte), az új beépítéseket, beruházásokat.

Mindenki arra törekszik, hogy naprakész legyen a térképe, de mindig van olyan közterület/utca, amelyik hiányzik a térképről. Érdemes olyan térképet választani, amelyet folyamatosan, és ismert időközökben frissítenek. (A Google Maps térképvel pl. az a legnagyobb probléma, hogy nem tudjuk – mert a Google nem adja meg –, hogy mi és mikor frissült a térképén. Az űrfelvétek frissítéséről ugyan kapunk infromációt, de arról is mindig utólag. Hasonló a helyzet a Bing Map esetében is.)

Cím, amit a térképen találunk

A címekben rejlő hibák és a megfelelő térkép szükségességének ismeretében lássunk néhány példát címkeresés eredményére a Bing Map (világtérkép), a Google Maps (világtérkép), illetve a GeoXRaszter (Magyarország térkép) térképeinek felhasználásával, az alábbi "kényes" területekre:

 • lakóparkok,
 • üdülőterületek,
 • ipari területek,
 • külterületi lakott helyek.

1. Dunakeszi, Lehár Ferenc utca, mely a Toldi lakópark egy utcája.

Eredmény a Bing Map térképen (nem tartalmazza a lakóparkot sem)

Eredmény a GoogleMaps térképen (nem tartalmazza a lakóparkot sem)


Eredmény a GeoXRaszter térképen (lakópark teljes úthálózattal)

2. Balassagyarmat, Nyírjes, Tópart utca, mely egy üdülőterületi rész Balassagyarmat külterületén.

Eredmény a Bing Map térképen (csak az úthálózat ismert)

Eredmény a GoogleMaps térképen (csak a bekötőút neve ismert)


Eredmény a GeoXRaszter térképen (valamennyi közterület neve ismert)

3. Székesfehérvár Repkény utca, mely az Alba Ipari park egy utcája.

Eredmény a Bing Map térképen (néhány közterület neve ismert)

Eredmény a GoogleMaps térképen (csak a bekötőút neve ismert)

Eredmény a GeoXRaszter térképen (valamennyi közterület neve ismert)Kinek fontos, hogy az eredmény pontos legyen?

Valószínű mindenkinek! A kérdés csak az, hogy mennyire elégszünk meg a majdnem pontos eredménnyel. A közigazgatás, a szolgáltatás területén jelentősen megkönnyíti a nyilvántartást, ügyintézést, ha az ügyféladatbázis pontos, kiszűrhetők a nem létező, vagy duplikált címek. A geokódolás ebben is segít. Minden olyan felhasználónak, akinek nagy mennyiségű címadata van, szüksége van adatai időszakos ellenőrzésére, rendezésére. A teljesség igénye nélkül néhány példa, ahol a geokódolás a hatékonyságot növelheti:
 • bank / biztosítás (geomarketing, potenciális "hideg" címek keresése)
 • közművek (víz-, gáz, áramszolgáltatás), hulladékkezelés (nyilvántartások, ügyfélszolgálatok támogatás)
 • postai szolgáltatások (geomarkating)
 • távközlés (ügyfelek nyilvántartása, ügyfeészolgálatok, egyedi "helyfüggő" ajánlatok)
 • védelem (ügyfélszolgálat, védett objektumok nyilvántatása)

Módszerek, melyekkel az eredmény javítható

A címek tisztítása a hatékony geokódoláshoz elengedhetetlen folyamat. A címek tisztítására, azaz a megfelelő közterület megtalálására más-más megoldást használnak az egyes térinformatikai szoftverek (ArcGIS Desktop, MapInfo) és a webes – gyakorlatilag a Google Maps API-n alapuló– megoldások.

A térinformatikai szoftverek geokódoló megoldásaira elmondható, hogy angol nyelvi környezetre fejlesztették, így nem támogatják a magyar nyelvet. A Google Maps API viszonylag jól elboldogul az angolon kívül más nyelvekkel is, bár legjobbnak mindig az adott nyelve – esetünkben a magyarra – kifejlesztett alkalmazások bizonyulnak.

A geokódolás során fontos, hogy visszajelzést kapjunk arról, milyen pontosan sikerült az adott címet elhelyezni a térképen. A geokódolás hatékonyságának mérésére valamennyi geokódoló algoritmus alkalmaz mérőszámokat. A mérőszámok/minőségkódok használatának célja, hogy megmutassa a felhasználónak, hogy az összes bemeneti cím közül mennyi került pontosan geokódolásra, illetve a nem pontosan geokódolt címeket hogyan sikerült elhelyezni a térképen. A tipikus osztályok a nem pontosan geokódolt címek esetében:

 • „x” házszám eltéréssel geokódolt cím a referencia-adatbázisban szereplő legnagyobb házszámhoz képest (Pl. a beépítés folytatódott az utcában, de a felmérése még nem történt meg, és nem jelenik meg a térképen.)
 • közterület szinten geokódolt cím, (Pl. a geokódolásra megadott címből hiányzik a házszám vagy használt térképen nincsenek házszámok az adott közterületen)
 • település szinten geokódolt cím, (Ez az eset akkor fordul elő, ha a megadott címben olyan közterület szerepel, ami nem létezik a településen.)
 • nem geokódolható cím esetén még a település sem ismerhető fel a megadott címből.

Nincsenek megjegyzések:

Megjegyzés küldése