Hvordan tolke geokodingsresultater

Geokoding er et verdifullt verktøy som lar deg geokode en rekke adresser eller interessepunkter satsvis. Selv om selve geokodingsprosessen gjøres automatisk må det manuell kvalitetssikring til for å forstå resultatet av geokodingen. Blant annet bør du vite hva resultatattributtene betyr for å kunne si noe om treffsikkerheten til resultatet.

Når du geokoder en rekke adresser eller interessepunkter får du mye informasjon sammen med resultatet. Det er tre variabler som er verdt å legge merke til:

  • Match status: Matched, Tied eller Unmatched
  • Score: Hvilken score fikk hvert enkelt treff?
  • Loc_name: Hvilken lokator ble brukt for å finne resultatet

Match Status

Det er tre statuser et geokodingstreff kan få:

Det beste er å få «matched» som resultattreff, men det kan også være tilfeller hvor «tied» er like gode treff. Eksempler på søk som kan føre til «tied» resultater hvor «tied» er like godt som «matched»:

  • Søk på kun poststed: Det er mange postsoner med samme poststed (men med forskjellige postnummer). Da vil det bli vilkårlig hvilken postsone med tilsvarende poststed som velges.
  • Søk på kun vegnavn/adresser: Uten noen filtrering vil det kunne finnes samme vegnavn/adresser rundt om i landet, og som da kan gi «tied» resultater.
  • Søk på en adresse uten husbokstav, hvor det kun finnes adresser med husbokstav: Mangelen på husbokstav gir like stor trekk i score uavhengig av om den manglende bokstaven er a, b eller c. Treffet vil bli «tied» fordi det er det samme hvilken husbokstav som da velges av lokatoren.

Både «tied» og «matched» resultater har fått et resultattreff. Det du dermed vil unngå er «unmatched» adresser, da disse har ikke ført til noe resultattreff.

Score

Score sier noe om hvor nøyaktig resultatet er i forhold til søket, og er gitt som et tall mellom 0 og 100. Det som typisk fører til trekk i score er:

  • Skrivefeil
  • Feil postnummer eller poststed
  • Manglende, feil eller overflødig husbokstav

Et søk som får 100 i score er derfor tolket til å være korrekt skrevet.

Hver av de medvirkende del-lokatorene som den Norske lokatoren er bygd opp av har også egne regler for hva som er minste tillate score. For adresselokatoren for eksempel er minste tillatte score satt til 85. Derfor vil et søk som får treff med 86 i score få «match» på dette resultatet, men treff med score på for eksempel 83 vil ikke kunne få «match».

Det som er viktig å merke seg med score er også at score er gitt ut i fra søket som gjøres, og er derfor sterkt knyttet opp til neste punkt: «Loc_name».

Lokatoren består av flere del-lokatorer som er satt sammen i et hierarki. Dersom du søker på en adresse med gatenavn, postnummer og posted, men hvor gatenavnet er feil vil ikke adresselokatoren finne et treff for dette søket. En av fallback-lokatorene er en postsonelokator, som vil gjøre et nytt søk med kun postnummer og poststed-inputene. Postsonelokatoren vil kunne finne et treff med postnummeret og poststedet, og søket kan få 100 i score dersom begge inputene er riktig skrevet.

Loc_name

«Loc_name» er en variabel som sier hvilken del-lokator som er ført til resultattreffet. De forskjellige lokatorene og hierarkiet som de er satt sammen i er vist i figuren under:

Atributtene som er listet opp under hver av del-lokatorene i figuren representerer hvilke inputfelter hver av del-lokatorene bruker til å utføre søk med lokatoren. Hvis du for eksempel ser på adresselokatoren kan vi se at den aldri vil bruke input fra stedsnavn-feltet får å gjøre geokodingssøk mot adresser.

Dersom du kun er interessert i geokodingsresultater på adressenivå bør du derfor først filtrere ut resultatene som har «Loc_name» = Adresse, og deretter kan en videre se på score blant disse treffene.

Tips: Det kan også være lurt å gjøre deg kjent med rematch-dialogen i ArcMap når du geokoder. Der kan en enkelt gjøre korrigeringer i søkene og matche nye treff. Det er ofte mye skrivefeil i søkene som gjør at noen søk ikke får treff, og disse kan enkelt ryddes opp i ved bruk av denne dialogen.