Gå til innhold

Data-snooping

I det svenske markedet er det vanlig å bruke en metode som baserer seg på data-snooping.

Den nederlandske geodeten Baarda (1968) utviklet denne formelle statistiske testen for å søke etter grove målefeil.

Sammendrag

I data-snooping tester vi standardiserte residualer (\(W_i\)) for å identifisere potensielle grove målefeil i observasjonene.

Prosess for data-snooping

Data-snooping bør utføres som en iterativ prosess der maksimalt én måling fjernes i hver iterasjon:

  1. Finn alle standardiserte residualer med sigma større enn forkastningsnivå
  2. Fjern observasjonen med den største sigma-verdien
  3. Kjør grovfeilsøk på nytt
  4. Fortsett trinn 1 til 3 til alle statistisk påviste grovfeil er fjernet
  5. Hvis mer enn én observasjon blir fjernet i trinn 1 til 4, start med å ta inn igjen observasjonene én om gangen. Kjør ny analyse og sjekk om den fremdeles blir merket som grovfeil. Hvis så er tilfellet, fjern den fra observasjonsmaterialet.

Hvis de grove feilene ikke er så mange og/eller om de er i forskjellige deler av nettet, fungerer data-snooping ganske bra – spesielt hvis k-tallet er rimelig.

Advarsel

Denne formen for grovfeilsøk er følsom for feil i vekting av observasjoner. Det er kritisk å bruke vekter som reflekterer de faktiske observasjonsfeilene.