Data-snooping¶
I den svenska marknaden är det vanligt att använda en metod som baserar sig på data-snooping.
Den nederländske geodeten Baarda (1968) utvecklade denna formella statistiska test för att söka efter grovmätfel.
Definition
I data-snooping testar vi standardiserade residualer (\(W_i\)) för att identifiera potentiella grovmätfel i observationerna.
Process för data-snooping¶
Data-snooping bör utföras som en iterativ process där maximalt en mätning tas bort i varje iteration:
- Hitta alla standardiserade residualer med sigma större än förkastningsnivå
- Ta bort observationen med den största sigma-värdet
- Kör grovfelsökning på nytt
- Fortsätt steg 1 till 3 tills alla statistiskt påvisade grovfel är borttagna
- Om mer än en observation blir borttagen i steg 1 till 4, börja med att ta in observationerna en i taget igen. Kör ny analys och kontrollera om den fortfarande blir markerad som grovfel. Om så är fallet, ta bort den från observationsmaterialet.
Om grovfelen inte är så många och/eller om de är i olika delar av nätet fungerar data-snooping ganska bra – särskilt om k-talet är rimligt.
Viktning är kritisk
Denna form av grovfelsökning är känslig för fel i viktning av observationer. Det är kritiskt att använda vikter som reflekterar de faktiska observationsfelen.
Metodens tillämpbarhet
Data-snooping är särskilt effektivt när grovfel är få och spridda i nätet, förutsatt att kontrollerbarheten (k-tal) är tillräcklig.