Gå till innehållet

Data-snooping

I den svenska marknaden är det vanligt att använda en metod som baserar sig på data-snooping.

Den nederländske geodeten Baarda (1968) utvecklade denna formella statistiska test för att söka efter grovmätfel.

Definition

I data-snooping testar vi standardiserade residualer (\(W_i\)) för att identifiera potentiella grovmätfel i observationerna.

Process för data-snooping

Data-snooping bör utföras som en iterativ process där maximalt en mätning tas bort i varje iteration:

  1. Hitta alla standardiserade residualer med sigma större än förkastningsnivå
  2. Ta bort observationen med den största sigma-värdet
  3. Kör grovfelsökning på nytt
  4. Fortsätt steg 1 till 3 tills alla statistiskt påvisade grovfel är borttagna
  5. Om mer än en observation blir borttagen i steg 1 till 4, börja med att ta in observationerna en i taget igen. Kör ny analys och kontrollera om den fortfarande blir markerad som grovfel. Om så är fallet, ta bort den från observationsmaterialet.

Om grovfelen inte är så många och/eller om de är i olika delar av nätet fungerar data-snooping ganska bra – särskilt om k-talet är rimligt.

Viktning är kritisk

Denna form av grovfelsökning är känslig för fel i viktning av observationer. Det är kritiskt att använda vikter som reflekterar de faktiska observationsfelen.

Metodens tillämpbarhet

Data-snooping är särskilt effektivt när grovfel är få och spridda i nätet, förutsatt att kontrollerbarheten (k-tal) är tillräcklig.