Wko

Hur beräkna extremvärden

En avvikare är en datapunkt som är signifikant numeriskt från de andra datapunkter i ett prov. Termen används i statistiska undersökningar, och kan peka på avvikelser i datamängden studerat eller fel i mätningarna. Att veta hur man beräknar extremvärden är viktigt för att säkerställa en riktig förståelse av uppgifterna, och kommer att leda till mer exakta slutsatser från studien. Det är en ganska enkel process för beräkning av extremvärden i en given uppsättning av observationer.

Steg

Hur beräkna extremvärden. Lär dig att känna igen en potentiell avvikare.
Hur beräkna extremvärden. Lär dig att känna igen en potentiell avvikare.
  1. 1
    Lär dig att känna igen en potentiell avvikare. Innan beräkna huruvida en datapunkt representerar en avvikare, är det lämpligt att undersöka datamängden och plocka ut eventuella extremvärden. Till exempel anser en datamängd som representerar temperaturerna 12 olika objekt i ett rum. Om 11 av objekten har temperaturerna inom några graders 70 grader Fahrenheit (21 grader Celsius), men den tolfte objektet (kanske en ugn) har en temperatur på 300 grader Fahrenheit (150 grader Celsius), kan en snabb undersökning berätta att ugnen är en trolig outlier.
  2. 2
    Ordna datapunkterna från lägsta till högsta. Fortsätter med exemplet ovan, överväga följande data som representerar temperaturer på flera objekt: {71, 70, 73, 70, 70, 69, 70, 72, 71, 300, 71, 69}. Denna uppsättning ska sorteras enligt följande: {69, 69, 70, 70, 70, 70, 71, 71, 71, 72, 73, 300}.
  3. 3
    Beräkna medianen av datamängden. Medianen är data punkt ovanför vilken hälften av uppgifterna sitter och under vilken hälften av uppgifterna sitter. Om datamängden innehåller ett jämnt antal observationer, då de 2 mittersta termer bör utjämnas. I exemplet ovan, de 2 mittersta villkoren är 70 och 71, så medianen är ((70 + 71) / 2), eller 70,5.
  4. 4
    Beräkna den lägre kvartilen. Denna punkt, som kallas Q1, är datapunkt under vilken 25 procent av observationerna sitta. I exemplet ovan, kommer 2 termer som medelvärdet igen-denna gång, 70 och 70. Deras genomsnittliga är ((70 + 70) / 2), eller 70.
  5. 5
    Beräkna den övre kvartilen. Denna punkt, som kallas Q3, är data punkt ovanför vilken 25 procent av uppgifterna sitter. Fortsätter med exemplet ovan, i genomsnitt de 2 punkterna 71 och 72 ger en Q2 på 71,5.
  6. 6
    Hitta de "inre staket" för datamängden. Det första steget är att multiplicera skillnaden mellan Q1 och Q3 (som kallas det interkvartila intervallet) med 1,5. I exemplet ovan är det interkvartila intervallet (71,5-70), eller 1,5. Multipliceras med 1,5 ger 2.25. Lägg denna siffra till Q3 och subtrahera det från Q1 för att konstruera de inre stängsel. De inre staket i detta exempel skulle vara 67.75 och 73.75.
    • Alla datapunkter som ligger utanför detta intervall anses milda extremvärden. I de uppgifter som i detta exempel, bara temperaturen i ugnen - 300 grader - anses vara en mild avvikare.
  7. 7
    Hitta de "yttre staket" för datamängden. Detta görs på samma sätt som de inre staket, utom det interkvartila intervallet multipliceras med tre i stället för 1,5. Multiplicera interkvartila intervallet ovan av 3 avkastning (1,5 * 3), eller 4.5. De yttre stängsel är alltså 65,5 och 76.
    • Alla datapunkter som ligger utanför de yttre staket anses extrema outliers. I detta exempel är ugnstemperaturen, 300 grader, också anses vara en extrem extremvärde.

Tips

  • När extremvärden hittas, försök att förklara sin närvaro innan du slänger dem från datamängden, de kan peka på mätfel eller avvikelser i fördelningen.

Saker du behöver

  • Kalkylatorn