Interkwartielafstand

Wat is het en hoe kun je deze berekenen?

De interkwartielafstand is een maat waarmee je de spreiding binnen je resultaten kunt weergeven. Je verdeelt de resultaten hiervoor in vier groepen en berekent dan de mate van spreiding in de middelste twee groepen. Dit geeft je een beeld van de verschillen binnen de gemeten resultaten.

Wat is de interkwartielafstand?

De interkwartielafstand is een spreidingsmaat die de spreiding binnen de middelste helft van alle gemeten data weergeeft. Je verdeelt als het ware alle gemeten data in vier groepen, op volgorde van laag naar hoog. De interkwartielafstand is dan het verschil tussen het hoogst gemeten resultaat in de eerste groep en het laagst gemeten resultaat in de derde groep. Daarmee heb je dus de middelste helft van alle data te pakken.

De interkwartielafstand is één van de mogelijke spreidingsmaten. Dit zijn andere spreidingsmaten die je kunt gebruiken:

  • Bereik (“range”): het verschil tussen de laagst gemeten en de hoogst gemeten waarde (dus de spreiding binnen de totale dataset).
  • Standaarddeviatie: een spreidingsmaat die aangeeft in hoeverre de data om het gemiddelde heen liggen of juist daarvan afwijken.
  • Variantie: de gekwadrateerde standaarddeviatie (het rekenkundig gemiddelde van de gekwadrateerde afwijkingen van het gemiddelde).

Wanneer gebruik je deze spreidingsmaat?

Je gebruikt de interkwartielafstand vaak bij scheve verdelingen van data. De mediaan is voor die datasets een passende centrummaat en de interkwartielafstand is een goede manier om de spreiding te meten.

Daarnaast werkt de interkwartielafstand goed als er sprake is van outliers in je dataset. Dat zijn losse sterk afwijkende waarden in je steekproef. Bij de interkwartielafstand heb je minder last van die extreme waarden, omdat je focust op het middelste deel van de gemeten waarden.

Interkwartielafstand berekenen

Je kunt de interkwartielafstand berekenen met deze formule:

Interkwartielafstand = grenswaarde van Q3 - grenswaarde van Q1

Voor een handmatige berekening van de interkwartielafstand maak je een lijst van alle gemeten waarden, van laag naar hoog. Stel: jij hebt 100 metingen gedaan. Dan is de grenswaarde van Q1 het 26e getal. Dat is namelijk het getal waar 25% van alle data onder ligt. De grenswaarde van Q3 is het 75e getal. Het is namelijk zo dat 25% van de getallen boven die waarde uitkomt.

Twee meetmethodes

Je kunt de interkwartielafstand op twee manieren berekenen: via een exclusieve of inclusieve methode. We lichten beide methodes toe.

Exclusieve meetmethode

Bij deze methode tel je de mediaan niet mee om Q1 en Q3 te bepalen.De mediaan is het middelste getal als je alle gemeten waarden van hoog naar laag ordent.

Deze methode pas je vaak toe als je een even aantal metingen hebt. Er liggen dan twee waarden in het midden. De mediaan is in dit geval het gemiddelde van die twee middelste waarden. Bij de exclusieve meetmethode hoef je die mediaan niet zelf uit te rekenen, omdat je de mediaanwaarde niet meeneemt in je berekening.

Bovendien is deze meetmethode geschikt voor grote steekproeven.

Inclusieve meetmethode

Bij de inclusieve meetmethode tel je de mediaan wel mee bij het bepalen van Q1 en Q3. Deze methode kun je toepassen bij een oneven aantal waarden in je dataset, alhoewel de exclusieve meetmethode in dat geval ook zou passen. Het is dus niet zo dat één van de twee methodes de beste is. Wel wordt de inclusieve meetmethode vaker gebruikt bij kleine steekproeven.

Exclusieve meetmethode toepassen

Bereken je de interkwartielafstand met de exclusieve meetmethode? Dan ga je als volgt te werk:

  1. Zet alle waarden op volgorde van laag naar hoog.
  2. Bepaal wat de mediaan is bij een even aantal waarden. Bij een even aantal waarden valt de mediaan tussen de twee middelste cijfers in. Bij een oneven aantal is de mediaan het exacte middelste getal. Je neemt dit getal in beide gevallen niet mee, maar rekent met alle waarden om de mediaan heen.
  3. Scheid de onderste en bovenste helft van de data. Bij een oneven aantal waarden laat je daarbij het mediaangetal weg in je berekeningen.
  4. Bepaal wat de grenswaarde voor Q1 en die voor Q3 zijn. Je hebt nu een oneven aantal waarden in de twee helften. Daardoor kun je makkelijk het middelste getal van beide helften pakken.
  5. Trek Q1 af van Q3. Nu heb je de interkwartielafstand.

Voorbeeldberekening

  1. Je hebt de volgende waarden gemeten: 34, 36, 37, 39, 40, 43, 45, 46, 47, 48, 50. Dit is een oneven aantal.
  2. De mediaan is het middelste getal. Omdat je 11 getallen hebt gemeten, is het middelste getal het zesde getal. Dat is in dit geval 43.
  3. De onderste helft bestaat uit de getallen 34, 36, 37, 39 en 40. De bovenste helft bestaat uit 45, 46, 47, 48 en 50. Het getal 43 (de mediaan) sluit je uit.
  4. De grenswaarde voor Q1 is de mediaan van de onderste helft. Dat is 37. De grenswaarde voor Q3 is de mediaan van de bovenste helft. Dat is 47.
  5. De interkwartielafstand is 47 - 37 = 10.

Inclusieve meetmethode toepassen

Werk je met de inclusieve meetmethode om de interkwartielafstand te berekenen? Dan neem je de mediaan wel mee in je berekening. De meetmethode is alleen in dat opzicht iets anders dan de exclusieve meetmethode.

Je past de inclusieve meetmethode als volgt toe:

  1. Zet alle waarden op volgorde van laag naar hoog.
  2. Bepaal wat de mediaan (de middelste waarde) is.
  3. Scheid de onderste en bovenste helft van de data. De mediaan hoort bij beide helften.
  4. Bepaal wat de grenswaarde voor Q1 en die voor Q3 zijn. Je krijgt een even aantal waarden in beide helften. Daarom is Q1 het gemiddelde van de middelste twee waarden binnen de eerste helft. Q3 is het gemiddelde van de middelste twee waarden binnen de tweede helft.
  5. Trek Q1 af van Q3. Nu heb je de interkwartielafstand.

Voorbeeldberekening

In de praktijk ziet de berekening er (met dezelfde dataset als in het eerdere voorbeeld) als volgt uit:

  1. Je hebt de volgende waarden gemeten: 34, 36, 37, 39, 40, 43, 45, 46, 47, 48, 50. Dit is een oneven aantal waarden.
  2. De mediaan is het middelste getal, dus 43.
  3. De onderste helft bestaat uit de getallen 34, 36, 37, 39, 40 en 43. De bovenste helft bestaat uit 43, 45, 46, 47, 48 en 50. Je ziet dus dat de mediaan (43) in beide helften is meegenomen.
  4. De grenswaarde voor Q1 is de mediaan van de onderste helft. Dat is het gemiddelde van de middelste twee getallen in de onderste helft (37 en 39), dus 38. De grenswaarde voor Q3 is de mediaan van de bovenste helft. Dat is het gemiddelde van 46 en 47, dus 46,5.
  5. De interkwartielafstand is 46,5 - 38 = 8,5.

Zoals je ziet, levert de inclusieve meetmethode een lagere interkwartielafstand op dan de exclusieve meetmethode.

Meer lezen over statistiek?

Naast heel veel schrijftips voor je scriptie en tips voor onderzoeksmethoden, vind je op AthenaCheck ook handige uitleg over statistiek. Bekijk in onze kennisbank ook de andere artikelen over statistiekonderwerpen. Wie weet helpt het je bij jouw onderzoek.