Spreidingsmaten

Uitleg over standaarddeviatie, bereik, variantie en interkwartielafstand

Spreidingsmaten geven samen met centrummaten een goede beschrijving van je onderzoeksdata. Je gebruikt spreidingsmaten specifiek om aan te geven in hoeverre datapunten van elkaar en van de centrummaat af liggen. De meest gebruikte spreidingsmaten zijn standaarddeviatie, bereik, variantie en interkwartielafstand. In dit artikel geven we je een korte uitleg over elk van die spreidingsmaten. Ook lees je hier wanneer je welke spreidingsmaat het beste kunt gebruiken.

Wat zijn spreidingsmaten?

Spreidingsmaten zijn maten die je in de statistiek gebruikt om weer te geven hoe ver data uit elkaar liggen en welke mate van spreiding er is om de centrummaat heen (zoals het gemiddelde of de mediaan). Spreidingsmaten gebruik je voor beschrijvende statistiek. Je geeft ermee aan in hoeverre er variatie is binnen de verzamelde data.

 

Waarom zijn spreidingsmaten belangrijk?

Spreidingsmaten zijn belangrijk voor het interpreteren van de data. Als er veel spreiding of variatie is binnen de data, zegt dat iets over de generaliseerbaarheid van je gegevens. Wanneer de metingen ver uit elkaar liggen, is er minder consistentie in de data. Het is dan lastiger om voorspellingen over de hele populatie te doen. De betrouwbaarheid is dan lager.

Daarom wil je het liefst zo min mogelijk spreiding in de data hebben. In dat geval geven de data van je steekproef waarschijnlijk een beter beeld van je populatie. 

Naast spreidingsmaten kijk je ook altijd naar centrummaten, zoals het gemiddelde. Zo gebruik je binnen de statistiek vaak het gemiddelde en de standaarddeviatie in combinatie met elkaar. Daarbij zegt de centrummaat iets over wat de meest voorkomende waarde is binnen de steekproef of welke waarde het absolute gemiddelde is van alle gemeten waarden.

 

Welke spreidingsmaten zijn er?

De meest gebruikte spreidingsmaten zijn standaarddeviatie, bereik, variantie en interkwartielafstand. Hieronder volgt een korte uitleg over elk van die spreidingsmaten.

  1. Standaarddeviatie. Dit is de gemiddelde afwijking van de data ten opzichte van het gemiddelde. Het wordt ook wel standaardafwijking genoemd. Je berekent hiermee hoe ver iedere gemeten waarde gemiddeld verwijderd is van het absolute gemiddelde. Deze waarde kun je in Excel en SPSS automatisch berekenen. Lees in je statistiekhandboek hoe je dit precies aanpakt.

  2. Bereik (“range”). Dit is het verschil tussen de hoogst en de laagst gemeten waarde binnen alle data. Hiervoor trek je de laagst gemeten waarde van de hoogst gemeten waarde af.

  3. Variantie. Dit is het rekenkundig gemiddelde als je kijkt naar de gekwadrateerde afwijkingen ten opzichte van het gemiddelde. De variantie bereken je door de standaarddeviatie in het kwadraat te nemen. 

  4. Interkwartielafstand. De interkwartielafstand geeft het verschil binnen de data weer tussen het eerste en derde kwartiel. Je krijgt hiermee dus inzicht in de middelste 50% van de data, als je alle gemeten waarden op volgorde van hoog naar laag zet. Deze afstand bereken je door te bepalen wat de laatste waarde voor kwartiel 1 en de eerste waarde voor kwartiel 3 zijn. Vervolgens trek je de waarde voor kwartiel 1 af van de waarde voor kwartiel 3.  

Meer informatie over elk van deze spreidingsmaten vind je in de gelinkte artikelen. Daar kun je ook diverse rekenvoorbeelden vinden.

Welke spreidingsmaat kun je het beste gebruiken?

Welke spreidingsmaat je het beste kunt gebruiken, hangt af van het gekozen meetniveau. Voor ordinale variabelen gebruik je bijvoorbeeld een andere spreidingsmaat dan voor intervalvariabelen en ratiovariabelen. Op elk van die typen data gaan we in het artikel over meetniveaus dieper in. Daarnaast speelt een rol hoe de data verdeeld zijn. 

Houd de volgende richtlijnen aan:

  • Bij ordinale data kun je alleen de spreidingsmaten bereik en interkwartielafstand gebruiken. 

  • Bij intervaldata of ratiodata kun je daarnaast kiezen voor de standaarddeviatie of variantie.

  • Bij normale verdelingen kun je elk van de spreidingsmaten toepassen. 

  • Bij scheve verdelingen of als er heel afwijkende waarden zijn gemeten, kun je het beste kiezen voor de interkwartielafstand. Die maat wordt namelijk minder beïnvloed door een paar sterk afwijkende waarden.

Meer lezen over onderzoek?

In de kennisbank van AthenaCheck vind je allerlei artikelen over het schrijven van je scriptie én over het opzetten van je onderzoek. Zo vertellen we je ook meer over verschillende soorten variabelen, meetniveaus en onderzoeksmethoden. Ook geven we je tips om een goed onderzoeksplan te maken en om je methodehoofdstuk te schrijven. Veel succes met jouw onderzoek!