Als je onderzoek doet, kun je bijna nooit de hele populatie onderzoeken. In plaats daarvan selecteer je een steekproef. Een geclusterde steekproef trekken is één van de manieren om tot een steekproef te komen. Bij deze steekproefmethode verdeel je de populatie in kleine clusters en trek je vervolgens willekeurig één of meerdere clusters om daarmee de steekproef op te bouwen.
Wat is een geclusterde steekproef?
Een geclusterde steekproef (ook wel “clustersteekproef”) is één van de typen aselecte steekproeven. Het idee is dat je de totale onderzoekspopulatie in clusters verdeelt (bijvoorbeeld regio’s, plaatsen of organisaties) en vervolgens één of enkele clusters trekt om bij die clusters je data te verzamelen.
Wanneer gebruik je een clustersteekproef?
Een geclusterde steekproef is met name passend als je een grote populatie onderzoekt die van nature in clusters te verdelen is. Stel: jij doet onderzoek naar de medewerkers van een organisatie die 25 vestigingen heeft in heel Nederland. Het is qua tijd en kosten niet haalbaar om al die vestigingen te bezoeken en op elke plek onderzoek te doen. Daarom kies je willekeurig vijf vestigingen (clusters in dit geval) om alleen daar je data te verzamelen. De medewerkers van die vestigingen vormen jouw steekproef.
Het voordeel van een geclusterde steekproef is dat je er veel tijd en kosten mee bespaart. Dat geldt al helemaal als je onderzoek doet naar mensen uit een groot gebied (bijvoorbeeld in heel Nederland). Het scheelt je dan veel tijd wanneer je alleen bepaalde vestigingen of groepen in bepaalde regio’s onderzoekt.
Hoe stel je een geclusterde steekproef samen?
Een geclusterde steekproef samenstellen kan op meerdere manieren. Meestal pak je het aan met een geclusterde steekproef van één fase. Dat werkt als volgt:
-
Baken je onderzoekspopulatie af. Maak concreet wie precies tot je onderzoekspopulatie behoren. Onderzoekspopulaties zijn bijvoorbeeld ‘alle medewerkers van Coca-Cola in Nederland’ of ‘alle groep-8-leerlingen in Overijssel’.
-
Bepaal de clusters binnen je steekproef. Stel vervolgens vast in welke clusters je de populatie onderverdeelt. Hiervoor is het belangrijk dat elk lid van de populatie maar binnen één cluster kan passen. Verder moeten de clusters samen de totale populatie vormen (je mag bijvoorbeeld niet een regio of vestiging missen).
-
Kies aselect de clusters die je gaat onderzoeken. Vervolgens kies je (meestal via een enkelvoudige aselecte steekproef) de clusters waarbinnen je onderzoek gaat doen. Door hier aselect (willekeurig) een keuze in te maken, is je onderzoek meer valide. Je krijgt zo een beter beeld van de totale populatie dan als je de clusters handmatig zou kiezen.
-
Doe onderzoek bij de verschillende clusters. Vervolgens ga je met de gekozen onderzoeksmethode (bijvoorbeeld interviews, enquêtes of een experiment) data verzamelen bij elk van de gekozen clusters.
Andere optie: meerfasen-geclusterde steekproef
Hierboven beschreven we een single-stage geclusterde steekproef. Er bestaat ook een geclusterde steekproef die uit meerdere fasen bestaat. Dit betekent dat je niet bij alle mensen uit de clusters data verzamelt, maar bij een deel van de mensen uit het cluster.
Bij een tweefasen-steekproef doe je na het bepalen van de clusters nogmaals een aselecte steekproef binnen de clusters. Daardoor zijn alleen bepaalde individuen uit elk cluster onderdeel van je steekproef. Daarna ga je alleen bij die personen data verzamelen.
Als je ook uit dat cluster nog een keer een steekproef trekt (en dat wellicht vervolgens nog eens en nog eens doet), spreek je van een meerfasen-steekproef. Of dit nodig is, hangt af van de grootte van de clusters. Als elk cluster een vestiging is met 500 mensen in dienst, kan het inderdaad handig zijn om binnen de clusters opnieuw diverse steekproeven te trekken.
Let op: mogelijk lagere validiteit
Houd er rekening mee dat de conclusies die je kunt trekken op basis van een geclusterde steekproef minder sterk zijn dan bij andere aselecte steekproefmethodes. Dit komt doordat elk cluster een populatie op zich is. Het is niet mogelijk dat elk cluster exact dezelfde verdeling van eigenschappen heeft als de hele populatie.
Stel: jij onderzoekt groep-8-leerlingen uit heel Nederland en komt via een clustersteekproef uit bij vijf scholen in Nederland die je onderzoekt. Dan kunnen de regio’s waar deze vijf scholen staan ook bepalend zijn voor de resultaten die je krijgt. Dit kan zorgen voor een lagere validiteit van de onderzoeksresultaten. Dit geldt al helemaal bij een meerfasen-steekproef.
Verder is het belangrijk dat de clusters een goede representatie zijn van de totale populatie. Anders beperkt dat de externe validiteit. Is de validiteit van je onderzoek door bepaalde (steekproef)keuzes wat lager? Geef dat dan, inclusief een toelichting, een plek in je discussiehoofdstuk.
Meer artikelen over onderzoek doen
Voor elk type onderzoek en voor iedere steekproeftrekking is een goede voorbereiding het halve werk. Daarom hebben we in onze kennisbank allerlei artikelen staan die je daarbij op weg helpen.
Lees bijvoorbeeld ook deze artikelen om goed voorbereid met je onderzoek van start te gaan: