Statistische analyse voor je scriptie

Alles wat je moet weten!

Een statistische analyse houdt in dat je cijfermatige onderzoeksgegevens analyseert met statistieken. Je rekent bijvoorbeeld gemiddelden en standaarddeviaties uit en analyseert vervolgens of de gemiddelden significant van elkaar afwijken. Statistieken helpen je om op basis van de resultaten tot een antwoord op de onderzoeksvraag te komen. Hoe voer je een statistische analyse goed uit? Welke vormen van statistische analyses zijn er? Waar moet je op letten? Lees er hieronder alles over.

Wanneer gebruik je een statistische analyse?

Je kunt een statische analyse gebruiken wanneer je kwantitatieve data (cijfermatige data) verzamelt. Met statistiek kun je bijvoorbeeld bepalen…

  • …in hoeverre de resultaten verschillen tussen twee groepen;

  • …of er een mogelijk verband bestaat tussen twee variabelen;

  • …of variabele X een positieve of negatieve impact heeft op variabele Y;

  • …of het mogelijk is om de gevonden resultaten te generaliseren naar de hele populatie.

Nulhypothese en alternatieve hypothese

Voor een statistische analyse stel je vooraf twee typen hypothesen op, waarin je het mogelijke antwoord op de onderzoeksvraag en deelvragen formuleert. Hierin geef je aan welk verband of welke relatie je verwacht tussen de variabelen. 

Voor elke voorspelling heb je twee hypothesen:

  1. De nulhypothese is de voorspelling dat er geen verband bestaat tussen variabelen.

  2. De alternatieve hypothese is de voorspelling dat er tussen de variabelen een correlatie of causaal verband is.

Met de statistische analyse ga je bepalen welke van die hypotheses je aanneemt en welke je moet verwerpen.

Om een voorbeeld te geven, zijn dit twee hypotheses voor een mogelijk onderzoeksproject:

  1. Nulhypothese: De koffie-inname van studenten heeft geen invloed op hun fietssnelheid één uur na het drinken van de koffie.

  2. Alternatieve hypothese: Er is een negatief verband tussen de koffie-inname van studenten en hun fietssnelheid één uur na het drinken van de koffie. Hoe meer koffie een student heeft gedronken, hoe minder kilometer per uur de student één uur na de koffie-inname fietst.

Hoe bepaal je welke statistische analyse je gebruikt?

Er zijn allerlei statistische analyses. Denk aan ANOVA en Cronbach’s alpha. In veel statistiekhandboeken staan de verschillende soorten analyses uitgelegd. Hier lees je ook terug wanneer je welke analyse kunt gebruiken.

De statistische analyse die je kiest, hangt van allerlei zaken af. Het is belangrijk om al voordat je start met je scriptie te bepalen wat voor type data je verzamelt en welke statistische analyse je gaat gebruiken. 

Voor je keuze uit de diverse soorten statistische analyses is onder andere het volgende belangrijk:

  • Naar welke variabelen doe je onderzoek en op welk meetniveau ga je die variabelen meten? 

  • Hoe ga je deze variabelen operationaliseren (dus meetbaar maken)?

  • Welke manier van dataverzameling ga je gebruiken?

  • Welke steekproefmethode ga je gebruiken? Kies je voor een selecte steekproef of een aselecte steekproef?

  • Welke steekproefgrootte heb je nodig? (Dit kun je uitrekenen aan de hand van het betrouwbaarheidsniveau.)

Statistiek en meetniveaus

Het type statistische analyse dat je gebruikt, hangt onder andere af van het meetniveau waarop je de variabelen meet. 

Je doet bij statistische analyses bijna altijd onderzoek naar een verband tussen twee variabelen: een onafhankelijke variabele en een afhankelijke variabele. De onafhankelijke variabele heeft (mogelijk) impact op de afhankelijke variabele. 

Stel: je doet onderzoek naar de impact van de koffie-inname van studenten in de ochtend op hun fietssnelheid. Dan is de koffie-inname in de ochtend de onafhankelijke variabele. De fietssnelheid is de onafhankelijke variabele.

Iedere variabele ga je operationaliseren. Dat betekent dat je de variabelen meetbaar maakt. 

Je kunt ‘koffie-inname van studenten’ bijvoorbeeld meten door een steekproef een enquête te laten invullen over het aantal koppen koffie dat zij ‘s ochtends hebben gedronken. De fietssnelheid meet je door studenten in een experimentele setting 5 minuten te laten fietsen op een hometrainer en te bepalen hoeveel meter zij in die 5 minuten hebben afgelegd.

Voor iedere variabele kies je een bepaald meetniveau. De verschillende meetniveaus zijn:

  • nominale variabele (de data vallen in categorieën die niet te ordenen zijn, zoals gender);

  • ordinale variabele (de data vallen in categorieën die je wel kunt ordenen, bijvoorbeeld leeftijdscategorieën);

  • intervalvariabele (de data zijn te ordenen en er zit steeds een gelijk interval tussen, zoals bij de leeftijdscategorieën 35-45 en 45-55 jaar);

  • ratiovariabele: de data hebben gelijke intervallen, een duidelijke orde en een nulpunt, bijvoorbeeld leeftijd of het aantal jaar werkervaring). 

Bij ratiovariabelen kun je meer typen statistische analyses gebruiken dan bij intervalvariabelen; bij ordinale en nominale variabelen is het aantal statistische analyses nog iets beperkter.

Statistische analyse voor de steekproefgrootte

Meestal is het niet mogelijk om data te verzamelen bij de totale populatie. Dan trek je een steekproef. Dit betekent dat je een selectie maakt uit de populatie en alleen bij die selectie data verzamelt. Je kunt daarbij kiezen voor een aselecte steekproef (ieder lid van de populatie heeft evenveel kans om geselecteerd te worden) of voor een selecte steekproef (sommige populatieleden hebben meer kans om uitgekozen te worden). Voor de betrouwbaarheid is een aselecte steekproef beter. 

Ook om de benodigde steekproefgrootte te bepalen, gebruik je statistische berekeningen. Hierbij kijk je onder andere naar het gewenste betrouwbaarheidsniveau. Voor deze berekening bestaan handige online calculators. Zo kun je met deze steekproefcalculator de minimale steekproefgrootte berekenen door enkel een paar gegevens in te voeren. 

Statistische analyse met beschrijvende statistiek

Beschrijvende statistieken komen in bijna elke statistische analyse voor. Hiermee beschrijf je de gevonden resultaten met centrummaten en spreidingsmaten. Met centrummaten geef je het gemiddelde, de middelste waarde of de vaakst voorkomende waarde in de dataset aan. Met spreidingsmaten laat je zien hoe de data om die centrummaat heen zijn verspreid.

Voor beschrijvende statistiek gebruik je één van deze drie centrummaten:

  1. Gemiddelde: de uitkomst als je alle gevonden waarden bij elkaar optelt en dat totaalcijfer deelt door het aantal waarden.

  2. Modus: de waarde die het meest voorkomt in je dataset.

  3. Mediaan: de waarde die precies in het midden van je dataset ligt als je alle gevonden waarden ordent van klein naar groot. 

Daarnaast maak je gebruik van een spreidingsmaat. In ons artikel over spreidingsmaten lees je welke spreidingsmaat wanneer het best passend is. De verschillende spreidingsmaten zijn:

  1. Standaarddeviatie: de gemiddelde afstand van iedere waarde tot de gemiddelde waarde in de dataset.

  2. Bereik: het verschil tussen de hoogste en de laagste waarde.

  3. Interkwartielafstand: het verschil tussen de hoogste en laagste waarde van de 50% die in het midden ligt als je alle gemeten data van laag naar hoog ordent.

  4. Variantie: de gekwadrateerde standaarddeviatie. 

Statische analyse met toetsstatistiek

Naast beschrijvende statistiek bestaat er ook toetsstatistiek. Daarmee toets je de nulhypothese en de alternatieve hypothese. Dat betekent dat je toetst of de resultaten al dan niet wijzen op een correlatie of een causaal verband. 

Er zijn allerlei soorten toetsstatistieken. Denk aan regressietesten, vergelijkingstoetsen en correlatietoetsen. Voorbeelden hiervan zijn Cronbach’s Alpha en ANOVA. Raadpleeg je statistiekboek om te bepalen welke toetsende statistiek jij het beste kunt gebruiken. 

Overigens kan SPSS de statistische analyse voor je uitvoeren als jij alle data in dit programma invoert. Je hoeft er dus niet zelf een rekenmachine bij te pakken.

Hoe rapporteer je over de statistische analyse?

De uitkomsten van de statistische analyse krijgen een plek in het resultatenhoofdstuk van je scriptie. Hierin beschrijf je bijvoorbeeld de gemiddelden en ook de uitkomsten van de statistische toetsen. Houd er rekening mee dat elk type statistiek een eigen manier van rapporteren heeft. Het is heel belangrijk om die rapportage-aanwijzingen nauwkeurig op te volgen. Bekijk je statistiekboek om te ontdekken wat de juiste rapportage-methode is. Soms krijgt beschrijvende statistiek ook een plek in het methodehoofdstuk. Dat geldt bijvoorbeeld voor de beschrijving van de gemiddelde leeftijden van de populatie. 

Meer lezen over statistische analyses?

In de kennisbank vind je nog veel meer artikelen die jou helpen bij het uitvoeren van je scriptie-onderzoek en bij het schrijven van je scriptie. Lees bijvoorbeeld ook onze artikelen over de volgende onderwerpen: