statistiekmodule

<Bol AlgemeenBol Algemeen

We hebben 90 gasten en geen leden online

Werken met gegroepeerde data of klassen


[Terug naar overzicht hoofdstuk]
      [Oefening]


 

Klassen, klassenbreedte en klassenmidden

Soms beschikken we bij het bepalen van statistische gegevens over teveel verschillende waarnemingsgetallen. Indien men bijvoorbeeld aan 100 mensen naar de lichaamslengte vraagt, zal men vermoedelijk te veel verschillende lengten krijgen waardoor het geheel vrij breed en onoverzichtelijk wordt. Daarom worden de waarnemingsgetallen hier best opgedeeld in klassen. Indien de kleinst voorkomende lengte 160 cm is en de grootste 203 cm, kunnen we volgende indeling maken: [160,165[ , [165,170[ , [170,175[ .... [200,205[. Een persoon die 168 cm meet, zal dus ingedeeld worden in de klasse [165,170[

Het kleinste getal in de intervalnotatie wordt de ondergrens genoemd, het grootste getal de bovengrens. Belangrijk om weten is dat de ondergrens steeds de klasse behoort, maar de bovengrens niet! Een persoon die 175 cm meet, zal dus ondergebracht worden in de klasse [175,180[ en niet in [170,175[ ! Het verschil tussen boven-en ondergrens wordt de klassenbreedte genoemd. Het getal pal tussen de onder-en bovengrens van een klasse noemen we het klassenmidden. Zo is 177,5 het klassenmidden van de klasse [175,180[.

Bij gegroepeerde data is de absolute frequentie steeds gelijk aan het aantal data binnen een klasse.

 > Gemiddelde en mediaan bij een reeks gegroepeerde data

  • Het gemiddelde van een reeks gegroepeerde data wordt op dezelfde manier berekend als het gemiddelde bij een reeks gewone gegevens die niet zijn opgedeeld in klassen. Alleen rekenen we nu niet met de waarnemingsgetallen zelf, maar wel met de klassenmiddens! We maken de som van de producten van deze middens en de bijhorende frequenties en delen vervolgens door de omvang van de steekproef. Door te werken met klassenmiddens zal het gemiddelde niet exact berekend worden, maar zal het toch een goed beeld geven!
  • Om de mediaan van een reeks gegroepeerde data te zoeken, bepalen we de klasse waarvan de somfrequentie juist boven de helft ligt van de omvang van de steekproef! Deze klasse wordt ook wel de mediale klasse genoemd. Het klassenmidden van deze klasse is een verantwoorde benadering van de mediaan!

Voorbeeld:

Tijdens de zomervakantie (die 62 dagen telt) houdt een persoon bij hoeveel keer per dag hij push-ups doet. Om het geheel overzichtelijk maken werken we met klassen met een klassenbreedte van 10. Dagen waarop de persoon bijvoorbeeld 28 push-ups doet, vallen dus in de klasse [20,30[

Werken met klassen in statistiek

Om het gemiddelde te bepalen, tellen we alle producten van de klassenmiddens met de absolute frequenties op en delen deze som vervolgens door het aantal data.

Gemiddelde bij een reeks gegroepeerde data

De omvang van deze steekproef is 62. De helft hiervan is gelijk aan 31. Dit betekent dat in de kolom van de absolute somfrequenties moeten kijken naar het eerst getal dat groter is dan 31. We stellen vast dat dit de klasse [30,40[ is. De absolute somfrequentie (36) is daar immers voor de eerste keer groter dan 31.