Lean Six Sigma

Home

Lean Six Sigma

Statistische concepten en hulpmiddelen: statistische generalisatie (inductieve statistiek)

Gepubliceerd in Lean Six Sigma

mrt

2018

steekproef populatie omvang sample size

In onderzoek verstaan we onder een populatie de verzameling van alle mogelijke onderzoekseenheden en hun kenmerken. Het doel van veel onderzoek is om een uitspraak te doen over alle eenheden uit de populatie. Meestal is de populatie zo groot dat niet alle eenheden uit de populatie kunnen worden onderzocht. Daarom baseren we ons doorgaans op steekproeven uit de populatie. De bedoeling is om op basis van de gegevens uit zo'n steekproef statistisch verantwoorde uitspraken te doen over de totale populatie. Op basis van een onderzoek naar een klein deel van de populatie zeggen we dan in feite iets over de gehele populatie. Dit noemen we statistische generalisatie, statistische inferntie of statistische inductie. De statistiek waarin de overgang van 'steekproeven' naar 'populaties wordt bestudeerd heet daarom 'inductieve statistiek'.

Inductieve statistiek

Bij het toepassen van inductieve statistiek wordt wel gebruik gemaakt van een steekproef. Om allerlei redenen kan het namelijk ongewenst of onmogelijk zijn de hele populatie te onderzoeken. In plaats daarvan wordt een deel van de populatie onderzocht met behulp van een steekproef. Aan de hand van de steekproef wordt dan geprobeerd informatie te verzamelen en valide uitspraken te doen over de gehele populatie. Hoe representatief een steekproef echter ook is, er blijft altijd een mate van onzekerheid dat de steekproef niet geheel het gedrag van de populatie beschrijft. wil men die onzekerheid volledig uitsluiten, dan zal de gehele populatie moeten worden gemeten, met alle gevolgen van dien. Denki n dit geval aan de tijd, moeite en geld die het kost om een volledige populatie te meten.

De inductieve statistiek geeft geschikte methoden om met een goed gekozen steekproef betrouwbare uitspraken te kunnen doen over de gehele onderliggende populatie.

(...)

Een populatie is een verzameling elementen waarop een onderzoek betrekking heeft. Een populatie kan uit een eindig, maar ook uit een oneindig aantal elementen bestaan. ... De hoofdletter N wordt meestal gebruikt om het aantal waarnemingen in een populatie aan te duiden.

Een steekproef is een al dan niet op basis van vastgestelde criteria aantal trekkingen uit de gehele populatie en beoogt beschrijvend te zijn voor het gedrag van de gehele populatie. De kleine letter n wordt meestal gebruikt om de steekproefgrootte aan te duiden.

Een steekproef moet dus een goede weergave zijn van de totale populatie, willen we waarde kunnen toekennen aan de conclusies die we trekken op basis van een steekproef. We zijn immers sec gesproken niet geïnteresseerd in de uitkomsten van de steekproef, we zijn aan de hand van de uitkomsten van de steekproef geïnteresseerd in het gedrag van de gehele populatie! Uiteindelijk is de steekproef niets meer of minder dan een praktisch middel om de gehele populatie te kunnen snappen. Specifiek in het kader van een Lean Six Sigma verbeterproject zijn we aan de hand van een steekproef geïnteresseerd om een uitspraak te kunnen doen over de reikwijdte en omvang van het business probleem Y.

Zie ook:

Statistische concepten en hulpmiddelen: steekproef

Bron:

Toegepaste statistiek - beschrijvende technieken, A.A.J. van Peet, G.L.H. van den Wittenboer & J.J. Hox
Theorieboek Lean Six Sigma - upgrade to Blackbelt, Marco A.M. Koet (MKPC)

Tags:

Laatst aangepast op zaterdag, 21 april 2018 08:45

Statistische concepten en hulpmiddelen: lijngrafiek

Gepubliceerd in Lean Six Sigma

mrt

2018

Ben je geïnteresseerd in trends van een kenmerk, dan is een lijngrafiek een goede keus. Een lijngrafiek wordt gebruikt als de variabele minimaal op intervalniveau ligt. Het aantal categorieën is onbeperkt: meestal zijn het er bij trends vee, zoals aantallen of leeftijden. Ook ontwikkelingen in de tijd kunnen met behulp van lijngrafieken worden weergegeven. Tijd is dan een extra variabele.

Bron:

Wat is onderzoek? Praktijkboek methoden en technieken voor het hoger onderwijs, Nel Verhoeven

Tags:

Laatst aangepast op maandag, 02 april 2018 09:14

Statistische concepten en hulpmiddelen: boxdiagram

Gepubliceerd in Lean Six Sigma

mrt

2018

Bij variabelen vanaf een ordinaal meetniveau kan voor het zichtbaar maken van de verdeling gebruik gemaakt worden van een boxdiagram. Uitgangspunt daarbij is de mediaan, ofwel de middelste waarneming. Deze mediaan is door middel van een dikke streep in de verdeling zichtbaar gemaakt, het geeft de 50 procent middelste waarnemingen weer. Daaromheen is een 'boxje' aan beide kanten 25 procent van de waarnemingen geplaatst. (...) Uit de box steekt aan weerskanten een steel uit met een dwarsstuk. Deze dwarsstukken geven het begin en het einde (zeg maar de overige 50 procent) van de verdeling aan. Een boxdiagram wordt vanwege de vorm ook wel 'repensteel' (een reep met twee stelen) of 'snorrendoos' genoemd. Zijn er uitschieters, dan worden deze oor middel van een punt zichtbaar gemaakt in deze grafiek. Een boxdiagram is dus een geschikte figuur als je zowel de middelste 50 procent als de uitschieters wilt weergeven.

Bron:

Wat is onderzoek? Praktijkboek methoden en technieken voor het hoger onderwijs, Nel Verhoeven

Tags:

Laatst aangepast op woensdag, 28 maart 2018 06:32

Statistische concepten en hulpmiddelen: gemiddelde

Gepubliceerd in Lean Six Sigma

mrt

2018

statistische hulpmiddelen concepten lean six sigma

Het gemiddelde wordt verkregen door alle scores bij elkaar op te tellen (de som dus) en vervolgens te delen door het aantal waarnemingen. Het wordt ook wel het rekenkundig gemiddelde genoemd. ... Een gemiddelde kan worden berekend voor variabelen vanaf een interval- of rationiveau. Waarom is dat? Een gemiddelde geeft pas informatie als je met de kenmerken ook daadwerkelijk kunt rekenen. Je kunt bijvoorbeeld zeggen dat de gemiddelde leeftijd van de mens tegenwoordig 85 jaar is. Maar je kunt niet zeggen dat de gemiddelde burgerlijke staat 'gehuwd' is. Er bestaat geen gemiddelde burgerlijke staat!

Bron:

Wat is onderzoek? Praktijkboek methoden en technieken voor het hoger onderwijs, Nel Verhoeven

Tags:

Laatst aangepast op woensdag, 28 maart 2018 20:35

Statistische concepten en hulpmiddelen: modus

Gepubliceerd in Lean Six Sigma

mrt

2018

statistische hulpmiddelen concepten lean six sigma

De modus is die categorie van een kenmerk die het meeste voorkomt. De modus kan worden toegepast bij variabelen vanaf een nominaal meetniveau; alle variabelen dus. ... Soms telt een verdeling niet één modus, maar twee. ... Deze verdeling wordt ook wel bimodaal genoemd, omdat ze twee toppen heeft.

De modus is de waarneming met de grootste frequentie. Deze centrummaat is vooral belangrijke bij kwalitatieve waarnemingen.

Bron:

Laatst aangepast op woensdag, 11 april 2018 07:39

Statistische concepten en hulpmiddelen: centrummaten

Gepubliceerd in Lean Six Sigma

mrt

2018

statistische hulpmiddelen concepten lean six sigma

Modus
Mediaan
Gemiddelde

Centrummaten duiden de plaats aan waar het centrum van een frequentieverdeling ligt. Zij geven aan rond welke locatie op de x-as de scores gegroepeerd liggen, daarom heten centrummaten ook wel locatiematen.

(...)

Centrummaten worden bij variabelen op intervalniveau of hoger uitgedrukt in een getal dat zo goed mogelijk het 'centrum' van de verdeling van de behaalde scores aanduidt; bij kwalitatieve variabelen worden daar nominale of ordinale categorieën voor gebruikt. Merk op dat het dus niet gaat over het centrum van alle mogelijke waarden op een variabele (bij variabelen op intervalniveau en hoger het middelpunt van de meetschaal dus), maar over het centrum van de daadwerkelijk geobserveerde waarden (of scores) zoals die in de datamatrix, of de daarop gebaseerde frequentieverdeling, terecht zijn gekomen.

Bron:

Laatst aangepast op donderdag, 29 maart 2018 05:31

Statistische concepten en hulpmiddelen: spreidingsmaten

Gepubliceerd in Lean Six Sigma

mrt

2018

statistische hulpmiddelen concepten lean six sigma

Variatiebreedte
Interkwartielafstand
Gemiddelde afwijking
Variantie
Standaardafwijking

Centrummaten geven het centrum aan waaromheen de scores op een variabele gegroepeerd liggen. Als we zo'n maat kennen, weten we slechts gedeeltelijk hoe de verdeling van de scores er uitziet. Wat we nog missen is een maat voor de variabiliteit. Het maakt een groot verschil of de scores dicht bij elkaar liggen (weinig variatie vertonen) of juist niet. Liggen de scores allemaal dicht bij elkaar rond het centrum, dan is de spreiding over de schaal klein. Liggen ze allemaal ver uit elkaar, en liggen ze dus ver van het centrum af, dan is de spreiding groot.

Spreidingsmaten geven aan hoever scores van het centrum afliggen. Ze geven daarmee tevens een indicatie voor de grootte van de verschillen tussen de scores: de al eerder genoemde variabiliteit.

Soms geeft een centrummaat te weinig informatie. Zo levert het gemiddelde aantal dagen ziekteverzuim niet voldoende informatie op over de spreiding van het ziekteverzuim. Een organisatie wil bijvoorbeeld weten tussen welke uitersten het ziekteverzuim zich bevindt, wat het minimum aantal ziektedagen is en wat het maximum, en hoe vaak beide voorkomen. Voor deze situaties is een spreidingsmaat beter geschikt, omdat dit antwoord geeft op de vraag hoe de waarnemingen ten opzichte van elkaar, met andere woorden hoe de scores in de variabele zijn verdeeld.

De eenvoudigste manier om met behulp van één getal de spreiding van een kenmerk weer te geven, is het aangeven van de variatiebreedte. Dat is simpelweg het verschil tussen het minimum- en de maximumscore. (...)

Een andere spreidingsmaat is de interkwartielafstand, de spreiding van waarnemingen als je de buitenste 25 procent aan twee kanten van de verdeling weglaat. (...)

Als je werkt met variabelen vanaf een interval-, en rationiveau, continue variabelen dus, dan kun je als spreidingsmaat de variantie gebruiken, o de afgeleide daarvan, de standaardafwijking.

Wat is de variantie? Dat is niet simpel te zeggen: de gemiddelde gekwadrateerde afwijking van het gemiddelde. Vergeet dat maar weer snel! Eigenlijk geef je met deze maat aan hoe de waarnemingen rondom het gemiddelde verspreid liggen.

Bron:

Laatst aangepast op donderdag, 29 maart 2018 16:22

Statistische concepten en hulpmiddelen: betrouwbaarheidsinterval

Gepubliceerd in Lean Six Sigma

mrt

2018

statistische hulpmiddelen concepten lean six sigma

Betrouwbaarheidsniveau

Het betrouwbaarheidsniveau is de mate waarin je onzekerheid over de juistheid van de uitkomsten toelaat. En betrouwbaarheidsniveau van 100% bij het nemen van een steekproef is onmogelijk, omdat het toeval altijd een bepaalde rol speelt. Wil je toch 100% zeker zijn van de uitspraken die je doet, dan rest slechts één mogelijkheid, namelijk de gehele populatie meten!

Een betrouwbaarheidsniveau van 95% is het meest gangbaar, met als alternatieven een betrouwbaarheid van 90% of 99%. Een betrouwbaarheid van 95% betekent dat je in 95 van de 100 gevallen met de gevonden steekproef een correcte uitspraak doet over de populatie. Je accepteert dan dus ook dat je in 5 van de 100 gevallen een foute uitspraak doet. ....

Een hoger percentage qua betrouwbaarheidsniveau zorgt ervoor dat de steekproefomvang groter moet zijn. Je wilt immers zekerder zijn van je zaak en om een scherp onderscheid te kunnen maken tussen bijvoorbeeld 'waar' of 'onwaar' heb je een grotere groep waarnemingen nodig!

95 betrouwbaarheidsinterval (of intervalschatting)

Een 95 betrouwbaarheidsinterval is een percentage waarmee je aangeeft hoeveel kans er is dat de gemeten variabele tussen bepaalde waarden ligt. Concreter: ik kan bijvoorbeeld met 95% zekerheid (betrouwbaarheidsinterval) zeggen dat het gemiddelde van spaargeld tussen de €1500 en €2500 ligt.

Waarom een betrouwbaarheidsinterval?

Een betrouwbaarheidsinterval wordt gebruikt om conclusies vanuit een steekproef te generaliseren naar de populatie. Alhoewel je geprobeerd hebt om zo’n representatieve steekproef als mogelijk te nemen, kan het natuurlijk altijd iets afwijken.

Daarom wordt er een slag om de arm gehouden: 95 betrouwbaarheidsinterval wil dan ook zeggen dat als het experiment vaak genoeg herhaalt wordt, in 95% van de gevallen de waardeen ook tussen X en Y liggen. Het gemiddelde vanuit de steekproef, laten we het Y noemen, ligt tussen X en Z in.

Tevens betekent dit dat er ook een foutmarge wordt gemeld: de alfa. Bij een 95 betrouwbaarheidsinterval is dit 5% (100% – 95% = 5%). Dat betekent dus dat er 5% kans is dat het in de populatie niet tussen X en Z ligt.

Bron: 95 betrouwbaarheidsinterval (of intervalschatting)

Laatst aangepast op zaterdag, 07 april 2018 07:04

Statistische concepten en hulpmiddelen: steekproef

Gepubliceerd in Lean Six Sigma

feb

2018

steekproef populatie omvang sample size

Bij het doen van onderzoek is het zelden mogelijk om alle elementen waarin men geïnteresseerd is (de populatie) te onderzoeken. ... Men onderzoekt dan een steekproef van elementen uit die populatie; dit is een kleinere groep uit het grote geheel. Wil men met enig vertrouwen op basis van die steekproef uitspraken over een populatie doen, dan moet de steekproef representatief en willekeurig getrokken zijn.

Bij een aselecte steekproef (random sample) heeft ieder element van de populatie een even grote kans om in de steekproef te worden opgenomen. Een aselecte steekproef wordt ook wel een willekeurige steekproef genoemd. ...

Een steekproef waarbij ieder reeds getrokken element bij iedere volgende trekking opnieuw in aanmerking komt getrokken te worden, heet een steekproef met teruglegging. ...

Uitspraken over populaties zijn altijd kansuitspraken; je weet het nooit helemaal zeker, jui s t omdat je niet de hele populatie, maar slechts een steekproef onderzocht hebt.

Om waarde toe te kennen aan de uitkomsten van een steekproef en daarmee valide statische conclusies te kunnen trekken over de gehele populatie, moet een steekproef aan een aantal algemene eisen voldoen, namelijk dat de steekproef representatief, onafhankelijk en unbiased zijn.

Representatief: de steekproef moet representatief zijn voor de gehele populatie.
Onafhankelijk: de keus voor het ene element mag geen invloed hebben op de ander.
Unbiased: elk element moet even grote kans hebben in de steekproef te komen.

Steekproefmethoden

Steekproeven kunnen op verschillende manieren worden genomen. Zo bestaat er een onderscheid tussen selecte en aselecte steekproeven, met elk weer zo hun eigen varianten.

Aselecte steekproef: elk element heeft evenveel kans om aan de steekproef deel te nemen. De steekproef komt tot stand door een volstrekt willekeurige loting, zonder criteria op basis waarvan wordt geselecteerd.
Selecte steekproef: het is aan de steekproefafnemer of een bepaald element wel of niet deel kan zijn van een steekproef. Zoals de naam al aangeeft is er een bepaald criterium dat selecteert.

Aselecte steekproeven

(1) Enkelvoudige steekproef

Uit een gegevensbestand (de populatie) worden willekeurige elementen getrokken om deel te zijn van de steekproef. Elke element uit de populatie heeft dus gelijke kans om geselecteerd te worden. (...) Wanneer je een steekproef wilt zonder teruglegging, kan elk element slechts één keer geselecteerd worden. Neem je een steekproef met terugleggen, dan bestaat er een kans dat een willekeurig element vaker geselecteerd wordt.

(2) Systematische steekproef

Bij een systematische steekproef gebruik je een regel om een steekproef samen te stellen. Uit een kaartenbak wordt bijvoorbeeld elke keer de achtste kaart getrokken. ... Of je selecteer alle personen van wie de voornaam begint met een 'K'.

(3) Cluster steekproef

Bij een clustersteekproef wordt een bepaald cluster (homogene subgroep) geselecteerd uit alle elementen van de gehele populatie. ...

(4) Gestratificeerde steekproef

Bij een gestratificeerde steekproef deel je een groep in deelpopulaties op basis van een specifiek kenmerk. Denk hierbij aan een groep bewoners uit een bepaalde deelgemeente die je weer verder opdeelt. Je kunt die groep bijvoorbeeld weer onderverdelen in alle mannen boven en onder de 55 in die deelgemeente. Bij een gestratificeerde steekproef wordt de populatie, op basis van een specifiek kenmerk (de strata), opgedeeld in verschillende deelpopulaties.

(...)

Selecte steekproeven

(1) Zelfselectie

Bij zelfselectie mogen de deelnemers zelf bepalen of zij onderdelen willen zijn van een steekproef. ...

(2) Quatasteekproef

Bij een quotasteekproef is een maximum aantal deelnemers of elementen afgesproken die deel uitmaken van de steekproef. ...

(3) Doelgerichte steekproef

Bij een doelgerichte steekproef worden specifieke deelnemers gezocht, die voldoen aan bepaalde kenmerken. Gezocht wordt dan naar typische gevallen die passen in de doelgroep waarop het onderzoek zich richt.

De steekproefgrootte

Willen we dus goede, betrouwbare uitspraken kunnen doen over een gehele populatie, aan de hand van een steekproef, dan moet die steekproef aan een aantal voorwaarden voldoen. Eerder hebben we dat een representatieve steekproef genoemd. Maar wat maakt een steekproef dan representatief? Om dat te kunnen beoordelen spelen zowel kwalitatieve als kwantitatieve aspecten een rol.

Een kwalitatief aspect is bijvoorbeeld dat de steekproef in zijn samenstelling een goede weergave moet zijn van de gehele populatie. ... De representativiteit van de steekproef wordt echter niet alleen bepaald door kwalitatieve aspecten, maar ook door de omvang. Een steekproef telt pas echt mee op het moment dat het de juiste omvang heeft! We zeggen dan dat de minimale steekproefgrootte van voldoende omvang moet zijn om significante uitspraken te kunnen doen. We zullen dus moeten vaststellen wat die minimale steekproefgrootte moet zijn!

De omvang van een steekproef, de steekproefgrootte is afhankelijk van een drietal zaken:

Het type data, dat onderzocht wordt.
Het betrouwbaarheidsniveau.
De foutenmarge.
De geschatte mate van spreiding in de data.
De omvang van de populatie.

Bron:

Statistiek in woorden, Anke Slotboom
Theorieboek Lean Six Sigma - upgrade to Blackbelt, Marco A.M. Koet (MKPC)

Laatst aangepast op zondag, 15 april 2018 11:44

Statistische concepten en hulpmiddelen: populatie

Gepubliceerd in Lean Six Sigma

feb

2018

steekproef populatie omvang sample size

Populatie

Een populatie is het geheel van elementen met een gemeenschappelijke waarneembare eigenschap waarin men geïnteresseerd is. De conclusies van het statistische onderzoek hebben hierop betrekking. Bij ieder onderzoek moet de populatie omschreven worden. Die omschrijving is zodanig dat van ieder object ondubbelzinnig kan worden vastgesteld of het een element is van de populatie.

(...)

Een populatie kan bestaan uit personen of dingen, maar ook uit gebeurtenissen: alle huwelijken die in 1984 in Nederland gesloten zijn; de ongelukken die het afgelopen jaar in Nederland plaatsvonden. ...

Aan de elementen van een populatie kunnen waarnemingen worden verricht. Het waarnemen bestaat uit het vaststellen of meten van een eigenschap van die elementen. ...

Bij het doen van onderzoek is men geïnteresseerd in de eigenschappen van (de elementen van) een populatie. Daarom worden die eigenschappen zelf, wel aangeduid als 'de populatie'. Men spreekt dan bijvoorbeeld over de populatie van IQ-scores, of de populatie van misdaadcijfers van grote steden.

Een bijzondere populatie, vormen de uitslagen van een kansexperiment. Bij het gooien van een munt zijn de mogelijke uitslagen kruis of munt. Iedere worp met de munt kunnen we beschouwen als één element van de populatie. De (oneindige!) populatie bestaat dan uit alle mogelijke worpen met die munt. In de kansrekening wordt dit meestal aangeduid met de term universum of ook wel: de uitslagenruimte van het kansexperiment.

Bron:

Statistiek in woorden, Anke Slotboom

Laatst aangepast op vrijdag, 30 maart 2018 06:06

Meer artikelen...

«
Start
Vorige
31
32
33
34
35
36
37
38
39
40
Volgende
Einde
»

JPAGE_CURRENT_OF_TOTAL

Categorieën

Citaten

Boeken over....

Archief

Lean boeken top 5

Recente berichten

Meest gelezen

Lean boekentips