• Vergroot lettergrootte
  • Standaard lettergrootte
  • Verklein lettergrootte
Home Lean Six Sigma
Lean Six Sigma
Statistische concepten en hulpmiddelen: statistische generalisatie (inductieve statistiek)
Gepubliceerd in Lean Six Sigma
E-mail Afdrukken

steekproef populatie omvang sample size

statistische generalisatie steekproef populatie

In onderzoek verstaan we onder een populatie de verzameling van alle mogelijke onderzoekseenheden en hun kenmerken. Het doel van veel onderzoek is om een uitspraak te doen over alle eenheden uit de populatie. Meestal is de populatie zo groot dat niet alle eenheden uit de populatie kunnen worden onderzocht. Daarom baseren we ons doorgaans op steekproeven uit de populatie. De bedoeling is om op basis van de gegevens uit zo'n steekproef statistisch verantwoorde uitspraken te doen over de totale populatie. Op basis van een onderzoek naar een klein deel van de populatie zeggen we dan in feite iets over de gehele populatie. Dit noemen we statistische generalisatie, statistische inferntie of statistische inductie. De statistiek waarin de overgang van 'steekproeven' naar 'populaties wordt bestudeerd heet daarom 'inductieve statistiek'.

statistische generalisatie steekproef populatie

Inductieve statistiek

Bij het toepassen van inductieve statistiek wordt wel gebruik gemaakt van een steekproef. Om allerlei redenen kan het namelijk ongewenst of onmogelijk zijn de hele populatie te onderzoeken. In plaats daarvan wordt een deel van de populatie onderzocht met behulp van een steekproef. Aan de hand van de steekproef wordt dan geprobeerd informatie te verzamelen en valide uitspraken te doen over de gehele populatie. Hoe representatief een steekproef echter ook is, er blijft altijd een mate van onzekerheid dat de steekproef niet geheel het gedrag van de populatie beschrijft. wil men die onzekerheid volledig uitsluiten, dan zal de gehele populatie moeten worden gemeten, met alle gevolgen van dien. Denki n dit geval aan de tijd, moeite en geld die het kost om een volledige populatie te meten.

De inductieve statistiek geeft geschikte methoden om met een goed gekozen steekproef betrouwbare uitspraken te kunnen doen over de gehele onderliggende populatie.

(...)

Een populatie is een verzameling elementen waarop een onderzoek betrekking heeft. Een populatie kan uit een eindig, maar ook uit een oneindig aantal elementen bestaan. ... De hoofdletter N wordt meestal gebruikt om het aantal waarnemingen in een populatie aan te duiden.

Een steekproef is een al dan niet op basis van vastgestelde criteria aantal trekkingen uit de gehele populatie en beoogt beschrijvend te zijn voor het gedrag van de gehele populatie. De kleine letter n wordt meestal gebruikt om de steekproefgrootte aan te duiden.

Een steekproef moet dus een goede weergave zijn van de totale populatie, willen we waarde kunnen toekennen aan de conclusies die we trekken op basis van een steekproef. We zijn immers sec gesproken niet geïnteresseerd in de uitkomsten van de steekproef, we zijn aan de hand van de uitkomsten van de steekproef geïnteresseerd in het gedrag van de gehele populatie! Uiteindelijk is de steekproef niets meer of minder dan een praktisch middel om de gehele populatie te kunnen snappen. Specifiek in het kader van een Lean Six Sigma verbeterproject zijn we aan de hand van een steekproef geïnteresseerd om een uitspraak te kunnen doen over de reikwijdte en omvang van het business probleem Y.

Zie ook:

Bron:

 

Laatst aangepast op zaterdag, 21 april 2018 08:45  
Statistische concepten en hulpmiddelen: lijngrafiek
Gepubliceerd in Lean Six Sigma
E-mail Afdrukken

statistiek lijngrafiek lean six sigma

histogram statistiek lean six sigma

Ben je geïnteresseerd in trends van een kenmerk, dan is een lijngrafiek een goede keus. Een lijngrafiek wordt gebruikt als de variabele minimaal op intervalniveau ligt. Het aantal categorieën is onbeperkt: meestal zijn het er bij trends vee, zoals aantallen of leeftijden. Ook ontwikkelingen in de tijd kunnen met behulp van lijngrafieken worden weergegeven. Tijd is dan een extra variabele.

 

Bron:

 

Laatst aangepast op maandag, 02 april 2018 09:14  
Statistische concepten en hulpmiddelen: boxdiagram
Gepubliceerd in Lean Six Sigma
E-mail Afdrukken

boxdiagram box plot six sigma statistiek

histogram statistiek lean six sigma

Bij variabelen vanaf een ordinaal meetniveau kan voor het zichtbaar maken van de verdeling gebruik gemaakt worden van een boxdiagram. Uitgangspunt daarbij is de mediaan, ofwel de middelste waarneming. Deze mediaan is door middel van een dikke streep in de verdeling zichtbaar gemaakt, het geeft de 50 procent middelste waarnemingen weer. Daaromheen is een 'boxje' aan beide kanten 25 procent van de waarnemingen geplaatst. (...) Uit de box steekt aan weerskanten een steel uit met een dwarsstuk. Deze dwarsstukken geven het begin en het einde (zeg maar de overige 50 procent) van de verdeling aan. Een boxdiagram wordt vanwege de vorm ook wel 'repensteel' (een reep met twee stelen) of 'snorrendoos' genoemd. Zijn er uitschieters, dan worden deze oor middel van een punt zichtbaar gemaakt in deze grafiek. Een boxdiagram is dus een geschikte figuur als je zowel de middelste 50 procent als de uitschieters wilt weergeven.

Bron:

 

Laatst aangepast op woensdag, 28 maart 2018 06:32  
Statistische concepten en hulpmiddelen: gemiddelde
Gepubliceerd in Lean Six Sigma
E-mail Afdrukken

statistische hulpmiddelen concepten lean six sigma

 

statistische hulpmiddelen concepten lean six sigma

Het gemiddelde wordt verkregen door alle scores bij elkaar op te tellen (de som dus) en vervolgens te delen door het aantal waarnemingen. Het wordt ook wel het rekenkundig gemiddelde genoemd. ... Een gemiddelde kan worden berekend voor variabelen vanaf een interval- of rationiveau. Waarom is dat? Een gemiddelde geeft pas informatie als je met de kenmerken ook daadwerkelijk kunt rekenen. Je kunt bijvoorbeeld zeggen dat de gemiddelde leeftijd van de mens tegenwoordig 85 jaar is. Maar je kunt niet zeggen dat de gemiddelde burgerlijke staat 'gehuwd' is. Er bestaat geen gemiddelde burgerlijke staat!

Bron:

Laatst aangepast op woensdag, 28 maart 2018 20:35  
Statistische concepten en hulpmiddelen: modus
Gepubliceerd in Lean Six Sigma
E-mail Afdrukken

statistische hulpmiddelen concepten lean six sigma

 

statistische hulpmiddelen concepten lean six sigma

De modus is die categorie van een kenmerk die het meeste voorkomt. De modus kan worden toegepast bij variabelen vanaf een nominaal meetniveau; alle variabelen dus. ... Soms telt een verdeling niet één modus, maar twee. ... Deze verdeling wordt ook wel bimodaal genoemd, omdat ze twee toppen heeft.

statistische hulpmiddelen concepten lean six sigma

De modus is de waarneming met de grootste frequentie. Deze centrummaat is vooral belangrijke bij kwalitatieve waarnemingen.

Bron:

Laatst aangepast op woensdag, 11 april 2018 07:39  
Statistische concepten en hulpmiddelen: centrummaten
Gepubliceerd in Lean Six Sigma
E-mail Afdrukken

statistische hulpmiddelen concepten lean six sigma

 

  • Modus
  • Mediaan
  • Gemiddelde

statistische hulpmiddelen concepten lean six sigma

Centrummaten duiden de plaats aan waar het centrum van een frequentieverdeling ligt. Zij geven aan rond welke locatie op de x-as de scores gegroepeerd liggen, daarom heten centrummaten ook wel locatiematen.

(...)

Centrummaten worden bij variabelen op intervalniveau of hoger uitgedrukt in een getal dat zo goed mogelijk het 'centrum' van de verdeling van de behaalde scores aanduidt; bij kwalitatieve variabelen worden daar nominale of ordinale categorieën voor gebruikt. Merk op dat het dus niet gaat over het centrum van alle mogelijke waarden op een variabele (bij variabelen op intervalniveau en hoger het middelpunt van de meetschaal dus), maar over het centrum van de daadwerkelijk geobserveerde waarden (of scores) zoals die in de datamatrix, of de daarop gebaseerde frequentieverdeling, terecht zijn gekomen.

Bron:

Laatst aangepast op donderdag, 29 maart 2018 05:31  
Statistische concepten en hulpmiddelen: spreidingsmaten
Gepubliceerd in Lean Six Sigma
E-mail Afdrukken

statistische hulpmiddelen concepten lean six sigma

  • Variatiebreedte
  • Interkwartielafstand
  • Gemiddelde afwijking
  • Variantie
  • Standaardafwijking

statistiek spreidingsmaat

Centrummaten geven het centrum aan waaromheen de scores op een variabele gegroepeerd liggen. Als we zo'n maat kennen, weten we slechts gedeeltelijk hoe de verdeling van de scores er uitziet. Wat we nog missen is een maat voor de variabiliteit. Het maakt een groot verschil of de scores dicht bij elkaar liggen (weinig variatie vertonen) of juist niet. Liggen de scores allemaal dicht bij elkaar rond het centrum, dan is de spreiding over de schaal klein. Liggen ze allemaal ver uit elkaar, en liggen ze dus ver van het centrum af, dan is de spreiding groot.

Spreidingsmaten geven aan hoever scores van het centrum afliggen. Ze geven daarmee tevens een indicatie voor de grootte van de verschillen tussen de scores: de al eerder genoemde variabiliteit.

statistiek spreidingsmaat

Soms geeft een centrummaat te weinig informatie. Zo levert het gemiddelde aantal dagen ziekteverzuim niet voldoende informatie op over de spreiding van het ziekteverzuim. Een organisatie wil bijvoorbeeld weten tussen welke uitersten het ziekteverzuim zich bevindt, wat het minimum aantal ziektedagen is en wat het maximum, en hoe vaak beide voorkomen. Voor deze situaties is een spreidingsmaat beter geschikt, omdat dit antwoord geeft op de vraag hoe de waarnemingen ten opzichte van elkaar, met andere woorden hoe de scores in de variabele zijn verdeeld.

De eenvoudigste manier om met behulp van één getal de spreiding van een kenmerk weer te geven, is het aangeven van de variatiebreedte. Dat is simpelweg het verschil tussen het minimum- en de maximumscore. (...)

Een andere spreidingsmaat is de interkwartielafstand, de spreiding van waarnemingen als je de buitenste 25 procent aan twee kanten van de verdeling weglaat. (...)

Als je werkt met variabelen vanaf een interval-, en rationiveau, continue variabelen dus, dan kun je als spreidingsmaat de variantie gebruiken, o de afgeleide daarvan, de standaardafwijking.

Wat is de variantie? Dat is niet simpel te zeggen: de gemiddelde gekwadrateerde afwijking van het gemiddelde. Vergeet dat maar weer snel! Eigenlijk geef je met deze maat aan hoe de waarnemingen rondom het gemiddelde verspreid liggen.

Bron:

Laatst aangepast op donderdag, 29 maart 2018 16:22  
Statistische concepten en hulpmiddelen: betrouwbaarheidsinterval
Gepubliceerd in Lean Six Sigma
E-mail Afdrukken

statistische hulpmiddelen concepten lean six sigma

 

betrouwbaarheidsinterval kansberekening intervalschatting

Betrouwbaarheidsniveau

Het betrouwbaarheidsniveau is de mate waarin je onzekerheid over de juistheid van de uitkomsten toelaat. En betrouwbaarheidsniveau van 100% bij het nemen van een steekproef is onmogelijk, omdat het toeval altijd een bepaalde rol speelt. Wil je toch 100% zeker zijn van de uitspraken die je doet, dan rest slechts één mogelijkheid, namelijk de gehele populatie meten!

Een betrouwbaarheidsniveau van 95% is het meest gangbaar, met als alternatieven een betrouwbaarheid van 90% of 99%. Een betrouwbaarheid van 95% betekent dat je in 95 van de 100 gevallen met de gevonden steekproef een correcte uitspraak doet over de populatie. Je accepteert dan dus ook dat je in 5 van de 100 gevallen een foute uitspraak doet. ....

Een hoger percentage qua betrouwbaarheidsniveau zorgt ervoor dat     de steekproefomvang groter moet zijn. Je wilt immers zekerder zijn van je zaak en om een scherp onderscheid te kunnen maken tussen bijvoorbeeld 'waar' of 'onwaar' heb je een grotere groep waarnemingen nodig!

 

betrouwbaarheidsinterval kansberekening intervalschatting

95 betrouwbaarheidsinterval (of intervalschatting)

Een 95 betrouwbaarheidsinterval is een percentage waarmee je aangeeft hoeveel kans er is dat de gemeten variabele tussen bepaalde waarden ligt. Concreter: ik kan bijvoorbeeld met 95% zekerheid (betrouwbaarheidsinterval) zeggen dat het gemiddelde van spaargeld tussen de €1500 en €2500 ligt.

Waarom een betrouwbaarheidsinterval?

Een betrouwbaarheidsinterval wordt gebruikt om conclusies vanuit een steekproef te generaliseren naar de populatie. Alhoewel je geprobeerd hebt om zo’n representatieve steekproef als mogelijk te nemen, kan het natuurlijk altijd iets afwijken.

Daarom wordt er een slag om de arm gehouden: 95 betrouwbaarheidsinterval wil dan ook zeggen dat als het experiment vaak genoeg herhaalt wordt, in 95% van de gevallen de waardeen ook tussen X en Y liggen. Het gemiddelde vanuit de steekproef, laten we het Y noemen, ligt tussen X en Z in.

Tevens betekent dit dat er ook een foutmarge wordt gemeld: de alfa. Bij een 95 betrouwbaarheidsinterval is dit 5% (100% – 95% = 5%). Dat betekent dus dat er 5% kans is dat het in de populatie niet tussen X en Z ligt.

Bron: 95 betrouwbaarheidsinterval (of intervalschatting)

Laatst aangepast op zaterdag, 07 april 2018 07:04  
Statistische concepten en hulpmiddelen: steekproef
Gepubliceerd in Lean Six Sigma
E-mail Afdrukken

steekproef populatie omvang sample size

 

 

steekproef steekproeven populatie statistiek

Bij het doen van onderzoek is het zelden mogelijk om alle elementen waarin men geïnteresseerd is (de populatie) te onderzoeken. ... Men onderzoekt dan een steekproef van elementen uit die populatie; dit is een kleinere groep uit het grote geheel. Wil men met enig vertrouwen op basis van die steekproef uitspraken over een populatie doen, dan moet de steekproef representatief en willekeurig getrokken zijn.

Bij een aselecte steekproef (random sample) heeft ieder element van de populatie een even grote kans om in de steekproef te worden opgenomen. Een aselecte steekproef wordt ook wel een willekeurige steekproef genoemd. ...

Een steekproef waarbij ieder reeds getrokken element bij iedere volgende trekking opnieuw in aanmerking komt getrokken te worden, heet een steekproef met teruglegging. ...

Uitspraken over populaties zijn altijd kansuitspraken; je weet het nooit helemaal zeker, jui s t omdat je niet de hele populatie, maar slechts een steekproef onderzocht hebt.

 

steekproef steekproeven populatie statistiek

Om waarde toe te kennen aan de uitkomsten van een steekproef en daarmee valide statische conclusies te kunnen trekken over de gehele populatie, moet een steekproef aan een aantal algemene eisen voldoen, namelijk dat de steekproef representatief, onafhankelijk en unbiased zijn.

  1. Representatief: de steekproef moet representatief zijn voor de gehele populatie.

  2. Onafhankelijk: de keus voor het ene element mag geen invloed hebben op de ander.

  3. Unbiased: elk element moet even grote kans hebben in de steekproef te komen.

Steekproefmethoden

Steekproeven kunnen op verschillende manieren worden genomen. Zo bestaat er een onderscheid tussen selecte en aselecte steekproeven, met elk weer zo hun eigen varianten.

 

  1. Aselecte steekproef: elk element heeft evenveel kans om aan de steekproef deel te nemen. De steekproef komt tot stand door een volstrekt willekeurige loting, zonder criteria op basis waarvan wordt geselecteerd.

  2. Selecte steekproef: het is aan de steekproefafnemer of een bepaald element wel of niet deel kan zijn van een steekproef. Zoals de naam al aangeeft is er een bepaald criterium dat selecteert.

 

Aselecte steekproeven

(1) Enkelvoudige steekproef

Uit een gegevensbestand (de populatie) worden willekeurige elementen getrokken om deel te zijn van de steekproef. Elke element uit de populatie heeft dus gelijke kans om geselecteerd te worden. (...) Wanneer je een steekproef wilt zonder teruglegging, kan elk element slechts één keer geselecteerd worden. Neem je een steekproef met terugleggen, dan bestaat er een kans dat een willekeurig element vaker geselecteerd wordt.

(2) Systematische steekproef

Bij een systematische steekproef gebruik je een regel om een steekproef samen te stellen. Uit een kaartenbak wordt bijvoorbeeld elke keer de achtste kaart getrokken. ... Of je selecteer alle personen van wie de voornaam begint met een 'K'.

(3) Cluster steekproef

Bij een clustersteekproef wordt een bepaald cluster (homogene subgroep) geselecteerd uit alle elementen van de gehele populatie. ...

(4) Gestratificeerde steekproef

Bij een gestratificeerde steekproef deel je een groep in deelpopulaties op basis van een specifiek kenmerk. Denk hierbij aan een groep bewoners uit een bepaalde deelgemeente die je weer verder opdeelt. Je kunt die groep bijvoorbeeld weer onderverdelen in alle mannen boven en onder de 55 in die deelgemeente. Bij een gestratificeerde steekproef wordt de populatie, op basis van een specifiek kenmerk (de strata), opgedeeld in verschillende deelpopulaties.

(...)

Selecte steekproeven

(1) Zelfselectie

Bij zelfselectie mogen de deelnemers zelf bepalen of zij onderdelen willen zijn van een steekproef. ...

(2) Quatasteekproef

Bij een quotasteekproef is een maximum aantal deelnemers of elementen afgesproken die deel uitmaken van de steekproef. ...

(3) Doelgerichte steekproef

Bij een doelgerichte steekproef worden specifieke deelnemers gezocht, die voldoen aan bepaalde kenmerken. Gezocht wordt dan naar typische gevallen die passen in de doelgroep waarop het onderzoek zich richt.

 

De steekproefgrootte

Willen we dus goede, betrouwbare uitspraken kunnen doen over een gehele populatie, aan de hand van een steekproef, dan moet die steekproef aan een aantal voorwaarden voldoen. Eerder hebben we dat een representatieve steekproef genoemd. Maar wat maakt een steekproef dan representatief? Om dat te kunnen beoordelen spelen zowel kwalitatieve als kwantitatieve aspecten een rol.

Een kwalitatief aspect is bijvoorbeeld dat de steekproef in zijn samenstelling een goede weergave moet zijn van de gehele populatie. ... De representativiteit van de steekproef wordt echter niet alleen bepaald door kwalitatieve aspecten, maar ook door de omvang. Een steekproef telt pas echt mee op het moment dat het de juiste omvang heeft! We zeggen dan dat de minimale steekproefgrootte van voldoende omvang moet zijn om significante uitspraken te kunnen doen. We zullen dus moeten vaststellen wat die minimale steekproefgrootte moet zijn!

De omvang van een steekproef, de steekproefgrootte is afhankelijk van een drietal zaken:

  1. Het type data, dat onderzocht wordt.

  2. Het betrouwbaarheidsniveau.

  3. De foutenmarge.

  4. De geschatte mate van spreiding in de data.

  5. De omvang van de populatie.

 

Bron:

Laatst aangepast op zondag, 15 april 2018 11:44  
Statistische concepten en hulpmiddelen: populatie
Gepubliceerd in Lean Six Sigma
E-mail Afdrukken

steekproef populatie omvang sample size

 

 

steekproef steekproeven populatie statistiek

Populatie

Een populatie is het geheel van elementen met een gemeenschappelijke waarneembare eigenschap waarin men geïnteresseerd is. De conclusies van het statistische onderzoek hebben hierop betrekking. Bij ieder onderzoek moet de populatie omschreven worden. Die omschrijving is zodanig dat van ieder object ondubbelzinnig kan worden vastgesteld of het een element is van de populatie.

(...)

Een populatie kan bestaan uit personen of dingen, maar ook uit gebeurtenissen: alle huwelijken die in 1984 in Nederland gesloten zijn; de ongelukken die het afgelopen jaar in Nederland plaatsvonden. ...

Aan de elementen van een populatie kunnen waarnemingen worden verricht. Het waarnemen bestaat uit het vaststellen of meten van een eigenschap van die elementen. ...

Bij het doen van onderzoek is men geïnteresseerd in de eigenschappen van (de elementen van) een populatie. Daarom worden die eigenschappen zelf, wel aangeduid als 'de populatie'. Men spreekt dan bijvoorbeeld over de populatie van IQ-scores, of de populatie van misdaadcijfers van grote steden.

Een bijzondere populatie, vormen de uitslagen van een kansexperiment. Bij het gooien van een munt zijn de mogelijke uitslagen kruis of munt. Iedere worp met de munt kunnen we beschouwen als één element van de populatie. De (oneindige!) populatie bestaat dan uit alle mogelijke worpen met die munt. In de kansrekening wordt dit meestal aangeduid met de term universum of ook wel: de uitslagenruimte van het kansexperiment.

Bron:

Laatst aangepast op vrijdag, 30 maart 2018 06:06  
Meer artikelen...


JPAGE_CURRENT_OF_TOTAL

It is not enough to do your best; you must know what to do, and then do your best.

William Edwards Deming

Banner

Archief

Lean boeken top 5

(maart 2016)
Banner
Banner
Banner
Banner
Banner

We hebben 76 gasten online
Artikelen

nothing so useless as doing efficiently that which should not be done at all peter drucker

Banner
Banner

social learning sociale media wilfred rubens

Social learning en leren met sociale media
Marcel de Leeuwe, Wilfred Rubens

Bij Bol.com | Managementboek

Lean boekentips

Banner