Statistische significantie: definitie, concept, significantie, regressievergelijkingen en hypothesetoetsing

Inhoudsopgave:

Statistische significantie: definitie, concept, significantie, regressievergelijkingen en hypothesetoetsing
Statistische significantie: definitie, concept, significantie, regressievergelijkingen en hypothesetoetsing

Video: Statistische significantie: definitie, concept, significantie, regressievergelijkingen en hypothesetoetsing

Video: Statistische significantie: definitie, concept, significantie, regressievergelijkingen en hypothesetoetsing
Video: S13-10 Significantie 2024, April
Anonim

Statistieken zijn al lang een integraal onderdeel van het leven. Overal worden mensen ermee geconfronteerd. Op basis van statistieken worden conclusies getrokken over waar en welke ziekten veel voorkomen, waar meer vraag naar is in een bepaalde regio of bij een bepaald deel van de bevolking. Zelfs de opbouw van politieke programma's van kandidaten voor overheidsinstanties is gebaseerd op statistische gegevens. Ze worden ook gebruikt door winkelketens bij de aankoop van goederen, en fabrikanten laten zich bij hun voorstellen leiden door deze gegevens.

Statistieken spelen een belangrijke rol in het leven van de samenleving en beïnvloeden elk van haar individuele leden, zelfs in kleine dingen. Als volgens statistieken bijvoorbeeld de meeste mensen de voorkeur geven aan donkere kleuren in kleding in een bepaalde stad of regio, dan zal het buitengewoon moeilijk zijn om een felgele regenjas met een bloemenprint te vinden in lokale winkels. Maar welke hoeveelheden?tellen deze gegevens op om zo'n impact te hebben? Wat is bijvoorbeeld "statistisch significant"? Wat wordt er precies bedoeld met deze definitie?

Wat is dit?

Statistieken als wetenschap bestaan uit een combinatie van verschillende grootheden en concepten. Een daarvan is het concept van "statistische significantie". Dit is de naam van de waarde van variabelen, waarbij de waarschijnlijkheid van het verschijnen van andere indicatoren verwaarloosbaar is.

Berekening van statistische indicatoren
Berekening van statistische indicatoren

Bijvoorbeeld: 9 van de 10 mensen trekken rubberen schoenen aan tijdens een ochtendwandeling naar paddenstoelen in het herfstbos na een regenachtige nacht. De kans dat er op een gegeven moment 8 van hen mocassins van canvas aantrekken is te verwaarlozen. Dus in dit specifieke voorbeeld is het getal 9 wat "statistische significantie" wordt genoemd.

Als we het gegeven praktijkvoorbeeld verder ontwikkelen, kopen schoenenwinkels dus tegen het einde van het zomerseizoen in grotere hoeveelheden rubberen laarzen dan in andere periodes van het jaar. De grootte van de statistische waarde heeft dus een impact op het gewone leven.

Bij complexe berekeningen, bijvoorbeeld bij het voorspellen van de verspreiding van virussen, wordt natuurlijk rekening gehouden met een groot aantal variabelen. Maar de essentie van het bepalen van een significante indicator van statistische gegevens is vergelijkbaar, ongeacht de complexiteit van de berekeningen en het aantal variabele waarden.

Hoe wordt het berekend?

Wordt gebruikt bij het berekenen van de waarde van de "statistische significantie"-indicator van de vergelijking. Dat wil zeggen, men kan stellen dat in dit geval alles wordt bepaald door wiskunde. De eenvoudigste berekeningsoptie is een reeks wiskundige bewerkingen, waarbij de volgende parameters betrokken zijn:

  • twee soorten resultaten verkregen uit enquêtes of de studie van objectieve gegevens, zoals het aantal aankopen, aangeduid met a en b;
  • sample size indicator voor beide groepen – n;
  • waarde van het gecombineerde steekproefaandeel - p;
  • standaardfout - SE.

De volgende stap is het bepalen van de algehele testscore - t, de waarde ervan wordt vergeleken met het getal 1.96. 1.96 is de gemiddelde waarde en geeft een bereik van 95% weer, volgens de t-verdelingsfunctie van de student.

Formule voor eenvoudige berekening
Formule voor eenvoudige berekening

De vraag rijst vaak wat het verschil is tussen de waarden van n en p. Deze nuance is eenvoudig te verduidelijken met een voorbeeld. Laten we zeggen dat de statistische significantie van loyaliteit aan een product of merk van mannen en vrouwen wordt berekend.

In dit geval worden de letters gevolgd door het volgende:

  • n - aantal respondenten;
  • p - aantal tevreden met het product.

Het aantal geïnterviewde vrouwen wordt in dit geval aangemerkt als n1. Dienovereenkomstig, mannen - n2. Dezelfde waarde heeft de nummers "1" en "2" van het symbool p.

Het vergelijken van de testscore met het gemiddelde van de leerlingenspreadsheets wordt wat "statistische significantie" wordt genoemd.

Wat wordt bedoeld met verificatie?

De resultaten van elke wiskundige berekening kunnen altijd worden gecontroleerd, dit wordt aan kinderen op de basisschool geleerd. Het is logisch om aan te nemendat aangezien de statistieken worden bepaald met behulp van de reeks berekeningen, ze worden gecontroleerd.

Het testen op statistische significantie is echter niet alleen wiskunde. Statistieken hebben te maken met een groot aantal variabelen en verschillende kansen, die lang niet altijd vatbaar zijn voor berekening. Dat wil zeggen, als we aan het begin van het artikel terugkeren naar het voorbeeld van rubberen schoenen, dan kan de logische constructie van statistische gegevens waarop kopers van goederen voor winkels vertrouwen, worden verstoord door droog en warm weer, wat niet typisch is voor de herfst. Als gevolg van dit fenomeen zal het aantal mensen dat rubberen laarzen koopt afnemen en zullen winkels verliezen lijden. Een wiskundige formule kan natuurlijk geen weerafwijking voorzien. Dit moment wordt "fout" genoemd.

Tools voor statistische datavisualisatie
Tools voor statistische datavisualisatie

Dat is gewoon de kans op dergelijke fouten en houdt rekening met de controle van het niveau van berekende significantie. Het houdt rekening met zowel berekende indicatoren als geaccepteerde significantieniveaus, evenals met hoeveelheden die conventioneel hypothesen worden genoemd.

Wat is het significantieniveau?

Het concept "niveau" is opgenomen in de belangrijkste criteria voor statistische significantie. Het wordt gebruikt in toegepaste en praktische statistieken. Dit is een soort waarde die rekening houdt met de kans op mogelijke afwijkingen of fouten.

Het niveau is gebaseerd op de identificatie van verschillen in kant-en-klare monsters, het stelt je in staat om hun significantie of, omgekeerd, willekeur vast te stellen. Dit concept heeft niet alleen digitale betekenissen, maar ook hun eigenaardige interpretaties. Ze leggen uithoe je de waarde moet begrijpen, en het niveau zelf wordt bepaald door het resultaat te vergelijken met de gemiddelde index, dit onthult de mate van betrouwbaarheid van de verschillen.

Bespreking van statistieken
Bespreking van statistieken

Zo kunnen we ons het concept van een niveau eenvoudig voorstellen - het is een indicator van een acceptabele, waarschijnlijke fout of fout in de conclusies die worden getrokken uit de verkregen statistische gegevens.

Welke significantieniveaus worden gebruikt?

De statistische significantie van foutkanscoëfficiënten in de praktijk is gebaseerd op drie basisniveaus.

Het eerste niveau is de drempel waarbij de waarde 5% is. Dat wil zeggen dat de foutkans het significantieniveau van 5% niet overschrijdt. Dit betekent dat het vertrouwen in de onberispelijkheid en onfeilbaarheid van de conclusies op basis van statistische onderzoeksgegevens 95% is.

Het tweede niveau is de drempel van 1%. Dienovereenkomstig betekent dit cijfer dat men zich met een betrouwbaarheid van 99% kan laten leiden door de gegevens die zijn verkregen tijdens statistische berekeningen.

Derde niveau - 0,1%. Met deze waarde is de kans op een fout gelijk aan een fractie van een procent, dat wil zeggen dat fouten praktisch worden geëlimineerd.

Wat is een hypothese in statistiek?

Fouten als concept zijn verdeeld in twee gebieden, met betrekking tot de acceptatie of verwerping van de nulhypothese. Een hypothese is een concept waarachter, volgens de definitie, een reeks onderzoeksresultaten, andere gegevens of uitspraken schuilgaat. Dat wil zeggen, een beschrijving van de kansverdeling van iets dat verband houdt met het onderwerp statistische boekhouding.

statistische significantie van de regressie
statistische significantie van de regressie

Er zijn twee hypothesen in eenvoudige berekeningen: nul en alternatief. Het verschil tussen beide is dat de nulhypothese gebaseerd is op het idee dat er geen fundamentele verschillen zijn tussen de steekproeven die betrokken zijn bij het bepalen van de statistische significantie, en de alternatieve hypothese is daar volledig tegengesteld aan. Dat wil zeggen, de alternatieve hypothese is gebaseerd op de aanwezigheid van een significant verschil in deze steekproeven.

Wat zijn de fouten?

Fouten als concept in statistieken staan in directe verhouding tot de acceptatie van deze of gene hypothese als waar. Ze kunnen worden onderverdeeld in twee richtingen of typen:

  • het eerste type is te wijten aan de acceptatie van de nulhypothese, die onjuist bleek te zijn;
  • second - veroorzaakt door het volgen van het alternatief.
Statistische grafieken bekijken
Statistische grafieken bekijken

Het eerste type fout wordt vals-positief genoemd en komt vrij vaak voor in alle gebieden waar statistieken worden gebruikt. Dienovereenkomstig wordt de fout van het tweede type vals-negatief genoemd.

Waarom hebben we regressie in statistieken nodig?

De statistische significantie van regressie is dat het met haar hulp mogelijk is om vast te stellen in hoeverre het model van verschillende afhankelijkheden berekend op basis van de gegevens overeenkomt met de werkelijkheid; stelt u in staat om de toereikendheid of het ontbreken van factoren voor boekhouding en conclusies te identificeren.

De regressiewaarde wordt bepaald door de resultaten te vergelijken met de gegevens in de Fisher-tabellen. Of het gebruik van variantieanalyse. Regressie-indicatoren zijn belangrijk wanneer:complexe statistische onderzoeken en berekeningen met een groot aantal variabelen, willekeurige gegevens en waarschijnlijke veranderingen.

Aanbevolen: