Rëndësia statistikore. Besueshmëria dhe rëndësia statistikore

TIPARI I PAGUAR. Tipari i rëndësisë statistikore është i disponueshëm vetëm në plane të zgjedhura. Kontrolloni nëse është në.

Ju mund të zbuloni nëse ka dallime statistikisht domethënëse në përgjigjet e marra nga grupe të ndryshme të të anketuarve për pyetjet në një anketë. Për të përdorur veçorinë e rëndësisë statistikore në SurveyMonkey, duhet:

Aktivizoni veçorinë e rëndësisë statistikore kur shtoni një rregull krahasimi në një pyetje në anketën tuaj. Zgjidhni grupet e të anketuarve për t'i krahasuar për të renditur rezultatet e anketës në grupe për krahasim vizual.
Ekzaminoni tabelat e të dhënave për pyetjet tuaja të anketës për të identifikuar ndonjë ndryshim statistikisht domethënës në përgjigjet e marra nga grupe të ndryshme të të anketuarve.

Shikoni rëndësinë statistikore

Duke ndjekur hapat e mëposhtëm, mund të krijoni një anketë që shfaq rëndësinë statistikore.

1. Shtoni pyetje të mbyllura në sondazhin tuaj

Për të shfaqur rëndësinë statistikore kur analizoni rezultatet, do t'ju duhet të aplikoni një rregull krahasimi për çdo pyetje në anketën tuaj.

Ju mund të aplikoni rregullin e krahasimit dhe të llogarisni rëndësinë statistikore në përgjigje nëse përdorni një nga sa vijon në hartimin e sondazhit tuaj: llojet e mëposhtme pyetje:

Është e nevojshme të siguroheni që opsionet e propozuara të përgjigjeve mund të ndahen në grupe të plota. Opsionet e përgjigjes që zgjidhni për krahasim kur krijoni një rregull krahasimi do të përdoren për të organizuar të dhënat në skeda të kryqëzuara gjatë anketës.

2. Mblidhni përgjigjet

Pasi të keni përfunduar sondazhin tuaj, krijoni një koleksionist për ta shpërndarë atë. Ka disa mënyra.

Ju duhet të merrni të paktën 30 përgjigje për çdo opsion përgjigjeje që planifikoni të përdorni në rregullin tuaj të krahasimit për të aktivizuar dhe parë rëndësinë statistikore.

Shembull sondazhi

Ju dëshironi të zbuloni nëse burrat janë dukshëm më të kënaqur me produktet tuaja sesa gratë.

Shtoni dy pyetje me zgjedhje të shumëfishta në sondazhin tuaj:
Cila është gjinia juaj? (Mashkull Femer)
Jeni të kënaqur apo të pakënaqur me produktin tonë? (i kënaqur, i pakënaqur)
Sigurohuni që të paktën 30 të anketuar të zgjedhin "mashkull" për pyetjen gjinore DHE të paktën 30 të anketuar të zgjedhin "femër" si gjini.
Shtoni një rregull krahasimi në pyetjen "Cila është gjinia juaj?" dhe zgjidhni të dyja opsionet e përgjigjes si grupet tuaja.
Përdorni tabelën e të dhënave poshtë grafikut të pyetjeve "A jeni të kënaqur apo të pakënaqur me produktin tonë?" për të parë nëse ndonjë opsion përgjigjeje tregon një ndryshim statistikisht domethënës

Cili është një ndryshim statistikisht i rëndësishëm?

Një ndryshim statistikisht domethënës do të thotë se analiza statistikore ka përcaktuar se ka dallime të rëndësishme midis përgjigjeve të një grupi të anketuarve dhe përgjigjeve të një grupi tjetër. Rëndësia statistikore do të thotë se numrat e përftuar janë dukshëm të ndryshëm. Një njohuri e tillë do t'ju ndihmojë shumë në analizën e të dhënave. Megjithatë, ju përcaktoni rëndësinë e rezultateve të marra. Jeni ju që vendosni se si të interpretoni rezultatet e sondazhit dhe çfarë veprimesh duhet të ndërmerren në bazë të tyre.

Për shembull, ju merrni më shumë ankesa nga klientët femra sesa nga klientët meshkuj. Si mund të përcaktojmë nëse një ndryshim i tillë është real dhe nëse duhet të ndërmerren veprime lidhur me të? Një mënyrë e shkëlqyer për të testuar vëzhgimet tuaja është të kryeni një anketë që do t'ju tregojë nëse klientët meshkuj janë dukshëm më të kënaqur me produktin tuaj. Duke përdorur një formulë statistikore, funksioni ynë i rëndësisë statistikore do t'ju japë mundësinë për të përcaktuar nëse produkti juaj është në të vërtetë shumë më tërheqës për burrat sesa për gratë. Kjo do t'ju lejojë të ndërmerrni veprime bazuar në fakte dhe jo në supozime.

Diferencë statistikisht domethënëse

Nëse rezultatet tuaja janë të theksuara në tabelën e të dhënave, kjo do të thotë se të dy grupet e të anketuarve janë dukshëm të ndryshëm nga njëri-tjetri. Termi "i rëndësishëm" nuk do të thotë se numrat që rezultojnë kanë ndonjë rëndësi apo rëndësi të veçantë, vetëm se ka një ndryshim statistikor midis tyre.

Asnjë ndryshim statistikisht domethënës

Nëse rezultatet tuaja nuk janë të theksuara në tabelën përkatëse të të dhënave, kjo do të thotë se megjithëse mund të ketë një ndryshim në dy shifrat që krahasohen, nuk ka dallim statistikor midis tyre.

Përgjigjet pa dallime të rëndësishme statistikisht tregojnë se nuk ka ndonjë ndryshim domethënës midis dy artikujve që krahasohen duke pasur parasysh madhësinë e kampionit që përdorni, por kjo nuk do të thotë domosdoshmërisht se ato nuk janë domethënëse. Ndoshta duke rritur madhësinë e kampionit, do të jeni në gjendje të identifikoni një ndryshim statistikisht të rëndësishëm.

Madhësia e mostrës

Nëse keni një madhësi shumë të vogël kampioni, vetëm dallimet shumë të mëdha midis dy grupeve do të jenë të rëndësishme. Nëse keni një madhësi shumë të madhe kampioni, dallimet e vogla dhe të mëdha do të llogariten si të rëndësishme.

Megjithatë, vetëm për shkak se dy numra janë statistikisht të ndryshëm nuk do të thotë se ndryshimi midis rezultateve bën ndonjë ndryshim për ju. rëndësi praktike. Ju do të duhet të vendosni vetë se cilat dallime janë domethënëse për anketën tuaj.

Llogaritja e rëndësisë statistikore

Ne llogarisim rëndësinë statistikore duke përdorur një nivel standard besimi 95%. Nëse një opsion përgjigjeje tregohet si i rëndësishëm statistikisht, kjo do të thotë që vetëm rastësisht ose për shkak të gabimit të kampionimit ka më pak se 5% probabilitet që ndryshimi midis dy grupeve të ndodhë (shpesh tregohet si: p<0,05).

Për të llogaritur dallimet statistikisht të rëndësishme midis grupeve, ne përdorim formulat e mëposhtme:

Parametri	Përshkrim
a1	Përqindja e pjesëmarrësve nga grupi i parë që iu përgjigjën pyetjes në një mënyrë të caktuar, shumëzuar me madhësinë e kampionit të këtij grupi.
b1	Përqindja e pjesëmarrësve nga grupi i dytë që iu përgjigjën pyetjes në një mënyrë të caktuar, shumëzuar me madhësinë e kampionit të këtij grupi.
Përqindja e mostrës së bashkuar (p)	Kombinimi i dy aksioneve nga të dy grupet.
Gabim standard (SE)	Një tregues se sa ndryshon pjesa juaj nga pjesa aktuale. Një vlerë më e ulët do të thotë se fraksioni është afër fraksionit aktual, një vlerë më e lartë do të thotë se fraksioni është dukshëm i ndryshëm nga fraksioni aktual.
Statistikat e testit (t)	Statistikat e testit. Numri i devijimeve standarde me të cilat një vlerë e caktuar ndryshon nga mesatarja.
Rëndësia statistikore	Nëse vlera absolute e statistikës së testit është më e madhe se 1,96* devijime standarde nga mesatarja, ajo konsiderohet një ndryshim statistikisht i rëndësishëm.

*1.96 është vlera e përdorur për nivelin e besimit 95%, sepse 95% e diapazonit të trajtuar nga funksioni i shpërndarjes t Studentit shtrihet brenda 1.96 devijimeve standarde të mesatares.

Shembull i llogaritjes

Duke vazhduar me shembullin e përdorur më sipër, le të zbulojmë nëse përqindja e meshkujve që thonë se janë të kënaqur me produktin tuaj është dukshëm më e lartë se përqindja e femrave.

Le të themi se 1000 burra dhe 1000 gra morën pjesë në sondazhin tuaj dhe rezultati i anketës ishte se 70% e burrave dhe 65% e grave thonë se janë të kënaqur me produktin tuaj. A është niveli 70% dukshëm më i lartë se niveli 65%?

Zëvendësoni të dhënat e mëposhtme nga sondazhi në formulat e dhëna:

p1 (% e meshkujve të kënaqur me produktin) = 0.7
p2 (% e grave të kënaqura me produktin) = 0.65
n1 (numri i burrave të anketuar) = 1000
n2 (numri i grave të intervistuara) = 1000

Meqenëse vlera absolute e statistikës së testit është më e madhe se 1.96, kjo do të thotë se diferenca midis burrave dhe grave është e rëndësishme. Krahasuar me femrat, meshkujt kanë më shumë gjasa të jenë të kënaqur me produktin tuaj.

Fshehja e rëndësisë statistikore

Si të fshehni rëndësinë statistikore për të gjitha pyetjet

Klikoni shigjetën poshtë në të djathtë të rregullit të krahasimit në shiritin anësor të majtë.
Zgjidhni një artikull Redakto rregullin.
Çaktivizo veçorinë Tregoni rëndësinë statistikore duke përdorur një ndërprerës.
Klikoni butonin Aplikoni.

Për të fshehur rëndësinë statistikore për një pyetje, duhet të:

Klikoni butonin Melodi mbi diagramin e kësaj çështjeje.
Hapni skedën Opsionet e shfaqjes.
Hiq zgjedhjen e kutisë pranë Rëndësia statistikore.
Klikoni butonin Ruaj.

Opsioni i shfaqjes aktivizohet automatikisht kur aktivizohet shfaqja e rëndësisë statistikore. Nëse e fshini këtë opsion të shfaqjes, do të çaktivizohet gjithashtu shfaqja e rëndësisë statistikore.

Aktivizoni veçorinë e rëndësisë statistikore kur shtoni një rregull krahasimi në një pyetje në anketën tuaj. Shqyrtoni tabelat e të dhënave për pyetjet tuaja të anketës për të përcaktuar nëse ka dallime statistikisht domethënëse në përgjigjet e marra nga grupe të ndryshme të anketuarish.

Hulumtimi zakonisht fillon me disa supozime që kërkojnë verifikim duke përdorur fakte. Ky supozim - një hipotezë - formulohet në lidhje me lidhjen e fenomeneve ose vetive në një grup të caktuar objektesh.

Për të testuar supozime të tilla kundrejt fakteve, është e nevojshme të maten vetitë përkatëse të bartësve të tyre. Por është e pamundur të matet ankthi tek të gjitha femrat dhe meshkujt, ashtu siç është e pamundur të matet agresiviteti tek të gjithë adoleshentët. Prandaj, gjatë kryerjes së hulumtimit, ai kufizohet vetëm në një grup relativisht të vogël përfaqësuesish të popullatave përkatëse të njerëzve.

Popullatë- ky është tërësia e objekteve në lidhje me të cilat formulohet një hipotezë kërkimore.

Për shembull, të gjithë burrat; ose të gjitha gratë; ose të gjithë banorët e një qyteti. Popullatat e përgjithshme në lidhje me të cilat studiuesi do të nxjerrë përfundime bazuar në rezultatet e studimit mund të jenë më modeste në numër, për shembull, të gjithë nxënësit e klasës së parë të një shkolle të caktuar.

Kështu, popullsia e përgjithshme është, megjithëse jo e pafundme në numër, por, si rregull, e paarritshme për kërkime të vazhdueshme, një grup subjektesh potenciale.

Mostra ose popullata e mostrësështë një grup objektesh të kufizuara në numër (në psikologji - lëndë, të anketuar), të zgjedhura posaçërisht nga popullatë për të studiuar vetitë e tij. Prandaj, quhet studimi i vetive të popullatës së përgjithshme duke përdorur një mostër studim kampionimi. Pothuajse të gjitha studimet psikologjike janë selektive dhe përfundimet e tyre shtrihen në popullatat e përgjithshme.

Kështu, pasi është formuluar një hipotezë dhe janë identifikuar popullatat përkatëse, studiuesi përballet me problemin e organizimit të një kampioni. Mostra duhet të jetë e tillë që të justifikohet përgjithësimi i përfundimeve të studimit kampion - përgjithësimi, shtrirja e tyre në popullatën e përgjithshme. Kriteret kryesore për vlefshmërinë e përfundimeve të kërkimit— këto janë përfaqësimi i kampionit dhe besueshmëria statistikore e rezultateve (empirike).

Përfaqësueshmëria e kampionit- me fjalë të tjera, përfaqësimi i tij është aftësia e kampionit për të përfaqësuar plotësisht fenomenet në studim - nga pikëpamja e ndryshueshmërisë së tyre në popullatën e përgjithshme.

Natyrisht, vetëm popullata e përgjithshme mund të japë një pasqyrë të plotë të fenomenit që studiohet, në të gjithë gamën e tij dhe nuancat e ndryshueshmërisë. Prandaj, përfaqësimi është gjithmonë i kufizuar në masën që kampioni është i kufizuar. Dhe është përfaqësimi i kampionit ai që është kriteri kryesor në përcaktimin e kufijve të përgjithësimit të gjetjeve të kërkimit. Sidoqoftë, ka teknika që bëjnë të mundur marrjen e një përfaqësimi të mostrës të mjaftueshme për studiuesin (Këto teknika studiohen në kursin "Psikologji Eksperimentale").

Teknika e parë dhe kryesore është përzgjedhja e thjeshtë e rastësishme (të rastësishme). Ai përfshin sigurimin e kushteve të tilla që çdo anëtar i popullatës të ketë shanse të barabarta me të tjerët për t'u përfshirë në kampion. Përzgjedhja e rastësishme siguron që një shumëllojshmëri përfaqësuesish të popullatës së përgjithshme mund të përfshihen në kampion. Në këtë rast, merren masa të veçanta për të parandaluar shfaqjen e ndonjë modeli gjatë përzgjedhjes. Dhe kjo na lejon të shpresojmë që në fund, në kampion, prona që studiohet do të përfaqësohet, nëse jo në të gjitha, atëherë në diversitetin maksimal të mundshëm.

Mënyra e dytë për të siguruar përfaqësimin është kampionimi i rastësishëm i shtresuar, ose përzgjedhja e bazuar në vetitë e popullatës së përgjithshme. Ai përfshin një përcaktim paraprak të atyre cilësive që mund të ndikojnë në ndryshueshmërinë e pronës që studiohet (kjo mund të jetë gjinia, niveli i të ardhurave ose arsimimi, etj.). Më pas përcaktohet raporti në përqindje i numrit të grupeve (shtresave) që ndryshojnë në këto cilësi në popullatën e përgjithshme dhe sigurohet një përqindje identike e grupeve përkatëse në kampion. Më pas, subjektet zgjidhen në secilin nëngrup të kampionit sipas parimit të përzgjedhjes së thjeshtë të rastësishme.

Rëndësia statistikore, ose rëndësisë statistikore, rezultatet e një studimi përcaktohen duke përdorur metodat e konkluzionit statistikor.

A jemi të siguruar nga gabimet kur marrim vendime, kur nxjerrim përfundime të caktuara nga rezultatet e hulumtimit? Sigurisht që jo. Në fund të fundit, vendimet tona bazohen në rezultatet e studimit të popullatës së mostrës, si dhe në nivelin e njohurive tona psikologjike. Ne nuk jemi plotësisht të imunizuar nga gabimet. Në statistika, gabime të tilla konsiderohen të pranueshme nëse ndodhin jo më shpesh se në një rast nga 1000 (probabiliteti i gabimit α = 0,001 ose probabiliteti i besimit të lidhur për një përfundim të saktë p = 0,999); në një rast nga 100 (probabiliteti i gabimit α = 0,01 ose probabiliteti shoqërues i besimit të një përfundimi të saktë p = 0,99) ose në pesë raste nga 100 (probabiliteti i gabimit α = 0,05 ose probabiliteti i lidhur me besimin e një përfundimi të saktë p=0.95). Pikërisht në dy nivelet e fundit merren vendimet në psikologji.

Ndonjëherë, kur flasin për rëndësinë statistikore, ata përdorin konceptin e "nivelit të rëndësisë" (i shënuar si α). Vlerat numerike të p dhe α plotësojnë njëra-tjetrën deri në 1000 - një grup i plotë ngjarjesh: ose kemi bërë përfundimin e duhur, ose kemi bërë një gabim. Këto nivele nuk llogariten, janë të dhëna. Niveli i rëndësisë mund të kuptohet si një lloj vije "e kuqe", kryqëzimi i së cilës do të na lejojë të flasim për këtë ngjarje si jo të rastësishme. Në çdo raport apo publikim të mirë shkencor, përfundimet e nxjerra duhet të shoqërohen me një tregues të vlerave p ose α në të cilat janë nxjerrë përfundimet.

Metodat e konkluzionit statistikor diskutohen në detaje në kursin Statistika Matematikore. Tani vetëm vërejmë se ata kanë kërkesa të caktuara për numrin, ose Madhësia e mostrës.

Fatkeqësisht, nuk ka udhëzime strikte për përcaktimin paraprak të madhësisë së kërkuar të mostrës. Për më tepër, pyetja për numrin e nevojshëm dhe të mjaftueshëm studiuesi zakonisht e merr shumë vonë - vetëm pasi të ketë analizuar të dhënat e një kampioni tashmë të anketuar. Sidoqoftë, rekomandimet më të përgjithshme mund të formulohen:

1. Madhësia më e madhe e mostrës kërkohet kur zhvillohet një teknikë diagnostikuese - nga 200 në 1000-2500 njerëz.

2. Nëse është e nevojshme të krahasohen 2 mostra, numri i përgjithshëm i tyre duhet të jetë së paku 50 persona; numri i mostrave që krahasohen duhet të jetë afërsisht i njëjtë.

3. Nëse po studiohet marrëdhënia ndërmjet ndonjë prone, atëherë madhësia e kampionit duhet të jetë së paku 30-35 persona.

4. Sa më shumë ndryshueshmëria prona që studiohet, aq më e madhe duhet të jetë madhësia e kampionit. Prandaj, ndryshueshmëria mund të reduktohet duke rritur homogjenitetin e kampionit, për shembull, sipas gjinisë, moshës, etj. Kjo, natyrisht, zvogëlon aftësinë për të përgjithësuar përfundimet.

Mostrat e varura dhe të pavarura. Një situatë e zakonshme kërkimore është kur një veti me interes për një studiues studiohet në dy ose më shumë mostra me qëllim krahasimi të mëtejshëm. Këto mostra mund të jenë në përmasa të ndryshme, në varësi të procedurës për organizimin e tyre. Mostrat e pavarura karakterizohen nga fakti se probabiliteti i përzgjedhjes së ndonjë lënde në një kampion nuk varet nga përzgjedhja e ndonjë prej lëndëve në një kampion tjetër. Kundër, mostrat e varura karakterizohen nga fakti se çdo subjekt nga një kampion përputhet sipas një kriteri të caktuar nga një subjekt nga një kampion tjetër.

Në përgjithësi, mostrat e varura përfshijnë zgjedhjen në çift të subjekteve në mostra të krahasuara, dhe mostrat e pavarura nënkuptojnë një përzgjedhje të pavarur të subjekteve.

Duhet të theksohet se rastet e mostrave "pjesërisht të varura" (ose "pjesërisht të pavarura") janë të papranueshme: kjo në mënyrë të paparashikueshme cenon përfaqësimin e tyre.

Si përfundim, vërejmë se mund të dallohen dy paradigma të kërkimit psikologjik.

E ashtuquajtura R-metodologjia përfshin studimin e ndryshueshmërisë së një vetie të caktuar (psikologjike) nën ndikimin e një ndikimi, faktori ose vetie tjetër të caktuar. Një mostër është një grup lëndësh.

Një tjetër qasje Q-metodologjia, përfshin studimin e ndryshueshmërisë së një subjekti (individi) nën ndikimin e stimujve të ndryshëm (kushte, situata, etj.). Ajo korrespondon me situatën kur mostra është një grup stimujsh.

Në çdo situatë shkencore dhe praktike të një eksperimenti (ankete), studiuesit mund të studiojnë jo të gjithë njerëzit (popullsia e përgjithshme, popullsia), por vetëm një mostër e caktuar. Për shembull, edhe nëse po studiojmë një grup relativisht të vogël njerëzish, siç janë ata që vuajnë nga një sëmundje e caktuar, është ende shumë e pamundur që të kemi burimet e duhura ose nevojën për të testuar çdo pacient. Në vend të kësaj, është e zakonshme të testohet një kampion nga popullata sepse është më i përshtatshëm dhe kërkon më pak kohë. Nëse po, si e dimë se rezultatet e marra nga kampioni janë përfaqësuese të të gjithë grupit? Ose, për të përdorur terminologjinë profesionale, a mund të jemi të sigurt se hulumtimi ynë e përshkruan saktë të gjithë popullatë, mostrën që kemi përdorur?

Për t'iu përgjigjur kësaj pyetjeje, është e nevojshme të përcaktohet rëndësia statistikore e rezultateve të testit. Rëndësia statistikore (Niveli i rëndësishëm, shkurtuar Sig.), ose /7-niveli i rëndësisë (niveli p) -është probabiliteti që një rezultat i dhënë përfaqëson saktë popullatën nga e cila është marrë kampion studimi. Vini re se kjo është vetëm probabiliteti- është e pamundur të thuhet me siguri absolute se një studim i caktuar përshkruan saktë të gjithë popullsinë. Në rastin më të mirë, niveli i rëndësisë mund të konkludojë vetëm se kjo është shumë e mundshme. Kështu, në mënyrë të pashmangshme lind pyetja tjetër: çfarë niveli i rëndësisë duhet të jetë përpara se një rezultat i caktuar të konsiderohet një karakterizim i saktë i popullsisë?

Për shembull, me çfarë vlere probabiliteti jeni të gatshëm të thoni se shanset e tilla janë të mjaftueshme për të marrë një rrezik? Po sikur shanset të jenë 10 nga 100 ose 50 nga 100? Po sikur ky probabilitet të jetë më i lartë? Po shanset si 90 nga 100, 95 nga 100, apo 98 nga 100? Për një situatë që përfshin rrezik, kjo zgjedhje është mjaft problematike, sepse varet nga karakteristikat personale të personit.

Në psikologji, tradicionalisht besohet se një shans 95 ose më shumë nga 100 do të thotë se probabiliteti që rezultatet të jenë të sakta është mjaft i lartë që ato të jenë të përgjithësueshme për të gjithë popullatën. Kjo shifër u krijua në procesin e veprimtarisë shkencore dhe praktike - nuk ka asnjë ligj sipas të cilit duhet të zgjidhet si udhëzues (dhe në të vërtetë, në shkencat e tjera ndonjëherë zgjidhen vlera të tjera të nivelit të rëndësisë).

Në psikologji, ky probabilitet operohet në një mënyrë disi të pazakontë. Në vend të probabilitetit që kampioni të përfaqësojë popullsinë, probabiliteti që kampioni nuk përfaqëson popullatë. Me fjalë të tjera, është probabiliteti që marrëdhënia ose dallimet e vëzhguara të jenë të rastësishme dhe jo një pronë e popullatës. Pra, në vend që të thonë se ka një shans 95 në 100 që rezultatet e një studimi të jenë të sakta, psikologët thonë se ka një shans 5 në 100 që rezultatet të jenë të gabuara (ashtu si një shans 40 në 100 që rezultatet janë të sakta do të thotë një shans 60 në 100 në favor të pasaktësisë së tyre). Vlera e probabilitetit ndonjëherë shprehet si përqindje, por më shpesh shkruhet si thyesë dhjetore. Për shembull, 10 shanse nga 100 shprehen si thyesë dhjetore prej 0,1; 5 nga 100 shkruhet si 0.05; 1 nga 100 - 0,01. Me këtë formë regjistrimi, vlera kufi është 0.05. Që një rezultat të konsiderohet i saktë, niveli i rëndësisë së tij duhet të jetë më poshtë ky numër (mos harroni, kjo është probabiliteti që rezultati gabim përshkruan popullsinë). Për të hequr terminologjinë nga rruga, le të shtojmë se "probabiliteti që rezultati të jetë i pasaktë" (që më saktë quhet niveli i rëndësisë) zakonisht shënohet me shkronjë latine R. Përshkrimet e rezultateve eksperimentale zakonisht përfshijnë një deklaratë përmbledhëse të tillë si “rezultatet ishin të rëndësishme në nivelin e besimit (R(p) më pak se 0.05 (d.m.th. më pak se 5%).

Kështu, niveli i rëndësisë ( R) tregon gjasat që rezultatet Jo përfaqësojnë popullsinë. Tradicionalisht në psikologji, rezultatet konsiderohen se pasqyrojnë në mënyrë të besueshme pamjen e përgjithshme nëse vlera R më pak se 0.05 (d.m.th. 5%). Sidoqoftë, kjo është vetëm një deklaratë probabiliste, dhe aspak një garanci e pakushtëzuar. Në disa raste ky përfundim mund të mos jetë i saktë. Në fakt, ne mund të llogarisim se sa shpesh mund të ndodhë kjo nëse shikojmë madhësinë e nivelit të rëndësisë. Në një nivel të rëndësisë prej 0.05, 5 nga 100 herë rezultatet ka të ngjarë të jenë të pasakta. 11a në shikim të parë duket se kjo nuk është shumë e zakonshme, por nëse mendoni për këtë, atëherë 5 shanse nga 100 janë të njëjta me 1 nga 20. Me fjalë të tjera, në një në çdo 20 raste rezultati do të jetë e pasaktë. Shanset e tilla nuk duken veçanërisht të favorshme dhe studiuesit duhet të kenë kujdes nga kryerja gabime të llojit të parë. Ky është emri për gabimin që ndodh kur studiuesit mendojnë se kanë gjetur rezultate reale, por në fakt nuk kanë gjetur. Gabimi i kundërt, i cili konsiston në faktin se studiuesit besojnë se nuk kanë gjetur një rezultat kur në fakt ka një të tillë, quhet gabime të llojit të dytë.

Këto gabime lindin sepse nuk mund të përjashtohet mundësia që analiza statistikore e kryer. Probabiliteti i gabimit varet nga niveli i rëndësisë statistikore të rezultateve. Ne kemi vërejtur tashmë se që një rezultat të konsiderohet i saktë, niveli i rëndësisë duhet të jetë nën 0.05. Sigurisht, disa rezultate janë më të ulëta se kaq, dhe nuk është e pazakontë të shohësh rezultate deri në 0.001 (një vlerë prej 0.001 do të thotë se ka një shans 1 në 1000 që rezultatet të jenë të gabuara). Sa më e vogël të jetë vlera p, aq më i fortë është besimi ynë në korrektësinë e rezultateve.

Në tabelë 7.2 tregon interpretimin tradicional të niveleve të rëndësisë në lidhje me mundësinë e përfundimit statistikor dhe arsyetimin për vendimin për praninë e një marrëdhënieje (ndryshime).

Tabela 7.2

Interpretimi tradicional i niveleve të rëndësisë që përdoret në psikologji

Bazuar në përvojën e hulumtimit praktik, rekomandohet: për të shmangur sa më shumë gabimet e tipit të parë dhe të dytë, gjatë nxjerrjes së përfundimeve të rëndësishme, duhet të merren vendime për praninë e dallimeve (lidhjeve), duke u fokusuar në nivelin. R shenjë n.

Test statistikor(Test statistikor -është një mjet për përcaktimin e nivelit të rëndësisë statistikore. Ky është një rregull vendimtar që siguron që një hipotezë e vërtetë të pranohet dhe një hipotezë e rreme të refuzohet me probabilitet të lartë.

Kriteret statistikore tregojnë gjithashtu metodën për llogaritjen e një numri të caktuar dhe vetë numrin. Të gjitha kriteret përdoren me një qëllim kryesor: për të përcaktuar niveli i rëndësisë të dhënat që ata analizojnë (d.m.th., gjasat që të dhënat pasqyrojnë një efekt të vërtetë që përfaqëson saktë popullatën nga e cila është nxjerrë kampioni).

Disa teste mund të përdoren vetëm për të dhëna të shpërndara normalisht (dhe nëse tipari matet në një shkallë intervali) - këto teste zakonisht quhen parametrike. Duke përdorur kritere të tjera, ju mund të analizoni të dhënat me pothuajse çdo ligj të shpërndarjes - ato quhen joparametrike.

Kriteret parametrike janë kritere që përfshijnë parametrat e shpërndarjes në formulën e llogaritjes, d.m.th. mesataret dhe variancat (Testi i studentit, F-testi Fisher etj.).

Kriteret joparametrike janë kritere që nuk përfshijnë parametrat e shpërndarjes në formulën për llogaritjen e parametrave të shpërndarjes dhe bazohen në funksionimin me frekuenca ose rangje (kriteri P Kriteri Rosenbaum U Mana - Whitney

Për shembull, kur themi se rëndësia e diferencave u përcaktua nga testi i Studentit, nënkuptojmë se për llogaritjen e vlerës empirike është përdorur metoda e testit t Studentit, e cila më pas krahasohet me vlerën e tabeluar (kritike).

Nga raporti i vlerave empirike (të llogaritura nga ne) dhe ato kritike të kriterit (tabelore) mund të gjykojmë nëse hipoteza jonë është konfirmuar apo hedhur poshtë. Në shumicën e rasteve, për t'i njohur dallimet si të rëndësishme, është e nevojshme që vlera empirike e kriterit të kalojë vlerën kritike, megjithëse ekzistojnë kritere (për shembull, testi Mann-Whitney ose testi i shenjave) në të cilat ne duhet t'i përmbahemi rregullit të kundërt.

Në disa raste, formula e llogaritjes për kriterin përfshin numrin e vëzhgimeve në kampionin në studim, të shënuar si P. Duke përdorur një tabelë të veçantë, ne përcaktojmë se me cilin nivel të rëndësisë statistikore të dallimeve korrespondon një vlerë e dhënë empirike. Në shumicën e rasteve, e njëjta vlerë empirike e kriterit mund të jetë e rëndësishme ose e parëndësishme në varësi të numrit të vëzhgimeve në kampionin në studim ( P ) ose nga të ashtuquajturat numri i shkallëve të lirisë , e cila shënohet si v (g>) ose si df (Ndonjehere d).

Duke ditur P ose numrin e shkallëve të lirisë, duke përdorur tabela të veçanta (kryesoret janë dhënë në Shtojcën 5) mund të përcaktojmë vlerat kritike të kriterit dhe të krahasojmë vlerën empirike të marrë me to. Kjo zakonisht shkruhet kështu: “kur n = 22 vlerat kritike të kriterit janë t St = 2.07" ose "në v (d) = 2 vlerat kritike të testit të Studentit janë = 4,30”, etj.

Në mënyrë tipike, preferenca u jepet ende kritereve parametrike, dhe ne i përmbahemi këtij pozicioni. Ato konsiderohen të jenë më të besueshme dhe mund të ofrojnë më shumë informacion dhe analiza më të thella. Sa i përket kompleksitetit të llogaritjeve matematikore, gjatë përdorimit programet kompjuterike kjo vështirësi zhduket (por disa të tjera duken, megjithatë, mjaft të kapërcyeshme).

Në këtë tekst mësimor ne nuk e shqyrtojmë në detaje problemin e statistikës
hipoteza (null - R0 dhe alternative - Hj) dhe vendime statistikore të marra, pasi studentët e psikologjisë e studiojnë këtë veçmas në disiplinën “Metodat matematikore në psikologji”. Për më tepër, duhet të theksohet se gjatë përgatitjes së një raporti kërkimor (punë kursi ose diplome, botim), hipotezat statistikore dhe zgjidhjet statistikore, si rregull, nuk jepen. Zakonisht, kur përshkruajnë rezultatet, ato tregojnë kriterin, japin statistikat e nevojshme përshkruese (mesatarja, sigma, koeficientët e korrelacionit, etj.), Vlerat empirike të kritereve, shkallët e lirisë dhe domosdoshmërisht niveli p i rëndësisë. Më pas formulohet një përfundim kuptimplotë në lidhje me hipotezën që testohet, duke treguar (zakonisht në formën e një pabarazie) nivelin e rëndësisë së arritur ose të paarritur.

Niveli i rëndësisë në statistika është një tregues i rëndësishëm që pasqyron shkallën e besimit në saktësinë dhe vërtetësinë e të dhënave të marra (të parashikuara). Koncepti përdoret gjerësisht në fusha të ndryshme: nga kryerja e kërkimeve sociologjike deri te testimi statistikor i hipotezave shkencore.

Përkufizimi

Niveli i rëndësisë statistikore (ose rezultati statistikisht i rëndësishëm) tregon probabilitetin e shfaqjes së rastësishme të treguesve të studiuar. Rëndësia e përgjithshme statistikore e një dukurie shprehet me koeficientin e vlerave p (niveli p). Në çdo eksperiment apo vëzhgim, ekziston mundësia që të dhënat e marra të jenë për shkak të gabimeve në kampionim. Kjo është veçanërisht e vërtetë për sociologjinë.

Kjo do të thotë, një vlerë statistikisht e rëndësishme është një vlerë, probabiliteti i shfaqjes së rastësishme të së cilës është jashtëzakonisht i vogël ose tenton në ekstrem. Ekstremi në këtë kontekst është shkalla në të cilën statistikat devijojnë nga hipoteza zero (hipotezë që testohet për konsistencë me të dhënat e marra të mostrës). Në praktikën shkencore, niveli i rëndësisë zgjidhet para mbledhjes së të dhënave dhe, si rregull, koeficienti i tij është 0.05 (5%). Për sistemet ku vlerat e sakta janë jashtëzakonisht të rëndësishme, kjo shifër mund të jetë 0.01 (1%) ose më pak.

Sfondi

Koncepti i nivelit të rëndësisë u prezantua nga statisticieni dhe gjenetisti britanik Ronald Fisher në vitin 1925, kur ai po zhvillonte një teknikë testimi. hipoteza statistikore. Kur analizohet çdo proces, ekziston një probabilitet i caktuar për fenomene të caktuara. Vështirësitë lindin kur punoni me përqindje të vogla (ose jo të dukshme) probabiliteti që bien nën konceptin e "gabimit të matjes".

Kur punojnë me të dhëna statistikore që nuk janë mjaftueshëm specifike për t'i testuar ato, shkencëtarët përballen me problemin e hipotezës zero, e cila "parandalon" funksionimin me sasi të vogla. Fisher propozoi që sisteme të tilla të përcaktojnë probabilitetin e ngjarjeve në 5% (0.05) si një prerje e përshtatshme kampionimi, duke lejuar që dikush të refuzojë hipotezën zero në llogaritje.

Prezantimi i probabiliteteve fikse

Në vitin 1933 Shkencëtarët Jerzy Neyman dhe Egon Pearson në veprat e tyre rekomanduan vendosjen e një niveli të caktuar rëndësie paraprakisht (para mbledhjes së të dhënave). Shembujt e përdorimit të këtyre rregullave janë qartë të dukshme gjatë zgjedhjeve. Le të themi se janë dy kandidatë, njëri prej të cilëve është shumë i njohur dhe tjetri pak i njohur. Është e qartë se kandidati i parë do të fitojë zgjedhjet, dhe shanset për të dytin priren në zero. Ata përpiqen - por nuk janë të barabartë: ekziston gjithmonë mundësia e forcës madhore, informacioneve të bujshme, vendimeve të papritura që mund të ndryshojnë rezultatet e parashikuara të zgjedhjeve.

Neyman dhe Pearson ranë dakord se niveli i rëndësisë së Fisher prej 0.05 (i shënuar me α) ishte më i përshtatshmi. Megjithatë, vetë Fischer në vitin 1956 kundërshtoi rregullimin e kësaj vlere. Ai besonte se niveli i α duhet të vendoset sipas rrethanave specifike. Për shembull, në fizikën e grimcave është 0.01.

vlera e nivelit p

Termi p-value u përdor për herë të parë nga Brownlee në 1960. Niveli P (p-vlera) është një tregues që është në marrëdhënie e anasjelltë mbi vërtetësinë e rezultateve. Koeficienti më i lartë i vlerës p korrespondon me nivelin më të ulët të besimit në marrëdhënien e mostrës midis variablave.

Kjo vlerë pasqyron mundësinë e gabimeve që lidhen me interpretimin e rezultateve. Le të supozojmë se niveli p = 0,05 (1/20). Ai tregon një probabilitet prej pesë për qind që marrëdhënia midis variablave të gjetur në kampion është vetëm një veçori e rastësishme e kampionit. Kjo do të thotë, nëse kjo varësi mungon, atëherë me eksperimente të ngjashme të përsëritura, mesatarisht, në çdo studim të njëzetë mund të pritet varësia e njëjtë ose më e madhe midis variablave. Niveli p shpesh shihet si një "diferencë" për shkallën e gabimit.

Nga rruga, vlera p mund të mos pasqyrojë marrëdhënien reale midis variablave, por tregon vetëm një vlerë mesatare të caktuar brenda supozimeve. Në veçanti, analiza përfundimtare e të dhënave do të varet edhe nga vlerat e zgjedhura të këtij koeficienti. Në nivelin p = 0,05 do të ketë disa rezultate, dhe në një koeficient të barabartë me 0,01 do të ketë rezultate të ndryshme.

Testimi i hipotezave statistikore

Niveli i rëndësisë statistikore është veçanërisht i rëndësishëm kur testohen hipotezat. Për shembull, kur llogaritet një test i dyanshëm, rajoni i refuzimit ndahet në mënyrë të barabartë në të dy skajet e shpërndarjes së mostrës (në raport me koordinatën zero) dhe llogaritet e vërteta e të dhënave që rezultojnë.

Supozoni se kur monitorohet një proces (dukuri) i caktuar, rezulton se informacioni i ri statistikor tregon ndryshime të vogla në krahasim me vlerat e mëparshme. Në të njëjtën kohë, mospërputhjet në rezultate janë të vogla, jo të dukshme, por të rëndësishme për studimin. Specialisti është përballur me një dilemë: a po ndodhin vërtet ndryshime apo janë këto gabime në kampionim (pasaktësi e matjes)?

Në këtë rast, ata përdorin ose refuzojnë hipotezën zero (i atribuojnë çdo gjë një gabimi, ose e njohin ndryshimin në sistem si një fakt të kryer). Procesi i zgjidhjes së problemit bazohet në raportin e rëndësisë së përgjithshme statistikore (p-vlera) dhe nivelit të rëndësisë (α). Nëse niveli p< α, значит, нулевую гипотезу отвергают. Чем меньше р-value, тем более значимой является тестовая статистика.

Vlerat e përdorura

Niveli i rëndësisë varet nga materiali që analizohet. Në praktikë, përdoren vlerat e mëposhtme fikse:

α = 0,1 (ose 10%);
α = 0,05 (ose 5%);
α = 0,01 (ose 1%);
α = 0,001 (ose 0,1%).

Sa më të sakta të kërkohen llogaritjet, aq më i ulët përdoret koeficienti α. Natyrisht, parashikimet statistikore në fizikë, kimi, farmaceutikë dhe gjenetikë kërkojnë saktësi më të madhe sesa në shkencën politike dhe sociologjinë.

Pragjet e rëndësisë në fusha specifike

Në fusha me precizion të lartë si fizika e grimcave dhe prodhimi, rëndësia statistikore shpesh shprehet si raport i devijimit standard (të shënuar me koeficientin sigma - σ) në lidhje me një shpërndarje normale probabiliteti (shpërndarja Gaussian). σ është një tregues statistikor që përcakton shpërndarjen e vlerave të një sasie të caktuar në lidhje me pritjet matematikore. Përdoret për të përshkruar probabilitetin e ngjarjeve.

Në varësi të fushës së njohurive, koeficienti σ ndryshon shumë. Për shembull, kur parashikohet ekzistenca e bozonit Higgs, parametri σ është i barabartë me pesë (σ = 5), që korrespondon me vlerën p = 1/3.5 milion. Në studimet e gjenomit, niveli i rëndësisë mund të jetë 5 × 10 - 8, gjë që nuk është e pazakontë për këto zona.

Efikasiteti

Duhet të merret parasysh se koeficientët α dhe p-vlera nuk janë specifikimet e sakta. Cilido qoftë niveli i rëndësisë në statistikat e fenomenit në studim, ai nuk është një bazë e pakushtëzuar për të pranuar hipotezën. Për shembull, sa më e vogël të jetë vlera e α, aq më e madhe është mundësia që hipoteza të jetë e rëndësishme. Megjithatë, ekziston rreziku i gabimit, i cili redukton fuqinë (rëndësinë) statistikore të studimit.

Studiuesit që fokusohen vetëm në rezultate statistikisht të rëndësishme mund të arrijnë në përfundime të gabuara. Në të njëjtën kohë, është e vështirë të kontrollohet dyfish puna e tyre, pasi ata aplikojnë supozime (që në fakt janë vlerat α dhe p). Prandaj, rekomandohet gjithmonë, së bashku me llogaritjen e rëndësisë statistikore, të përcaktohet një tregues tjetër - madhësia e efektit statistikor. Madhësia e efektit është një masë sasiore e fuqisë së një efekti.

Koncepti i rëndësisë statistikore

Besueshmëria statistikore është thelbësore në praktikën e llogaritjes së FCC. Është vërejtur më parë se mostra të shumta mund të zgjidhen nga e njëjta popullatë:

Nëse ato zgjidhen saktë, atëherë treguesit e tyre mesatarë dhe treguesit e popullsisë së përgjithshme ndryshojnë pak nga njëri-tjetri në madhësinë e gabimit të përfaqësimit, duke marrë parasysh besueshmërinë e pranuar;

Nëse zgjidhen nga popullata të ndryshme, diferenca mes tyre rezulton të jetë e rëndësishme. Statistikat kanë të bëjnë me krahasimin e mostrave;

Nëse ato ndryshojnë në mënyrë të parëndësishme, joparimore, në mënyrë të parëndësishme, domethënë, ata në të vërtetë i përkasin të njëjtës popullatë të përgjithshme, ndryshimi midis tyre quhet statistikisht jo të besueshme.

Statistikisht e besueshme Diferenca e mostrës është një kampion që ndryshon në mënyrë të konsiderueshme dhe thelbësore, domethënë i përket popullatave të ndryshme të përgjithshme.

Në FCC, vlerësimi i rëndësisë statistikore të dallimeve të mostrës nënkupton zgjidhjen e shumë problemeve praktike. Për shembull, futja e metodave të reja të mësimdhënies, programeve, grupeve të ushtrimeve, testeve, ushtrimeve të kontrollit shoqërohet me testimin e tyre eksperimental, i cili duhet të tregojë se grupi testues është thelbësisht i ndryshëm nga grupi i kontrollit. Prandaj, përdoren metoda të veçanta statistikore, të quajtura kriteret e besueshmërisë statistikore, duke lejuar zbulimin e pranisë ose mungesës së një ndryshimi statistikisht të rëndësishëm midis mostrave.

Të gjitha kriteret ndahen në dy grupe: parametrike dhe joparametrike. Kriteret parametrike parashikojnë praninë e detyrueshme të një ligji normal të shpërndarjes, d.m.th. kjo nënkupton përcaktimin e detyrueshëm të treguesve kryesorë të ligjit normal - mesatares aritmetike X dhe devijimi standard o. Kriteret parametrike janë më të sakta dhe më të sakta. Testet joparametrike bazuar në dallimet e renditjes (rendore) ndërmjet elementeve të mostrës.

Këtu janë kriteret kryesore për rëndësinë statistikore të përdorura në praktikën e FCC: Testi i studentit, testi i Fisher, testi Wilcoxon, testi i White, testi i Van der Waerden (testi i shenjave).

Testi i studentit emëruar pas shkencëtarit anglez K. Gosset (Studenti - pseudonim), i cili zbuloi këtë metodë. Testi i studentit është parametrike, përdoret për të krahasuar treguesit absolut të mostrave. Mostrat mund të ndryshojnë në madhësi.

T-testi i Studentit përcaktohet si më poshtë.

1. Gjeni T-testin e Studentit t sipas formulës së mëposhtme:

Ku Xi, x 2 - mesataret aritmetike të mostrave të krahasuara; /i ь w 2 - gabimet e përfaqësimit të identifikuara në bazë të treguesve të mostrave të krahasuara.

2. Praktika në FCC ka treguar se për punë sportive mjafton të pranohet besueshmëria e llogarisë R= 0,95.

63 Për besueshmërinë e llogarisë: P= 0,95 (a = 0,05), me numrin e gradave; lirinë k= «! + f 2 - 2, duke përdorur tabelën në Shtojcën 4, gjejmë vlerën \ mirë, vlera kufi e kriterit (^gr).

3. Në bazë të vetive të ligjit të shpërndarjes normale, bëhet krahasimi në testin Studenti t Dhe t^.

4. Ne nxjerrim përfundime:

Nëse t> ftp, atëherë diferenca ndërmjet mostrave të krahasuara është statistikisht e rëndësishme;

Nëse t< 7 F, atëherë diferenca është statistikisht e parëndësishme.

Për kërkuesit e FCS, vlerësimi i rëndësisë statistikore është hapi i parë në zgjidhjen e një problemi specifik: nëse ka një ndryshim themelor ose jo themelor midis; krahasohen mostrat. Hapi tjetër është; vlerësimi i këtij ndryshimi nga pikëpamja pedagogjike, e cila përcaktohet nga kushtet e detyrës.