Popullata e përgjithshme dhe studimi i mostrës. Rëndësia statistikore. Termat dhe konceptet bazë të statistikave mjekësore

Rëndësia statistikore

Rezultatet e marra duke përdorur një procedurë të veçantë kërkimore quhen statistikisht të rëndësishme, nëse probabiliteti i shfaqjes së tyre të rastësishme është shumë i vogël. Ky koncept mund të ilustrohet me shembullin e hedhjes së një monedhe. Supozoni se monedha është hedhur 30 herë; Kokat u ngritën 17 herë dhe bishtat u ngritën 13 herë. E bën atë domethënëse devijimi i këtij rezultati nga ai i pritshëm (15 koka dhe 15 bishta), apo është ky devijim i rastësishëm? Për t'iu përgjigjur kësaj pyetjeje, për shembull, mund të hidhni të njëjtën monedhë shumë herë, 30 herë me radhë, dhe në të njëjtën kohë të vini re se sa herë përsëritet raporti i "kokave" me "bishtin" prej 17:13. Analiza statistikore na shpëton nga ky proces i lodhshëm. Me ndihmën e saj, pas 30 hedhjeve të para të një monedhe, mund të vlerësoni numrin e mundshëm të dukurive të rastësishme prej 17 "kokave" dhe 13 "bishtave". Një vlerësim i tillë quhet një deklaratë probabiliste.

Në literaturën shkencore mbi psikologjinë industriale-organizative, deklarata probabiliste në formë matematikore shënohet me shprehjen R(probabilitet)< (менее) 0,05 (5 %), которое следует читать как «вероятность менее 5 %». В примере с киданием монеты это утверждение будет означать, что если исследователь проведет 100 опытов, каждый раз кидая монету по 30 раз, то он может ожидать случайного выпадения комбинации из 17 «орлов» и 13 «решек» менее, чем в 5 опытах. Этот результат будет сочтен статистически значимым, поскольку в индустриально-организационной психологии уже давно приняты стандарты статистической значимости 0,05 и 0,01 (R< 0.01). Ky fakt është i rëndësishëm për të kuptuar literaturën, por nuk duhet kuptuar se është e pakuptimtë të bëhen vëzhgime që nuk i plotësojnë këto standarde. Të ashtuquajturat rezultate kërkimore jo të rëndësishme (vëzhgime që mund të merren rastësisht) më shumë një deri në pesë herë nga 100) mund të jetë shumë i dobishëm në identifikimin e tendencave dhe si një udhëzues për kërkimet e ardhshme.

Duhet të theksohet gjithashtu se jo të gjithë psikologët pajtohen me standardet dhe procedurat tradicionale (p.sh., Cohen, 1994; Sauley & Bedeian, 1989). Çështjet e matjes janë në vetvete një temë kryesore e punës për shumë studiues që studiojnë saktësinë e metodave të matjes dhe supozimet që qëndrojnë në themel të tyre. metodat ekzistuese dhe standardet, si dhe zhvillimin e mjekëve dhe mjeteve të reja. Ndoshta diku në të ardhmen, kërkimi në këtë fuqi do të çojë në ndryshime në standardet tradicionale për vlerësimin e rëndësisë statistikore dhe këto ndryshime do të fitojnë pranim të gjerë. (Divizioni i Pestë i Shoqatës Psikologjike Amerikane është një grup psikologësh që specializohen në studimin e vlerësimit, matjes dhe statistikave.)

Në raportet kërkimore, një deklaratë probabiliste si p.sh R< 0.05, për shkak të disa statistika, pra një numër që fitohet si rezultat i një grupi të caktuar procedurash llogaritëse matematikore. Konfirmimi probabilistik merret duke krahasuar këto statistika me të dhënat nga tabelat e veçanta që publikohen për këtë qëllim. Në kërkimet psikologjike industriale-organizative, statistikat si p.sh r, F, t, r>(lexo “chi Square”) dhe R(lexo "shumës" R"). Në secilin rast, statistikat (një numër) të marra nga analiza e një sërë vëzhgimesh mund të krahasohen me numrat nga një tabelë e publikuar. Pas kësaj, ju mund të formuloni një deklaratë probabiliste në lidhje me probabilitetin e marrjes së rastësishme të këtij numri, domethënë të nxirrni një përfundim në lidhje me rëndësinë e vëzhgimeve.

Për të kuptuar studimet e përshkruara në këtë libër, mjafton të kemi një kuptim të qartë të konceptit të rëndësisë statistikore dhe jo domosdoshmërisht të dimë se si llogariten statistikat e përmendura më sipër. Megjithatë, do të ishte e dobishme të diskutohej një supozim që qëndron në themel të të gjitha këtyre procedurave. Ky është supozimi se të gjitha variablat e vëzhguara janë të shpërndara përafërsisht normalisht. Përveç kësaj, gjatë leximit të raporteve mbi kërkimet psikologjike industriale-organizative, shpesh hasen tre koncepte të tjera që luajnë një rol të rëndësishëm - së pari, korrelacioni dhe komunikimi korrelativ, së dyti, ndryshorja përcaktuese/parashikuese dhe "ANOVA" (analiza e variancës), në - së treti, një grup metodash statistikore nën emrin e përgjithshëm "meta-analizë".

Hulumtimi zakonisht fillon me disa supozime që kërkojnë verifikim duke përdorur fakte. Ky supozim - një hipotezë - formulohet në lidhje me lidhjen e fenomeneve ose vetive në një grup të caktuar objektesh.

Për të testuar supozime të tilla kundrejt fakteve, është e nevojshme të maten vetitë përkatëse të bartësve të tyre. Por është e pamundur të matet ankthi tek të gjitha femrat dhe meshkujt, ashtu siç është e pamundur të matet agresiviteti tek të gjithë adoleshentët. Prandaj, gjatë kryerjes së hulumtimit, ai kufizohet vetëm në një grup relativisht të vogël përfaqësuesish të popullatave përkatëse të njerëzve.

Popullatë- ky është tërësia e objekteve në lidhje me të cilat formulohet një hipotezë kërkimore.

Për shembull, të gjithë burrat; ose të gjitha gratë; ose të gjithë banorët e një qyteti. Popullatat e përgjithshme në lidhje me të cilat studiuesi do të nxjerrë përfundime bazuar në rezultatet e studimit mund të jenë më modeste në numër, për shembull, të gjithë nxënësit e klasës së parë të një shkolle të caktuar.

Kështu, popullsia e përgjithshme është, megjithëse jo e pafundme në numër, por, si rregull, e paarritshme për kërkime të vazhdueshme, një grup subjektesh potenciale.

Mostra ose popullata e mostrës- ky është një grup objektesh të kufizuara në numër (në psikologji - lëndë, të anketuar), të zgjedhur posaçërisht nga popullata e përgjithshme për të studiuar vetitë e tij. Prandaj, quhet studimi i vetive të popullatës së përgjithshme duke përdorur një mostër studim kampionimi. Pothuajse gjithçka kërkime psikologjike janë marrë kampione dhe përfundimet e tyre shtrihen në popullatat e përgjithshme.

Kështu, pasi është formuluar një hipotezë dhe janë identifikuar popullatat përkatëse, studiuesi përballet me problemin e organizimit të një kampioni. Mostra duhet të jetë e tillë që të justifikohet përgjithësimi i përfundimeve të studimit kampion - përgjithësimi, shtrirja e tyre në popullatën e përgjithshme. Kriteret kryesore për vlefshmërinë e përfundimeve të kërkimit— këto janë përfaqësimi i kampionit dhe besueshmëria statistikore e rezultateve (empirike).

Përfaqësueshmëria e kampionit- me fjalë të tjera, përfaqësimi i tij është aftësia e kampionit për të përfaqësuar plotësisht fenomenet në studim - nga pikëpamja e ndryshueshmërisë së tyre në popullatën e përgjithshme.

Natyrisht, vetëm popullata e përgjithshme mund të japë një pasqyrë të plotë të fenomenit që studiohet, në të gjithë gamën e tij dhe nuancat e ndryshueshmërisë. Prandaj, përfaqësimi është gjithmonë i kufizuar në masën që kampioni është i kufizuar. Dhe është përfaqësimi i kampionit ai që është kriteri kryesor në përcaktimin e kufijve të përgjithësimit të gjetjeve të kërkimit. Sidoqoftë, ka teknika që bëjnë të mundur marrjen e një përfaqësimi të mostrës të mjaftueshme për studiuesin (Këto teknika studiohen në kursin "Psikologji Eksperimentale").

Teknika e parë dhe kryesore është përzgjedhja e thjeshtë e rastësishme (të rastësishme). Ai përfshin sigurimin e kushteve të tilla që çdo anëtar i popullatës të ketë shanse të barabarta me të tjerët për t'u përfshirë në kampion. Përzgjedhja e rastësishme siguron mundësinë për të hyrë më së shumti në kampion përfaqësues të ndryshëm popullata e përgjithshme. Në këtë rast, merren masa të veçanta për të parandaluar shfaqjen e ndonjë modeli gjatë përzgjedhjes. Dhe kjo na lejon të shpresojmë se në fund, në kampion, prona që studiohet do të përfaqësohet, nëse jo në të gjitha, atëherë në diversitetin maksimal të mundshëm.

Mënyra e dytë për të siguruar përfaqësimin është kampionimi i rastësishëm i shtresuar, ose përzgjedhja e bazuar në vetitë e popullatës së përgjithshme. Ai përfshin një përcaktim paraprak të atyre cilësive që mund të ndikojnë në ndryshueshmërinë e pronës që studiohet (kjo mund të jetë gjinia, niveli i të ardhurave ose arsimimi, etj.). Pastaj përcaktohet përqindje sigurohet numri i grupeve (shtresave) që ndryshojnë në këto cilësi në popullatën e përgjithshme dhe një përqindje identike e grupeve përkatëse në kampion. Më pas, subjektet zgjidhen në secilin nëngrup të kampionit sipas parimit të përzgjedhjes së thjeshtë të rastësishme.

Rëndësia statistikore, ose rëndësisë statistikore, rezultatet e një studimi përcaktohen duke përdorur metodat e konkluzionit statistikor.

A jemi të siguruar nga gabimet kur marrim vendime, kur nxjerrim përfundime të caktuara nga rezultatet e hulumtimit? Sigurisht që jo. Në fund të fundit, vendimet tona bazohen në rezultatet e studimit të popullatës së mostrës, si dhe në nivelin e njohurive tona psikologjike. Ne nuk jemi plotësisht të imunizuar nga gabimet. Në statistika, gabime të tilla konsiderohen të pranueshme nëse ndodhin jo më shpesh se në një rast nga 1000 (probabiliteti i gabimit α = 0,001 ose probabiliteti i besimit të lidhur për një përfundim të saktë p = 0,999); në një rast nga 100 (probabiliteti i gabimit α = 0,01 ose probabiliteti i lidhur me besimin e një përfundimi të saktë p = 0,99) ose në pesë raste nga 100 (probabiliteti i gabimit α = 0,05 ose probabiliteti i lidhur me besimin e një përfundimi të saktë p=0.95). Pikërisht në dy nivelet e fundit merren vendimet në psikologji.

Ndonjëherë, kur flasin për rëndësinë statistikore, ata përdorin konceptin e "nivelit të rëndësisë" (i shënuar si α). Vlerat numerike të p dhe α plotësojnë njëra-tjetrën deri në 1000 - një grup i plotë ngjarjesh: ose kemi bërë përfundimin e duhur, ose kemi bërë një gabim. Këto nivele nuk llogariten, janë të dhëna. Niveli i rëndësisë mund të kuptohet si një lloj vije "e kuqe", kryqëzimi i së cilës do të na lejojë të flasim për këtë ngjarje si jo të rastësishme. Në çdo raport apo publikim të mirë shkencor, përfundimet e nxjerra duhet të shoqërohen me një tregues të vlerave p ose α në të cilat janë nxjerrë përfundimet.

Metodat e konkluzionit statistikor diskutohen në detaje në kursin Statistika Matematikore. Tani vetëm vërejmë se ata kanë kërkesa të caktuara për numrin, ose Madhësia e mostrës.

Fatkeqësisht, nuk ka udhëzime strikte për përcaktimin paraprak të madhësisë së kërkuar të mostrës. Për më tepër, pyetja për numrin e nevojshëm dhe të mjaftueshëm studiuesi zakonisht e merr shumë vonë - vetëm pasi të ketë analizuar të dhënat e një kampioni tashmë të anketuar. Sidoqoftë, rekomandimet më të përgjithshme mund të formulohen:

1. Madhësia më e madhe e mostrës kërkohet kur zhvillohet një teknikë diagnostikuese - nga 200 në 1000-2500 njerëz.

2. Nëse është e nevojshme të krahasohen 2 mostra, numri i përgjithshëm i tyre duhet të jetë së paku 50 persona; numri i mostrave që krahasohen duhet të jetë afërsisht i njëjtë.

3. Nëse po studiohet marrëdhënia ndërmjet ndonjë prone, atëherë madhësia e kampionit duhet të jetë së paku 30-35 persona.

4. Sa më shumë ndryshueshmëria prona që studiohet, aq më e madhe duhet të jetë madhësia e kampionit. Prandaj, ndryshueshmëria mund të reduktohet duke rritur homogjenitetin e kampionit, për shembull, sipas gjinisë, moshës, etj. Kjo, natyrisht, zvogëlon aftësinë për të përgjithësuar përfundimet.

Mostrat e varura dhe të pavarura. Një situatë e zakonshme kërkimore është kur një veti me interes për një studiues studiohet në dy ose më shumë mostra me qëllim krahasimi të mëtejshëm. Këto mostra mund të jenë në përmasa të ndryshme, në varësi të procedurës për organizimin e tyre. Mostrat e pavarura karakterizohen nga fakti se probabiliteti i përzgjedhjes së ndonjë lënde në një kampion nuk varet nga përzgjedhja e ndonjë prej lëndëve në një kampion tjetër. Kundër, mostrat e varura karakterizohen nga fakti se çdo subjekt nga një kampion përputhet sipas një kriteri të caktuar nga një subjekt nga një kampion tjetër.

Në përgjithësi, mostrat e varura përfshijnë zgjedhjen në çift të subjekteve në mostra të krahasuara, dhe mostrat e pavarura nënkuptojnë një përzgjedhje të pavarur të subjekteve.

Duhet të theksohet se rastet e mostrave "pjesërisht të varura" (ose "pjesërisht të pavarura") janë të papranueshme: kjo në mënyrë të paparashikueshme cenon përfaqësimin e tyre.

Si përfundim, vërejmë se mund të dallohen dy paradigma të kërkimit psikologjik.

E ashtuquajtura R-metodologjia përfshin studimin e ndryshueshmërisë së një vetie të caktuar (psikologjike) nën ndikimin e një ndikimi, faktori ose vetie tjetër të caktuar. Një mostër është një grup lëndësh.

Një tjetër qasje Q-metodologjia, përfshin studimin e ndryshueshmërisë së një subjekti (individi) nën ndikimin e stimujve të ndryshëm (kushte, situata, etj.). Ajo korrespondon me situatën kur mostra është një grup stimujsh.

Rëndësia statistikore e një rezultati (p-vlera) është një masë e vlerësuar e besimit në "të vërtetën" e tij (në kuptimin e "përfaqësueshmërisë së kampionit"). Duke folur më teknikisht, një vlerë p është një masë që ndryshon në rendin në rënie të madhësisë me besueshmërinë e rezultatit. Më shumë P-vlerë e lartë korrespondon me një nivel më të ulët besimi në marrëdhënien midis variablave të gjetur në kampion. Në mënyrë të veçantë, vlera p përfaqëson probabilitetin e gabimit të lidhur me përgjithësimin e rezultatit të vëzhguar për të gjithë popullatën. Për shembull, një vlerë p prej 0.05 (d.m.th. 1/20) tregon se ekziston një shans 5% që lidhja midis variablave të gjetur në mostër të jetë vetëm një tipar i rastësishëm i kampionit. Me fjalë të tjera, nëse një marrëdhënie e caktuar nuk ekziston në një popullatë, dhe ju kryeni eksperimente të ngjashme shumë herë, atëherë në rreth një në njëzet përsëritje të eksperimentit do të prisnit të njëjtën marrëdhënie ose më të fortë midis variablave.

Në shumë studime, një vlerë p prej 0.05 konsiderohet një "marzhë e pranueshme" për nivelin e gabimit.

Nuk ka asnjë mënyrë për të shmangur arbitraritetin në vendosjen se cili nivel i rëndësisë duhet të konsiderohet vërtet "i rëndësishëm". Zgjedhja e një niveli të caktuar rëndësie mbi të cilin rezultatet refuzohen si të rreme është mjaft arbitrare. Në praktikë, vendimi përfundimtar zakonisht varet nga fakti nëse rezultati ishte parashikuar a priori (d.m.th., përpara se të kryhej eksperimenti) ose u zbulua a posteriori si rezultat i shumë analizave dhe krahasimeve të kryera në një sërë të dhënash, si dhe në traditën e fushës së studimit. Në mënyrë tipike, në shumë fusha, rezultati i p 0.05 është një kufi i pranueshëm për rëndësinë statistikore, por duhet mbajtur mend se ky nivel ende përfshin një shkallë gabimi mjaft të madh (5%). Rezultatet e rëndësishme në nivelin p 0.01 përgjithësisht konsiderohen të rëndësishme statistikisht dhe rezultatet me një nivel p 0.005 ose p 0.001 përgjithësisht konsiderohen si shumë domethënëse. Sidoqoftë, duhet kuptuar se ky klasifikim i niveleve të rëndësisë është mjaft arbitrar dhe është thjesht një marrëveshje joformale e miratuar në bazë të përvojë praktike në një ose një fushë tjetër të kërkimit.

Siç është përmendur tashmë, madhësia e varësisë dhe besueshmërisë përfaqësojnë dy karakteristika të ndryshme varësitë ndërmjet variablave. Megjithatë, nuk mund të thuhet se ata janë plotësisht të pavarur. Duke folur gjuha e përbashkët, sa më e madhe të jetë madhësia e varësisë (lidhja) ndërmjet variablave në një kampion me madhësi normale, aq më i besueshëm është.

Nëse supozojmë se nuk ka asnjë lidhje midis variablave përkatës në popullatë, atëherë ka shumë të ngjarë të pritet që në kampionin në studim nuk do të ketë gjithashtu asnjë lidhje midis këtyre variablave. Kështu, sa më e fortë të gjendet një lidhje në një kampion, aq më pak ka gjasa që marrëdhënia të mos ekzistojë në popullatën nga e cila është nxjerrë.

Madhësia e kampionit ndikon në rëndësinë e marrëdhënies. Nëse ka pak vëzhgime, atëherë ka përkatësisht pak kombinime të mundshme vlerash për këto variabla dhe kështu probabiliteti për të zbuluar aksidentalisht një kombinim vlerash që tregon një marrëdhënie të fortë është relativisht i lartë.

Si llogaritet niveli i rëndësisë statistikore. Le të supozojmë se ju keni llogaritur tashmë një masë të varësisë midis dy variablave (siç shpjegohet më lart). Pyetja tjetër me të cilën përballeni është: "sa e rëndësishme është kjo marrëdhënie?" Për shembull, a mjafton 40% varianca e shpjeguar ndërmjet dy variablave për ta konsideruar lidhjen të rëndësishme? Përgjigja: "në varësi të rrethanave". Domethënë, rëndësia varet kryesisht nga madhësia e kampionit. Siç është shpjeguar tashmë, në mostrat shumë të mëdha edhe marrëdhëniet shumë të dobëta midis variablave do të jenë domethënëse, ndërsa në mostrat e vogla edhe marrëdhëniet shumë të forta nuk janë të besueshme. Kështu, për të përcaktuar nivelin e rëndësisë statistikore, ju nevojitet një funksion që përfaqëson marrëdhënien midis "madhësive" dhe "rëndësisë" së marrëdhënies midis variablave për çdo madhësi kampion. Ky funksion do t'ju tregojë saktësisht "sa ka gjasa të merret një marrëdhënie e një vlere të caktuar (ose më shumë) në një kampion të një madhësie të caktuar, duke supozuar se nuk ka një lidhje të tillë në popullatë." Me fjalë të tjera, ky funksion do të jepte nivelin e rëndësisë (p-vlera), dhe rrjedhimisht mundësinë e refuzimit të rremë të supozimit se një marrëdhënie e caktuar nuk ekziston në popullatë. Kjo hipotezë "alternative" (që nuk ka marrëdhënie në popullatë) zakonisht quhet hipoteza zero. Do të ishte ideale nëse funksioni që llogarit probabilitetin e gabimit do të ishte linear dhe do të kishte vetëm pjerrësi të ndryshme për madhësi të ndryshme të mostrës. Fatkeqësisht, ky funksion është shumë më kompleks dhe nuk është gjithmonë saktësisht i njëjtë. Megjithatë, në shumicën e rasteve forma e tij është e njohur dhe mund të përdoret për të përcaktuar nivelet e rëndësisë në studimet e mostrave të një madhësie të caktuar. Shumica e këtyre funksioneve shoqërohen me një klasë shumë të rëndësishme shpërndarjesh të quajtur normale.

Le të shqyrtojmë një shembull tipik të aplikimit të metodave statistikore në mjekësi. Krijuesit e ilaçit sugjerojnë se ai rrit diurezën në përpjesëtim me dozën e marrë. Për të testuar këtë hipotezë, ata u japin pesë vullnetarëve doza të ndryshme të barit.

Bazuar në rezultatet e vëzhgimit, paraqitet grafiku i diurezës kundrejt dozës (Fig. 1.2A). Varësia është e dukshme me sy të lirë. Studiuesit urojnë njëri-tjetrin për zbulimin dhe bota për diuretikin e ri.

Në fakt, të dhënat na lejojnë vetëm të deklarojmë me besueshmëri se tek këta pesë vullnetarë është vërejtur një diurezë e varur nga doza. Fakti që kjo varësi do të shfaqet tek të gjithë njerëzit që marrin ilaçin nuk është më shumë se një supozim.
Z Y

jeta Nuk mund të thuhet se është e pabazë - përndryshe, pse të kryhen eksperimente?

Por droga doli në shitje. Gjithnjë e më shumë njerëz po e marrin atë me shpresën për të rritur prodhimin e urinës. Pra, çfarë shohim? Ne shohim figurën 1.2B, e cila tregon mungesën e ndonjë lidhjeje midis dozës së barit dhe diurezës. Rrathët e zinj tregojnë të dhëna nga studimi origjinal. Statistikat kanë metoda që na lejojnë të vlerësojmë mundësinë e marrjes së një kampioni të tillë "jopërfaqësues" dhe në të vërtetë konfuz. Rezulton se në mungesë të një lidhjeje midis diurezës dhe dozës së barit, "varësia" që rezulton do të vërehej në afërsisht 5 nga 1000 eksperimente. Pra, në këtë rast, studiuesit ishin thjesht të pafat. Edhe sikur të kishin përdorur metodat më të avancuara statistikore, sërish nuk do t'i pengonte të bënin gabime.

E dhamë këtë shembull fiktiv, por aspak larg realitetit, për të mos vënë në dukje kotësinë
e statistikave. Ai flet për diçka tjetër, për natyrën probabiliste të përfundimeve të saj. Si rezultat i aplikimit të metodës statistikore, ne nuk marrim të vërtetën përfundimtare, por vetëm një vlerësim të probabilitetit të një supozimi të caktuar. Përveç kësaj, çdo metodë statistikore bazohet në modelin e vet matematikor dhe rezultatet e saj janë të sakta në masën që ky model korrespondon me realitetin.

Më shumë mbi temën BESUESHMËRIA DHE RËNDËSIA STATISTIKORE:

Dallime statistikisht domethënëse në treguesit e cilësisë së jetës
Popullsia statistikore. Karakteristikat e kontabilitetit. Koncepti i kërkimit të vazhdueshëm dhe selektiv. Kërkesat për të dhëna statistikore dhe përdorimin e dokumenteve të kontabilitetit dhe raportimit
ABSTRAKT. STUDIMI I BESUESHMËRISË SË TREGUESVE TË TONOMETRAVE PËR MATJEN E PRISJES INTRAOKULARE NË TË GJYQËS SË QYRËS 2018, 2018

Koncepti i rëndësisë statistikore

Rëndësia statistikore ka një rëndësi të madhe në praktikën llogaritëse të FCC. Është vërejtur më parë se mostra të shumta mund të zgjidhen nga e njëjta popullatë:

Nëse ato zgjidhen saktë, atëherë treguesit e tyre mesatarë dhe treguesit e popullsisë së përgjithshme ndryshojnë pak nga njëri-tjetri në madhësinë e gabimit të përfaqësimit, duke marrë parasysh besueshmërinë e pranuar;

Nëse zgjidhen nga popullata të ndryshme, diferenca mes tyre rezulton të jetë e rëndësishme. Statistikat kanë të bëjnë me krahasimin e mostrave;

Nëse ato ndryshojnë në mënyrë të parëndësishme, joparimore, në mënyrë të parëndësishme, domethënë, ata në të vërtetë i përkasin të njëjtës popullatë të përgjithshme, ndryshimi midis tyre quhet statistikisht jo të besueshme.

Statistikisht e besueshme Diferenca e mostrës është një kampion që ndryshon në mënyrë të konsiderueshme dhe thelbësore, domethënë i përket popullatave të ndryshme të përgjithshme.

Në FCC, vlerësimi i rëndësisë statistikore të dallimeve të mostrës nënkupton zgjidhjen e shumë problemeve praktike. Për shembull, futja e metodave të reja të mësimdhënies, programeve, grupeve të ushtrimeve, testeve, ushtrimeve të kontrollit shoqërohet me testimin e tyre eksperimental, i cili duhet të tregojë se grupi testues është thelbësisht i ndryshëm nga grupi i kontrollit. Prandaj, përdoren metoda të veçanta statistikore, të quajtura kriteret e besueshmërisë statistikore, duke lejuar zbulimin e pranisë ose mungesës së një ndryshimi statistikisht të rëndësishëm midis mostrave.

Të gjitha kriteret ndahen në dy grupe: parametrike dhe joparametrike. Kriteret parametrike parashikojnë praninë e detyrueshme të një ligji normal të shpërndarjes, d.m.th. kjo nënkupton përcaktimin e detyrueshëm të treguesve kryesorë të ligjit normal - mesatares aritmetike X dhe devijimi standard o. Kriteret parametrike janë më të sakta dhe më të sakta. Testet joparametrike bazuar në dallimet e renditjes (rendore) ndërmjet elementeve të mostrës.

Këtu janë kriteret kryesore për rëndësinë statistikore të përdorura në praktikën e FCC: Testi i studentit, testi i Fisher, testi Wilcoxon, testi i White, testi i Van der Waerden (testi i shenjave).

Testi i studentit emëruar pas shkencëtarit anglez K. Gosset (Studenti - pseudonim), i cili zbuloi këtë metodë. Testi i studentit është parametrike, përdoret për të krahasuar treguesit absolut të mostrave. Mostrat mund të ndryshojnë në madhësi.

T-testi i Studentit përcaktohet si më poshtë.

1. Gjeni T-testin e Studentit t sipas formulës së mëposhtme:

Ku Xi, x 2 - mesataret aritmetike të mostrave të krahasuara; /i ь w 2 - gabimet e përfaqësimit të identifikuara në bazë të treguesve të mostrave të krahasuara.

2. Praktika në FCC ka treguar se për punë sportive mjafton të pranohet besueshmëria e llogarisë R= 0,95.

63 Për besueshmërinë e llogarisë: P= 0,95 (a = 0,05), me numrin e gradave; lirinë k= «! + f 2 - 2, duke përdorur tabelën në Shtojcën 4, gjejmë vlerën \ mirë, vlera kufi e kriterit (^gr).

3. Në bazë të vetive të ligjit të shpërndarjes normale, bëhet krahasimi në testin Studenti t Dhe t^.

4. Ne nxjerrim përfundime:

Nëse t> ftp, atëherë diferenca ndërmjet mostrave të krahasuara është statistikisht e rëndësishme;

Nëse t< 7 F, atëherë diferenca është statistikisht e parëndësishme.

Për kërkuesit e FCS, vlerësimi i rëndësisë statistikore është hapi i parë në zgjidhjen e një problemi specifik: nëse ka një ndryshim themelor ose jo themelor midis; krahasohen mostrat. Hapi tjetër është; vlerësimi i këtij ndryshimi nga pikëpamja pedagogjike, e cila përcaktohet nga kushtet e detyrës.