statistiskā nozīme. Uzticamība un statistiskais nozīmīgums

APMAKSĀTA FUNKCIJA. Statistiskā nozīmīguma funkcija ir pieejama tikai ar dažiem cenu plāniem. Pārbaudiet, vai tas ir iekšā.

Varat noskaidrot, vai ir statistiski nozīmīgas atšķirības saņemtajās atbildēs no dažādām respondentu grupām uz jautājumiem aptaujā. Lai strādātu ar statistiskā nozīmīguma funkciju programmā SurveyMonkey, jums ir:

  • Iespējojiet statistiskā nozīmīguma funkciju, kad aptaujas jautājumam pievienojat salīdzināšanas kārtulu. Atlasiet Salīdzināšanas grupas, lai kārtotu aptaujas rezultātus grupās, lai tos varētu viegli salīdzināt.
  • Izpētiet savu aptaujas jautājumu datu tabulas, lai noteiktu, vai ir statistiski nozīmīgas atšķirības saņemtajās atbildēs no dažādām respondentu grupām.

Statistiskā nozīmīguma skatīšana

Veicot tālāk norādītās darbības, varat izveidot aptauju, kas parāda statistisko nozīmīgumu.

1. Pievienojiet slēgtos jautājumus savai aptaujai

Lai rezultātu analīzes laikā parādītu statistisko nozīmīgumu, jebkuram aptaujas jautājumam būs jāpiemēro salīdzināšanas kārtula.

Varat lietot salīdzināšanas kārtulu un aprēķināt statistisko nozīmību atbildēs, ja aptaujas noformējumā izmantojat kādu no tālāk norādītajām iespējām. šādus veidus jautājumi:

Jāpārliecinās, vai piedāvātos atbilžu variantus var sadalīt pilnvērtīgās grupās. Atbilžu izvēles, kuras atlasāt salīdzināšanai, veidojot salīdzināšanas kārtulu, tiks izmantotas, lai visā aptaujā pārbaudītu jūsu datus.

2. Savāc atbildes

Kad esat aizpildījis aptauju, izveidojiet savācēju, lai to izplatītu. Ir vairāki veidi.

Lai aktivizētu un skatītu statistisko nozīmīgumu, katrai atbildes opcijai, ko plānojat izmantot savā salīdzināšanas kārtulā, ir jāsaņem vismaz 30 atbildes.

Aptaujas piemērs

Jūs vēlaties uzzināt, vai vīrieši ir ievērojami vairāk apmierināti ar jūsu produktiem nekā sievietes.

  1. Pievienojiet savai aptaujai divus jautājumus ar atbilžu variantiem:
    Kāds ir Jūsu dzimums? (Vīrietis sieviete)
    Vai esat apmierināts vai neapmierināts ar mūsu produktu? (apmierināts (-lini), neapmierināts (-lini))
  2. Pārliecinieties, ka vismaz 30 respondenti dzimuma jautājumam izvēlas “vīrietis”, UN ARĪ vismaz 30 respondenti kā savu dzimumu izvēlas “sieviete”.
  3. Pievienojiet salīdzināšanas kārtulu jautājumam "Kāds ir jūsu dzimums?" un atlasiet abas atbildes kā savas grupas.
  4. Izmantojiet datu lapu zem jautājumu tabulas "Vai esat apmierināts vai neapmierināts ar mūsu produktu?" lai redzētu, vai kāda no atbilžu izvēlēm uzrāda statistiski nozīmīgu atšķirību

Kāda ir statistiski nozīmīga atšķirība?

Statistiski nozīmīga atšķirība nozīmē, ka, izmantojot statistisko analīzi, pastāv būtiskas atšķirības starp vienas respondentu grupas atbildēm un citas grupas atbildēm. Statistiskā nozīmība nozīmē, ka iegūtie skaitļi būtiski atšķiras. Šādas zināšanas jums ļoti palīdzēs datu analīzē. Tomēr iegūto rezultātu nozīmi nosakāt jūs. Jūs esat tas, kurš izlemj, kā interpretēt aptauju rezultātus un kādas darbības būtu jāveic, pamatojoties uz tiem.

Piemēram, jūs saņemat vairāk pretenziju no pircējām sievietēm nekā no vīriešiem. Kā noteikt, vai šāda atšķirība ir reāla un vai šajā sakarā ir jārīkojas? Viens lielisks veids, kā pārbaudīt savus novērojumus, ir veikt aptauju, kas parādīs, vai vīrieši vīrieši ir ievērojami apmierinātāki ar jūsu produktu. Ar statistikas formulas palīdzību mūsu piedāvātā statistiskā nozīmīguma funkcija ļaus jums noteikt, vai jūsu produkts patiešām patīk vīriešiem daudz vairāk nekā sievietēm. Tas ļaus jums rīkoties, pamatojoties uz faktiem, nevis minējumiem.

Statistiski nozīmīga atšķirība

Ja jūsu rezultāti ir izcelti datu tabulā, tas nozīmē, ka abas respondentu grupas būtiski atšķiras viena no otras. Jēdziens “būtiski” nenozīmē, ka iegūtajiem skaitļiem ir kāda īpaša nozīme vai nozīme, bet tikai to, ka starp tiem pastāv statistiska atšķirība.

Nav statistiski nozīmīgas atšķirības

Ja jūsu rezultāti nav izcelti attiecīgajā datu tabulā, tas nozīmē, ka, neskatoties uz iespējamo atšķirību abos salīdzinātajos skaitļos, starp tiem nav statistiskas atšķirības.

Atbildes bez statistiski nozīmīgām atšķirībām parāda, ka, ņemot vērā jūsu izmantoto izlases lielumu, starp diviem salīdzinātajiem vienumiem nav būtiskas atšķirības, taču tas nebūt nenozīmē, ka tiem nav nozīmes. Iespējams, palielinot izlases lielumu, jūs varēsiet noteikt statistiski nozīmīgu atšķirību.

Parauga lielums

Ja jums ir ļoti mazs izlases lielums, būtiskas būs tikai ļoti lielas atšķirības starp abām grupām. Ja jums ir ļoti liels izlases lielums, gan nelielas, gan lielas atšķirības tiks uzskatītas par būtiskām.

Tomēr tas, ka divi skaitļi ir statistiski atšķirīgi, nenozīmē, ka atšķirība starp rezultātiem jums ir nozīmīga. praktiskā vērtība. Jums pašam būs jāizlemj, kuras atšķirības ir nozīmīgas jūsu aptaujā.

Statistiskā nozīmīguma aprēķins

Mēs aprēķinām statistisko nozīmīgumu, izmantojot standarta 95% ticamības līmeni. Ja atbildes iespēja ir parādīta kā statistiski nozīmīga, tas nozīmē, ka atšķirības starp abām grupām iespējamība ir mazāka par 5% tikai nejaušības vai izlases kļūdas dēļ (bieži tiek parādīta kā: p<0,05).

Lai aprēķinātu statistiski nozīmīgas atšķirības starp grupām, mēs izmantojam šādas formulas:

Parametrs

Apraksts

a1Pirmās grupas dalībnieku īpatsvars, kuri uz jautājumu atbildēja noteiktā veidā, reizināts ar šīs grupas izlases lielumu.
b1Otrās grupas dalībnieku īpatsvars, kuri uz jautājumu atbildēja noteiktā veidā, reizināts ar šīs grupas izlases lielumu.
Konsolidētā izlases daļa (p)Divu akciju summa no abām grupām.
Standarta kļūda (SE)Mērījums, kas parāda, cik ļoti jūsu daļa atšķiras no faktiskās daļas. Mazāka vērtība nozīmē, ka daļa ir tuvu faktiskajai daļai, lielāka vērtība nozīmē, ka daļa būtiski atšķiras no faktiskās daļas.
Pārbaudes statistika (t)Pārbaudes statistika. Standarta novirzes vērtību skaits, ar kurām šī vērtība atšķiras no vidējās.
Statistiskā nozīmeJa testa statistikas absolūtā vērtība pārsniedz 1,96* standarta novirzes no vidējā, to uzskata par statistiski nozīmīgu atšķirību.

*1,96 ir vērtība, ko izmanto 95% ticamības līmenim, jo ​​95% no Stjudenta t-testa apstrādātā diapazona atrodas 1,96 vidējās standarta novirzes robežās.

Aprēķinu piemērs

Turpinot ar iepriekš izmantoto piemēru, noskaidrosim, vai to vīriešu procentuālais daudzums, kuri apgalvo, ka ir apmierināti ar jūsu produktu, patiešām ir ievērojami lielāks nekā sieviešu īpatsvars.

Pieņemsim, ka jūsu aptaujā piedalījās 1000 vīriešu un 1000 sieviešu, un aptaujas rezultātā izrādījās, ka 70% vīriešu un 65% sieviešu apgalvo, ka ir apmierināti ar jūsu produktu. Vai 70% rezultāts ir ievērojami augstāks nekā 65% rezultāts?

Aizvietojiet šādus aptaujas datus ieteiktajās formulās:

  • p1 (% vīriešu, kas apmierināti ar produktu) = 0,7
  • p2 (% sieviešu apmierinātas ar produktu) = 0,65
  • n1 (intervēto vīriešu skaits) = 1000
  • n2 (intervēto sieviešu skaits) = 1000

Tā kā testa statistikas absolūtā vērtība ir lielāka par 1,96, tas nozīmē, ka atšķirība starp vīriešiem un sievietēm ir nozīmīga. Salīdzinot ar sievietēm, vīrieši, visticamāk, ir apmierināti ar jūsu produktu.

Slēpt statistisko nozīmīgumu

Kā paslēpt statistisko nozīmīgumu visiem jautājumiem

  1. Kreisajā sānjoslā noklikšķiniet uz lejupvērstās bultiņas pa labi no salīdzināšanas kārtulas.
  2. Izvēlieties vienumu Rediģēt kārtulu.
  3. Atspējot funkciju Rādīt statistisko nozīmīgumu izmantojot slēdzi.
  4. Noklikšķiniet uz pogas Pieteikties.

Lai paslēptu viena jautājuma statistisko nozīmīgumu, jums ir:

  1. Noklikšķiniet uz pogas Noskaņot virs jautājumu diagrammas.
  2. Atveriet cilni Displeja opcijas.
  3. Noņemiet atzīmi no izvēles rūtiņas blakus Statistiskā nozīme.
  4. Noklikšķiniet uz pogas Saglabāt.

Displeja opcija tiek automātiski iespējota, kad ir iespējots statistiskās nozīmes attēlojums. Ja noņemsit atzīmi no šīs parādīšanas opcijas, tiks atspējota arī statistiskā nozīmīguma rādīšana.

Ieslēdziet statistiskā nozīmīguma funkciju, kad aptaujas jautājumam pievienojat salīdzināšanas kārtulu. Pārbaudiet aptaujas jautājumu datu tabulas, lai noteiktu statistiski nozīmīgas atšķirības no dažādām respondentu grupām saņemtajās atbildēs.

Pētījumi parasti sākas ar kādu pieņēmumu, kas prasa pārbaudi, iesaistot faktus. Šis pieņēmums - hipotēze - tiek formulēts saistībā ar parādību vai īpašību saistību noteiktā objektu kopā.

Lai pārbaudītu šādus pieņēmumus uz faktiem, ir jāizmēra atbilstošās to nesēju īpašības. Bet nav iespējams izmērīt trauksmi visām sievietēm un vīriešiem, tāpat kā nav iespējams izmērīt agresivitāti visiem pusaudžiem. Tāpēc, veicot pētījumu, tie ir ierobežoti tikai ar salīdzinoši nelielu attiecīgo cilvēku populāciju pārstāvju grupu.

Populācija- tas ir viss objektu kopums, attiecībā uz kuriem tiek formulēta pētījuma hipotēze.

Piemēram, visi vīrieši; vai visas sievietes; vai visi pilsētas iedzīvotāji. Kopējās populācijas, par kurām pētnieks, pamatojoties uz pētījuma rezultātiem, gatavojas izdarīt secinājumus, var būt mazāks un pieticīgāks, piemēram, visi konkrētās skolas pirmklasnieki.

Tādējādi vispārējā populācija ir, lai gan ne bezgalīgi daudz, bet, kā likums, ir daudz potenciālu priekšmetu, kas nav pieejami nepārtrauktai izpētei.

Izlase vai izlases kopa- šī ir ierobežota skaita objektu grupa (psiholoģijā - subjekti, respondenti), no kuriem īpaši atlasīti populācija izpētīt tā īpašības. Attiecīgi tiek saukta vispārējās populācijas īpašību izpēte paraugā selektīvs pētījums. Gandrīz visi psiholoģiskie pētījumi ir selektīvi, un to secinājumi attiecas uz vispārējām populācijām.

Tādējādi pēc hipotēzes formulēšanas un atbilstošo vispārējo populāciju noteikšanas pētnieks saskaras ar izlases organizēšanas problēmu. Izlasei jābūt tādai, lai būtu pamatots izlases pētījuma secinājumu vispārinājums - vispārinājums, to sadalījums kopējā populācijā. Pētījuma secinājumu pamatotības galvenie kritērijitie ir izlases reprezentativitāte un (empīrisko) rezultātu statistiskais derīgums.

Izlases reprezentativitāte- citiem vārdiem sakot, tās reprezentativitāte ir izlases spēja reprezentēt pētāmās parādības diezgan pilnībā - no to mainīguma viedokļa vispārējā populācijā.

Protams, tikai vispārējā populācija var sniegt pilnīgu priekšstatu par pētāmo parādību visā tās diapazonā un mainīguma niansēs. Tāpēc reprezentativitāte vienmēr ir ierobežota tādā mērā, kā izlase ir ierobežota. Un tieši izlases reprezentativitāte ir galvenais kritērijs, nosakot pētījuma atziņu vispārinājuma robežas. Tomēr ir paņēmieni, kas ļauj iegūt pētniekam pietiekamu reprezentatīvu paraugu (Šīs tehnikas tiek pētītas kursā "Eksperimentālā psiholoģija").


Pirmais un galvenais paņēmiens ir vienkārša nejauša (nejaušināta) atlase. Tas paredz nodrošināt, ka katram kopas loceklim ir vienādas iespējas tikt iekļautam izlasē. Nejaušs atlase nodrošina iespēju iekļūt izlasē no visdažādākajiem vispārējās populācijas pārstāvjiem. Tajā pašā laikā tiek veikti īpaši pasākumi, lai izslēgtu jebkādas likumsakarības parādīšanos atlasē. Un tas ļauj cerēt, ka beigu beigās izlasē pētāmā īpašība tiks pārstāvēta ja ne visā, tad maksimāli iespējamā daudzveidībā.

Otrs veids, kā nodrošināt reprezentativitāti, ir stratificēta nejauša atlase vai atlase atbilstoši vispārējās populācijas īpašībām. Tas ietver to īpašību iepriekšēju noteikšanu, kas var ietekmēt pētāmā īpašuma mainīgumu (tas var būt dzimums, ienākumu līmenis vai izglītība utt.). Pēc tam tiek noteikta ar šīm īpašībām atšķirīgo grupu (slāņu) skaita procentuālā attiecība vispārējā populācijā un nodrošināta identiska attiecīgo grupu procentuālā attiecība izlasē. Tālāk katrā izlases apakšgrupā subjekti tiek atlasīti pēc vienkāršas nejaušās atlases principa.

Statistiskais derīgums, vai statistisko nozīmīgumu, pētījuma rezultātus nosaka, izmantojot statistisko secinājumu metodes.

Vai esam apdrošināti pret kļūdām, pieņemot lēmumus, ar zināmiem secinājumiem no pētījuma rezultātiem? Protams, nē. Galu galā mūsu lēmumi ir balstīti uz izlases populācijas pētījuma rezultātiem, kā arī uz mūsu psiholoģisko zināšanu līmeni. Mēs neesam pilnībā pasargāti no kļūdām. Statistikā šādas kļūdas tiek uzskatītas par pieņemamām, ja tās rodas ne vairāk kā vienā gadījumā no 1000 (kļūdas varbūtība α = 0,001 vai ar to saistītā pareizā secinājuma ticamības varbūtības vērtība p = 0,999); vienā gadījumā no 100 (kļūdas varbūtība α = 0,01 vai saistītā pareizā secinājuma ticamības varbūtības vērtība p = 0,99) vai piecos gadījumos no 100 (kļūdas varbūtība α = 0,05 vai saistītā ticamības varbūtības vērtība pareizā izvade p=0,95). Tieši pēdējos divos līmeņos ir pieņemts pieņemt lēmumus psiholoģijā.

Dažreiz, runājot par statistisko nozīmīgumu, tiek izmantots jēdziens "nozīmības līmenis" (apzīmēts kā α). P un α skaitliskās vērtības papildina viena otru līdz 1000 - pilns notikumu kopums: vai nu mēs izdarījām pareizo secinājumu, vai arī pieļāvām kļūdu. Šie līmeņi netiek aprēķināti, tie ir noteikti. Nozīmīguma līmeni var saprast kā sava veida "sarkano" līniju, kuras krustpunkts ļaus runāt par šo notikumu kā negadījumu. Katrā kompetentajā zinātniskajā ziņojumā vai publikācijā izdarītajiem secinājumiem jāpievieno norāde par p vai α vērtībām, pēc kurām izdarīti secinājumi.

Statistikas secinājumu metodes ir detalizēti aplūkotas kursā "Matemātiskā statistika". Pagaidām atzīmējam tikai to, ka tie izvirza noteiktas prasības numuram vai parauga lielums.

Diemžēl nav stingru ieteikumu par vajadzīgā izlases lieluma provizorisku noteikšanu. Turklāt atbildi uz jautājumu par to nepieciešamo un pietiekamo skaitu pētnieks parasti saņem pārāk vēlu - tikai pēc jau apsekotās izlases datu analīzes. Tomēr var formulēt vispārīgākos ieteikumus:

1. Izstrādājot diagnostikas tehniku, nepieciešams lielākais izlases lielums - no 200 līdz 1000-2500 cilvēkiem.

2. Ja nepieciešams salīdzināt 2 paraugus, to kopējam skaitam jābūt vismaz 50 cilvēkiem; salīdzināmo paraugu skaitam jābūt aptuveni vienādam.

3. Ja tiek pētītas attiecības starp kādiem īpašumiem, tad izlases lielumam jābūt vismaz 30-35 cilvēkiem.

4. Jo vairāk mainīgums no pētāmā īpašuma, jo lielākam jābūt izlases lielumam. Tāpēc mainīgumu var samazināt, palielinot izlases viendabīgumu, piemēram, pēc dzimuma, vecuma utt. Tas, protams, samazina vispārēju secinājumu izdarīšanas iespēju.

Atkarīgi un neatkarīgi paraugi. Tipiska pētījuma situācija ir tad, kad pētnieku interesējoša īpašība tiek pētīta uz diviem vai vairākiem paraugiem, lai tos tālāk salīdzinātu. Šie paraugi var būt dažādās proporcijās atkarībā no to organizēšanas procedūras. Neatkarīgi paraugi ir raksturīgi ar to, ka jebkuras vienas izlases subjekta atlases varbūtība nav atkarīga no kāda cita izlases subjekta atlases. Pret, atkarīgie paraugi ir raksturīgi ar to, ka katrs vienas izlases subjekts atbilst noteiktam kritērijam ar priekšmetu no citas izlases.

Vispārīgā gadījumā atkarīgās izlases ietver subjektu atlasi pa pāriem salīdzinātajos izlasēs, bet neatkarīgie paraugi - neatkarīgu subjektu atlasi.

Jāņem vērā, ka “daļēji atkarīgu” (vai “daļēji neatkarīgu”) paraugu gadījumi nav pieļaujami: tas neprognozējamā veidā pārkāpj to reprezentativitāti.

Noslēgumā mēs atzīmējam, ka var izdalīt divas psiholoģiskās izpētes paradigmas.

Tā saucamais R-metodika ietver noteiktas īpašības (psiholoģiskās) mainīguma izpēti kādas ietekmes, faktora vai citas īpašības ietekmē. Paraugs ir priekšmetu kopums.

Cita pieeja Q-metodoloģija, ietver subjekta mainīguma izpēti (viena) dažādu stimulu (apstākļi, situācijas utt.) ietekmē. Tas atbilst situācijai, kad paraugs ir stimulu kopums.

Jebkurā eksperimenta (aptaujas) zinātniski praktiskajā situācijā pētnieki nevar pētīt visus cilvēkus (kopējo populāciju, populāciju), bet tikai noteiktu izlasi. Piemēram, pat ja mēs izmeklējam salīdzinoši nelielu cilvēku grupu, piemēram, tos, kuriem ir noteikta slimība, ir maz ticams, ka mums ir resursi vai nepieciešamība pārbaudīt katru pacientu. Tā vietā parasti tiek pārbaudīta populācijas izlase, jo tā ir ērtāk un aizņem mazāk laika. Kā tādā gadījumā mēs zinām, ka no izlases iegūtie rezultāti atspoguļo visu grupu? Vai arī, izmantojot profesionālo terminoloģiju, vai mēs varam būt pārliecināti, ka mūsu pētījums pareizi apraksta visu populācija, paraugs, no kura mēs izmantojām?

Lai atbildētu uz šo jautājumu, ir nepieciešams noteikt testa rezultātu statistisko nozīmīgumu. Statistiskā nozīme (Nozīmīgs līmenis, saīsināti paraksts), vai /7 nozīmības līmenis (p līmenis) - ir varbūtība, ka dotais rezultāts pareizi atspoguļo populāciju, no kuras tika pētīta izlase. Ņemiet vērā, ka tas ir tikai varbūtība- nav iespējams pilnīgi droši apgalvot, ka šis pētījums pareizi raksturo visu iedzīvotāju skaitu. Labākajā gadījumā no nozīmīguma līmeņa var secināt, ka tas ir ļoti iespējams. Līdz ar to neizbēgami rodas jautājums: kādam jābūt nozīmīguma līmenim, lai šo rezultātu uzskatītu par pareizu populācijas raksturojumu?

Piemēram, ar kādu varbūtības vērtību jūs esat gatavs teikt, ka šādas izredzes ir pietiekamas, lai uzņemtos risku? Ja iespēja ir 10 no 100 vai 50 no 100? Bet ko tad, ja šī varbūtība ir lielāka? Kā ar izredzēm, piemēram, 90 no 100, 95 no 100 vai 98 no 100? Situācijai, kas saistīta ar risku, šī izvēle ir diezgan problemātiska, jo tā ir atkarīga no cilvēka personības īpašībām.

Psiholoģijā tradicionāli tiek uzskatīts, ka iespēja 95 vai vairāk no 100 nozīmē, ka rezultātu pareizības varbūtība ir pietiekami augsta, lai to varētu vispārināt uz visu populāciju. Šis skaitlis tika izveidots zinātniskās un praktiskās darbības procesā - nav likuma, saskaņā ar kuru tas būtu jāizvēlas par vadlīniju (un patiešām citās zinātnēs dažreiz tiek izvēlētas citas nozīmīguma līmeņa vērtības).

Psiholoģijā šī varbūtība tiek apstrādāta nedaudz neparastā veidā. Tā vietā, lai varbūtība, ka izlase atspoguļo populāciju, ir varbūtība, ka izlase ir nepārstāv populācija. Citiem vārdiem sakot, tā ir varbūtība, ka atklātās attiecības vai atšķirības ir nejaušas, nevis populācijas īpašums. Tādējādi, tā vietā, lai teiktu, ka pētījuma rezultāti ir pareizi ar varbūtību 95 no 100, psihologi saka, ka pastāv 5 no 100 iespējamība, ka rezultāti ir nepareizi (līdzīgi 40 no 100 iespējām par labu rezultātu pareizība nozīmē 60 no 100 iespējām par labu to nepareizībai). Varbūtības vērtību dažreiz izsaka procentos, bet biežāk to raksta kā decimāldaļskaitli. Piemēram, 10 iespējas no 100 ir attēlotas kā decimāldaļdaļa 0,1; 5 no 100 ir rakstīts kā 0,05; 1 no 100 — 0,01. Izmantojot šo ierakstīšanas veidu, robežvērtība ir 0,05. Lai rezultātu uzskatītu par pareizu, tā nozīmīguma līmenim ir jābūt zemākšis skaitlis (atcerieties, ka šī ir varbūtība, ka rezultāts nepareizi raksturo iedzīvotāju skaitu. Lai novērstu terminoloģiju, mēs pievienojam, ka "nepareiza rezultāta iespējamība" (ko pareizāk sauc nozīmīguma līmenis) parasti apzīmē ar latīņu burtu R. Eksperimenta rezultātu aprakstā parasti ir iekļauts apkopojošs secinājums, piemēram, "rezultāti bija nozīmīgi nozīmīguma līmenī (R p) mazāks par 0,05 (ti, mazāks par 5%).

Tādējādi nozīmīguma līmenis ( R) norāda varbūtību, ka rezultāti Nav pārstāv iedzīvotājus. Pēc tradīcijas psiholoģijā tiek uzskatīts, ka rezultāti ticami atspoguļo kopējo ainu, ja tā ir vērtība R mazāks par 0,05 (t.i., 5%). Tomēr tas ir tikai varbūtības apgalvojums un nepavisam nav beznosacījumu garantija. Dažos gadījumos šis secinājums var būt nepareizs. Faktiski mēs varam aprēķināt, cik bieži tas var notikt, ja skatāmies uz nozīmīguma līmeņa lielumu. Ja nozīmīguma līmenis ir 0,05, 5 no 100 gadījumiem rezultāti, iespējams, ir nepareizi. 11a no pirmā acu uzmetiena šķiet, ka tas nav pārāk bieži, bet, ja tā padomā, tad 5 iespējas no 100 ir tādas pašas kā 1 no 20. Citiem vārdiem sakot, vienā no katriem 20 gadījumiem rezultāts mainīsies kļūdīties. Šādas izredzes nešķiet īpaši labvēlīgas, un pētniekiem vajadzētu piesargāties no apņemšanās pirmā veida kļūdas.Šis ir kļūdas nosaukums, kas rodas, kad pētnieki domā, ka ir atraduši reālus rezultātus, bet patiesībā tādu nav. Tiek sauktas pretējas kļūdas, kas sastāv no tā, ka pētnieki uzskata, ka viņi nav atraduši rezultātu, bet patiesībā tāds ir. otrā veida kļūdas.

Šīs kļūdas rodas tāpēc, ka nevar izslēgt nepareizas statistiskās analīzes iespēju. Kļūdas iespējamība ir atkarīga no rezultātu statistiskā nozīmīguma līmeņa. Mēs jau atzīmējām, ka, lai rezultāts tiktu uzskatīts par pareizu, nozīmīguma līmenim jābūt zem 0,05. Protams, daži rezultāti ir zemāki, un nav nekas neparasts, ka rezultāti ir pat 0,001 (vērtība 0,001 norāda uz 1 pret 1000 iespējamību, ka tas ir nepareizi). Jo mazāka ir p vērtība, jo spēcīgāka ir mūsu pārliecība par rezultātu pareizību.

Tabulā. 7.2 parāda tradicionālo nozīmīguma līmeņu interpretāciju par statistisko secinājumu iespējamību un lēmuma par sakarības (atšķirību) esamību pamatojumu.

7.2. tabula

Psiholoģijā izmantotā nozīmes līmeņu tradicionālā interpretācija

Balstoties uz praktisko pētījumu pieredzi, lai izvairītos no pirmā un otrā tipa kļūdām, izdarot atbildīgus secinājumus, būtu jāpieņem lēmumi par atšķirību (sakarību) esamību, koncentrējoties uz līmeni. R n zīme.

Statistiskais tests(Statistikas pārbaude - tas ir rīks statistiskās nozīmīguma līmeņa noteikšanai. Šis ir lēmuma noteikums, kas nodrošina patiesas hipotēzes pieņemšanu un nepatiesas hipotēzes noraidīšanu ar lielu varbūtību.

Statistikas kritēriji norāda arī noteikta skaitļa aprēķināšanas metodi un pašu šo skaitli. Visi kritēriji tiek izmantoti ar vienu galveno mērķi: noteikt nozīmīguma līmenis dati, ko tie analizē (t.i., iespējamība, ka dati atspoguļo patieso efektu, kas pareizi atspoguļo populāciju, no kuras tika ņemta izlase).

Dažus kritērijus var izmantot tikai normāli izplatītiem datiem (un, ja pazīme tiek mērīta intervālu skalā) - šos kritērijus parasti sauc parametrisks. Ar citu kritēriju palīdzību jūs varat analizēt datus ar gandrīz jebkuru izplatīšanas likumu - tos sauc neparametrisks.

Parametriskie kritēriji - kritēriji, kas aprēķina formulā ietver sadalījuma parametrus, t.i. vidējie un dispersijas (Studenta t-tests, Fišera F-tests utt.).

Neparametriskie kritēriji - kritēriji, kas aprēķina formulā neietver sadalījuma parametrus un ir balstīti uz darbības frekvencēm vai rangiem (kritērijs J Rozenbaums, kritērijs U Manna - Vitnija

Piemēram, kad mēs sakām, ka atšķirību nozīmīgumu noteica Stjudenta t-tests, mēs domājam, ka Stjudenta t-testa metode tika izmantota, lai aprēķinātu empīrisko vērtību, kas pēc tam tiek salīdzināta ar tabulas (kritisko) vērtību.

Pēc empīriskā (mēs aprēķinājām) un kritērija (tabulas) kritisko vērtību attiecības mēs varam spriest, vai mūsu hipotēze ir apstiprināta vai atspēkota. Vairumā gadījumu, lai mēs varētu atzīt atšķirības par būtiskām, ir nepieciešams, lai kritērija empīriskā vērtība pārsniegtu kritisko, lai gan ir kritēriji (piemēram, Mann-Whitney tests vai zīmju tests), kuros mums ir jāievēro pretējs noteikums.

Dažos gadījumos kritērija aprēķina formulā ir iekļauts novērojumu skaits pētījuma izlasē, kas apzīmēts kā P. Izmantojot īpašu tabulu, mēs nosakām, kāds atšķirību statistiskās nozīmīguma līmenis atbilst noteiktai empīriskai vērtībai. Vairumā gadījumu viena un tā pati kritērija empīriskā vērtība var izrādīties nozīmīga vai nenozīmīga atkarībā no novērojumu skaita pētījuma izlasē ( P ) vai no ts brīvības pakāpju skaits , kas tiek apzīmēts kā v (g>) vai abiem df (Dažreiz d).

Zinot P vai brīvības pakāpju skaitu, varam izmantot speciālas tabulas (galvenās dotas 5.pielikumā), lai noteiktu kritērija kritiskās vērtības un ar tām salīdzinātu iegūto empīrisko vērtību. Parasti to raksta šādi: n = Kritērija 22 kritiskās vērtības ir tSt = 2.07" vai "at v (d) = 2, Studenta kritērija kritiskās vērtības ir = 4,30 "un t.s.

Tomēr parasti priekšroka tiek dota parametriskiem kritērijiem, un mēs pieturamies pie šīs pozīcijas. Tie tiek uzskatīti par uzticamākiem un var sniegt vairāk informācijas un dziļāku analīzi. Attiecībā uz matemātisko aprēķinu sarežģītību, izmantojot datorprogrammasšīs grūtības pazūd (bet dažas citas šķiet diezgan pārvaramas).

  • Šajā mācību grāmatā mēs sīkāk neaplūkojam statistikas problēmu
  • hipotēzes (nulle - R0 un alternatīva - Hj) un statistiskos lēmumus, jo psiholoģijas studenti to apgūst atsevišķi disciplīnā "Matemātiskās metodes psiholoģijā". Turklāt jāņem vērā, ka, sagatavojot pētījuma ziņojumu (kursa darbu vai diplomdarbu, publikāciju), statistiskās hipotēzes un statistikas risinājumi parasti netiek sniegti. Parasti, aprakstot rezultātus, tiek norādīts kritērijs, norādīta nepieciešamā aprakstošā statistika (vidēji, sigma, korelācijas koeficienti utt.), Kritēriju empīriskās vērtības, brīvības pakāpes un obligāti p-nozīmības līmenis. Pēc tam saistībā ar pārbaudāmo hipotēzi tiek formulēts jēgpilns secinājums, kas norāda (parasti nevienlīdzības formā) sasniegto vai nesasniegto nozīmīguma līmeni.

Nozīmīguma līmenis statistikā ir svarīgs rādītājs, kas atspoguļo pārliecības pakāpi saņemto (paredzamo) datu precizitātei un patiesumam. Jēdziens tiek plaši izmantots dažādās jomās: no socioloģiskajiem pētījumiem līdz zinātnisko hipotēžu statistiskajai pārbaudei.

Definīcija

Statistiskā nozīmīguma (jeb statistiski nozīmīga rezultāta) līmenis parāda, kāda ir pētāmo rādītāju nejaušas rašanās varbūtība. Parādības kopējo statistisko nozīmīgumu izsaka p-vērtība (p-līmenis). Jebkurā eksperimentā vai novērojumā pastāv iespēja, ka iegūtie dati radušies izlases kļūdu dēļ. Īpaši tas attiecas uz socioloģiju.

Tas ir, statistiski nozīmīga ir vērtība, kuras nejaušības iespējamība ir ārkārtīgi maza vai tai ir tendence uz galējībām. Ekstrēms šajā kontekstā ir statistikas novirzes pakāpe no nulles hipotēzes (hipotēzes, kas tiek pārbaudīta, lai nodrošinātu atbilstību iegūtajiem izlases datiem). Zinātniskajā praksē nozīmīguma līmeni izvēlas pirms datu vākšanas un parasti tā koeficients ir 0,05 (5%). Sistēmām, kurās precīzas vērtības ir kritiskas, tas var būt 0,01 (1%) vai mazāks.

Fons

Nozīmīguma līmeņa jēdzienu ieviesa britu statistiķis un ģenētiķis Ronalds Fišers 1925. gadā, kad viņš izstrādāja testēšanas metodi. statistiskās hipotēzes. Analizējot jebkuru procesu, pastāv zināma noteiktu parādību iespējamība. Grūtības rodas, strādājot ar nelielu (vai ne acīmredzamu) varbūtību procentuālo daļu, kas ietilpst "mērīšanas kļūdas" jēdzienā.

Strādājot ar statistiku, kas nebija pietiekami specifiska, lai to pārbaudītu, zinātnieki saskārās ar nulles hipotēzes problēmu, kas “neļauj” darboties ar mazām vērtībām. Fišers ierosināja šādām sistēmām noteikt notikumu iespējamību pie 5% (0,05) kā ērtu parauga robežvērtību, kas ļauj aprēķinos noraidīt nulles hipotēzi.

Fiksēta koeficienta ieviešana

1933. gadā Jerzy zinātnieki Neimans un Egons Pīrsons savos rakstos ieteica iepriekš (pirms datu vākšanas) noteikt noteiktu nozīmīguma līmeni. Šo noteikumu izmantošanas piemēri ir skaidri redzami vēlēšanu laikā. Pieņemsim, ka ir divi kandidāti, no kuriem viens ir ļoti populārs, bet otrs nav plaši pazīstams. Acīmredzami, ka pirmais kandidāts uzvarēs vēlēšanās, un otrā izredzes sliecas uz nulli. Centieties – bet ne līdzvērtīgi: vienmēr pastāv nepārvaramas varas iespēja, sensacionāla informācija, negaidīti lēmumi, kas var mainīt prognozētos vēlēšanu rezultātus.

Noimans un Pīrsons vienojās, ka Fišera piedāvātais nozīmīguma līmenis 0,05 (apzīmēts ar simbolu α) ir visērtākais. Tomēr pats Fišers 1956. gadā iebilda pret šīs vērtības noteikšanu. Viņš uzskatīja, ka α līmenis ir jānosaka atbilstoši konkrētiem apstākļiem. Piemēram, daļiņu fizikā tas ir 0,01.

p-vērtība

Terminu p-vērtība pirmo reizi izmantoja Braunlijs 1960. gadā. P līmenis (p vērtība) ir rādītājs, kas atrodams apgrieztā attiecība par rezultātu pamatotību. Augstākā p-vērtība atbilst zemākajam ticamības līmenim attiecībā uz izlasē starp mainīgajiem.

Šī vērtība atspoguļo kļūdu iespējamību, kas saistīta ar rezultātu interpretāciju. Pieņemsim, ka p vērtība = 0,05 (1/20). Tas parāda 5% iespējamību, ka attiecība starp izlasē atrastajiem mainīgajiem ir tikai izlases nejauša iezīme. Tas ir, ja šīs atkarības nav, tad ar atkārtotiem līdzīgiem eksperimentiem vidēji katrā divdesmitajā pētījumā var sagaidīt tādu pašu vai lielāku atkarību starp mainīgajiem. Bieži vien p-līmenis tiek uzskatīts par kļūdas līmeņa "robežu".

Starp citu, p-vērtība var neatspoguļot reālās attiecības starp mainīgajiem, bet tikai parāda noteiktu vidējo vērtību pieņēmumu ietvaros. Jo īpaši datu galīgā analīze būs atkarīga arī no šī koeficienta izvēlētajām vērtībām. Ar p-līmeni = 0,05 būs daži rezultāti, un ar koeficientu, kas vienāds ar 0,01, citi.

Statistisko hipotēžu pārbaude

Pārbaudot hipotēzes, īpaši svarīgs ir statistiskās nozīmīguma līmenis. Piemēram, aprēķinot divu virzienu testu, noraidīšanas laukums tiek sadalīts vienādi abos izlases sadalījuma galos (attiecībā pret nulles koordinātu) un tiek aprēķināta iegūto datu patiesība.

Pieņemsim, ka, uzraugot noteiktu procesu (parādību), izrādījās, ka jaunā statistiskā informācija liecina par nelielām izmaiņām salīdzinājumā ar iepriekšējām vērtībām. Tajā pašā laikā rezultātu neatbilstības ir nelielas, nav acīmredzamas, bet svarīgas pētījumam. Speciālists saskaras ar dilemmu: vai izmaiņas tiešām notiek vai tās ir izlases kļūdas (mērījumu neprecizitāte)?

Šajā gadījumā nulles hipotēze tiek piemērota vai noraidīta (viss tiek norakstīts kā kļūda, vai izmaiņas sistēmā tiek atzītas par fait accompli). Problēmas risināšanas process balstās uz kopējā statistiskā nozīmīguma (p-vērtības) un nozīmīguma līmeņa (α) attiecību. Ja p-līmenis< α, значит, нулевую гипотезу отвергают. Чем меньше р-value, тем более значимой является тестовая статистика.

Izmantotās vērtības

Nozīmīguma līmenis ir atkarīgs no analizējamā materiāla. Praksē tiek izmantotas šādas fiksētās vērtības:

  • α = 0,1 (vai 10%);
  • α = 0,05 (vai 5%);
  • α = 0,01 (vai 1%);
  • α = 0,001 (vai 0,1%).

Jo precīzāki aprēķini ir nepieciešami, jo mazāks tiek izmantots koeficients α. Protams, statistikas prognozēm fizikā, ķīmijā, farmācijā un ģenētikā ir nepieciešama lielāka precizitāte nekā politikas zinātnē un socioloģijā.

Nozīmīguma sliekšņi konkrētās jomās

Augstas precizitātes jomās, piemēram, daļiņu fizikā un ražošanā, statistisko nozīmīgumu bieži izsaka kā standartnovirzes attiecību (ko apzīmē ar sigma — σ koeficientu) attiecībā pret normālu varbūtības sadalījumu (Gausa sadalījums). σ ir statistisks rādītājs, kas nosaka noteikta lieluma vērtību izplatību attiecībā pret matemātiskajām prognozēm. Izmanto, lai attēlotu notikumu varbūtību.

Atkarībā no zināšanu jomas koeficients σ ļoti atšķiras. Piemēram, prognozējot Higsa bozona esamību, parametrs σ ir vienāds ar pieci (σ=5), kas atbilst p-vērtībai=1/3,5 milj.. apgabaliem.

Efektivitāte

Jāņem vērā, ka koeficienti α un p-vērtība nav precīzas īpašības. Lai kāds būtu pētāmās parādības statistikas nozīmīguma līmenis, tas nav beznosacījuma pamats hipotēzes pieņemšanai. Piemēram, jo ​​mazāka ir α vērtība, jo lielāka iespēja, ka izvirzītā hipotēze ir nozīmīga. Tomēr pastāv kļūdu risks, kas samazina pētījuma statistisko jaudu (nozīmību).

Pētnieki, kas koncentrējas tikai uz statistiski nozīmīgiem rezultātiem, var izdarīt kļūdainus secinājumus. Tajā pašā laikā ir grūti vēlreiz pārbaudīt viņu darbu, jo viņi izmanto pieņēmumus (kas faktiski ir α un p vērtības vērtības). Tāpēc vienmēr ir ieteicams kopā ar statistiskā nozīmīguma aprēķinu noteikt vēl vienu rādītāju - statistiskā efekta lielumu. Efekta lielums ir kvantitatīvs efekta stipruma mērs.

Statistiskā nozīmīguma jēdziens

FCC aprēķinu praksē statistikas derīgums ir būtisks. Iepriekš tika atzīmēts, ka no vienas un tās pašas populācijas var atlasīt daudzus paraugus:

Ja tie ir pareizi izvēlēti, tad to vidējie rādītāji un vispārējās populācijas rādītāji nedaudz atšķiras viens no otra reprezentativitātes kļūdas lielumā, ņemot vērā pieņemto ticamību;

Ja tos izvēlas no dažādām vispārējām populācijām, atšķirība starp tām izrādās būtiska. Statistikā parasti tiek apsvērta paraugu salīdzināšana;

Ja tie atšķiras nenozīmīgi, nesvarīgi, nenozīmīgi, tas ir, tie faktiski pieder vienai un tai pašai kopējai populācijai, atšķirību starp tām sauc statistiski neuzticams.

statistiski nozīmīgi atšķirība starp paraugiem ir paraugs, kas būtiski un fundamentāli atšķiras, tas ir, tas pieder dažādām vispārējām populācijām.

FCC izlases atšķirību statistiskā nozīmīguma novērtēšana nozīmē daudzu praktisku problēmu risināšanu. Piemēram, jaunu mācību metožu, programmu, vingrojumu kompleksu, testu, kontroles vingrinājumu ieviešana ir saistīta ar to eksperimentālo pārbaudi, kam jāparāda, ka testa grupa būtiski atšķiras no kontroles grupas. Tāpēc tiek izmantotas īpašas statistikas metodes, t.s statistiskā nozīmīguma kritēriji, kas ļauj konstatēt statistiski nozīmīgu atšķirību esamību vai neesamību starp paraugiem.

Visi kritēriji ir sadalīti divās grupās: parametriskie un neparametriskie. Parametriskie kritēriji paredzēt normālā sadales likuma obligātu klātbūtni, t.i. tas attiecas uz parastā likuma galveno rādītāju - vidējā aritmētiskā - obligātu noteikšanu X un standarta novirze par. Parametriskie kritēriji ir visprecīzākie un pareizākie. Neparametriskie testi ir balstīti uz rangu (kārtas) atšķirībām starp paraugu elementiem.

Šeit ir galvenie statistiskās nozīmīguma kritēriji, ko izmanto FCC praksē: Studenta tests, Fišera tests, Vilkoksona tests, Vaita tests, Van der Vērdena tests (zīmju tests).

Studenta kritērijs nosaukts pēc angļu zinātnieka C. Gosset (Students ir pseidonīms), kurš atklāja šī metode. Studenta kritērijs ir parametrisks, izmanto, lai salīdzinātu paraugu absolūtās vērtības. Paraugi var atšķirties pēc izmēra.

Studenta kritērijs ir definēts šādi.

1. Atrodiet Studenta kritēriju t saskaņā ar šādu formulu:

Kur xi, x 2 - salīdzināto paraugu vidējais aritmētiskais; /i b w 2 - reprezentativitātes kļūdas, kas konstatētas, pamatojoties uz salīdzināmo paraugu rādītājiem.

2. FCC prakse ir parādījusi, ka sporta darbam pietiek pieņemt rezultāta ticamību R= 0,95.

63 Konta uzticamībai: P= 0,95 (a = 0,05), ar grādu skaitu; brīvība k= «! + n 2 - 2 saskaņā ar pielietojuma tabulu 4 mēs atrodam vērtību \ nu, kritērija robežvērtība (^gr).

3. Pamatojoties uz normālā sadalījuma likuma īpašībām, tiek veikts salīdzinājums Stjudenta testā t Un t^.

4. Izdariet secinājumus:

Ja t> ftp, tad atšķirība starp salīdzinātajām izlasēm ir statistiski nozīmīga;

Ja t< 7 F, tad atšķirība nav statistiski nozīmīga.

Pētniekiem FCC jomā statistiskās nozīmības novērtējums ir pirmais solis konkrētas problēmas risināšanā: būtiski vai nebūtiski atšķirties starp; salīdzināmi paraugi. Nākamais solis ir; šīs atšķirības novērtējums no pedagoģiskā viedokļa, ko nosaka problēmas stāvoklis.