Statistiskā nozīme: definīcija, jēdziens, nozīmīgums, regresijas vienādojumi un hipotēžu pārbaude. Statistiskās nozīmīguma līmenis

Statistika jau sen ir bijusi neatņemama dzīves sastāvdaļa. Cilvēki ar to saskaras visur. Balstoties uz statistiku, tiek izdarīti secinājumi par to, kur un kādas slimības ir izplatītas, kas ir vairāk pieprasīts konkrētajā reģionā vai noteiktā iedzīvotāju segmentā. Uz to balstās pat valdības struktūru kandidātu politisko programmu veidošana. Tos izmanto arī mazumtirdzniecības ķēdes, iegādājoties preces, un ražotāji savos priekšlikumos vadās pēc šiem datiem.

Statistikai ir liela nozīme sabiedrības dzīvē un tā ietekmē katru atsevišķu tās locekli, pat nelielos veidos. Piemēram, ja līdz , lielākā daļa cilvēku dod priekšroku tumšas krāsas apģērbā konkrētā pilsētā vai reģionā vietējās tirdzniecības vietās būs ārkārtīgi grūti atrast spilgti dzeltenu lietusmēteli ar ziedu apdruku. Bet kādi ir daudzumi, kas veido šos datus, kuriem ir šāda ietekme? Piemēram, kas ir “statistiski nozīmīgs”? Kas īsti ir domāts ar šo definīciju?

Kas tas?

Statistika kā zinātne sastāv no dažādu daudzumu un jēdzienu kombinācijas. Viens no tiem ir jēdziens "statistiskā nozīme". Šis ir vērtības nosaukums mainīgie, citu rādītāju rašanās varbūtība, kurā ir niecīga.

Piemēram, 9 no 10 cilvēkiem pēc lietainas nakts rīta sēņošanas laikā rudens mežā kājās uzvelk gumijas apavus. Varbūtība, ka kādā brīdī 8 no viņiem uzvilka audekla mokasīnus, ir niecīga. Tādējādi šajā konkrēts piemērs skaitlis 9 ir vērtība, ko sauc par "statistisko nozīmīgumu".

Attiecīgi, ja mēs tālāk attīstām iepriekš minēto praktisks piemērs, apavu veikali pērk līdz beigām vasaras sezona gumijas zābaki lielākā skaitā nekā citos gada laikos. Tātad statistiskās vērtības lielums ietekmē parasto dzīvi.

Protams, sarežģītos aprēķinos, teiksim, prognozējot vīrusu izplatību, tiek ņemts vērā liels skaits mainīgo. Bet pati būtiska statistikas datu rādītāja noteikšanas būtība ir līdzīga neatkarīgi no aprēķinu sarežģītības un nepastāvīgo vērtību skaita.

Kā tas tiek aprēķināts?

Izmanto, aprēķinot vienādojuma rādītāja "statistiskā nozīme" vērtību. Tas ir, var apgalvot, ka šajā gadījumā visu izšķir matemātika. visvairāk vienkāršs variants aprēķins ir matemātisko darbību ķēde, kurā sekojoši parametri:

divu veidu rezultāti, kas iegūti no aptaujām vai objektīvu datu izpētes, piemēram, summas, par kurām tiek veikti pirkumi, apzīmēti ar a un b;
rādītājs abām grupām - n;
apvienotās izlases daļas vērtība - p;
jēdziens "standarta kļūda" - SE.

Nākamais solis ir noteikt kopējo testa rādītāju – t, tā vērtību salīdzina ar skaitli 1,96. 1,96 ir vidējā vērtība, kas atbilst 95% diapazonam saskaņā ar Stjudenta t sadalījumu.

Bieži rodas jautājums, kāda ir atšķirība starp n un p vērtībām. Šo niansi ir viegli noskaidrot ar piemēru. Pieņemsim, ka tiek aprēķināta vīriešu un sieviešu lojalitātes statistiskā nozīme jebkuram produktam vai zīmolam.

Šajā gadījumā burtiem sekos sekojošais:

n ir respondentu skaits;
p - apmierināto ar preci skaits.

Intervēto sieviešu skaits šajā gadījumā tiks apzīmēts kā n1. Attiecīgi vīrieši - n2. Vienai un tai pašai vērtībai pie simbola p būs cipari "1" un "2".

Testa indikatora salīdzināšana ar Studenta aprēķinu tabulu vidējām vērtībām kļūst par "statistisko nozīmīgumu".

Ko nozīmē pārbaude?

Jebkuru matemātisku aprēķinu rezultātus vienmēr var pārbaudīt, to māca bērniem pat iekšā pamatskola. Loģiski ir pieņemt, ka, tā kā statistiskie rādītāji tiek noteikti, izmantojot aprēķinu ķēdi, tad tie tiek pārbaudīti.

Tomēr statistiskā nozīmīguma pārbaude nav tikai matemātika. Statistika nodarbojas ar liels daudzums mainīgie un dažādas varbūtības, kurus ne vienmēr var aprēķināt. Respektīvi, ja atgriežamies pie raksta sākumā dotā gumijas apavu piemēra, tad statistikas datu loģisko konstrukciju, uz ko paļausiesies preču veikaliem pircēji, var izjaukt sausais un karstais laiks, kas nav raksturīgs rudens. Šīs parādības rezultātā samazināsies to cilvēku skaits, kuri iegādājas gumijas zābakus, un tirdzniecības vietas cietīs zaudējumus. Paredzēt laikapstākļu anomāliju matemātiskā formula, protams, nevar. Šo brīdi sauc - "kļūda".

Tieši šādu kļūdu iespējamība tiek ņemta vērā, pārbaudot aprēķinātās nozīmīguma līmeni. Tas ņem vērā gan aprēķinātos rādītājus, gan pieņemtos nozīmīguma līmeņus, kā arī lielumus, ko parasti sauc par hipotēzēm.

Kas ir nozīmes līmenis?

Jēdziens "līmenis" ir iekļauts galvenajos statistiskās nozīmīguma kritērijos. To izmanto lietišķajā un praktiskajā statistikā. Šī ir sava veida vērtība, kas ņem vērā iespējamo noviržu vai kļūdu iespējamību.

Līmenis ir balstīts uz gatavu paraugu atšķirību identificēšanu, tas ļauj noteikt to nozīmīgumu vai, gluži pretēji, nejaušību. Šim jēdzienam ir ne tikai digitālas nozīmes, bet arī to savdabīgās interpretācijas. Viņi izskaidro, kā saprast vērtību, un pats līmenis tiek noteikts, salīdzinot rezultātu ar vidējo indeksu, tas atklāj atšķirību ticamības pakāpi.

Tādējādi līmeņa jēdzienu iespējams pasniegt vienkārši - tas ir pieņemamas, iespējamās kļūdas vai kļūdas rādītājs secinājumos, kas izdarīti no iegūtajiem statistikas datiem.

Kādi nozīmes līmeņi tiek izmantoti?

Statistiskā nozīme kļūdu varbūtības koeficienti praksē ir balstīti uz trim pamatlīmeņiem.

Pirmais līmenis ir slieksnis, pie kura vērtība ir 5%. Tas ir, kļūdas iespējamība nepārsniedz 5% nozīmīguma līmeni. Tas nozīmē, ka pārliecība par uz statistisko pētījumu datiem izdarīto secinājumu nevainojamību un nekļūdīgumu ir 95%.

Otrais līmenis ir 1% slieksnis. Attiecīgi šis skaitlis nozīmē, ka ar 99% ticamību var vadīties pēc statistisko aprēķinu laikā iegūtajiem datiem.

Trešais līmenis ir 0,1%. Ar šo vērtību kļūdas iespējamība ir vienāda ar daļu no procentiem, tas ir, kļūdas praktiski tiek novērstas.

Kas ir hipotēze statistikā?

Kļūdas kā jēdziens ir sadalītas divās jomās attiecībā uz nulles hipotēzes pieņemšanu vai noraidīšanu. Hipotēze ir jēdziens, aiz kura saskaņā ar definīciju ir paslēpta citu datu vai apgalvojumu kopa. Tas ir, varbūtības sadalījuma apraksts kaut kam, kas saistīts ar statistiskās uzskaites priekšmetu.

Vienkāršos aprēķinos ir divas hipotēzes - nulle un alternatīva. Atšķirība starp abiem ir tāda, ka nulles hipotēze ir balstīta uz priekšstatu, ka nav principiālas atšķirības starp izlasēm, kas piedalās statistiskā nozīmīguma noteikšanā, un alternatīvā ir tai pilnīgi pretēja. Tas ir, alternatīvā hipotēze ir balstīta uz būtisku atšķirību esamību šajos paraugos.

Kādas ir kļūdas?

Kļūdas kā jēdziens statistikā ir tieši atkarīgas no vienas vai otras hipotēzes pieņemšanas kā patiesas. Tos var iedalīt divos virzienos vai veidos:

pirmais veids ir saistīts ar nulles hipotēzes pieņemšanu, kas izrādījās nepareiza;
otro izraisa alternatīvas ievērošana.

Pirmais kļūdu veids tiek saukts par viltus pozitīvu un ir diezgan izplatīts visās jomās, kur tiek izmantota statistika. Attiecīgi otrā veida kļūdu sauc par viltus negatīvu.

Kāpēc statistikā ir svarīga regresija?

Regresijas statistiskā nozīme ir tāda, ka to var izmantot, lai noteiktu, cik reāls ir modelis, kas aprēķināts, pamatojoties uz datiem. dažādas atkarības; ļauj identificēt faktoru pietiekamību vai trūkumu uzskaitei un secinājumiem.

Regresijas vērtību nosaka, salīdzinot rezultātus ar Fišera tabulās norādītajiem datiem. Vai arī izmantojot dispersijas analīzi. Svarīgums regresijas rādītājiem ir ar kompleksu statistikas pētījumi un aprēķini, kas ietver lielu skaitu mainīgo lielumu, nejaušus datus un iespējamās izmaiņas.

Statistiskā nozīmīguma jēdziens

FCC aprēķinu praksē statistikas derīgums ir būtisks. Iepriekš tika atzīmēts, ka no vienas un tās pašas populācijas var atlasīt daudzus paraugus:

Ja tie ir pareizi izvēlēti, tad to vidējie rādītāji un vispārējās populācijas rādītāji nedaudz atšķiras viens no otra reprezentativitātes kļūdas lielumā, ņemot vērā pieņemto ticamību;

Ja tos izvēlas no dažādām vispārējām populācijām, atšķirība starp tām izrādās būtiska. Statistikā parasti tiek apsvērta paraugu salīdzināšana;

Ja tie atšķiras nenozīmīgi, nesvarīgi, nenozīmīgi, tas ir, tie faktiski pieder vienai un tai pašai kopējai populācijai, atšķirību starp tām sauc statistiski neuzticams.

statistiski nozīmīgi izlases atšķirība ir izlase, kas būtiski un fundamentāli atšķiras, t.i., pieder dažādām vispārējām populācijām.

FCC, lai novērtētu paraugu atšķirību statistisko nozīmīgumu, ir jāatrisina daudzas praktiskas problēmas. Piemēram, jaunu mācību metožu, programmu, vingrojumu kompleksu, testu, kontroles vingrinājumu ieviešana ir saistīta ar to eksperimentālo pārbaudi, kam jāparāda, ka testa grupa būtiski atšķiras no kontroles grupas. Tāpēc tiek izmantotas īpašas statistikas metodes, t.s statistiskā nozīmīguma kritēriji, kas ļauj konstatēt statistiski nozīmīgu atšķirību esamību vai neesamību starp paraugiem.

Visi kritēriji ir sadalīti divās grupās: parametriskie un neparametriskie. Parametriskie kritēriji paredzēt normālā sadales likuma obligātu klātbūtni, t.i. tas attiecas uz parastā likuma galveno rādītāju - vidējā aritmētiskā - obligātu noteikšanu X un standarta novirze par. Parametriskie kritēriji ir visprecīzākie un pareizākie. Neparametriskie testi ir balstīti uz rangu (kārtas) atšķirībām starp paraugu elementiem.

Šeit ir minēti galvenie statistiskās nozīmīguma kritēriji, ko izmanto FCC praksē: Studenta tests, Fišera tests, Vilkoksona tests, Vaita tests, Van der Vērdena tests (zīmju tests).

Studenta kritērijs nosaukts pēc angļu zinātnieka C. Gosset (Students ir pseidonīms), kurš atklāja šī metode. Studenta kritērijs ir parametrisks, izmanto, lai salīdzinātu paraugu absolūtās vērtības. Paraugi var atšķirties pēc izmēra.

Studenta kritērijs ir definēts šādi.

1. Atrodiet Studenta kritēriju t saskaņā ar šādu formulu:

kur xi, x 2 - salīdzināto paraugu vidējais aritmētiskais; /i b w 2 - reprezentativitātes kļūdas, kas konstatētas, pamatojoties uz salīdzināmo paraugu rādītājiem.

2. FCC prakse ir parādījusi, ka sporta darbam pietiek pieņemt rezultāta ticamību R= 0,95.

63 Konta uzticamībai: P= 0,95 (a = 0,05), ar grādu skaitu; brīvība k= «! + n 2 - 2 saskaņā ar pielietojuma tabulu 4 mēs atrodam vērtību \ nu, kritērija robežvērtība (^gr).

3. Pamatojoties uz normālā sadalījuma likuma īpašībām, Stjudenta testā tiek veikts salīdzinājums t un t^.

4. Izdariet secinājumus:

Ja t> ftp, tad atšķirība starp salīdzinātajām izlasēm ir statistiski nozīmīga;

Ja t< 7 F, tad atšķirība nav statistiski nozīmīga.

Pētniekiem FCC jomā statistiskās nozīmības novērtējums ir pirmais solis konkrētas problēmas risināšanā: būtiski vai nebūtiski atšķirties starp; salīdzināmi paraugi. Nākamais solis ir; šīs atšķirības novērtējums no pedagoģiskā viedokļa, ko nosaka problēmas stāvoklis.

Nozīmīguma līmenis statistikā ir svarīgs rādītājs, kas atspoguļo pārliecības pakāpi saņemto (paredzamo) datu precizitātei un patiesumam. Jēdziens tiek plaši izmantots dažādās jomās: no socioloģiskajiem pētījumiem līdz zinātnisko hipotēžu statistiskajai pārbaudei.

Definīcija

Statistiskā nozīmīguma (jeb statistiski nozīmīga rezultāta) līmenis parāda, kāda ir pētāmo rādītāju nejaušas rašanās varbūtība. Parādības kopējo statistisko nozīmīgumu izsaka p-vērtība (p-līmenis). Jebkurā eksperimentā vai novērojumā pastāv iespēja, ka iegūtie dati radušies izlases kļūdu dēļ. Īpaši tas attiecas uz socioloģiju.

Tas ir, statistiski nozīmīga ir vērtība, kuras nejaušības iespējamība ir ārkārtīgi maza vai tiecas uz galējībām. Galējība šajā kontekstā ir statistikas novirzes pakāpe no nulles hipotēzes (hipotēzes, kas tiek pārbaudīta, lai nodrošinātu atbilstību iegūtajiem izlases datiem). Zinātniskajā praksē nozīmīguma līmeni izvēlas pirms datu vākšanas un parasti tā koeficients ir 0,05 (5%). Sistēmām, kurās precīzas vērtības ir kritiskas, tas var būt 0,01 (1%) vai mazāks.

Fons

Nozīmīguma līmeņa jēdzienu ieviesa britu statistiķis un ģenētiķis Ronalds Fišers 1925. gadā, kad viņš izstrādāja statistisko hipotēžu pārbaudes paņēmienu. Analizējot jebkuru procesu, pastāv zināma noteiktu parādību iespējamība. Grūtības rodas, strādājot ar nelielu (vai ne acīmredzamu) varbūtību procentuālo daļu, kas ietilpst "mērīšanas kļūdas" jēdzienā.

Strādājot ar statistiku, kas nebija pietiekami specifiska, lai to pārbaudītu, zinātnieki saskārās ar nulles hipotēzes problēmu, kas “neļauj” darboties ar mazām vērtībām. Fišers ierosināja šādām sistēmām noteikt notikumu iespējamību pie 5% (0,05) kā ērtu parauga robežvērtību, kas ļauj aprēķinos noraidīt nulles hipotēzi.

Fiksēta koeficienta ieviešana

1933. gadā Jerzy zinātnieki Neimans un Egons Pīrsons savos rakstos ieteica iepriekš (pirms datu vākšanas) noteikt noteiktu nozīmīguma līmeni. Šo noteikumu izmantošanas piemēri ir skaidri redzami vēlēšanu laikā. Pieņemsim, ka ir divi kandidāti, no kuriem viens ir ļoti populārs, bet otrs nav plaši pazīstams. Acīmredzami, ka pirmais kandidāts uzvarēs vēlēšanās, un otrā izredzes sliecas uz nulli. Centieties – bet ne līdzvērtīgi: vienmēr pastāv nepārvaramas varas iespēja, sensacionāla informācija, negaidīti lēmumi, kas var mainīt prognozētos vēlēšanu rezultātus.

Noimans un Pīrsons vienojās, ka Fišera piedāvātais nozīmīguma līmenis 0,05 (apzīmēts ar simbolu α) ir visērtākais. Tomēr pats Fišers 1956. gadā iebilda pret šīs vērtības noteikšanu. Viņš uzskatīja, ka α līmenis ir jānosaka atbilstoši konkrētiem apstākļiem. Piemēram, daļiņu fizikā tas ir 0,01.

p-vērtība

Terminu p-vērtība pirmo reizi izmantoja Braunlijs 1960. gadā. P līmenis (p vērtība) ir rādītājs, kas atrodams apgrieztā attiecība par rezultātu pamatotību. Augstākā p-vērtība atbilst zemākajam ticamības līmenim izlasē starp mainīgajiem.

Šī vērtība atspoguļo kļūdu iespējamību, kas saistīta ar rezultātu interpretāciju. Pieņemsim, ka p vērtība = 0,05 (1/20). Tas parāda piecu procentu iespējamību, ka attiecība starp izlasē atrastajiem mainīgajiem ir tikai izlases nejauša iezīme. Tas ir, ja šīs atkarības nav, tad, veicot vairākus līdzīgus eksperimentus, vidēji katrā divdesmitajā pētījumā var sagaidīt tādu pašu vai lielāku atkarību starp mainīgajiem. Bieži vien p-līmenis tiek uzskatīts par kļūdas līmeņa "robežu".

Starp citu, p-vērtība var neatspoguļot reālās attiecības starp mainīgajiem, bet tikai parāda noteiktu vidējo vērtību pieņēmumu ietvaros. Jo īpaši datu galīgā analīze būs atkarīga arī no šī koeficienta izvēlētajām vērtībām. Ar p-līmeni = 0,05 būs daži rezultāti, un ar koeficientu, kas vienāds ar 0,01, citi.

Statistisko hipotēžu pārbaude

Pārbaudot hipotēzes, īpaši svarīgs ir statistiskās nozīmīguma līmenis. Piemēram, aprēķinot divpusēju testu, noraidīšanas laukums tiek sadalīts vienādi abos izlases sadalījuma galos (attiecībā pret nulles koordinātu) un tiek aprēķināts iegūto datu patiesums.

Pieņemsim, ka, uzraugot noteiktu procesu (parādību), izrādījās, ka jaunā statistiskā informācija norāda uz nelielām izmaiņām salīdzinājumā ar iepriekšējām vērtībām. Tajā pašā laikā rezultātu neatbilstības ir nelielas, nav acīmredzamas, bet svarīgas pētījumam. Speciālists saskaras ar dilemmu: vai izmaiņas tiešām notiek vai tās ir izlases kļūdas (mērījumu neprecizitāte)?

Šajā gadījumā nulles hipotēze tiek piemērota vai noraidīta (viss tiek attiecināts uz kļūdu, vai arī sistēmas izmaiņas tiek atzītas par fait accompli). Problēmas risināšanas process balstās uz kopējā statistiskā nozīmīguma (p-vērtības) un nozīmīguma līmeņa (α) attiecību. Ja p-līmenis< α, значит, нулевую гипотезу отвергают. Чем меньше р-value, тем более значимой является тестовая статистика.

Izmantotās vērtības

Nozīmīguma līmenis ir atkarīgs no analizējamā materiāla. Praksē tiek izmantotas šādas fiksētās vērtības:

α = 0,1 (vai 10%);
α = 0,05 (vai 5%);
α = 0,01 (vai 1%);
α = 0,001 (vai 0,1%).

Jo precīzāki aprēķini nepieciešami, jo mazāks tiek izmantots koeficients α. Protams, statistikas prognozēm fizikā, ķīmijā, farmācijā un ģenētikā ir nepieciešama lielāka precizitāte nekā politikas zinātnē un socioloģijā.

Nozīmīguma sliekšņi konkrētās jomās

Augstas precizitātes jomās, piemēram, daļiņu fizikā un ražošanā, statistisko nozīmīgumu bieži izsaka kā standartnovirzes attiecību (ko apzīmē ar sigma — σ koeficientu) attiecībā pret normālu varbūtības sadalījumu (Gausa sadalījums). σ ir statistisks rādītājs, kas nosaka noteikta lieluma vērtību izplatību attiecībā pret matemātiskajām prognozēm. Izmanto, lai attēlotu notikumu iespējamību.

Atkarībā no zināšanu jomas koeficients σ ļoti atšķiras. Piemēram, prognozējot Higsa bozona esamību, parametrs σ ir vienāds ar pieci (σ=5), kas atbilst p-vērtība=1/3,5 milj.. apgabaliem.

Efektivitāte

Jāņem vērā, ka koeficienti α un p-vērtība nav precīzas specifikācijas. Lai kāds būtu pētāmās parādības statistikas nozīmīguma līmenis, tas nav beznosacījuma pamats hipotēzes pieņemšanai. Piemēram, jo mazāka ir α vērtība, jo lielāka iespēja, ka izvirzītā hipotēze ir nozīmīga. Tomēr pastāv kļūdu risks, kas samazina pētījuma statistisko jaudu (nozīmību).

Pētnieki, kas koncentrējas tikai uz statistiski nozīmīgiem rezultātiem, var izdarīt kļūdainus secinājumus. Tajā pašā laikā ir grūti vēlreiz pārbaudīt viņu darbu, jo viņi izmanto pieņēmumus (kas patiesībā ir α un p vērtības vērtības). Tāpēc vienmēr ir ieteicams līdz ar statistiskā nozīmīguma aprēķinu noteikt vēl vienu rādītāju - statistiskā efekta lielumu. Efekta lielums ir ietekmes stipruma kvantitatīvais mērs.

UZTICAMĪBA STATISTIKA

- Angļu ticamība/validitāte, statistiskā; vāciski Validitat, statistische. Konsekvence, objektivitāte un neskaidrības trūkums statistikas testā vai C.L. mērījumu komplekts. D. s. var pārbaudīt, atkārtojot to pašu testu (vai anketu) par to pašu priekšmetu, lai redzētu, vai tiek iegūti vienādi rezultāti; vai salīdzinājums dažādas daļas testi, kuriem paredzēts izmērīt vienu un to pašu objektu.

Antinazi. Socioloģijas enciklopēdija, 2009

Skatiet, kas ir "STATISTISKĀ UZTICAMĪBA" citās vārdnīcās:

UZTICAMĪBA STATISTIKA- Angļu. ticamība/validitāte, statistiskā; vāciski Validitat, statistische. Konsekvence, objektivitāte un neskaidrības trūkums statistikas testā vai s. mērījumu komplekts. D. s. var pārbaudīt, atkārtojot to pašu testu (vai ... ... Vārdnīca socioloģijā

Statistikā vērtību sauc par statistiski nozīmīgu, ja tās nejaušības rašanās varbūtība vai pat ekstrēmākas vērtības ir maza. Šeit galējība tiek saprasta kā testa statistikas novirzes pakāpe no nulles hipotēzes. Atšķirību sauc par ... ... Wikipedia

Statistiskās stabilitātes fiziskā parādība ir tāda, ka, palielinoties izlases lielumam, biežums nejaušs notikums vai vidēji fiziskais daudzums tiecas uz kādu fiksētu numuru. Statistikas fenomens ... ... Wikipedia

ATŠĶIRĪBAS TICAMĪBA (līdzība)- analītiskā un statistiskā procedūra paraugu atšķirību vai līdzību nozīmīguma līmeņa noteikšanai atbilstoši pētītajiem rādītājiem (mainīgajiem) ... Mūsdienu izglītības process: pamatjēdzieni un termini

ATSKAITES, STATISTIKA Lielā grāmatvedības vārdnīca

ATSKAITES, STATISTIKA- valsts statistiskā novērošanas forma, kurā attiecīgās iestādes saņem no uzņēmumiem (organizācijām un iestādēm) tiem nepieciešamo informāciju likumā noteikto pārskata dokumentu (statistisko pārskatu) veidā par ... Lielā ekonomikas vārdnīca

Zinātne, kas pēta masu parādību sistemātiskas novērošanas metodes sociālā dzīve cilvēku, to skaitlisko aprakstu sastādīšanu un šo aprakstu zinātnisko apstrādi. Tādējādi teorētiskā statistika ir zinātne ...... enciklopēdiskā vārdnīca F. Brokhauss un I.A. Efrons

Korelācijas koeficients- (Korelācijas koeficients) Korelācijas koeficients ir divu nejaušu lielumu atkarības statistiskais rādītājs Korelācijas koeficienta definīcija, korelācijas koeficientu veidi, korelācijas koeficienta īpašības, aprēķins un pielietojums ... ... Investora enciklopēdija

Statistika- (Statistika) Statistika ir vispārēji teorētiska zinātne, kas pēta kvantitatīvās parādību un procesu izmaiņas. Valsts statistika, statistikas pakalpojumi, Rosstat (Goskomstat), statistikas dati, pieprasījumu statistika, pārdošanas statistika, ... ... Investora enciklopēdija

Korelācija- (Korelācija) Korelācija ir divu vai vairāku gadījuma mainīgo statistiskā sakarība. Korelācijas jēdziens, korelācijas veidi, korelācijas koeficients, korelācijas analīze, cenu korelācija, valūtu pāru korelācija Forex saturā ... ... Investora enciklopēdija

Grāmatas

Pētījumi matemātikā un matemātika pētniecībā: Metodiskais krājums par skolēnu pētniecisko darbību, Borzenko V.I.. Krājumā ir metodiskā attīstība piemērojams organizācijā pētniecības aktivitātes studenti. Krājuma pirmā daļa ir veltīta pētnieciskās pieejas pielietošanai…

Statistiskā nozīmība jeb p-nozīmības līmenis – galvenais testa rezultāts

statistiskā hipotēze. Tehniskā izteiksmē tā ir dotā iegūšanas varbūtība

selektīva pētījuma rezultāts, ar nosacījumu, ka faktiski vispārējam

komplektā, nulles hipotēze ir patiesa - tas ir, nav attiecības. Citiem vārdiem sakot, šis

varbūtība, ka atklātā sakarība ir nejauša, nevis īpašība

agregāti. Tā ir statistiskā nozīmība, p-nozīmības līmenis ir

savienojuma uzticamības kvantitatīvs novērtējums: jo mazāka šī varbūtība, jo uzticamāks savienojums.

Pieņemsim, ka, salīdzinot divus izlases vidējos rādītājus, tika iegūta līmeņa vērtība

statistiskā nozīmība p=0,05. Tas nozīmē, ka pārbaudot statistisko hipotēzi par

vidējo vienlīdzība vispārējā populācijā parādīja, ka, ja tā ir taisnība, tad varbūtība

konstatēto atšķirību nejaušība ir ne vairāk kā 5%. Citiem vārdiem sakot, ja

divi paraugi tika atkārtoti ņemti no vienas un tās pašas vispārējās populācijas, tad 1 no

20 gadījumi uzrādītu tādu pašu vai lielāku atšķirību starp šo paraugu vidējiem.

Tas ir, pastāv 5% iespēja, ka atrastās atšķirības ir nejaušas.

raksturs, un tie nav kopuma īpašums.

Saistībā ar zinātnisku hipotēzi statistiskā nozīmīguma līmenis ir kvantitatīvs

neuzticības pakāpes rādītājs slēdzienā par savienojuma esamību, kas aprēķināts pēc rezultātiem

šīs hipotēzes selektīva, empīriska pārbaude. Jo mazāka p vērtība, jo lielāka

pētījuma rezultāta statistiskā nozīme, apstiprinot zinātnisko hipotēzi.

Ir noderīgi zināt, kas ietekmē nozīmīguma līmeni. Nozīmes līmenis, ja pārējās lietas ir vienādas

augstāk (zemāka p vērtība), ja:

Savienojuma lielums (atšķirība) ir lielāks;

Iezīmes(-ju) mainīgums ir mazāks;

Izlases lielums(-i) ir lielāks(-i).

VienpusējsŠeit ir divu virzienu nozīmīguma testi

Ja pētījuma mērķis ir atklāt atšķirību starp divu vispārīgo parametru

pildvielas, kas atbilst tās dažādiem dabas apstākļiem (dzīves apstākļi,

pētāmo personu vecums utt.), bieži vien nav zināms, kurš no šiem parametriem būs lielāks, un

kura ir mazāka.

Piemēram, ja jūs interesē rezultātu mainīgums kontroles un

eksperimentālās grupas, tad, kā likums, nav pārliecības par atšķirības zīmi starp dispersijas vai

standarta novirzes rezultāti, pret kuriem tiek novērtēta mainīgums. Šajā gadījumā

nulles hipotēze ir tāda, ka dispersijas ir vienādas viena ar otru, un pētījuma mērķis ir

pierādīt pretējo, t.i. starp dispersijām ir atšķirība. Tajā pašā laikā tas ir atļauts

atšķirība var būt jebkuras zīmes. Šādas hipotēzes sauc par divpusējām.

Bet dažreiz uzdevums ir pierādīt parametra palielināšanos vai samazināšanos;

piemēram, vidējais rezultāts eksperimentālajā grupā ir augstāks nekā kontroles grupā. Kurā

vairs nav pieļaujams, ka atšķirība var būt ar citu zīmi. Šādas hipotēzes sauc

Vienpusējs.

Tiek saukti nozīmīguma testi, ko izmanto, lai pārbaudītu divpusējas hipotēzes

Divpusējs, un vienpusējs - vienpusējs.

Rodas jautājums, kurš no kritērijiem būtu jāizvēlas konkrētajā gadījumā. Atbilde

Šis jautājums ir ārpus formālās statistikas metožu darbības jomas un ir pilnībā

Atkarīgs no pētījuma mērķa. Nekādā gadījumā nevajadzētu izvēlēties vienu vai otru kritēriju pēc

Eksperimenta veikšana, pamatojoties uz eksperimentālo datu analīzi, jo tas var

novest pie nepareiziem secinājumiem. Ja pirms eksperimenta tiek pieņemts, ka atšķirība

No tā izriet, ka salīdzināmie parametri var būt gan pozitīvi, gan negatīvi