Hipoteza testi statistikada zəruri prosedurdur. Bir fərziyyə testi nümunə məlumatları ilə hansı ifadənin ən yaxşı şəkildə dəstəkləndiyini müəyyən etmək üçün bir-birini istisna edən iki ifadəni qiymətləndirir. Tapıntının statistik əhəmiyyətli olduğu deyildikdə, bunun səbəbi hipotez testidir.
Doğrulama üsulları
Statistik fərziyyələrin yoxlanılması üsulları statistik təhlil üsullarıdır. Tipik olaraq, iki statistika dəsti müqayisə edilir və ya nümunə götürülmüş məlumat dəsti ideallaşdırılmış modeldən sintetik məlumat dəsti ilə müqayisə edilir. Məlumatlar yeni mənalar əlavə edəcək şəkildə şərh edilməlidir. Son nəticənin müəyyən strukturunu fərz etməklə və fərziyyəni təsdiq və ya rədd etmək üçün statistik metodlardan istifadə etməklə onları şərh edə bilərsiniz. Fərziyyə hipotez adlanır və bu məqsədlə istifadə edilən statistik testlər statistik fərziyyələr adlanır.
H0 və H1 hipotezləri
İki əsas varfərziyyələrin statistik sınağı anlayışları - sözdə "əsas, və ya sıfır fərziyyə" və " alternativ hipotez". Bunlara Neyman-Pirson hipotezləri də deyilir. Statistik test fərziyyəsi sıfır hipotezi, əsas hipotez və ya qısaca H0 adlanır. Buna tez-tez defolt fərziyyə və ya heç bir şeyin dəyişmədiyi fərziyyəsi deyilir. Test fərziyyəsinin pozulması tez-tez birinci fərziyyə, alternativ hipotez və ya H1 adlanır. H1 bəzi başqa fərziyyələrin stenoqramıdır, çünki bu barədə bildiyimiz tək şey H0 məlumatının ləğv edilə biləcəyidir.
Null fərziyyəni rədd etmədən və ya rədd etməzdən əvvəl test nəticəsi şərh edilməlidir. Müqayisə statistik cəhətdən əhəmiyyətli hesab edilir, əgər verilənlər dəstləri arasındakı əlaqə həddi ehtimala - əhəmiyyət səviyyəsinə görə sıfır fərziyyənin həyata keçirilməsi ehtimalı azdır. Statistik fərziyyələrin yoxlanılması üçün uyğunluq meyarları da mövcuddur. Bu, naməlum paylanmanın ehtimal olunan qanunu ilə əlaqəli olan hipotez test meyarının adıdır. Bu, empirik və nəzəri paylanmalar arasındakı uyğunsuzluğun ədədi ölçüsüdür.
Statistik fərziyyələrin yoxlanılması proseduru və meyarları
Ən ümumi fərziyyə seçim üsulları ya Akaike məlumat meyarına, ya da Bayes əmsalına əsaslanır. Statistik fərziyyələrin yoxlanılması həm nəticə çıxarmada, həm də Bayesian nəticədə əsas texnikadır, baxmayaraq ki, iki növün nəzərəçarpacaq fərqləri var. Statistik hipotez testləriyanlış defolt və ya sıfır fərziyyə ilə bağlı səhv qərar vermə ehtimalına nəzarət edən proseduru müəyyənləşdirin. Prosedur onun işləmə ehtimalına əsaslanır. Səhv qərar vermə ehtimalı, sıfır fərziyyənin doğru olması və heç bir xüsusi alternativ fərziyyənin olmaması ehtimalının olmamasıdır. Test bunun doğru və ya yalan olduğunu göstərə bilməz.
Qərar nəzəriyyəsinin alternativ üsulları
Qərar nəzəriyyəsinin alternativ üsulları mövcuddur ki, burada sıfır və birinci fərziyyələr daha bərabər əsasda nəzərdən keçirilir. Bayes nəzəriyyəsi kimi digər qərar qəbuletmə yanaşmaları, tək bir sıfır fərziyyəyə diqqət yetirməkdənsə, pis qərarların nəticələrini bütün imkanlar arasında balanslaşdırmağa çalışır. Fərziyyələrdən hansının düzgün olduğuna qərar vermək üçün bir sıra digər yanaşmalar məlumatlara əsaslanır, onlardan hansının arzu olunan xassələri var. Lakin fərziyyə testi bir çox elm sahələrində məlumatların təhlilinə üstünlük təşkil edən yanaşmadır.
Statistik fərziyyənin sınaqdan keçirilməsi
Bir nəticə dəsti digər çoxluqdan fərqlənəndə, statistik fərziyyə testinə və ya statistik fərziyyə testlərinə etibar etmək lazımdır. Onların təfsiri p-dəyərlərinin və kritik dəyərlərin düzgün başa düşülməsini tələb edir. Həm də anlamaq lazımdır ki, əhəmiyyət səviyyəsindən asılı olmayaraq, testlərdə hələ də səhvlər ola bilər. Buna görə də nəticə düzgün olmaya bilər.
Sınaq prosesi aşağıdakılardan ibarətdirbir neçə addım:
- Tədqiqat üçün ilkin fərziyyə yaradılır.
- Müvafiq sıfır və alternativ fərziyyələr göstərilmişdir.
- Testdəki nümunə ilə bağlı statistik fərziyyələri izah edir.
- Hansı testin uyğun olduğunun müəyyən edilməsi.
- Null fərziyyənin rədd ediləcəyi əhəmiyyətlilik səviyyəsini və ehtimal həddini seçin.
- Sıfır fərziyyə testi statistikasının paylanması sıfır hipotezinin rədd edildiyi mümkün dəyərləri göstərir.
- Hesablama davam edir.
- Alternativin xeyrinə sıfır fərziyyəni rədd etmək və ya qəbul etmək qərarı verilir.
P-dəyəri istifadə edən alternativ var.
Əhəmiyyət testləri
Saf məlumatın təfsiri olmadan praktiki istifadəsi yoxdur. Statistikada, məlumatlarla bağlı suallar vermək və nəticələri şərh etməyə gəldikdə, cavabların düzgünlüyünü və ya ehtimalını təmin etmək üçün statistik üsullardan istifadə olunur. Statistik fərziyyələri sınaqdan keçirərkən bu üsullar sinfi statistik test və ya əhəmiyyət testləri adlanır. “Fərziyyə” termini fərziyyə və nəzəriyyələrin araşdırıldığı elmi metodları xatırladır. Statistikada fərziyyə testi verilmiş bir fərziyyə verilən kəmiyyətlə nəticələnir. Bu, fərziyyənin doğru olub-olmadığını və ya pozuntunun olub olmadığını şərh etməyə imkan verir.
Testlərin statistik şərhi
Fərziyyə testlərihansı tədqiqat nəticələrinin əvvəlcədən müəyyən edilmiş əhəmiyyət səviyyəsinə görə sıfır fərziyyənin rədd edilməsinə səbəb olacağını müəyyən etmək üçün istifadə olunur. Statistik fərziyyə testinin nəticələri onun üzərində işin davam etdirilməsi üçün şərh edilməlidir. Statistik fərziyyələrin yoxlanılması meyarlarının iki ümumi forması var. Bunlar p-dəyəri və kritik dəyərlərdir. Seçilmiş meyardan asılı olaraq, alınan nəticələr fərqli şəkildə şərh edilməlidir.
P-dəyəri nədir
Çıxış p-dəyəri şərh edilərkən statistik əhəmiyyətli kimi təsvir edilir. Əslində, bu göstərici sıfır fərziyyənin rədd edildiyi təqdirdə səhv ehtimalı deməkdir. Başqa sözlə, ondan test nəticəsini şərh etmək və ya kəmiyyətləndirmək üçün istifadə edilə bilən dəyəri adlandırmaq və sıfır fərziyyənin rədd edilməsində səhv ehtimalını müəyyən etmək üçün istifadə edilə bilər. Məsələn, siz verilənlər nümunəsi üzərində normallıq testi keçirə və kənara çıxmaq şansının az olduğunu görə bilərsiniz. Bununla belə, sıfır hipotezini rədd etmək lazım deyil. Statistik fərziyyə testi p-dəyəri qaytara bilər. Bu, p dəyərini əhəmiyyət səviyyəsi adlanan əvvəlcədən müəyyən edilmiş hədd dəyəri ilə müqayisə etməklə həyata keçirilir.
Əhəmiyyət Səviyyəsi
Əhəmiyyət səviyyəsi çox vaxt yunanca kiçik "alfa" hərfi ilə yazılır. Alfa üçün istifadə olunan ümumi dəyər 5% və ya 0,05-dir. Daha kiçik bir alfa dəyəri sıfır hipotezinin daha etibarlı şərhini təklif edir. p-dəyəri ilə müqayisə edilirəvvəlcədən seçilmiş alfa dəyəri. Əgər p-dəyəri alfadan azdırsa, nəticə statistik cəhətdən əhəmiyyətlidir. Əhəmiyyət səviyyəsi onu birdən çıxarmaqla tərsinə çevrilə bilər. Bu, müşahidə edilən nümunə məlumatları nəzərə alınmaqla hipotezin etibarlılıq səviyyəsini müəyyən etmək üçün edilir. Statistik fərziyyələri yoxlamaq üçün bu üsuldan istifadə edərkən P-dəyəri ehtimal xarakteri daşıyır. Bu o deməkdir ki, statistik testin nəticəsinin şərhi zamanı insan nəyin doğru və ya yalan olduğunu bilmir.
Statistik fərziyyələrin yoxlanılması nəzəriyyəsi
Null fərziyyənin rədd edilməsi o deməkdir ki, onun ehtimal edildiyinə dair kifayət qədər statistik sübut var. Əks halda, bu, onu rədd etmək üçün kifayət qədər statistikanın olmaması deməkdir. Statistik testləri sıfır fərziyyəni rədd etmək və qəbul etmək dixotomiyası baxımından düşünmək olar. Sıfır fərziyyənin statistik sınaqdan keçirilməsinin təhlükəsi ondan ibarətdir ki, qəbul olunarsa, o, doğru görünə bilər. Bunun əvəzinə sıfır fərziyyənin rədd edilmədiyini söyləmək daha düzgün olardı, çünki onu rədd etmək üçün kifayət qədər statistik sübut yoxdur.
Bu an tez-tez naşı əlavələri qarışdırır. Belə bir vəziyyətdə nəticənin ehtimala əsaslandığını və sıfır fərziyyəni qəbul etməyin belə hələ də kiçik bir səhv şansının olduğunu özünüzə xatırlatmaq vacibdir.
Doğru və ya yanlış sıfır fərziyyə
P dəyərinin şərhi sıfır demək deyilhipotez doğru və ya yanlışdır. Bu o deməkdir ki, empirik məlumatlara və seçilmiş statistik testə əsaslanaraq müəyyən səviyyədə statistik əhəmiyyət kəsb edən sıfır fərziyyəni rədd etmək və ya rədd etmək seçimi edilib. Buna görə də, p-dəyəri statistik testlərə daxil edilmiş əvvəlcədən müəyyən edilmiş fərziyyə altında verilən məlumatların ehtimalı kimi düşünülə bilər. p-dəyəri, sıfır fərziyyə doğru olarsa, məlumat nümunəsinin müşahidə olunma ehtimalının ölçüsüdür.
Kritik dəyərlərin şərhi
Bəzi testlər səh. Bunun əvəzinə onlar kritik dəyərlərin siyahısını qaytara bilərlər. Belə bir araşdırmanın nəticələri oxşar şəkildə şərh olunur. Tək p-dəyərini əvvəlcədən müəyyən edilmiş əhəmiyyət səviyyəsi ilə müqayisə etmək əvəzinə, test statistikası kritik dəyərlə müqayisə edilir. Daha az olduğu ortaya çıxarsa, sıfır fərziyyəni rədd etmək mümkün deyildi. Əgər ondan böyük və ya bərabərdirsə, sıfır hipotezi rədd edilməlidir. Statistik fərziyyənin yoxlanılması alqoritminin mənası və onun nəticəsinin şərhi p-qiymətinə bənzəyir. Seçilmiş əhəmiyyətlilik səviyyəsi verilənlər əsasında əsas test fərziyyəsini rədd etmək və ya rədd etməmək üçün ehtimala əsaslanan qərardır.
Statistik testlərdə səhvlər
Statistik fərziyyə testinin təfsiri ehtimala əsaslanır. Statistik fərziyyələri yoxlamaq vəzifəsi doğru və ya yalan ifadə tapmaq deyil. Test sübutları səhv ola bilər. Məsələn, alfa 5% idisə, bu o deməkdir ki, əksər hissəsi üçün 20-dən 1-isıfır fərziyyə səhvən rədd ediləcək. Və ya məlumat nümunəsindəki statistik səs-küyə görə olmayacaq. Bu məqamı nəzərə alsaq, sıfır fərziyyəni rədd etmək üçün kiçik bir p dəyəri onun yalan olduğunu və ya səhvə yol verildiyini bildirə bilər. Bu tip xəta edilirsə, nəticə yalançı müsbət adlanır. Və belə bir səhv statistik fərziyyələri sınaqdan keçirərkən birinci növ səhvdir. Digər tərəfdən, əgər p-dəyəri sıfır fərziyyənin rədd edilməsi demək üçün kifayət qədər böyükdürsə, bu onun doğru olduğunu ifadə edə bilər. Və ya düzgün deyil və səhvə yol verilən bəzi qeyri-mümkün hadisə baş verdi. Bu növ xəta yanlış mənfi adlanır.
Səhv ehtimalı
Statistik fərziyyələri sınaqdan keçirərkən hələ də bu növ səhvlərdən hər hansı birini etmək şansı var. Yanlış məlumatlar və ya yanlış nəticələr çox ehtimal olunur. İdeal olaraq, bu səhvlərdən birinin baş vermə ehtimalını minimuma endirən bir əhəmiyyət səviyyəsi seçilməlidir. Məsələn, sıfır fərziyyələrin statistik sınaqdan keçirilməsi çox aşağı səviyyəli əhəmiyyətə malik ola bilər. 0,05 və 0,01 kimi əhəmiyyətlilik səviyyələri bir çox elm sahələrində ümumi olsa da, ən çox istifadə edilən əhəmiyyətlilik səviyyəsi 310^-7 və ya 0,0000003-dür. Ona çox vaxt “5-siqma” deyilir. Bu o deməkdir ki, təcrübələrin 3,5 milyon müstəqil təkrarlanmasının 1-i ehtimalı ilə nəticə təsadüfi olub. Statistik fərziyyələrin sınaqdan keçirilməsinə dair nümunələr çox vaxt belə səhvlərə yol verir. Müstəqil nəticələr əldə etməyin vacib olmasının səbəbi də budur.doğrulama.
Statistik doğrulamadan istifadə nümunələri
Təcrübədə fərziyyə testinin bir neçə ümumi nümunəsi var. Ən məşhurlarından biri “Çay dequstasiyası” kimi tanınır. Biometrikanın qurucusu Robert Fişerin həmkarı Dr. Muriel Bristol onun ilk olaraq bir stəkan çaya, yoxsa südə əlavə olunduğunu dəqiq deyə bildiyini iddia etdi. Fisher təsadüfi olaraq ona səkkiz stəkan (hər çeşiddən dördü) verməyi təklif etdi. Test statistikası sadə idi: kubok seçimində uğurların sayını hesablamaq. Kritik bölgə, ola bilsin, adi ehtimal meyarına (< 5%; 70-də 1 ≈ 1,4%) əsaslanan 4 bölgədən yeganə uğur idi. Fisher alternativ bir fərziyyənin lazım olmadığını müdafiə etdi. Xanım hər bir fincanı düzgün müəyyənləşdirdi ki, bu da statistik əhəmiyyətli nəticə hesab edildi. Bu təcrübə Fişerin Tədqiqatçılar üçün Statistika Metodları kitabına səbəb oldu.
Müttəhim Nümunəsi
Statistik mühakimə proseduru təqsirləndirilən şəxsin təqsiri sübuta yetirilənə qədər təqsirsiz hesab edildiyi cinayət məhkəməsi ilə müqayisə edilə bilər. Prokuror təqsirləndirilən şəxsin təqsirini sübut etməyə çalışır. Yalnız ittiham üçün kifayət qədər sübut olduqda müttəhimi təqsirli hesab etmək olar. Prosedurun əvvəlində iki fərziyyə var: “Müttəhim günahkar deyil” və “Müttəhim günahkardır”. Təqsirsizlik fərziyyəsi yalnız o zaman rədd edilə bilər ki, səhv ehtimalı çox azdır, çünki günahsız müttəhimi məhkum etmək istəmir. Belə xəta I növ xəta adlanır və onun baş verməsinadir hallarda idarə olunur. Bu asimmetrik davranışın nəticəsi olaraq II növ xəta, yəni cinayətkarın bəraət alması daha çox olur.
Statistikalar böyük həcmdə məlumatların təhlili zamanı faydalıdır. Bu, heç bir elmi nəzəriyyə olmasa belə, nəticələri əsaslandıra bilən fərziyyələrin yoxlanmasına eyni dərəcədə aiddir. Çayın dadına baxma nümunəsində "aydın" idi ki, çaya süd tökmək və ya südə çay tökmək arasında heç bir fərq yoxdur.
Fərziyyə testinin real praktik tətbiqinə daxildir:
- kişilərin qadınlardan daha çox kabus görüb-görmədiyini yoxlamaq;
- sənəd aidiyyatı;
- Tam ayın davranışa təsirinin qiymətləndirilməsi;
- yarasanın əks-sədadan istifadə edərək həşərat aşkarlaya biləcəyi diapazonun müəyyən edilməsi;
- siqareti atmaq üçün ən yaxşı vasitələri seçmək;
- Bamper stikerlərinin avtomobil sahibinin davranışını əks etdirməsi yoxlanılır.
Statistik fərziyyələrin yoxlanılması ümumi statistikada və statistik nəticə çıxarmada mühüm rol oynayır. Dəyər testi elmi metodun əsasında proqnozlaşdırılan dəyər və eksperimental nəticənin ənənəvi müqayisəsini əvəz etmək üçün istifadə olunur. Nəzəriyyə yalnız əlaqənin əlamətini proqnozlaşdırmağa qadir olduqda, istiqamətləndirilmiş fərziyyə testləri elə konfiqurasiya edilə bilər ki, yalnız statistik əhəmiyyətli nəticə nəzəriyyəni dəstəkləsin. Qiymətləndirmə nəzəriyyəsinin bu forması ən sərtdirhipotez testindən istifadənin tənqidi.