Statistik modelləşdirmə: üsullar, təsvir, tətbiq

Mündəricat:

Statistik modelləşdirmə: üsullar, təsvir, tətbiq
Statistik modelləşdirmə: üsullar, təsvir, tətbiq
Anonim

Statistik modelləşdirmədə təcəssüm olunmuş fərziyyələr bir sıra ehtimal paylamalarını təsvir edir, onlardan bəzilərinin paylanmanı adekvat şəkildə təxmin etdiyi güman edilir. Tərifdən müəyyən bir məlumat dəsti seçilir. Statistik modelləşdirməyə xas olan ehtimal paylamaları statistik modelləri digər qeyri-statistik riyazi modellərdən fərqləndirir.

Image
Image

Riyaziyyatla əlaqə

Bu elmi metod ilk növbədə riyaziyyata əsaslanır. Sistemlərin statistik modelləşdirilməsi adətən bir və ya daha çox təsadüfi dəyişənləri və ola bilsin ki, digər təsadüfi olmayan dəyişənləri əlaqələndirən riyazi tənliklərlə verilir. Beləliklə, statistik model "nəzəriyyənin formal təmsilidir" (Hermann Ader, Kennet Bollendən sitat gətirir).

Bütün statistik fərziyyə testləri və bütün statistik təxminlər statistik modellərdən əldə edilir. Ümumiyyətlə, statistik modellər statistik nəticənin əsasının bir hissəsidir.

Statistika üsullarımodelləşdirmə

Qeyri-rəsmi olaraq, statistik modeli müəyyən xüsusiyyətə malik statistik fərziyyə (və ya statistik fərziyyələr toplusu) kimi düşünmək olar: bu fərziyyə bizə hər hansı hadisənin baş vermə ehtimalını hesablamağa imkan verir. Nümunə olaraq, bir cüt adi altı tərəfli zarı nəzərdən keçirək. Sümüklə bağlı iki fərqli statistik fərziyyəni öyrənəcəyik.

İlk statistik fərziyyə statistik modeli təşkil edir, çünki yalnız bir fərziyyə ilə hər hansı hadisənin baş vermə ehtimalını hesablaya bilərik. Alternativ statistik fərziyyə statistik model təşkil etmir, çünki yalnız bir fərziyyə ilə biz hər bir hadisənin ehtimalını hesablaya bilmərik.

Tipik statistik model
Tipik statistik model

Yuxarıdakı misalda birinci fərziyyə ilə hadisənin baş vermə ehtimalını hesablamaq asandır. Bununla belə, bəzi digər nümunələrdə hesablama mürəkkəb və ya hətta qeyri-mümkün ola bilər (məsələn, milyonlarla illik hesablama tələb edə bilər). Statistik modeli təşkil edən fərziyyə üçün bu çətinlik məqbuldur: hesablamanın aparılması praktiki olaraq mümkün olmamalıdır, sadəcə nəzəri cəhətdən mümkündür.

Model nümunələri

Fərz edək ki, bizdə bərabər paylanmış uşaqlı məktəblilər var. Uşağın boyu stokastik olaraq yaşa bağlı olacaq: məsələn, bir uşağın 7 yaşında olduğunu bildiyimiz zaman, bu, uşağın 5 fut (təxminən 152 sm) boyu olma ehtimalına təsir göstərir. Bu əlaqəni xətti reqressiya modelində rəsmiləşdirə bilərik, məsələn: artım=b0 + b1agei+ εi, burada b0 kəsişmədir, b1 böyümə proqnozunu əldə edərkən yaşın vurulduğu parametrdir, εi səhv terminidir. Bu o deməkdir ki, boy müəyyən səhvlə yaşa görə proqnozlaşdırılır.

Etibarlı model bütün data nöqtələrinə uyğun olmalıdır. Beləliklə, düz xətt (heighti=b0 + b1agei) məlumat modeli üçün tənlik ola bilməz - əgər o, bütün məlumat nöqtələrinə tam uyğun gəlmirsə, yəni bütün məlumat nöqtələri xətt üzərində mükəmməl şəkildə yerləşir. Modelin bütün məlumat nöqtələrinə uyğun olması üçün εi xəta termini tənliyə daxil edilməlidir.

gender statistikası
gender statistikası

Statistik nəticə çıxarmaq üçün əvvəlcə εi üçün bəzi ehtimal paylamalarını qəbul etməliyik. Məsələn, güman edə bilərik ki, εi paylamaları sıfır orta ilə Qaussdur. Bu halda, model 3 parametrə malik olacaq: b0, b1 və Qauss paylanmasının dispersiyası.

Ümumi Təsvir

Statistik model riyazi modelin xüsusi sinfidir. Statistik modeli digər riyazi modellərdən fərqləndirən onun qeyri-deterministik olmasıdır. Statistik məlumatları modelləşdirmək üçün istifadə olunur. Beləliklə, riyazi tənliklərlə müəyyən edilən statistik modeldə bəzi dəyişənlərin xüsusi qiymətləri yoxdur, əksinə ehtimal paylamaları var; yəni bəzi dəyişənlər stoxastikdir. Yuxarıdakı misalda ε stokastik dəyişəndir; bu dəyişən olmadan, model idideterminist olardı.

Statistik modellər, modelləşdirilən fiziki proses deterministik olsa belə, tez-tez statistik təhlil və modelləşdirmədə istifadə olunur. Məsələn, sikkələrin atılması prinsipcə deterministik bir prosesdir; lakin o, adətən stokastik kimi modelləşdirilir (Bernoulli prosesi vasitəsilə).

istiləşmə statistikası
istiləşmə statistikası

Parametrik modellər

Parametrik modellər ən çox istifadə edilən statistik modellərdir. Yarımparametrik və qeyri-parametrik modellərə gəldikdə, Ser David Cox dedi: "Onlar ümumiyyətlə paylanmanın strukturu və forması haqqında daha az fərziyyələri ehtiva edir, lakin adətən güclü müstəqillik fərziyyələrini ehtiva edir." Bütün digər qeyd olunan modellər kimi, onlar da tez-tez riyazi modelləşdirmənin statistik metodunda istifadə olunur.

Çoxsəviyyəli modellər

Çoxsəviyyəli modellər (həmçinin iyerarxik xətti modellər, iç-içə məlumat modelləri, qarışıq modellər, təsadüfi əmsallar, təsadüfi təsir modelləri, təsadüfi parametr modelləri və ya bölməli modellər kimi tanınır) birdən çox səviyyədə dəyişən statistik parametr modelləridir. Buna misal olaraq fərdi tələbələr üçün göstəriciləri, eləcə də tələbələrin qruplaşdırıldığı sinif otaqları üçün göstəriciləri ehtiva edən şagird nailiyyət modelidir. Bu modellər xətti modellərin (xüsusən də xətti reqressiya) ümumiləşdirilməsi kimi düşünülə bilər, baxmayaraq ki, onları qeyri-xətti modellərə də şamil etmək olar. Bu modellər halına gəldiKifayət qədər hesablama gücü və proqram təminatı mövcud olduqdan sonra daha populyarlaşdı.

Seqment statistikası
Seqment statistikası

Çoxsəviyyəli modellər xüsusilə iştirakçılar üçün məlumatların birdən çox səviyyədə təşkil edildiyi tədqiqat layihələri üçün uyğundur (yəni, iç-içə məlumat). Təhlil vahidləri adətən kontekst/məcmu vahidlər (daha yüksək səviyyədə) daxilində yerləşdirilmiş fərdlərdir (aşağı səviyyədə). Çoxsəviyyəli modellərdə verilənlərin ən aşağı səviyyəsi adətən fərdi olsa da, fərdlərin təkrar ölçmələri də nəzərdən keçirilə bilər. Beləliklə, çoxsəviyyəli modellər birdəyişənli və ya çoxdəyişənli təkrar ölçülərin təhlili üçün alternativ analiz növü təqdim edir. Artım əyrilərində fərdi fərqlər nəzərə alına bilər. Bundan əlavə, çoxsəviyyəli modellər ANCOVA-ya alternativ kimi istifadə oluna bilər, burada asılı dəyişən xalları müalicə fərqləri üçün sınaqdan əvvəl kovariatlar (məsələn, fərdi fərqlər) üçün düzəliş edilir. Çoxsəviyyəli modellər ANCOVA tərəfindən tələb olunan vahid reqressiya yamacları ehtimalı olmadan bu təcrübələri təhlil edə bilir.

Çoxsəviyyəli modellər çox səviyyəli məlumatlar üçün istifadə edilə bilər, baxmayaraq ki, iki səviyyəli modellər ən çox yayılmışdır və bu məqalənin qalan hissəsi bunlara diqqət yetirir. Asılı dəyişən analizin ən aşağı səviyyəsində araşdırılmalıdır.

Atmosfer təzyiqi qrafiki
Atmosfer təzyiqi qrafiki

Model seçimi

Model seçimistatistik modelləşdirmə çərçivəsində həyata keçirilən verilənlər əsasında namizəd modellər toplusundan seçmək vəzifəsidir. Ən sadə hallarda artıq mövcud olan verilənlər toplusu nəzərə alınır. Bununla belə, tapşırıq toplanmış məlumatların model seçimi tapşırığına yaxşı uyğunlaşması üçün təcrübələrin layihələndirilməsini də əhatə edə bilər. Bənzər proqnozlaşdırıcı və ya izahedici gücə malik olan namizəd modelləri nəzərə alsaq, ən sadə model ən yaxşı seçim ola bilər (Occam ülgüc).

Konishi & Kitagawa deyir ki, "Statistik nəticə çıxarma problemlərinin əksəriyyəti statistik modelləşdirmə ilə bağlı problemlər hesab edilə bilər." Eynilə, Koks demişdir: “Mövzunun statistik modelə necə çevrilməsi çox vaxt təhlilin ən vacib hissəsidir.”

Model seçimi qeyri-müəyyənlik şəraitində qərar və ya optimallaşdırma məqsədləri üçün çoxlu hesablama modellərindən bir neçə təmsilçi modelin seçilməsi probleminə də istinad edə bilər.

Qrafik nümunələr

Qrafik model və ya ehtimal qrafik modeli, (PGM) və ya strukturlaşdırılmış ehtimal modeli, qrafikin təsadüfi dəyişənlər arasında şərti əlaqənin strukturunu ifadə etdiyi ehtimal modelidir. Onlar adətən ehtimal nəzəriyyəsi, statistika (xüsusilə Bayes statistikası) və maşın öyrənməsində istifadə olunur.

Qrafik ilə statistik model
Qrafik ilə statistik model

Ekonometrik modellər

Ekonometrik modellər istifadə olunan statistik modellərdirekonometriya. Ekonometrik model müəyyən iqtisadi hadisə ilə bağlı müxtəlif iqtisadi kəmiyyətlər arasında mövcud olduğu güman edilən statistik əlaqələri müəyyən edir. Ekonometrik model qeyri-müəyyənliyi nəzərə alan deterministik iqtisadi modeldən və ya özü stoxastik olan iqtisadi modeldən əldə edilə bilər. Bununla belə, heç bir konkret iqtisadi nəzəriyyə ilə bağlı olmayan ekonometrik modellərdən də istifadə etmək mümkündür.

Tövsiyə: