Statistik model bəzi nümunə məlumatlarının yaradılması ilə bağlı müxtəlif fərziyyələr toplusunu özündə cəmləşdirən riyazi proyeksiyadır. Termin çox vaxt ideallaşdırılmış formada təqdim olunur.
Statistik modeldə ifadə edilən fərziyyələr bir sıra ehtimal paylamalarını göstərir. Onların bir çoxu müəyyən məlumat dəstinin götürüldüyü paylanmanı düzgün təxmin etmək üçün nəzərdə tutulub. Proyeksiyanı digər riyazi modifikasiyalardan fərqləndirən statistik modellərə xas olan ehtimal paylamalarıdır.
Ümumi proyeksiya
Riyazi model müəyyən anlayışlar və dildən istifadə edərək sistemin təsviridir. Onlar təbiət elmlərinə (fizika, biologiya, yerşünaslıq, kimya kimi) və mühəndislik fənlərinə (informatika, elektrik mühəndisliyi kimi), həmçinin sosial elmlərə (iqtisadiyyat, psixologiya, sosiologiya, siyasət elmləri kimi) müraciət edirlər.
Model sistemi izah etməyə kömək edə bilər vəmüxtəlif komponentlərin təsirini öyrənin və davranış haqqında proqnozlar verin.
Riyazi modellər dinamik sistemlər, statistik proqnozlar, diferensial tənliklər və ya oyun nəzəri parametrləri daxil olmaqla bir çox formada ola bilər. Bu və digər növlər üst-üstə düşə bilər və bu modelə bir çox abstrakt strukturlar daxildir. Ümumiyyətlə, riyazi proyeksiyalara məntiqi komponentlər də daxil ola bilər. Bir çox hallarda elmi sahənin keyfiyyəti nəzəri cəhətdən işlənmiş riyazi modellərin təkrar təcrübələrin nəticələri ilə nə dərəcədə uyğun olmasından asılıdır. Nəzəri proseslər və eksperimental ölçmələr arasında razılığın olmaması çox vaxt daha yaxşı nəzəriyyələr inkişaf etdirildikcə mühüm irəliləyişlərə səbəb olur.
Fizika elmlərində ənənəvi riyazi model çoxlu sayda aşağıdakı elementləri ehtiva edir:
- Nəzarət tənlikləri.
- Əlavə alt modellər.
- Tənlikləri təyin edin.
- Təsisedici tənliklər.
- Fərziyyələr və məhdudiyyətlər.
- İlkin və sərhəd şərtləri.
- Klassik məhdudiyyətlər və kinematik tənliklər.
Formula
Statistik model, bir qayda olaraq, bir və ya bir neçə təsadüfi dəyişəni və ola bilsin ki, digər təbii dəyişənləri birləşdirən riyazi tənliklərlə müəyyən edilir. Eynilə, proyeksiya "konseptin formal konsepsiyası" hesab olunur.
Bütün statistik fərziyyələrin yoxlanılması və statistik qiymətləndirmələr riyazi modellərdən əldə edilir.
Giriş
Qeyri-rəsmi olaraq, statistik modelə spesifik xüsusiyyəti olan fərziyyə (və ya fərziyyələr toplusu) kimi baxmaq olar: o, hər hansı hadisənin baş vermə ehtimalını hesablamağa imkan verir. Nümunə olaraq, bir cüt adi altı tərəfli zarı nəzərdən keçirək. Sümüklə bağlı iki fərqli statistik fərziyyə araşdırılmalıdır.
İlk fərziyyə belədir:
Zərlərin hər biri üçün ədədlərdən birini (1, 2, 3, 4, 5 və 6) əldə etmə ehtimalı: 1/6.
Bu fərziyyədən hər iki zərin ehtimalını hesablaya bilərik: 1:1/6×1/6=1/36.
Ümumiyyətlə, hər hansı hadisənin baş vermə ehtimalını hesablaya bilərsiniz. Bununla belə, başa düşmək lazımdır ki, hər hansı digər qeyri-trivial hadisənin baş vermə ehtimalını hesablamaq mümkün deyil.
Yalnız birinci rəy statistik riyazi model toplayır: ona görə ki, yalnız bir fərziyyə ilə hər bir hərəkətin ehtimalını müəyyən etmək mümkündür.
Yuxarıdakı nümunədə ilkin icazə ilə hadisənin baş vermə ehtimalını müəyyən etmək asandır. Bəzi digər misallarla hesablama çətin və ya hətta qeyri-real ola bilər (məsələn, uzun illər hesablamalar tələb edə bilər). Statistik təhlil modelini tərtib edən şəxs üçün belə mürəkkəblik yolverilməz hesab olunur: hesablamaların həyata keçirilməsi praktiki olaraq mümkünsüz və nəzəri cəhətdən qeyri-mümkün olmamalıdır.
Formal tərif
Riyazi dillə desək, sistemin statistik modeli adətən bir cüt (S, P) kimi qəbul edilir, burada Smümkün müşahidələr toplusu, yəni nümunə sahəsi və P S.
üzərindəki ehtimal paylamaları dəstidir.
Bu tərifin intuisiyası aşağıdakı kimidir. Müəyyən məlumatları yaradan prosesin yaratdığı "həqiqi" ehtimal paylanmasının olduğu güman edilir.
Set
Modelin parametrlərini təyin edən odur. Parametrləşdirmə ümumiyyətlə fərqli paylamalarla nəticələnmək üçün fərqli dəyərlər tələb edir, yəni
tutmalıdır (başqa sözlə, inyeksiya olmalıdır). Tələblərə cavab verən parametrləşdirmənin müəyyən edilə bilən olduğu deyilir.
Nümunə
Fərz edək ki, müxtəlif yaşlarda olan bir neçə tələbə var. Uşağın boyu stokastik olaraq doğum ili ilə əlaqəli olacaq: məsələn, məktəblinin 7 yaşı olanda bu, böyümə ehtimalına təsir edir, yalnız insanın boyu 3 santimetrdən çox olacaq.
Bu yanaşmanı düzxətli reqressiya modelində, məsələn, aşağıdakı kimi rəsmiləşdirə bilərsiniz: hündürlük i=b 0 + b 1agei + εi, burada b 0 kəsişmədir, b 1 yaşın parametridir yüksəklik monitorinqi əldə edildikdə çoxalır. Bu səhv terminidir. Yəni boyu müəyyən xəta ilə yaşa görə proqnozlaşdırıldığını güman edir.
Etibarlı forma bütün məlumat nöqtələrinə uyğun olmalıdır. Beləliklə, düzxətli istiqamət (səviyyə i=b 0 + b 1agei) məlumat modeli üçün tənlik ola bilməz - əgər o, tamamilə bütün məqamlara aydın şəkildə cavab vermirsə. yəniistisnasız olaraq, bütün məlumatlar xətdə qüsursuz yatır. Səhv həddi εi tənliyə daxil edilməlidir ki, forma tamamilə bütün məlumat elementlərinə uyğun olsun.
Statistik nəticə çıxarmaq üçün əvvəlcə ε i üçün bəzi ehtimal paylamalarını qəbul etməliyik. Məsələn, güman etmək olar ki, ε i-nin paylanması sıfır orta ilə Qauss formasına malikdir. Bu halda, modelin 3 parametri olacaq: b 0, b 1 və Qauss paylanmasının dispersiyası.
Modeli rəsmi olaraq (S, P) kimi təyin edə bilərsiniz.
Bu nümunədə model S işarəsi ilə müəyyən edilir və buna görə də P haqqında bəzi fərziyyələr irəli sürmək olar. İki seçim var:
Bu artım yaşın xətti funksiyası ilə təxmini edilə bilər;
Təxmini səhvlər Qauss daxilində olduğu kimi paylanır.
Ümumi qeydlər
Modellərin statistik parametrləri riyazi proyeksiyanın xüsusi sinfidir. Bir növü digərindən fərqləndirən nədir? Beləliklə, statistik model qeyri-deterministikdir. Beləliklə, onda riyazi tənliklərdən fərqli olaraq, müəyyən dəyişənlər müəyyən qiymətlərə malik deyil, əksinə imkanların paylanmasına malikdir. Yəni fərdi dəyişənlər stoxastik hesab olunur. Yuxarıdakı misalda ε stokastik dəyişəndir. Onsuz, proyeksiya deterministik olardı.
Maddi proses deterministik hesab edilsə belə, statistik modelin qurulması tez-tez istifadə olunur. Məsələn, sikkə atmaq, prinsipcə, əvvəlcədən müəyyən edilmiş bir hərəkətdir. Bununla belə, bu, hələ də əksər hallarda stoxastik kimi modelləşdirilir (Bernulli prosesi vasitəsilə).
Konişi və Kitagavaya görə, statistik model üçün üç məqsəd var:
- Proqnozlar.
- İnformasiya mədən.
- Stokastik strukturların təsviri.
Proyeksiya ölçüsü
Fərz edək ki, statistik proqnoz modeli var, O sonlu ölçüyə malikdirsə, model parametrik adlanır. Həlldə
yazmalısınız
burada k müsbət tam ədəddir (R istənilən real ədədləri ifadə edir). Burada k modelin ölçüsü adlanır.
Nümunə olaraq, bütün məlumatların birdəyişənli Qauss paylanmasından gəldiyini güman edə bilərik:
Bu misalda k ölçüsü 2-dir.
Və başqa bir misal olaraq, verilənlərin (x, y) nöqtələrindən ibarət olduğunu güman etmək olar ki, bu nöqtələrin Qauss qalıqları ilə düz xətt üzrə paylanması (sıfır orta ilə). Onda statistik iqtisadi modelin ölçüsü 3-ə bərabərdir: xəttin kəsişməsi, onun mailliyi və qalıqların paylanmasının dispersiyası. Qeyd etmək lazımdır ki, həndəsədə düz xəttin ölçüsü 1 olur.
Yuxarıdakı dəyər texniki cəhətdən k ölçüsünə malik olan yeganə parametr olsa da, bəzən k fərqli dəyərləri ehtiva edən hesab olunur. Məsələn, bir ölçülü Qauss paylanması ilə O, ölçüsü 2 olan yeganə parametrdir, lakin bəzən ikidən ibarət hesab olunur.fərdi parametr - orta dəyər və standart kənarlaşma.
O dəyərlər dəsti sonsuz ölçülüdürsə, statistik proses modeli parametrik deyil. Həm sonlu, həm də sonsuz ölçülü parametrlərə malikdirsə, həm də yarı parametrikdir. Formal olaraq, əgər k O ölçüsüdürsə və n nümunələrin sayıdırsa, yarımparametrik və qeyri-parametrik modellərdə
var.
onda model yarıparametrikdir. Əks halda, proyeksiya parametrik deyil.
Parametrik modellər ən çox istifadə edilən statistikadır. Yarımparametrik və qeyri-parametrik proqnozlar ilə bağlı ser Devid Koks qeyd etdi:
"Adətən, onlar faktura və paylanma forması ilə bağlı ən az fərziyyələri əhatə edir, lakin onlar öz-özünə təminat haqqında güclü nəzəriyyələri ehtiva edirlər."
Yerləşmiş modellər
Onları çoxsəviyyəli proqnozlarla qarışdırmayın.
Birincinin parametrlərinə məhdudiyyətlər qoymaqla birincini ikinciyə çevirmək olarsa, iki statistik model yuvalanır. Məsələn, bütün Qauss paylamalarının çoxluğunda sıfır orta paylamaların yuvalanmış dəsti var:
Yəni, sıfır orta ilə paylanmaları əldə etmək üçün bütün Qauss paylamalarının çoxluğunda ortanı məhdudlaşdırmalısınız. İkinci misal olaraq, kvadratik model y=b 0 + b 1 x + b 2 x 2 + ε, ε ~N (0, σ 2) daxili xətti modelə malikdir y=b 0 + b 1 x + ε, ε ~ N (0,σ 2) - yəni b2 parametri 0-a bərabərdir.
Bu nümunələrin hər ikisində birinci model ikinci modeldən daha yüksək ölçüyə malikdir. Bu tez-tez olur, lakin həmişə belə deyil. Başqa bir misal 2 ölçüsü olan müsbət orta olan Qauss paylanmaları toplusudur.
Modellərin müqayisəsi
Müşahidə edilmiş məlumatın əsasında onu yaradan prosesin yaratdığı "həqiqi" ehtimal paylanmasının olduğu güman edilir.
Həmçinin modellər kəşfiyyat analizi və ya təsdiqləyici üsullardan istifadə edərək bir-biri ilə müqayisə oluna bilər. Kəşfiyyat xarakterli təhlildə müxtəlif modellər tərtib edilir və onların hər birinin məlumatları nə dərəcədə yaxşı təsvir etdiyinə dair qiymətləndirmə aparılır. Təsdiqedici təhlildə əvvəllər tərtib edilmiş fərziyyə orijinalı ilə müqayisə edilir. Bunun üçün ümumi meyarlara P 2, Bayes faktoru və nisbi ehtimal daxildir.
Konişi və Kitagavanın Düşüncəsi
“Statistik riyazi modeldəki problemlərin əksəriyyətini proqnozlaşdıran suallar kimi düşünmək olar. Onlar adətən bir neçə faktorun müqayisəsi kimi tərtib edilir.”
Bundan əlavə, ser David Cox dedi: "Mövzudan tərcümə olaraq, statistik modeldəki problem çox vaxt təhlilin ən vacib hissəsidir."