Statistik məlumat: toplama, emal, təhlil

Mündəricat:

Statistik məlumat: toplama, emal, təhlil
Statistik məlumat: toplama, emal, təhlil
Anonim

Statistika tarixi boyu ölçmə səviyyələrinin taksonomiyasını yaratmaq üçün müxtəlif cəhdlər edilmişdir. Psixofizik Stanley Smith Stevens nominal, ordinal, interval və mütənasib miqyasları təyin etdi.

Nominal ölçmələrin dəyərlər arasında əhəmiyyətli dərəcə sırası yoxdur və hər hansı bir-bir çevrilməyə imkan verir.

Daimi ölçülər ardıcıl dəyərlər arasında qeyri-dəqiq fərqlərə malikdir, lakin bu dəyərlərin xüsusi sırasına malikdir və istənilən sifarişi qoruyan transformasiyaya icazə verir.

İnterval ölçmələri nöqtələr arasında mənalı məsafələrə malikdir, lakin sıfır dəyəri ixtiyaridir (Selsi və ya Farenheitdə uzunluq və temperatur ölçmələrində olduğu kimi) və istənilən xətti transformasiyaya imkan verir.

Nisbət ölçüləri həm mənalı sıfır dəyərinə, həm də müxtəlif ölçülər arasında məsafələrə malikdir və istənilən miqyaslı transformasiyaya imkan verir.

Image
Image

Dəyişənlər və məlumatın təsnifatı

Çünki dəyişənləryalnız nominal və ya sıralı ölçmələrə uyğun gələnlər rəqəmsal olaraq əsaslı şəkildə ölçülə bilməz və bəzən kateqoriyalı dəyişənlər kimi qruplaşdırılır. Nisbət və interval ölçüləri kəmiyyət dəyişənləri kimi qruplaşdırılır, onlar ədədi təbiətinə görə diskret və ya davamlı ola bilər. Bu cür fərqlər çox vaxt kompüter elmində məlumat növü ilə sərbəst şəkildə əlaqələndirilir, çünki dixotom kateqoriyalı dəyişənlər boolean dəyərlərlə, inteqral məlumat tipində ixtiyari tam ədədləri olan politomlu kateqoriyalı dəyişənlər və üzən nöqtə hesablamasını əhatə edən real komponentləri olan davamlı dəyişənlər ilə təmsil oluna bilər. Lakin statistik məlumat məlumat növlərinin göstərilməsi hansı təsnifatın tətbiq olunduğundan asılıdır.

İşçilər haqqında statistik məlumat
İşçilər haqqında statistik məlumat

Digər təsnifatlar

Statistik məlumatların (məlumatların) digər təsnifatları da yaradılmışdır. Məsələn, Mosteller və Tukey qiymətlər, dərəcələr, hesablanmış səhmlər, saylar, məbləğlər və qalıqlar arasında fərq qoydular. Nelder bir vaxtlar davamlı hesablamaları, davamlı nisbətləri, sayların korrelyasiyasını və məlumatların ötürülməsinin kateqoriyalı yollarını təsvir etdi. Bütün bu təsnifat üsulları statistik məlumatların toplanmasında istifadə olunur.

Problemlər

Müxtəlif ölçmə (toplama) prosedurları vasitəsilə əldə edilən məlumatlara müxtəlif növ statistik metodların tətbiqinin məqsədəuyğun olub-olmaması sualı dəyişənlərin çevrilməsi və sualların dəqiq şərhi ilə bağlı məsələlərlə çətinləşir.tədqiqat. “Məlumatlar və onun təsvir etdikləri arasındakı əlaqə, sadəcə olaraq, müəyyən növ statistik ifadələrin müəyyən transformasiyalar zamanı dəyişməz olmayan həqiqət dəyərlərinə malik ola biləcəyi faktını əks etdirir. Transformasiyanın nəzərdən keçirilməsinə dəyər olub-olmaması cavab verməyə çalışdığınız sualdan asılıdır.

Statistik məlumatların nümunəsi
Statistik məlumatların nümunəsi

Məlumat növü nədir

Məlumat növü dəyişənin semantik məzmununun əsas komponentidir və dəyişəni təsvir etmək üçün hansı növ ehtimal paylamalarının məntiqi olaraq istifadə oluna biləcəyinə, onun üzərində icazə verilən əməliyyatlara, onu proqnozlaşdırmaq üçün istifadə olunan reqressiya analizinin növünə nəzarət edir., və s. Məlumat növü anlayışı ölçmə səviyyəsi anlayışı ilə oxşardır, lakin daha spesifikdir - məsələn, məlumatların sayılması mənfi olmayan real dəyərlərdən fərqli paylanma (Puason və ya binomial) tələb edir, lakin hər ikisi eyni səviyyəyə düşür. ölçmə səviyyəsi (əmsal şkalası).

Hakimlər haqqında statistik məlumatlar
Hakimlər haqqında statistik məlumatlar

Tərəzi

Statistik məlumatların emalı üçün ölçmə səviyyələrinin taksonomiyasını yaratmaq üçün müxtəlif cəhdlər edilmişdir. Psixofizik Stanley Smith Stevens nominal, ordinal, interval və mütənasib miqyasları təyin etdi. Nominal ölçmələr dəyərlər arasında əhəmiyyətli dərəcə sırasına malik deyil və hər hansı bir tək-tək çevrilməyə imkan verir. Adi ölçmələr ardıcıl dəyərlər arasında qeyri-dəqiq fərqlərə malikdir, lakin bu dəyərlərin əhəmiyyətli ardıcıllığında fərqlənir və imkan verirhər hansı sifarişi qoruyan transformasiya. İnterval ölçmələri ölçmələr arasında mənalı məsafələrə malikdir, lakin sıfır dəyəri ixtiyaridir (Selsi və ya Farenheitdə uzunluq və temperatur ölçmələri vəziyyətində olduğu kimi) və istənilən xətti transformasiyaya imkan verir. Nisbət ölçüləri həm mənalı sıfır dəyərinə, həm də fərqli müəyyən edilmiş ölçülər arasındakı məsafələrə malikdir və istənilən miqyaslı transformasiyaya icazə verir.

Diaqram modeli
Diaqram modeli

Tək nömrə ilə təsvir edilə bilməyən məlumatlar çox vaxt real təsadüfi dəyişənlərin təsadüfi vektorlarına daxil edilir, baxmayaraq ki, onları özünüz emal etmək tendensiyası artmaqdadır. Bu cür nümunələr aşağıda müzakirə olunacaq.

Təsadüfi vektorlar

Fərdi elementlər korrelyasiya ola bilər və ya olmaya da bilər. Korrelyasiya olunmuş təsadüfi vektorları təsvir etmək üçün istifadə edilən paylanma nümunələri çoxdəyişənli normal paylanma və çoxdəyişənli t-paylanmadır. Ümumiyyətlə, istənilən elementlər arasında ixtiyari korrelyasiya ola bilər, lakin bu, çox vaxt müəyyən ölçüdən yuxarı idarəolunmaz olur və əlaqəli komponentlər üçün əlavə məhdudiyyətlər tələb edir.

statistik atributlar
statistik atributlar

Təsadüfi matrislər

Təsadüfi matrislər xətti düzülə və təsadüfi vektorlar kimi baxıla bilər, lakin bu, müxtəlif elementlər arasında korrelyasiyaları təmsil etmək üçün səmərəli üsul olmaya bilər. Bəzi ehtimal paylamaları xüsusi olaraq normal matris kimi təsadüfi matrislər üçün nəzərdə tutulmuşdurpaylama və Wishart paylanması.

Təsadüfi Ardıcıllıq

Bəzən onlar təsadüfi vektorlarla eyni hesab edilir, lakin digər hallarda bu termin xüsusi olaraq hər bir təsadüfi dəyişənin yalnız yaxınlıqdakı dəyişənlərlə korrelyasiya etdiyi hallara tətbiq edilir (Markov modelində olduğu kimi). Bu, Bayes şəbəkəsinin xüsusi halıdır və gen zəncirləri və ya uzun mətn sənədləri kimi çox uzun ardıcıllıqlar üçün istifadə olunur. Bir sıra modellər gizli Markov ardıcıllığı kimi belə ardıcıllıqlar üçün xüsusi olaraq hazırlanmışdır.

Tipik diaqram
Tipik diaqram

Təsadüfi proseslər

Onlar təsadüfi ardıcıllıqlara bənzəyir, lakin yalnız ardıcıllığın uzunluğu qeyri-müəyyən və ya sonsuz olduqda və ardıcıllıqdakı elementlər bir-bir işləndikdə. Bu, tez-tez zaman seriyası kimi təsvir edilə bilən məlumatlar üçün istifadə olunur. Bu, məsələn, ertəsi gün səhm qiymətinə gəldikdə doğrudur.

Nəticə

Statistik məlumatların təhlili tamamilə onun toplanmasının keyfiyyətindən asılıdır. Sonuncu, öz növbəsində, onun təsnifatının imkanları ilə güclü şəkildə bağlıdır. Əlbəttə ki, statistik məlumatların təsnifatının bir çox növləri var ki, oxucu bu məqaləni oxuyarkən bunu özü görə bilər. Buna baxmayaraq, effektiv vasitələrin olması və riyaziyyatı yaxşı bilmək, həmçinin sosiologiya sahəsində biliklər öz işini görəcək və səhv üçün əhəmiyyətli düzəlişlər etmədən istənilən sorğu və ya araşdırma aparmağa imkan verəcəkdir. Formada statistik məlumatların mənbələriinsanlar, təşkilatlar və sosiologiyanın digər subyektləri, xoşbəxtlikdən, çox sayda təmsil olunur. Heç bir çətinlik əsl kəşfiyyatçının qarşısında dura bilməz.

Tövsiyə: