Çoxölçülü miqyas: tərif, məqsədlər, məqsədlər və nümunə

Mündəricat:

Çoxölçülü miqyas: tərif, məqsədlər, məqsədlər və nümunə
Çoxölçülü miqyas: tərif, məqsədlər, məqsədlər və nümunə
Anonim

Çoxvariantlı miqyaslama (MDS) verilənlər toplusunda fərdi halların oxşarlıq səviyyəsini vizuallaşdırmaq üçün alətdir. Bu, məlumatın vizuallaşdırılmasında, xüsusən də məsafə matrisində olan məlumatları göstərmək üçün istifadə olunan əlaqəli təyinat metodlarının toplusuna aiddir. Bu, qeyri-xətti ölçülü azalmanın bir formasıdır. MDS alqoritmi hər bir obyekti N ölçülü fəzada elə yerləşdirməyi hədəfləyir ki, obyektlər arasındakı məsafələr mümkün qədər yaxşı qorunsun. Sonra hər bir obyektə N ölçülərin hər birində koordinatlar təyin edilir.

MDS qrafikinin ölçülərinin sayı 2-dən çox ola bilər və a priori müəyyən edilir. N=2-nin seçilməsi 2D səpələnmə qrafiki üçün obyektin yerləşdirilməsini optimallaşdırır. Məqalədəki şəkillərdə çoxölçülü ölçmə nümunələrini görə bilərsiniz. Rus dilində simvolları olan nümunələr xüsusilə izahedicidir.

Çoxölçülü miqyaslama
Çoxölçülü miqyaslama

Essensiya

Çoxölçülü miqyaslama metodu (MMS,MDS) itki funksiyaları dəsti üçün optimallaşdırma prosedurunu ümumiləşdirən klassik alətlər toplusudur və çəkilər və s. ilə məlum məsafələrin giriş matrisləri. Bu kontekstdə faydalı itki funksiyası stress adlanır və bu, tez-tez stressin əsaslandırılması adlı prosedurla minimuma endirilir.

Əliyyat kitabı

Çoxölçülü miqyaslama üçün bir neçə seçim var. MDS proqramları həll yolu tapmaq üçün yükü avtomatik olaraq minimuma endirir. Qeyri-metrik MDS alqoritminin əsasını ikitərəfli optimallaşdırma prosesi təşkil edir. Birincisi, optimal monoton yaxınlıq çevrilməsi tapılmalıdır. İkincisi, konfiqurasiya nöqtələri optimal şəkildə yerləşdirilməlidir ki, onların məsafələri miqyaslı yaxınlıq dəyərlərinə mümkün qədər yaxın olsun.

Çoxölçülü miqyaslı nümunə
Çoxölçülü miqyaslı nümunə

Genişləndirmə

Hədəf fəzanın ixtiyari hamar qeyri-Evklid fəzası olduğu statistikada metrik çoxölçülü miqyaslamanın genişləndirilməsi. Fərqlər bir səthdəki məsafələr və hədəf məkanı fərqli bir səthdir. Tematik proqramlar bir səthin digər səthə minimal təhrifi ilə qoşma tapmağa imkan verir.

Addımlar

Çoxvariantlı miqyasdan istifadə edərək tədqiqat aparmaq üçün bir neçə addım var:

  1. Problemin tərtibi. Hansı dəyişənləri müqayisə etmək istəyirsiniz? Neçə dəyişəni müqayisə etmək istəyirsiniz? Tədqiqat hansı məqsədlə istifadə olunacaq?
  2. Daxiletmə datası əldə edilir. Respondentlərə bir sıra suallar verilir. Hər bir məhsul cütü üçün onlardan oxşarlığı qiymətləndirmələri xahiş olunur (adətən 7 ballıq Likert şkalasında çox oxşardan çox bənzəməyənə qədər). Birinci sual Coca-Cola/Pepsi üçün ola bilər, məsələn, növbəti sual pivə, növbəti sual Dr. Pepper və s. Sualların sayı brendlərin sayından asılıdır.
Məsafə ölçmə
Məsafə ölçmə

Alternativ yanaşmalar

İki başqa yanaşma da var. "Perceptual Data: Derived Approach" adlı bir texnika var ki, bu üsulda məhsulların atributlara parçalanması və qiymətləndirmənin semantik diferensial miqyasda aparılması aparılır. Digər üsul, respondentlərdən oxşarlıqlar deyil, üstünlüklər haqqında soruşulduğu “üstünlük məlumatı yanaşmasıdır”.

Aşağıdakı addımlardan ibarətdir:

  1. MDS statistik proqramı işə salınır. Proseduru yerinə yetirmək üçün proqram təminatı bir çox statistik proqram paketlərində mövcuddur. Tez-tez metrik MDS (interval və ya nisbət səviyyəsi datası ilə məşğul olur) və qeyri-metrik MDS (sıralı data ilə məşğul olur) arasında seçim olur.
  2. Ölçmələrin sayının müəyyən edilməsi. Tədqiqatçı kompüterdə yaratmaq istədiyi ölçülərin sayını müəyyən etməlidir. Nə qədər çox ölçmə olsa, statistik uyğunluq bir o qədər yaxşı olar, lakin nəticələri şərh etmək bir o qədər çətindir.
  3. Nəticələri göstərin və ölçmələri müəyyənləşdirin - statistik proqram (və ya əlaqəli modul) nəticələri göstərəcək. Xəritə hər bir məhsulu göstərəcək (adətən 2D).boşluq). Məhsulların bir-birinə yaxınlığı hansı yanaşmadan istifadə olunduğundan asılı olaraq ya oxşarlığını, ya da üstünlüklərini göstərir. Bununla belə, ölçmələrin əslində sistem davranışının ölçülərinə necə uyğun gəldiyi həmişə aydın deyil. Uyğunluğa dair subyektiv mühakimə burada verilə bilər.
  4. Nəticələri etibarlılıq və etibarlılıq üçün yoxlayın - MDS proseduru ilə hesablana bilən miqyaslı məlumat fərqinin nisbətini müəyyən etmək üçün R-kvadratını hesablayın. Kvadrat R 0.6 minimum məqbul səviyyə hesab olunur. R kvadratı 0,8 metrik miqyaslama üçün, 0,9 isə qeyri-metrik miqyaslama üçün yaxşı hesab edilir.
Çoxvariantlı miqyaslama nəticələri
Çoxvariantlı miqyaslama nəticələri

Müxtəlif testlər

Digər mümkün testlər Kruskal tipli stress testləri, bölünmüş məlumat testləri, məlumat sabitliyi testləri və təkrar test etibarlılıq testləridir. Testdəki nəticələr haqqında ətraflı yazın. Xəritəçəkmə ilə yanaşı, ən azı məsafə ölçüsü (məsələn, Sorenson indeksi, Jaccard indeksi) və etibarlılıq (məsələn, stress dəyəri) göstərilməlidir.

Əgər siz başlanğıc konfiqurasiya vermişsinizsə və ya təsadüfi seçim etmisinizsə, tez-tez istifadə olunan proqram (bəzən alqoritm hesabatını əvəz edən) tərəfindən müəyyən edilən alqoritm (məsələn, Kruskal, Mather) vermək çox arzuolunandır. ölçü qaçışları, Monte Karlo nəticələri, iterasiyaların sayı, sabitlik hesabı və hər oxun mütənasib variasiyası (r-kvadrat).

Vizual məlumat və məlumatların təhlili üsuluçoxölçülü miqyas

İnformasiya vizuallaşdırılması insan idrakını təkmilləşdirmək üçün mücərrəd məlumatların interaktiv (vizual) təsvirlərinin öyrənilməsidir. Mücərrəd verilənlərə mətn və coğrafi məlumatlar kimi həm ədədi, həm də qeyri-rəqəm məlumatları daxildir. Bununla belə, informasiyanın vizuallaşdırılması elmi vizuallaşdırmadan fərqlənir: “məkan təsviri seçildikdə informasiya xarakterlidir (informasiya vizualizasiyası), fəza təsviri verildikdə isə scivis (elmi vizuallaşdırma)”

İnformasiya vizualizasiyası sahəsi insan-kompüter qarşılıqlı əlaqəsi, kompüter elmləri tətbiqləri, qrafika, vizual dizayn, psixologiya və biznes metodları üzrə tədqiqatlar nəticəsində yaranmışdır. O, getdikcə daha çox elmi tədqiqat, rəqəmsal kitabxanalar, məlumatların öyrənilməsi, maliyyə məlumatları, bazar araşdırması, istehsala nəzarət və s.-də vacib komponent kimi istifadə olunur.

Metodlar və prinsiplər

İnformasiya vizualizasiyası vizuallaşdırma və qarşılıqlı əlaqə metodlarının insan qavrayışının zənginliyindən istifadə etməyi təklif edir ki, bu da istifadəçilərə eyni vaxtda böyük həcmdə məlumatı görmək, araşdırmaq və anlamaq imkanı verir. Məlumatın vizuallaşdırılması mücərrəd məlumatların, məlumatların intuitiv şəkildə ötürülməsi üçün yanaşmalar yaratmağı hədəfləyir.

Rəngin çoxölçülü miqyası
Rəngin çoxölçülü miqyası

Məlumatların təhlili sənayedə bütün tətbiqi tədqiqatların və problemlərin həllinin tərkib hissəsidir. Ən çoxMəlumatların təhlilinə fundamental yanaşmalar vizuallaşdırma (histoqramlar, səpələnmə qrafikləri, səth qrafikləri, ağac xəritələri, paralel koordinat qrafikləri və s.), statistika (hipoteza testi, reqressiya, PCA və s.), verilənlərin təhlili (uyğunluq və s.)dır..d.) və maşın öyrənmə üsulları (klasterləşdirmə, təsnifat, qərar ağacları və s.).

Bu yanaşmalar arasında məlumatın vizuallaşdırılması və ya vizual məlumatların təhlili analitik heyətin koqnitiv bacarıqlarından ən çox asılıdır və yalnız insan təxəyyülü və yaradıcılığı ilə məhdudlaşan strukturlaşdırılmamış hərəkətə gətirilə bilən fikirlərin kəşfinə imkan verir. Məlumatların vizuallaşdırılmasını şərh edə bilmək üçün analitikin hər hansı mürəkkəb texnika öyrənməsinə ehtiyac yoxdur. Məlumatın vizuallaşdırılması, eyni zamanda, statistik fərziyyə testi kimi daha analitik və ya formal analizlə müşayiət oluna bilən və adətən müşayiət olunan bir fərziyyə yaratma sxemidir.

Təhsil

Vizuallaşdırmanın müasir tədqiqi kompüter qrafikası ilə başladı, "əvvəldən elmi problemlərin öyrənilməsi üçün istifadə olunurdu. Lakin ilk illərdə qrafik gücünün olmaması çox vaxt onun faydalılığını məhdudlaşdırırdı. Vizuallaşdırmaya üstünlük verilməyə başladı. Elmi Hesablamada Kompüter Qrafikası və Vizuallaşdırma üçün xüsusi proqram təminatının buraxılması ilə 1987-ci ildə inkişaf etdiriləcək. O vaxtdan bəri, IEEE Kompüter Cəmiyyəti və ACM SIGGRAPH tərəfindən birgə təşkil edilmiş bir neçə konfrans və seminar keçirilmişdir".

Onlar verilənlərin vizuallaşdırılması, məlumatın vizuallaşdırılması və elmi vizuallaşdırılmasının ümumi mövzularını əhatə edirdi,həmçinin həcm göstərilməsi kimi daha spesifik sahələr.

Çoxölçülü marka miqyası
Çoxölçülü marka miqyası

Xülasə

Ümumiləşdirilmiş Çoxölçülü Ölçmə (GMDS) hədəf fəzanın qeyri-Evklid olduğu metrik çoxölçülü miqyaslamanın genişləndirilməsidir. Fərqlər səthdəki məsafələr və hədəf məkan başqa bir səth olduqda, GMDS sizə minimal təhriflə bir səthin digərinə yuvasını tapmağa imkan verir.

GMDS yeni tədqiqat xəttidir. Hazırda əsas tətbiqlər deformasiya olunan obyektin tanınması (məsələn, 3D üz tanınması üçün) və faktura xəritəsidir.

Çoxölçülü miqyaslamanın məqsədi çoxölçülü məlumatları təmsil etməkdir. Çoxölçülü verilənləri, yəni təmsil etmək üçün iki və ya üçdən çox ölçü tələb edən verilənləri şərh etmək çətin ola bilər. Sadələşdirməyə yanaşmalardan biri maraq doğuran məlumatların yüksək ölçülü fəzada yerləşdirilmiş qeyri-xətti manifoldda olduğunu güman etməkdir. Kollektorun kifayət qədər aşağı ölçüsü varsa, data aşağı ölçülü məkanda vizuallaşdırıla bilər.

Qeyri-xətti ölçülərin azaldılması üsullarının çoxu xətti metodlarla əlaqədardır. Qeyri-xətti üsullar geniş şəkildə iki qrupa təsnif edilə bilər: xəritələşdirməni təmin edənlər (yaxud yüksək ölçülü məkandan aşağı ölçülü yerləşdirməyə və ya əksinə) və sadəcə vizuallaşdırmanı təmin edənlər. Maşın öyrənməsi kontekstində xəritəçəkmə üsulları kimi baxıla bilərxüsusiyyətlərin çıxarılmasının ilkin mərhələsi, bundan sonra nümunənin tanınması alqoritmləri tətbiq olunur. Adətən sadəcə vizuallaşdırma verənlər yaxınlıq məlumatlarına - yəni məsafə ölçmələrinə əsaslanır. Çoxölçülü miqyaslama psixologiya və digər humanitar elmlərdə də kifayət qədər geniş yayılmışdır.

Diaqonal çoxölçülü miqyaslama
Diaqonal çoxölçülü miqyaslama

Əgər atributların sayı böyükdürsə, o zaman unikal mümkün sətirlərin sahəsi də eksponent olaraq böyükdür. Beləliklə, ölçü nə qədər böyükdürsə, məkanı təsvir etmək bir o qədər çətinləşir. Bu bir çox problemə səbəb olur. Yüksək ölçülü verilənlər üzərində işləyən alqoritmlər çox yüksək zaman mürəkkəbliyinə malikdirlər. Məlumatların daha az ölçülərə endirilməsi çox vaxt analiz alqoritmlərini daha səmərəli edir və maşın öyrənməsi alqoritmlərinə daha dəqiq proqnozlar verməyə kömək edə bilər. Buna görə çoxölçülü data miqyası çox populyardır.

Tövsiyə: