Metodat e paraqitjes vizuale të të dhënave. Metodat e vizualizimit

“Ata thonë se një fotografi vlen sa një mijë fjalë, dhe kjo është e vërtetë, për sa kohë që fotografia është e mirë.” Bowman

Me një rritje të sasisë së të dhënave të grumbulluara, edhe kur përdorni sado të fuqishëm dhe të gjithanshëm algoritme të Minierave të të Dhënave, bëhet gjithnjë e më e vështirë "tretja" dhe interpretimi i rezultateve të marra. Dhe, siç e dini, një nga dispozitat e Data Mining është kërkimi i modeleve praktikisht të dobishme. Një model mund të bëhet praktikisht i dobishëm vetëm nëse mund të konceptohet dhe kuptohet.

Në vitin 1987, me iniciativën e Komitetit Teknik të Grafikës Kompjuterike të Shoqërisë Kompjuterike ACM SIGGRAPH IEEE, për shkak të nevojës për të përdorur metoda, mjete dhe teknologji të reja të të dhënave, u formuluan detyrat përkatëse në fushën e vizualizimit.

Metodat e paraqitjes vizuale ose grafike të të dhënave përfshijnë grafikët, grafikët, tabelat, raportet, listat, bllok diagramet, harta etj.

Vizualizimi është parë tradicionalisht si ndihma kur analizohen të dhënat, por tani gjithnjë e më shumë studime tregojnë rolin e saj të pavarur.

Teknikat tradicionale të imazhit mund të kenë aplikimet e mëposhtme:

t'i paraqesë informacion përdoruesit në formë vizuale;

përshkruani në mënyrë kompakte modelet e qenësishme në grupin origjinal të të dhënave;

zvogëloni dimensionalitetin ose kompresoni informacionin;

riparimi i boshllëqeve në grupin e të dhënave;

gjeni zhurmën dhe pikat e jashtme në një grup të dhënash.

Vizualizimi i mjeteve të Data Mining

Secili nga algoritmet e Minierave të të Dhënave përdor një qasje specifike vizualizimi. Në leksionet e mëparshme ne shikuam një sërë metodash të Miningut të të Dhënave. Gjatë përdorimit të secilës prej metodave, ose më saktë, zbatimit të softuerit të saj, ne morëm vizualizues të caktuar, me ndihmën e të cilëve ishim në gjendje të interpretonim rezultatet e marra si rezultat i punës së metodave dhe algoritmeve përkatëse.

Për pemët e vendimeve, ky është një vizualizues i pemës së vendimeve, një listë rregullash dhe një tabelë emergjente.

Për rrjetet nervore, në varësi të mjetit, kjo mund të jetë topologjia e rrjetit, një grafik i ndryshimeve në madhësinë e gabimit, që tregon procesin e të mësuarit.

Për kartat Kohonen: kartat e hyrjeve, daljeve, karta të tjera specifike.

Për regresionin linear, linja e regresionit përdoret si vizualizues.

Për grumbullimin: dendrogramet, diagramet e shpërndarjes.

Grafikët e shpërndarjes dhe grafikët përdoren shpesh për të vlerësuar performancën e një metode.

Të gjitha këto mënyra të paraqitjes ose shfaqjes vizuale të të dhënave mund të kryejnë një nga funksionet e mëposhtme:

janë një ilustrim i ndërtimit të një modeli (për shembull, një paraqitje e strukturës (grafikut) të një rrjeti nervor);

ndihmoni në interpretimin e rezultateve të marra;

janë një mjet për të vlerësuar cilësinë e modelit të ndërtuar;

kombinoni funksionet e mësipërme (pema e vendimit, dendrogrami).

Vizualizimi i Modeleve të Minierave të të Dhënave

Funksioni i parë (ilustrimi i ndërtimit të modelit) është në thelb një vizualizimi i modelit të Minierave të të Dhënave. Ka shumë mënyra të ndryshme për të paraqitur modele, por paraqitjet grafike i japin përdoruesit më shumë "vlerë". Përdoruesi, në shumicën e rasteve, nuk është një specialist modelimi, ai më së shpeshti është ekspert në fushën e tij lëndore. Prandaj, modeli i Data Mining duhet të paraqitet në gjuhën më të natyrshme për të ose, të paktën, të përmbajë një numër minimal elementesh të ndryshme matematikore dhe teknike.

Kështu, disponueshmëria është një nga karakteristikat kryesore të modelit të Data Mining. Përkundër kësaj, ekziston edhe një mënyrë kaq e zakonshme dhe më e thjeshtë për të paraqitur një model si një "kuti e zezë". Në këtë rast, përdoruesi nuk e kupton sjelljen e modelit që po përdor. Megjithatë, pavarësisht nga keqkuptimi, ai merr rezultatin - modele të identifikuara. Një shembull klasik i një modeli të tillë është modeli i rrjetit nervor.

Një mënyrë tjetër për të paraqitur një model është ta paraqisni atë në një mënyrë intuitive dhe të kuptueshme. Në këtë rast, përdoruesi mund të kuptojë se çfarë po ndodh "brenda" modelit. Në këtë mënyrë është e mundur të sigurohet pjesëmarrja e tij e drejtpërdrejtë në proces.

Modele të tilla i ofrojnë përdoruesit mundësinë për të diskutuar ose shpjeguar logjikën e tij me kolegët, klientët dhe përdoruesit e tjerë.

Të kuptuarit e modelit çon në kuptimin e përmbajtjes së tij. Si rezultat i mirëkuptimit, rritet besimi në model. Një shembull klasik është një pemë vendimi. Pema e ndërtuar e vendimeve përmirëson vërtet të kuptuarit e modelit, d.m.th. mjeti i të dhënave Mining i përdorur.

Përveç të kuptuarit, modele të tilla i ofrojnë përdoruesit mundësinë për të bashkëvepruar me modelin, për t'i bërë pyetje dhe për të marrë përgjigje. Një shembull i një ndërveprimi të tillë është mjeti what-if. Duke përdorur dialogun "systemuser", përdoruesi mund të kuptojë modelin.

Tani le të kalojmë te funksionet që ndihmojnë në interpretimin dhe vlerësimin e rezultateve të ndërtimit të modeleve të Minierave të të Dhënave. Këto janë të gjitha llojet e grafikëve, diagrameve, tabelave, listave, etj.

Shembuj të mjeteve të vizualizimit që mund të përdoren për të vlerësuar cilësinë e një modeli janë një grafik shpërhapjeje, një tabelë e papritur dhe një grafik i ndryshimeve në madhësinë e gabimit.

Komplot shpërndajështë një grafik i devijimit të vlerave të parashikuara nga modeli nga ato aktuale. Këto diagrame përdoren për sasi të vazhdueshme. Vlerësimi vizual i cilësisë së modelit të ndërtuar është i mundur vetëm në fund të procesit të ndërtimit të modelit.

Tabela e kontigjencës përdoret për të vlerësuar rezultatet e klasifikimit. Tabelat e tilla përdoren për metoda të ndryshme klasifikimet. Ne i kemi përdorur tashmë në leksionet e mëparshme. Vlerësimi i cilësisë së modelit të ndërtuar është i mundur vetëm në fund të procesit të ndërtimit të modelit.

Grafiku i ndryshimit të vlerës së gabimit. Grafiku tregon ndryshimin në madhësinë e gabimit gjatë funksionimit të modelit. Për shembull, gjatë funksionimit të rrjeteve nervore, përdoruesi mund të vëzhgojë ndryshimin e gabimit në grupet e trajnimit dhe testimit dhe të ndalojë stërvitjen për të parandaluar "mbitrajnimin" e rrjetit. Këtu, cilësia e modelit dhe ndryshimet e tij mund të vlerësohen drejtpërdrejt gjatë procesit të ndërtimit të modelit.

Shembuj të mjeteve të vizualizimit që ndihmojnë në interpretimin e rezultatit janë: linja e trendit në regresionin linear, hartat Kohonen, scatterplot në analizën e grupimeve.

Metodat e vizualizimit

Metodat e vizualizimit, në varësi të numrit të matjeve të përdorura, zakonisht klasifikohen në dy grupe:

prezantimi i të dhënave në një, dy dhe tre dimensione;

përfaqësimi i të dhënave në katër ose më shumë dimensione.

Paraqitja e të dhënave në një, dy dhe tre dimensione

Ky grup metodash përfshin metoda të njohura të shfaqjes së informacionit që janë të arritshme për imagjinatën njerëzore. Pothuajse çdo mjet modern i Minierave të të Dhënave përfshin metoda të paraqitjes vizuale nga ky grup.

Në varësi të numrit të dimensioneve të përfaqësimit, këto mund të jenë në mënyrat e mëposhtme:

matje njëndryshore, ose 1-D;

matje bivariate, ose 2-D;

matje tredimensionale ose projeksionale, ose 3-D.

Duhet të theksohet se syri i njeriut percepton në mënyrë më të natyrshme paraqitjet dydimensionale të informacionit.

Kur përdor paraqitjen dy dhe tre-dimensionale të informacionit, përdoruesi ka mundësinë të shohë modelet e grupit të të dhënave:

struktura e tij e grupimit dhe shpërndarja e objekteve në klasa (për shembull, në një diagramë shpërndarjeje);

veçoritë topologjike;

prania e tendencave;

informacion për vendndodhjen relative të të dhënave;

ekzistenca e varësive të tjera të qenësishme në grupin e të dhënave në studim.

Nëse grupi i të dhënave ka më shumë se tre dimensione, atëherë opsionet e mëposhtme janë të mundshme:

përdorimi i metodave shumëdimensionale të paraqitjes së informacionit (ato janë diskutuar më poshtë);

zvogëlimi i dimensionit në paraqitje një, dy ose tre-dimensionale. ekzistojnë mënyra të ndryshme reduktimi i dimensionalitetit, një prej tyre është analiza faktoriale- u diskutua në një nga leksionet e mëparshme. Hartat vetë-organizuese të Kohonen përdoren për të reduktuar dimensionalitetin dhe në të njëjtën kohë përfaqësojnë vizualisht informacionin në një hartë dydimensionale.

Përfaqësimi i të dhënave në dimensione 4+

Përfaqësimet e informacionit në katër ose më shumë dimensione janë të paarritshme për perceptimin njerëzor. Megjithatë, janë zhvilluar metoda të veçanta për t'i mundësuar një personi të shfaqë dhe të perceptojë një informacion të tillë.

Metodat më të njohura të paraqitjes shumëdimensionale të informacionit:

koordinatat paralele;

∙ "Fytyrat e Chernovit";

grafikët e radarit.

Koordinatat paralele

Në koordinatat paralele, variablat kodohen horizontalisht, vijë vertikale përcakton vlerën e ndryshores. Shembull i të dhënave të paraqitura në Koordinatat karteziane dhe koordinatat paralele, të dhëna në Fig. 16.1. Kjo metodë e paraqitjes së të dhënave shumëdimensionale u shpik nga Alfred Inselberg në 1985.

2.1. Përparësitë e një forme vizuale të paraqitjes së informacionit

Gjuha verbale dhe kategoritë verbale përmbajnë mjete jashtëzakonisht primitive për të ndërtuar hapësirën, për ta interpretuar atë ose për të bërë diçka me të. Këtij qëllimi i shërben gjuha e imazheve dhe sistemi i veprimeve perceptuese, me ndihmën e të cilave një person ndërton një imazh të realitetit përreth dhe orientohet në të. Ky sistem quhet perceptim. Perceptimi përkufizohet si një imazh holistik që pasqyron unitetin e strukturës dhe vetive të një objekti. Objektet e perceptimit vizual janë objektet, proceset dhe fenomenet e botës përreth, të cilat mund të ndahen dhe përshkruhen në kategoritë e hapësirës, ​​lëvizjes, formës, teksturës, ngjyrës, shkëlqimit, etj. Kur perceptohen objektet, imazhi pak a shumë plotësisht. pasqyron objektin ose situatën në të cilën ndodhet një person.

Imazhet e krijuara në bazë të perceptimit vizual kanë fuqi më të madhe shoqëruese se fjalët. Ndoshta kjo është arsyeja pse ato ruhen në mënyrë të përsosur në kujtesë. Edhe pasi kanë parë disa mijëra piktura një herë, vëzhguesit janë në gjendje të identifikojnë saktë rreth 90% të tyre. Imazhi vizual është shumë plastik. Kjo veti manifestohet në faktin se për sa i përket imazhit një kalim i shpejtë nga një vlerësim i përgjithësuar i situatës në analiza e detajuar elementet e saj. Lloje të ndryshme lëvizjesh të objekteve të pasqyruara në imazh, zhvendosjet e tyre, rrotullimet, si dhe zmadhimi, zvogëlimi, shtrembërimi i perspektivës dhe normalizimi janë të mundshme. Kjo aftësi unike manipuluese e sistemit vizual ju lejon të imagjinoni situatën në këndvështrimin e drejtpërdrejtë dhe të kundërt. Manipulimi i imazheve, përfundimi i tyre - mjetet më të rëndësishme perceptimi produktiv dhe të menduarit vizual.

Shumë studime tregojnë se sistemi vizual ka mekanizma që sigurojnë lindjen e një imazhi të ri. Falë tyre, një person është në gjendje ta shohë botën jo vetëm siç ekziston në të vërtetë, por edhe ashtu siç mund (ose duhet) të jetë. Kjo do të thotë se imazhet vizuale janë një kusht i domosdoshëm, edhe për më tepër, një instrument i aktivitetit mendor. Ato lidhen më drejtpërdrejt, në krahasim me simbolet dhe fjalimin, me realitetin objektiv që rrethon një person. Një imazh nuk është vetëm dhe jo aq shumë soditje sa është një rindërtim i realitetit. Ai, ky realitet, mund të rikrijohet në formën (ose afër tij) në të cilën objekti ekziston realisht. Por shkatërrimi i një objekti ose situate dhe rindërtimi i versionit ose varianteve të tij të reja janë gjithashtu të mundshme. Në bazë të këtij imazhi, të ndryshuar në krahasim me realitetin, një person i kthehet përsëri realitetit objektiv dhe e rindërton atë në vetvete. aktivitete praktike. Është e pamundur të përgatitësh një specialist që mendon në mënyrë krijuese pa zhvilluar përfaqësimin e tij imagjinativ, imagjinatën dhe të menduarit. Aparati universal i skematizmit të projeksionit ofron një përfitim të prekshëm në këtë çështje. Një nga mjetet më të rëndësishme të modelimit të projeksionit që përdoret për të formuar paraqitje hapësinore është interpretimi gjeometrik. Objektet e interpretimit janë modele grafike në formën e një kombinimi të vizatimeve, diagrameve, tekstit, diagrameve, etj. Modelet grafike përfshijnë shfaqjen e informacionit në formën e një grupi mjetesh për paraqitjen grafike të informacionit: vija, simbole, shenja kujtese, të përdorura. në përputhje me rregullat për ndërtimin e modeleve grafike. Kur perceptohet informacioni në këtë formë, qasja në një hapësirë ​​operative dimensionale më të lartë është e nevojshme sesa kur perceptohet teksti. Shkalla e saktësisë kur krahasohet një objekt informacioni me modelin e tij varet nga plotësia e informacionit në lidhje me aparatin e projektimit që u zhvillua gjatë modelimit. Figura 2.1 tregon një nga klasifikimet e mundshme të modeleve grafike. Modeli piktografik– një model grafik i përpiluar duke përdorur kushtëzuar imazhe grafike(piktograme) që tregojnë objekte, veprime ose ngjarje. Modeli ideografik– një model grafik i përpiluar duke përdorur ideograme – shenja të shkruara konvencionale që tregojnë koncepte.

Çështja e efikasitetit të transferimit dhe asimilimit të informacionit ka qenë një nga çështjet kryesore gjatë dekadave të fundit. Mjetet kryesore të komunikimit në botë fillimi i shekullit XXI shekulli shërben si vizualizim (formë vizuale e transmetimit) të informacionit. Një person e percepton sasinë më të madhe të informacionit (afërsisht 80-90%) vizualisht. “Rëndësia dominuese e sistemit vizual për njerëzit shpjegohet me faktin se ai është burimi më i fuqishëm i informacionit për botën e jashtme, ka shtrirjen më të madhe dhe stereoskopinë. funksionet shqisore» .

Efikasitet, avantazh metodë grafike transmetimi i informacionit, në krahasim me motorin ose zërin (Figura 2.2), është se perceptimi vizual i një personi për informacionin e transmetuar dhe krijimi i një imazhi mendor ndodhin aq shpejt sa një person e percepton këtë proces si "të menjëhershëm". Kjo shpjegon efektin e njëkohshmërisë, ose të njëkohshme, bazuar në vetinë e perceptimit njerëzor të informacionit: imazhet mendore të krijuara gjatë perceptimit të informacionit dhe modelet grafike të transmetuara janë shumë të ngjashme në formë.

Studiuesit mjekësorë kanë zbuluar se nëse udhëzimet për një ilaç përmbajnë vetëm tekst, një person thith vetëm 70% të informacionit prej tij. Nëse shtoni fotografi në udhëzimet, personi tashmë do të kuptojë 95%.

Kompania jonë ka zhvilluar dhe mbështetur mjetet e vizualizimit të të dhënave për shumë vite, duke mbuluar një gamë të gjerë platformash dhe teknologjish. Dhe kjo ka kuptim, sepse mjetet e vizualizimit kanë qenë gjithmonë dhe mbeten të kërkuara në tregun e zhvillimit. Dhe ne e dimë arsyen e një popullariteti të tillë.

Çfarë është vizualizimi i të dhënave?

Para së gjithash, duhet të dini se çfarë është vizualizimi i të dhënave dhe cilat metoda përdoren, përfshirë këtu Jeta e përditshme.


Metodat më të thjeshta dhe për këtë arsye më të zakonshmet e vizualizimit janë grafikët

Vizualizimi i të dhënave është një paraqitje vizuale e grupeve të informacionit të ndryshëm. Ekzistojnë disa lloje të vizualizimit:

  • Një paraqitje e zakonshme vizuale e informacionit sasior në formë skematike. Ky grup përfshin grafikët e njohur të byrekut dhe linjave, histogramet dhe spektrogramet, tabelat dhe grafikët e ndryshëm të shpërndarjes.
  • Kur vizualizohen, të dhënat mund të shndërrohen në një formë që përmirëson perceptimin dhe analizën e këtij informacioni. Për shembull, harta dhe grafiku polar, grafiku i vijës kohore dhe i boshtit paralel, diagrami i Euler-it.
  • Vizualizimi konceptual ju lejon të zhvilloni koncepte, ide dhe plane komplekse duke përdorur hartat konceptuale, grafikët Gantt, grafikët e rrugëve minimale dhe lloje të tjera të ngjashme të diagrameve.
  • Vizualizimi strategjik përkthehet në formë vizuale të dhëna të ndryshme për aspekte të punës së organizatave. Këto janë të gjitha llojet e tabelave të performancës, cikli i jetes dhe grafikët e strukturave organizative.
  • Vizualizimi metaforik, një shembull kryesor i të cilit është harta e metrosë, do t'ju ndihmojë të organizoni grafikisht informacionin strukturor duke përdorur piramidat, pemët dhe hartat e të dhënave.
  • Vizualizimi i kombinimit ju lejon të kombinoni disa grafikë komplekse në një diagram, si një hartë e parashikimit të motit.

Pse të përdorni vizualizimin e të dhënave?

Informacioni vizual perceptohet më mirë dhe ju lejon të përcillni shpejt dhe në mënyrë efektive mendimet dhe idetë tuaja tek shikuesi. Fiziologjikisht, perceptimi i informacionit vizual është themelor për njerëzit. Ka shumë studime që konfirmojnë se:
  • 90% e informacionit që një person percepton përmes vizionit
  • 70% e receptorëve ndijor janë në sy
  • rreth gjysma e neuroneve në trurin e njeriut janë të përfshirë në përpunimin e informacionit vizual
  • 19% më pak përdorim kur punoni me të dhëna vizuale funksioni njohës truri, përgjegjës për përpunimin dhe analizimin e informacionit
  • Produktivitet 17% më i lartë për njerëzit që punojnë me informacion vizual
  • 4.5% rikujtim më i mirë i informacionit vizual të detajuar


Nëse i kërkoni lexuesit të kujtojë emrat e kontinenteve, kjo është fotografia që do të shfaqet në kokën e tij
  • informacioni vizual perceptohet 60,000 herë më shpejt në krahasim me tekstin


Në grafik, lexuesi do të gjejë shpejt vlerat minimale dhe maksimale
  • 10% e njerëzve mbajnë mend nga ajo që dëgjojnë, 20% nga ajo që lexojnë dhe 80% nga ajo që shohin dhe bëjnë.
  • me 323% njeri me i mire ekzekuton instruksionet nëse ato përmbajnë ilustrime


Udhëzimet e mëposhtme janë shumë më të lehta dhe më të shpejta për t'u kuptuar dhe ndjekur.

Më shumë informacion rreth fakteve dhe hulumtimeve mund të gjeni në këtë infografik interesant.

Është e qartë se njerëzit janë të predispozuar për të përpunuar informacionin vizual. Përveçse është i shkëlqyer për përpunimin nga truri ynë, vizualizimi i të dhënave ka disa përfitime:

  • Përqendrohuni në aspekte të ndryshme të të dhënave


Duke përdorur grafikët, lehtë mund të tërhiqni vëmendjen e lexuesit te treguesit e kuq
  • Analiza e një grupi të madh të dhënash me një strukturë komplekse
  • Reduktimi i mbingarkesës së informacionit të një personi dhe ruajtja e vëmendjes së tyre
  • Paqartësia dhe qartësia e të dhënave dalëse
  • Theksimi i lidhjeve dhe marrëdhënieve të përfshira në informacion


Ju mund të shihni lehtësisht të dhëna të rëndësishme në grafik
  • Apel estetik


Grafikët estetikisht tërheqës e bëjnë prezantimin e të dhënave mbresëlënëse dhe të paharrueshme

Edward Tufte, autor i disa prej librat më të mirë mbi vizualizimin, e përshkruan atë si një mjet për shfaqjen e të dhënave; nxitja e shikuesit të mendojë për thelbin, jo për metodologjinë; shmangia e shtrembërimit të asaj që të dhënat kanë për të thënë; duke shfaqur shumë numra në hapësirë ​​e vogël; duke treguar një grup të madh të dhënash si një tërësi koherente dhe e unifikuar; inkurajimi i shikuesit për të krahasuar pjesë të të dhënave; duke shërbyer për qëllime mjaft të qarta: përshkrim, eksplorim, organizim ose dekorim (“The Visual Display of Quantitative Information”, Edward Tufte).

Si të përdorni saktë vizualizimin e të dhënave?

Suksesi i vizualizimit varet drejtpërdrejt nga korrektësia e aplikimit të tij, përkatësisht nga zgjedhja e llojit të grafikut, përdorimi i saktë dhe dizajni i tij.


60% e suksesit të vizualizimit varet nga zgjedhja e llojit të grafikut, 30% nga përdorimi i saktë dhe 10% nga dizajni i saktë i tij.

Lloji i saktë i grafikut

Një grafik ju lejon të shprehni idenë e përcjellë nga të dhënat më plotësisht dhe saktë, kështu që është shumë e rëndësishme të zgjidhni lloj i përshtatshëm diagramet. Zgjedhja mund të bëhet duke përdorur algoritmin e mëposhtëm:

Qëllimet e vizualizimit janë zbatimi i idesë kryesore të informacionit, kjo është arsyeja pse të dhënat e zgjedhura duhet të tregohen, çfarë efekti duhet të arrihet - identifikimi i marrëdhënieve në informacion, duke treguar shpërndarjen e të dhënave, përbërjen ose krahasimin e të dhëna.


Rreshti i parë tregon grafikët me qëllim të paraqitjes së marrëdhënieve në të dhëna dhe shpërndarjes së të dhënave, dhe rreshti i dytë tregon qëllimin e paraqitjes së përbërjes dhe krahasimit të të dhënave.

Marrëdhëniet në të dhëna- kështu varen nga njëri-tjetri, lidhja mes tyre. Duke përdorur marrëdhëniet, mund të identifikoni praninë ose mungesën e varësive midis variablave. Nëse ideja kryesore e informacionit përmban frazat "i referohet", "ulet / rritet në", atëherë duhet të përpiqeni të tregoni saktësisht marrëdhëniet në të dhëna.
Shpërndarja e të dhënave- si janë të vendosura në lidhje me diçka, sa objekte bien në të caktuara zona të njëpasnjëshme vlerat numerike. Ideja kryesore do të përmbajë frazat "në rangun nga x në y", "përqendrimi", "frekuenca", "shpërndarja".
Përbërja e të dhënave- kombinimi i të dhënave për të analizuar pamjen e përgjithshme në tërësi, duke krahasuar komponentët që përbëjnë një përqindje të një tërësie të caktuar. Frazat kryesore për përbërjen janë "përbërë x%", "pjesë", "përqindje e tërësisë".
Krahasimi i të dhënave- kombinimi i të dhënave për të krahasuar tregues të caktuar, duke identifikuar se si objektet lidhen me njëri-tjetrin. Është gjithashtu një krahasim i komponentëve që ndryshojnë me kalimin e kohës. Frazat kryesore për idetë kur krahasohen janë "më shumë/më pak se", "barabartë", "ndryshon", "rritje/zvogëlohet".

Pas përcaktimit të qëllimit të vizualizimit, duhet të përcaktoni llojin e të dhënave. Ato mund të jenë shumë heterogjene në llojin dhe strukturën e tyre, por në rastin më të thjeshtë dallojnë të dhëna të vazhdueshme numerike dhe kohore, të dhëna diskrete, të dhëna gjeografike dhe logjike. Të dhënat numerike të vazhdueshme përmbajnë informacion në lidhje me varësinë e një vlere numerike nga një tjetër, për shembull, grafikët e funksioneve të tilla si y=2x. Koha e vazhdueshme përmban të dhëna për ngjarjet që ndodhin gjatë një periudhe kohore, si një grafik i temperaturës që matet çdo ditë. Të dhënat diskrete mund të përmbajnë varësi të sasive kategorike, për shembull, një grafik të numrit të shitjeve të mallrave në dyqane të ndryshme. Të dhënat gjeografike përmbajnë informacione të ndryshme në lidhje me vendndodhjen, gjeologjinë dhe tregues të tjerë gjeografikë, një shembull kryesor është i zakonshmi harta gjeografike. Të dhënat logjike tregojnë renditjen logjike të komponentëve në raport me njëri-tjetrin, p.sh. pema e familjes familjet.


Grafikët e të dhënave të vazhdueshme numerike dhe kohore, të dhëna diskrete, të dhëna gjeografike dhe logjike

Në varësi të qëllimit dhe të dhënave, ju mund të zgjidhni orarin më të përshtatshëm për ta. Është më mirë të shmangni shumëllojshmërinë për hir të shumëllojshmërisë dhe të zgjidhni sipas parimit "sa më e thjeshtë aq më mirë". Përdorni lloje specifike të grafikëve vetëm për të dhëna specifike, në raste të tjera, grafikët më të zakonshëm janë të përshtatshëm:

  • lineare
  • me zona
  • kolonat dhe histogramet (bar)
  • grafiku i byrekut (byrek, donut)
  • tabelë polare (radar)
  • komplot shpërndaj (shpërndaj, flluskë)
  • hartat
  • pemët (pema, harta mendore, harta e pemës)
  • diagramet kohore (vija kohore, gantt, ujëvara).
Grafikët e linjës, grafikët e zonave dhe histogramet mund të përmbajnë disa vlera në një argument për një kategori, të cilat mund të jenë ose absolute (më pas parashtesa e grumbulluar u shtohet këtyre llojeve të grafikëve) ose relative (të grumbulluara plotësisht).


Grafikoni me vlera të grumbulluara dhe me stivime të plota

Kur zgjidhni një tabelë të përshtatshme, mund të përdorni tabelën e mëposhtme, bazuar në këtë tabelë dhe librin "Flisni gjuhën e grafikëve" nga Gene Zelazny:

Përdorimi i duhur i një grafiku

Është e rëndësishme jo vetëm të zgjidhni llojin e duhur të grafikut, por edhe ta përdorni atë në mënyrë korrekte:
  • Nuk ka nevojë të mbingarkoni orarin tuaj sasi e madhe informacion. Sasia optimale tipe te ndryshme të dhënat, kategoritë - kjo nuk është më shumë se 4-5, përndryshe do të ishte më e përshtatshme për të ndarë një diagram të tillë në disa pjesë.


Një grafik i tillë mund të krahasohet me spageti dhe ndahet më mirë në disa diagrame
  • Zgjidhni shkallën dhe shkallën e duhur për grafikun. Për histogramet dhe parcelat e sipërfaqes, preferohet të fillohet shkalla e vlerës nga zero. Mundohuni të mos përdorni shkallë të përmbysur - kjo shumë shpesh mashtron shikuesin në lidhje me të dhënat.


Një shkallë e pasaktë ndikon negativisht në perceptimin e të dhënave. Në rastin e parë, shkalla është zgjedhur gabimisht, në të dytën shkalla është e përmbysur
  • Për grafikët me byrek dhe grafikët që tregojnë një përqindje të një pjese totale, shuma e vlerave duhet të mblidhet gjithmonë deri në 100%.
  • Për perceptim më i mirë Shtë më mirë të organizoni të dhënat në bosht - ose sipas vlerës, ose alfabetikisht, ose sipas kuptimit logjik

Hartimi i saktë i orarit

Asgjë nuk i pëlqen syrit më shumë se grafikët e dizajnuar mirë dhe asgjë nuk i prish grafikët më shumë se prania e "plehrave" grafike. Parimet themelore të dizajnit:
  • përdorni paleta të ngjashme, mos ngjyra të ndezura, dhe përpiquni të kufizoni veten në një grup prej gjashtë pjesësh
  • linjat ndihmëse dhe dytësore duhet të jenë të thjeshta dhe jo të dukshme


Linjat ndihmëse në grafik nuk duhet të largojnë vëmendjen nga ideja kryesore e të dhënave
  • Kur është e mundur, përdorni vetëm etiketat e boshtit horizontal
  • Për grafikët e zonave, preferohet të përdoret një ngjyrë me transparencë
  • përdorni një ngjyrë të ndryshme për secilën kategori në grafik

konkluzionet

Vizualizimi është një mjet i fuqishëm për përcjelljen e mendimeve dhe ideve te konsumatori fundor, një asistent për perceptimin dhe analizën e të dhënave. Por si të gjitha mjetet, ai duhet të përdoret në kohën dhe vendin e vet. Përndryshe, informacioni mund të perceptohet ngadalë ose edhe gabimisht.


Grafikët tregojnë të njëjtat të dhëna, gabimet kryesore të vizualizimit shfaqen në të majtë dhe korrigjohen në të djathtë.

Kur përdoret me shkathtësi, vizualizimi i të dhënave mund ta bëjë materialin mbresëlënës, interesant dhe të paharrueshëm.

P.S. Grafikët për këtë artikull janë bërë duke përdorur

Ky artikull është shkruar nga një përfaqësues i DevExpress dhe është publikuar në një blog në HabraHabr.

Studiuesit mjekësorë kanë zbuluar se nëse udhëzimet për një ilaç përmbajnë vetëm tekst, një person thith vetëm 70% të informacionit prej tij. Nëse shtoni fotografi në udhëzimet, personi tashmë do të kuptojë 95%.

Është e qartë se njerëzit janë të predispozuar për të përpunuar informacionin vizual. Përveçse është i shkëlqyer për përpunimin nga truri ynë, vizualizimi i të dhënave ka disa përfitime:

  • Përqendrohuni në aspekte të ndryshme të të dhënave


Duke përdorur grafikët, lehtë mund të tërhiqni vëmendjen e lexuesit te treguesit e kuq.

  • Analiza e një grupi të madh të dhënash me një strukturë komplekse
  • Reduktimi i mbingarkesës së informacionit të një personi dhe ruajtja e vëmendjes së tyre
  • Paqartësia dhe qartësia e të dhënave dalëse
  • Theksimi i lidhjeve dhe marrëdhënieve të përfshira në informacion


Të dhënat e rëndësishme mund të shihen lehtësisht në grafik.

Apel estetik


Grafikët estetikisht tërheqës e bëjnë prezantimin e të dhënave mbresëlënëse dhe të paharrueshme.

Edward Tufte, autor i disa prej librave më të mirë mbi vizualizimin, e përshkruan atë si një mjet për të treguar të dhënat; nxitja e shikuesit të mendojë për thelbin, jo për metodologjinë; shmangia e shtrembërimit të asaj që të dhënat kanë për të thënë; shfaqja e shumë numrave në një hapësirë ​​të vogël; duke treguar një grup të madh të dhënash si një tërësi koherente dhe e unifikuar; inkurajimi i shikuesit për të krahasuar pjesë të të dhënave; duke shërbyer për qëllime mjaft të qarta: përshkrim, hulumtim, porositje ose dekorim ().

Si të përdorni saktë vizualizimin e të dhënave?

Suksesi i vizualizimit varet drejtpërdrejt nga korrektësia e aplikimit të tij, përkatësisht nga zgjedhja e llojit të grafikut, përdorimi i saktë dhe dizajni i tij.


60% e suksesit të vizualizimit varet nga zgjedhja e llojit të grafikut, 30% nga përdorimi i saktë i tij dhe 10% nga dizajni i saktë i tij.

Lloji i saktë i grafikut

Një grafik ju lejon të shprehni më plotësisht dhe saktë idenë e përcjellë nga të dhënat, kështu që është shumë e rëndësishme të zgjidhni llojin e duhur të diagramit. Zgjedhja mund të bëhet duke përdorur algoritmin e mëposhtëm:

Qëllimet e vizualizimit- ky është zbatimi i idesë kryesore të informacionit, kjo është ajo për të cilën duhet të tregohen të dhënat e përzgjedhura, çfarë efekti duhet të arrihet - identifikimi i marrëdhënieve në informacion, duke treguar shpërndarjen e të dhënave, përbërjen ose krahasimin të të dhënave.


Rreshti i parë tregon grafikë me qëllim të paraqitjes së marrëdhënieve në të dhëna dhe shpërndarjes së të dhënave, dhe rreshti i dytë ka për qëllim të tregojë përbërjen dhe krahasimin e të dhënave.

Marrëdhëniet në të dhëna- kështu varen nga njëri-tjetri, lidhja mes tyre. Duke përdorur marrëdhëniet, mund të identifikoni praninë ose mungesën e varësive midis variablave. Nëse ideja kryesore e informacionit përmban frazat "i referohet", "ulet / rritet në", atëherë duhet të përpiqeni të tregoni saktësisht marrëdhëniet në të dhëna.
Shpërndarja e të dhënave është se si është rregulluar në lidhje me diçka, sa objekte bien në zona të caktuara vijuese të vlerave numerike. Ideja kryesore do të përmbajë frazat "në rangun nga x në y", "përqendrimi", "frekuenca", "shpërndarja".

Përbërja e të dhënave- kombinimi i të dhënave për të analizuar pamjen e përgjithshme në tërësi, duke krahasuar komponentët që përbëjnë një përqindje të një tërësie të caktuar. Frazat kryesore për përbërjen janë "përbërë x%", "pjesë", "përqindje e tërësisë".

Krahasimi i të dhënave - kombinimi i të dhënave për të krahasuar tregues të caktuar, duke identifikuar se si objektet lidhen me njëri-tjetrin. Është gjithashtu një krahasim i komponentëve që ndryshojnë me kalimin e kohës. Frazat kyçe për idetë kur krahasohen janë "më shumë se/më pak se", "e barabartë me", "ndryshime", "rritje/ulje".

Pas përcaktimit të qëllimit të vizualizimit, duhet të përcaktoni llojin e të dhënave. Ato mund të jenë shumë heterogjene në llojin dhe strukturën e tyre, por në rastin më të thjeshtë dallojnë të dhëna të vazhdueshme numerike dhe kohore, të dhëna diskrete, të dhëna gjeografike dhe logjike. Të dhënat numerike të vazhdueshme përmbajnë informacion në lidhje me varësinë e një vlere numerike nga një tjetër, për shembull, grafikët e funksioneve të tilla si y=2x. Koha e vazhdueshme përmban të dhëna për ngjarjet që ndodhin gjatë një periudhe kohore, si një grafik i temperaturës që matet çdo ditë. Të dhënat diskrete mund të përmbajnë varësi të sasive kategorike, për shembull, një grafik të numrit të shitjeve të mallrave në dyqane të ndryshme. Të dhënat gjeografike përmbajnë informacione të ndryshme në lidhje me vendndodhjen, gjeologjinë dhe tregues të tjerë gjeografikë, një shembull kryesor është një hartë e rregullt gjeografike. Të dhënat logjike tregojnë renditjen logjike të komponentëve në lidhje me njëri-tjetrin, siç është pema familjare.


Grafikët e të dhënave të vazhdueshme numerike dhe kohore, të dhëna diskrete, të dhëna gjeografike dhe logjike.

Në varësi të qëllimit dhe të dhënave, ju mund të zgjidhni orarin më të përshtatshëm për ta. Është më mirë të shmangni shumëllojshmërinë për hir të shumëllojshmërisë dhe të zgjidhni sipas parimit "sa më e thjeshtë aq më mirë". Përdorni lloje specifike të grafikëve vetëm për të dhëna specifike, në raste të tjera, grafikët më të zakonshëm janë të përshtatshëm:

  • lineare
  • me zona
  • kolonat dhe histogramet (bar)
  • grafiku i byrekut (byrek, donut)
  • tabelë polare (radar)
  • komplot shpërndaj (shpërndaj, flluskë)
  • hartat
  • pemët (pema, harta mendore, harta e pemës)
  • diagramet kohore (vija kohore, gantt, ujëvara).

Grafikët e linjës, grafikët e zonave dhe histogramet mund të përmbajnë disa vlera në një argument për një kategori, të cilat mund të jenë ose absolute (më pas parashtesa e grumbulluar u shtohet këtyre llojeve të grafikëve) ose relative (të grumbulluara plotësisht).


Grafikoni me vlera të grumbulluara dhe me stivime të plota

Kur zgjidhni një grafik të përshtatshëm, mund të udhëhiqeni nga tabela e mëposhtme, e përpiluar në bazë të këtij diagrami dhe:


Përdorimi i duhur i një grafiku

Është e rëndësishme jo vetëm të zgjidhni llojin e duhur të grafikut, por edhe ta përdorni atë në mënyrë korrekte:

  • Nuk ka nevojë të ngarkoni grafikun me shumë informacion. Numri optimal i llojeve të ndryshme të të dhënave dhe kategorive nuk është më shumë se 4-5, përndryshe është më e këshillueshme që një diagram i tillë të ndahet në disa pjesë.


Një grafik i tillë mund të krahasohet me spageti dhe ndahet më mirë në disa diagrame.

Zgjidhni shkallën dhe shkallën e duhur për grafikun. Për histogramet dhe parcelat e sipërfaqes, preferohet të fillohet shkalla e vlerës nga zero. Mundohuni të mos përdorni shkallë të përmbysur - kjo shumë shpesh mashtron shikuesin në lidhje me të dhënat.


Një shkallë e pasaktë ndikon negativisht në perceptimin e të dhënave. Në rastin e parë, shkalla është zgjedhur gabimisht, në të dytën, shkalla është e përmbysur.

  • Për grafikët me byrek dhe grafikët që tregojnë një përqindje të një pjese totale, shuma e vlerave duhet të mblidhet gjithmonë deri në 100%.
  • Për perceptim më të mirë të të dhënave, është më mirë të organizoni informacionin në bosht - ose sipas vlerës, ose alfabetikisht, ose sipas kuptimit logjik.

Hartimi i saktë i orarit

Asgjë nuk është më e këndshme për syrin sesa grafikët e dizajnuar mirë, dhe asgjë nuk i prish grafikët më shumë se prania e "plehrave" grafike. Parimet themelore të dizajnit:

  • përdorni paleta me ngjyra të ngjashme, jo të ndritshme dhe përpiquni të kufizoni veten në një grup prej gjashtë pjesësh
  • linjat ndihmëse dhe dytësore duhet të jenë të thjeshta dhe jo të dukshme


Linjat ndihmëse në një grafik nuk duhet të largojnë vëmendjen nga ideja kryesore e të dhënave.

  • kur është e mundur, përdorni vetëm etiketat e boshteve horizontale;
  • Për grafikët e zonave, preferohet të përdoret një ngjyrë me transparencë;
  • Përdorni një ngjyrë të ndryshme për secilën kategori në grafik.

konkluzionet

Vizualizimi- një mjet i fuqishëm për përcjelljen e mendimeve dhe ideve te konsumatori fundor, një asistent për perceptimin dhe analizën e të dhënave. Por si të gjitha mjetet, ai duhet të përdoret në kohën dhe vendin e vet. Përndryshe, informacioni mund të perceptohet ngadalë ose edhe gabimisht.


Grafikët tregojnë të njëjtat të dhëna, gabimet kryesore të vizualizimit shfaqen në të majtë dhe korrigjohen në të djathtë.

Kur përdoret me shkathtësi, vizualizimi i të dhënave mund ta bëjë materialin mbresëlënës, interesant dhe të paharrueshëm.

Hartat mendore dhe teknikat e paraqitjes vizuale janë shpesh baza e strategjisë së orientimit për interpretimin e hartës. Për disa kjo vjen lehtë, për të tjerët është më e vështirë, megjithëse me përvojë aftësitë përmirësohen. Përshkrimi i pikturës në formën e tekstit të shkruar që lidhet me një lloj të caktuar sportive, përdoret shpesh për të ndihmuar pjesëmarrësit të krijojnë imazh i ndritshëm. Kjo u lejon atyre të ndërtojnë strategji të përshtatshme përballuese për potencialin situata të vështira mjedisi. Përshkrimi i terrenit shpesh përdoret në orientim si pjesë e trajnimit teknik. Për shembull, trajneri ose personi tjetër i kërkon orientuesit të prezantojë dhe më pas të përshkruajë verbalisht vendndodhjen e pikës së kontrollit ose pikave kryesore parcelë e vogël kartat. Vendndodhja e postbllokut është në majë të një grope që ka këneta të vogla në verilindje dhe jugperëndim. Një nxitje e gjatë shtrihet në perëndim, dhe kodra më të vogla ndodhen në verilindje, lindje dhe jugperëndim. Në cilën kodër qëndron posta komanduese? Në mënyrë të ngjashme, orientuesi mund të dëgjojë një përshkrim të një seksioni të vogël të hartës ose vendndodhjen e një pike kontrolli dhe më pas të përpiqet të riprodhojë përshkrimin verbal: Kodra në formë sallami ka dy maja, një në çdo skaj të një kreshtë të ngushtë mali. e vendosur në drejtim lindje-perëndim. vargmali ka dy tuma që krijojnë një shalë në një distancë të barabartë nga majat. Në veriperëndim të shalës, lugina zbret në mënyrë të pjerrët. Maja lindore është më e lartë se ajo perëndimore dhe ka një pjerrësi të pjerrët në lindje, një shtytje të madhe të gjerë që shkon në veri dhe një pjerrësi të butë në jug. Maja perëndimore ka një pjerrësi të lehtë në veri dhe perëndim dhe një shpat të gjatë të hollë që shtrihet në jug. Të dyja këto metoda ndihmojnë në zhvillimin e vetëdijes vizuale. Aftësitë vizuale janë thelbësore për gjetjen e rrugës. Aftësia për të vizualizuar vendndodhjen e një pike kontrolli ose një zone specifike të hartës duhet të përmirësohet me përvojë. Praktika, megjithatë, nuk duhet të kufizohet në stërvitje ose konkurrencë. Ka mundësi të tjera për të praktikuar, si brenda ashtu edhe jashtë. Për shembull, mësimi gradualisht i hartave të zonave të njohura dhe të panjohura dhe më pas vizualizimi i vendndodhjes së një pike kontrolli bazuar në informacionin e hartës mund t'i paraprijë vizitës reale të zonës. Shumë shpesh, kur diskutoni vendndodhjen e një pike kontrolli ose një seksion harte, mund të dëgjoni nga orientuesi "kjo nuk ishte ajo që prisja". Një metodë tjetër e përdorur nga disa orientues është të praktikoni në terrene të njohura, të punoni me një hartë të një zone tjetër dhe të përpiqeni ta imagjinoni atë ndërsa shkoni. tipare të karakterit peizazh i panjohur. Kjo mund të duket mjaft e çuditshme, por është shumë ushtrim i mirë për përqendrim.