一、數據可視化
是關于數據視覺表現形式的科學技術研究。其中,這種數據的視覺表現形式被定義為,一種以某種概要形式抽提出來的信息,包括相應信息單位的各種屬性和變量。它是一個處于不斷演變之中的概念,其邊界在不斷地擴大。主要指的是技術上較為高級的技術方法,而這些技術方法允許利用圖形、圖像處理、計算機視覺以及用戶界面,通過表達、建模以及對立體、表面、屬性以及動畫的顯示,對數據加以可視化解釋。與立體建模之類的特殊技術方法相比,數據可視化所涵蓋的技術方法要廣泛得多。
二、重造輪子
是重復創造一個已經存在的基本方法或者被其他人優化。它在軟件開發和其他工程領域被人們廣泛使用。造輪子的含義:明知道你做的不可能比前輩做得更好,卻仍然堅持要做。車輪子是圓形的,這是大家公認的最合適的形狀。而自己非要發明另一種形狀的輪子,這種行為就叫「重復發明輪子( the wheel)」,即“造輪子”。程序開發中常用。因為計算機系統從低級語言到高級語言,涉及到的東西非常復雜,僅憑一個人的力量不可能完全掌握,無法面面俱到。程序開發中,需要的所有東西不可能一個人做出來。這時候需要站在前人的肩膀上,即使他的輪子不是最圓的,在此基礎上修改即可,不必完全通曉造輪子的全部過程。
我覺得很多現實中的業務場景其實也是在造輪子。很多Excel、PPT中的已有的圖表或者是用這兩個Office軟件可以輕松繪制的簡單圖表,現實中的需求卻要用BI工具來實現,耗時耗力、不能快速部署落地,同時本質上和造輪子無異。但即使80%的需求是在造輪子,為了剩下20%有現實意義的需求,也需要把數據可視化這件事情做好。
以下是筆者選取的52個經典圖表做介紹,一些比較常用的報表也配上了Tableau / Power BI / Apache ECharts 實現的效果圖,有的圖表偏實用,有的就比較花里胡哨,實用性不高。如有錯誤之處,也歡迎及時指出。
1.弧線圖
弧線圖是一種圖形繪制樣式,其中圖形的頂點沿歐幾里德平面中的一條線放置,邊在以該線為邊界的兩個半平面之一中繪制為半圓,或繪制為半圓序列形成的平滑曲線。在某些情況下,直線本身的線段也可以作為邊,只要它們只連接沿直線連續的頂點。
2.面積圖
(不同產品產生收入)
面積圖以圖形方式顯示定量數據。它基于折線圖。軸與線之間的區域通常用顏色、紋理和圖案填充來強調。通常一個面積圖用于比較兩個或兩個以上的變量。
3.箭頭圖
箭頭圖可用作多個餅圖的替代品。
4.條形圖
條形圖是一種用矩形表示分組數據的圖表,矩形條的長度與其表示的值成比例。可以垂直或水平繪制條形圖。垂直條形圖有時也稱為折線圖。圖表的一個軸顯示要比較的特定類別,另一個軸表示離散值。
5.布林線指標
布林線指標,即BOLL指標,其英文全稱是“ Bands”,布林線(BOLL)由約翰·布林先生創造,其利用統計原理,求出股價的標準差及其信賴區間,從而確定股價的波動范圍及未來走勢,利用波帶顯示股價的安全高低價位,因而也被稱為布林帶。其上下限范圍不固定,隨股價的滾動而變化。布林指標和麥克指標MIKE一樣同屬路徑指標,股價波動在上限和下限的區間之內,這條帶狀區的寬窄,隨著股價波動幅度的大小而變化,股價漲跌幅度大時,帶狀區變寬,漲跌幅度狹小盤整時,帶狀區則變窄。
6.箱線圖
(不同專業錄取分數線箱線圖)
在描述性統計中,箱線圖是通過四分位數以圖形方式描述數據的一種方便方法。方框圖從方框(晶須)垂直延伸的線,表示上四分位數和下四分位數之外的可變性。異常值可繪制為單個點。箱線圖是非參數圖:它們顯示統計總體樣本的變化,而無需對潛在的統計分布進行任何假設。框的不同部分之間的間距表示數據的分散度(擴散)和偏度,并顯示異常值。除了點本身,它們還允許人們直觀地估計各種L-估計量,尤其是四分位區間、中間鉸鏈、區間、中間區間和三均值。箱線圖可以水平或垂直繪制。
7.氣泡地圖
(地震追蹤,圓圈大小代表震級,顏色代表深度)
氣泡地圖,圓圈顯示在指定的地理區域上,圓圈的面積與其在數據集中的值成比例。氣泡地圖可以很好地比較地理區域的比例,而不會出現區域面積大小引起的問題。但是,氣泡地圖的主要缺陷是,過大的氣泡可能會與貼圖上的其他氣泡和區域重疊,因此需要對此加以說明。
8.子彈圖
(不同產品的預計銷售目標以及實際銷售情況)
子彈圖是Stephen Few開發的條形圖的變體。子彈圖的靈感來自于許多儀表板中的傳統溫度計圖表和進度條。子彈圖是為了克服量規和儀表的基本問題而開發的:它們通常顯示的信息太少,需要太多的空間,并且充斥著無用和分散注意力的裝飾。子彈圖以一個單一的主要度量(例如,本年度迄今的收入)為特征,將該度量與一個或多個其他度量進行比較,以豐富其含義(例如,與目標進行比較),并在績效的定性范圍(如差、滿意和良好)中顯示。定性范圍顯示為單個色調的不同強度,以使色盲者能夠識別,并將儀表板上顏色的使用限制在最低限度。
9.凹凸圖
(不同產品半年內排名變化)
凹凸圖用于使用其中一個測量值將兩個維度相互比較。它們對于探索值在時間維度、地點維度或與分析相關的其他維度上的排名變化非常有用。
10.日歷圖
(一個月內北京機場天氣綜合指數變化,顏色深淺代表指數高低)
日歷圖用于顯示長時間跨度內的活動,如月份或年份。當你想說明一些數量是如何隨一周中的某一天而變化,或者它是如何隨時間變化的時候,最好使用日歷圖。
11.燭臺圖
燭臺圖(也稱為日本燭臺圖)是一種金融圖表,用于描述證券、衍生品或貨幣的價格變動。每個“燭臺”通常顯示一天;因此,舉例來說,一個月圖表可能顯示20個交易日為20個“燭臺”。
12.卡通圖
卡通圖是一種地圖,其中一些專題地圖變量——如旅行時間、人口或國民生產總值——被陸地面積或距離所替代。地圖的幾何體或空間被扭曲,以便傳達該替代變量的信息。
13.弦圖
弦圖是一種顯示矩陣中數據之間相互關系的圖形方法。數據圍繞圓呈放射狀排列,點之間的關系通常繪制為將數據連接在一起的圓弧。
14.分級統計圖
(不同省份銷售利潤的高低,由顏色代表)
分級統計地圖是一種主題地圖,其中區域的陰影或圖案與地圖上顯示的統計變量(如人口密度或人均收入)的測量值成比例。分級統計圖法可反映布滿整個區域的現象(如地貌切割密度)、呈點狀分布的現象(如居民點的密度)或線狀分布的現象(如河流密度或道路網密度),但較多的是反映呈面狀但屬分散分布的現象,如反映人口密度、某農作物播種面積的比、人均收入等。此法因常用色級表示,故亦稱色級統計圖法。
15.組合圖表
組合圖表是在同一圖紙中使用多個標記類型的視圖。例如,可以將利潤總額顯示為橫條,橫條上有一條線顯示銷售總額。還可以使用組合圖表在同一視圖中顯示多個詳細級別。例如,可以有一個折線圖,其中各行顯示每個客戶細分一段時間內的平均銷售額,然后可以有另一行顯示所有客戶細分的組合平均值。
16.連接地圖
連接地圖是通過直線或曲線將放置在地圖上的點連接起來繪制的。雖然連接地圖非常適合在地理位置上顯示連接和關系,但它們也可以用于通過單個鏈接顯示地圖路線。連接圖還可以通過連接的分布或連接在地圖上的集中程度來顯示空間模式。
17.控制圖
控制圖是用于研究過程如何隨時間變化的圖形。數據按時間順序繪制。控制圖總是有一條中心線表示平均值,一條上線表示控制上限,一條下線表示控制下限。這些線是根據歷史數據確定的。
18.南丁格爾玫瑰圖
Coxcomb圖,有時被稱為極區圖或玫瑰圖,是條形圖和餅圖的組合。不是根據數據更改角度,而是通過更改半徑調整每個線段的面積。重要的是,不是純粹根據數據更改半徑,而是按比例更改半徑,以便每個線段的面積隨數據的變化而變化。更改原始半徑值將不成比例地更改面積,導致人們錯誤地感知數據。有助于使季節性模式可見,淡化細微差異,同時提供更好的圖像。
19.交叉表
交叉表將來自一個或多個來源的數據組合和/或匯總為簡明格式,以供分析或報告。交叉表顯示兩個或多個變量的聯合分布,它們通常以矩陣中列聯表的形式表示。
(由于和excel格式相仿,個人認為是Tableau里最體現造輪子特點的一張圖。)
20.環形圖
(按產品種類、客戶類型劃分銷售額,圓心為銷售總額)
就像餅圖一樣,環形圖是一種圖形類型,其中一個圓被劃分為多個扇區,每個扇區代表整體的一部分。不同之處在于,圓環圖切掉了圓的中心,這允許您顯示有關可視化數據的附加信息。
21.漏斗圖
(按照不同階段區分利潤)
漏斗圖是一種圖表,通常用于表示銷售流程中的各個階段,并顯示每個階段的潛在收入。這種類型的圖表在識別組織銷售流程中的潛在問題方面也很有用。漏斗圖類似于堆積百分比條形圖。
22.甘特圖
(不同產品在特定時間段是否完成裝運)
甘特圖是一種圖表,其中一系列水平線顯示在特定時間段內完成的工作量或完成的生產量與這些時間段內計劃的工作量的關系。
23.熱圖
熱圖是數據的圖形表示,其中矩陣中包含的各個值表示為顏色。分形貼圖和樹貼圖通常都使用類似的顏色編碼系統來表示層次結構中某個變量的值。
24.六邊形平鋪地圖
六邊形平鋪地圖是一種使用六邊形表示地理區域的圖,以防止具有較大地理區域產生偏移。25.直方圖
直方圖是顯示分布形狀的圖表。直方圖看起來像條形圖,但將連續度量值分組到范圍或數據桶中。
26.地平線圖
地平線圖是一種功能強大的工具,用于在一個類別內的多個項目之間比較一段時間內的數據。
27.跳轉圖
跳轉圖允許對具有多種變體的序列事件數據進行可擴展的圖形化,以成功地可視化工作流的性能。
28.折線圖
(不同類型客戶銷售額趨勢以及按照線性回歸模型預測未來銷量)
折線圖連接視圖中的各個數據點。它們提供了一種可視化價值序列的簡單方法,在您希望看到隨時間變化的趨勢或預測未來價值時非常有用。
29.棒棒糖圖
棒棒糖圖是折線圖和點圖的組合,允許您在圖表中添加更詳細的信息。
30.Mekko圖
Mekko圖(有時也稱為圖)是二維堆疊圖。除了常規堆疊圖表的不同線段高度外,Mekko圖表的列寬也不同。列寬按比例縮放,使總寬度與所需圖表寬度匹配。
31.網絡圖
這種類型的可視化顯示了事物是如何通過使用節點/頂點和鏈接線來表示它們的連接而相互連接的,并有助于說明一組實體之間的關系類型。
32.壓縮氣泡圖
使用壓縮氣泡圖在一組圓圈中顯示數據。尺寸定義單個氣泡,度量定義單個圓的大小和顏色。
33.面板圖
面板圖是一組類似的圖表,整齊地排列在面板中,以幫助我們理解一些包含多個變量的數據。
34.帕累托圖
以 Pareto命名的Pareto圖表是一種包含條形圖和折線圖的圖表類型,其中單個值由條形圖按降序表示,累積總數由線條表示。
35.餅圖
使用餅圖顯示比例。
36.雷達圖
(LPL打野數據雷達圖)
雷達圖是一種以二維圖的形式顯示多元數據的圖形方法,該二維圖由三個或更多定量變量組成,這些變量從同一點開始在軸上表示。軸的相對位置和角度通常不具信息性。
37.圓型條形圖
圓型條形圖只是在極坐標系上繪制的條形圖,而不是在笛卡爾坐標系上繪制的條形圖。雖然看起來很酷,但圓型條形圖的問題是條形長度可能會被誤解。外部的每個條相對于最后一個相對較長,即使它們代表相同的值。這是因為每個桿必須位于不同的半徑,所以每個桿都是根據其角度來判斷的。我們的視覺系統更擅長解釋直線,因此笛卡爾條形圖是比較數值的更好選擇。因此,使用圓型條形圖主要是為了美觀。
38.圓型柱形圖
這種類型的圖形使用同心圓網格在其上繪制條形圖。圖上的每個圓表示一個刻度上的值,而徑向分隔符(從中心跨越的線)用于每個類別或間隔(如果是直方圖)。通常,刻度上的較低值從中心開始,隨著每個圓的增大而增大。但是,負值也可以顯示在圓型柱狀圖上,法是從任何一個外圓(從中心圓)開始零位,并將其內的所有圓用于負值。
39.圓型樹形圖
這種類型的可視化通過一系列環顯示層次結構,這些環為每個類別節點切片。每個環對應于層次中的一個級別,中心圓表示根節點,層次從根節點向外移動。環根據其與父切片的層次關系進行切片和劃分。每個切片的角度要么在其父節點下等分,要么與某個值成比例。顏色可用于突出顯示層次分組或特定類別。
40.桑基圖
桑基圖,即桑基能量分流圖,也叫桑基能量平衡圖。它是一種特定類型的流程圖,圖中延伸的分支的寬度對應數據流量的大小,通常應用于能源、材料成分、金融等數據的可視化分析。因1898年Matthew Henry Phineas Riall Sankey繪制的“蒸汽機的能源效率圖”而聞名,此后便以其名字命名為“桑基圖”。
桑基圖最明顯的特征就是,始末端的分支寬度總各相等,即所有主支寬度的總和應與所有分出去的分支寬度的總和相等,保持能量的平衡。
41.散點圖
(全球各地進行的 100 次地表溫度 (°C) 觀察。每個數據點均表示為根據 1961-1990 平均值計算出的與中值的差值或溫度異常值。)
散點圖是指在回歸分析中,數據點在直角坐標系平面上的分布圖,散點圖表示因變量隨自變量而變化的大致趨勢,據此可以選擇合適的函數對數據點進行擬合。
用兩組數據構成多個坐標點,考察坐標點的分布,判斷兩變量之間是否存在某種關聯或總結坐標點的分布模式。散點圖將序列顯示為一組點。值由點在圖表中的位置表示。類別由圖表中的不同標記表示。散點圖通常用于比較跨類別的聚合數據。
42.分段條形圖
當兩個或多個數據集并排繪制并分組在同一軸上的類別下時,可以使用如圖的條形圖的這種變化。與條形圖一樣,每個條形圖的長度用于顯示類別之間的離散數值比較。每個數據系列都指定了一種單獨的顏色或同一顏色的不同陰影,以便區分它們。然后將每組鋼筋彼此隔開。
43.斜坡圖
斜坡圖很像線形圖,因為它繪制點之間的變化。然而,坡度圖只繪制了兩點之間的變化。這是基于這樣一種觀點,即人類相當擅長解釋方向上的變化。很容易檢測到下降和快速上升。
斜坡圖通常用于顯示隨時間的變化,但也用于比較兩組,如男孩和女孩。
44.小倍數圖
小倍數圖(有時稱為網格圖、格子圖或面板圖)是一系列使用相同比例和軸的類似圖形或圖表,便于比較。它使用多個視圖來顯示數據集的不同分區。Edward Tufte推廣了這個概念。
45.跨度圖
用于顯示最小值和最大值之間的數據集范圍的跨度圖。它非常適合比較范圍,通常是分類范圍。跨度圖只將讀者的注意力集中在極值上,沒有給出最小值和最大值之間的值或平均值或數據分布的信息。
46.迷你圖
迷你圖是一種非常小的折線圖,通常沒有軸或坐標。它以一種簡單且高度濃縮的方式呈現了某些測量(如溫度或股票市場價格)中變化(通常隨時間變化)的一般形狀。迷你圖足夠小,可以嵌入到文本中,或者可以將多個迷你圖組合在一起作為一個小倍數的元素。雖然典型圖表旨在顯示盡可能多的數據,并從文本流出發,但火花線旨在簡潔、令人難忘,并位于討論它們的位置。
47.螺旋圖
這種類型的可視化沿著阿基米德螺線繪制基于時間的數據。曲線圖從螺旋的中心開始向外延伸。緩和曲線圖用途廣泛,可以使用沿緩和曲線路徑顯示的條、線或點。螺旋圖是顯示大型數據集的理想方法,通常用于顯示較長時間段內的趨勢。這使得螺旋圖非常適合顯示周期性圖案。可以為每個周期分配顏色,以將其分解,并允許在每個周期之間進行一些比較。例如,如果我們要顯示一年的數據,我們可以在圖表上為每個月指定一種顏色。
48.流圖
這種類型的可視化是堆疊面積圖的一種變體,它不是針對固定的直軸繪制值,而是圍繞變化的中心基線移動值。流圖通過使用流動的有機形狀顯示不同類別數據隨時間的變化,這些形狀有點像河流。這使得流圖在美學上更令人愉悅,看起來更吸引人。
在流圖中,每個單獨流形狀的大小與每個類別中的值成比例。流圖與之平行的軸用于時間刻度。顏色既可以用來區分每個類別,也可以通過改變顏色的色度來可視化每個類別的附加定量值。
49.樹形圖
樹形圖是一種直觀地表示樹狀結構中層次結構的方法。通常,樹形圖的結構由根節點、沒有上級/上級的成員等元素組成。然后是節點,這些節點通過稱為分支的線連接在一起,表示成員之間的關系和連接。最后,葉節點(或結束節點)是沒有子節點或子節點的成員。
50.樹狀圖
使用樹狀圖以嵌套矩形顯示數據。您可以使用尺寸來定義樹狀圖的結構,使用度量來定義各個矩形的大小或顏色。樹狀圖是一種相對簡單的數據可視化,可以以一種具有視覺吸引力的格式提供洞察力。
51.瀑布圖
瀑布圖是一種數據可視化形式,有助于理解連續引入的正值或負值的累積效應。瀑布圖也被稱為飛磚圖或馬里奧圖,因為在半空中有明顯的懸浮柱。
52.詞云圖
詞云圖是文本數據的可視化表示,通常用于描述網站上的關鍵字元數據(標記),或可視化自由格式文本。標簽通常是單個單詞,每個標簽的重要性用字體大小或顏色表示。這種格式對于快速識別最突出的術語和按字母順序定位術語以確定其相對突出程度非常有用。當用作網站導航輔助工具時,術語會超鏈接到與標記關聯的項目。
轉自: 公眾號;
系統性實踐課程推薦(點擊課程標題進入課程詳情)
以下課程為視頻教程,可長期觀看
會務組賈老師:(同微)課程最高享受7.5折優惠
農林生態、遙感類視頻課程推薦(即買即看)
無人機遙感圖像拼接及處理實踐技術專題視頻教程
基于PyTorch深度學習無人機遙感影像目標檢測、地物分類及語義分割視頻教程
10
11
陸面生態水文模擬與多源遙感數據同化的實踐技術應用精品課程
12
13
14
15
16
17
實操案例精講:GIS、GPS、RS 綜合案例應用技術視頻課程
18
無人機支持下的自然災害風險評估技術應用視頻課程
19
遙感影像信息提取與案例分析實踐技術視頻課程
20
21
基于查找表(lookup table,LUT)方法反演植被參數視頻課程
22
基于ArcGIS污染物濃度及風險的時空分布視頻課程
23
基于ArcGIS農業面源污染模擬案例分享視頻課程
24
基于ArcGIS土地利用量化人類活動的分析及模型構建視頻課程
25
ArcGIS應用實戰專題視頻課程
26
地統計學空間插值方法及實踐應用專題視頻課程
27
28
長時間序列遙感數據暨植被物候提取與分析實踐應用視頻課程
29
基于MATLAB長時間序列遙感數據分析(以MODIS數據處理為例)實踐操作視頻課
30
基于MATLAB的長時間序列遙感數據產品分析暨MODIS NDVILAI多年產品數據批處理分析視頻教程
31
32
33
34
35
36
37
城市/農村用地適宜性評價視頻課程
38
39
40
41
視頻教程+課件資料及數據代碼+導師隨行輔導
聯系課程專員,最高享受7.5折優惠
大氣科學類視頻課程推薦(即買即看)
基于CAMx的空氣質量模擬及污染來源解析技術與案例分析精品視頻課程
10
11
12
13
14
16
18
20
21
22
23
24
25
26
分子動力學LAMMPS模擬實戰技術應用精品課程
視頻教程+課件資料及數據代碼+導師隨行輔導
聯系課程專員,最高享受7.5折優惠
語言類視頻課程推薦(即買即看)
R-GIS:如何用 R 語言實現 GIS 地理空間分析及模型預測時間技術應用
R 語言回歸及混合效應(多水平/層次/嵌套)模型實踐應用技術視頻課程
基于R語言的貝葉斯網絡模型的實踐技術應用視頻課程
基于GeoDa與R語言的空間數據回歸實踐技術應用視頻教程
10
面向高校的基于算法的發明專利申請寫作方法視頻教程
11
12
13
14
15
16
17
18
如何使用python網絡爬蟲批量獲取公共資源數據實踐技術應用視頻課程
19
20
統計方法在變量變化及變量間關系分析中的應用視頻課程
21
22
基于PyTorch深度學習實踐技術應用視頻課程
23
24
25
最新基于MATLAB 2021b的機器學習、深度學習實踐應用視頻課程
26
R語言數據統計分析與 ggplot2高級繪圖實踐應用精品視頻課程
27
基于R語言的現代線性回歸實踐技術方法精品課程
28
基于R語言的分位數回歸實踐技術高級應用精品課程
視頻教程+課件資料及數據代碼+導師隨行輔導
聯系課程專員,最高享受7.5折優惠
土壤、地下水、地質類視頻課程推薦(即買即看)
10
11
全流程地下水環境影響評價方法及關鍵技術與化工、工業園區、固廢堆積、礦山等 實際項目應用精品視頻課程
視頻教程+課件資料及數據代碼+導師隨行輔導
聯系課程專員,最高享受7.5折優惠
水文類視頻課程推薦(即買即看)
涉河建設項目防洪評價報告編制技術精品課程
HEC-RAS建模方法及實踐技術應用精品視頻課程
10
11
12
13
基于DEM的水文分析專題視頻課程
14
FVCOM流域、海洋水環境數值模擬方法及實踐技術應用視頻教程
15
16
17
18
19
20
視頻教程+課件資料及數據代碼+導師隨行輔導
聯系課程專員,最高享受7.5折優惠
生物信息類視頻課程推薦(即買即看)
python 生物信息多組學大數據深度挖掘與論文整理技巧視頻課程
R 語言生物信息學大數據分析與繪圖技術視頻課程
基因家族分析及SCI寫作技巧實踐技術應用精品課程
如何利用 shell 進行上萬個基因組的批量分析視頻課程
視頻教程+課件資料及數據代碼+導師隨行輔導
聯系課程專員,最高享受7.5折優惠
掃碼了解課程詳情
添加小編微信,海量數據、視頻教程免費獲取
免費數據資源
Ai尚研修海量資源(數據、課件、書籍、視頻教程)一鍵免費領取
(點擊數據標題,直接進入)
地學領域數據
18、【數據分享】全球冰川數據集RGI v3.2
部分數據展示,關注Ai尚研修公眾號→學術資源→數據分享,海量數據資源輕松下載!
大氣領域數據
部分數據展示,關注Ai尚研修公眾號→學術資源→數據分享,海量數據資源輕松下載!
土利用數據
土地利用數據
部分數據展示,關注Ai尚研修公眾號→學術資源→數據分享,海量數據資源輕松下載!
水文領域數據
部分數據展示,關注Ai尚研修公眾號→學術資源→數據分享,海量數據資源輕松下載!
年鑒類數據
部分數據展示,關注Ai尚研修公眾號→學術資源→數據分享,海量數據資源輕松下載!
經濟類數據
部分數據展示,關注Ai尚研修公眾號→學術資源→數據分享,海量數據資源輕松下載!
*請認真填寫需求信息,我們會在24小時內與您取得聯系。