ExplainerHK:立法會秘書處香港政府歷年稅收

A+A-
圖片來源:g0d4ather/Shutterstock

要查找香港的數據資料,除了統計處及各個政府行政部門,立法會秘書處也有公佈不同數據可供參考。這次就看看立法會秘書處的資料研究組,如何用圖表去表示香港政府歷年稅收的組成部分及走向。

圖片來源:香港立法會秘書處

最怕就是強行合併兩項不同的資料

這幅圖表一看上去,顏色繽紛,眾多線條令人目不暇給。相信大部分人都要花上至少半分鐘,才可以好好理解這幅圖表想表達的是甚麼。為甚麼這樣難?因為這裡的資訊很多,嘗試用一幅圖合併兩類不同的數據:第一,灰色棒形圖(bar chart)代表的政府收入數字;第二,不同顏色線所表示的各類收入百分比。第一是實質數字,第二則是百分比。雖然這幅圖表的左右沒有顯示任何縱軸(y-axis)或刻度,但這是一幅典型的雙縱軸圖(dual y-axis chart),將兩類不可以放在同一把尺上的資料,放在同一時間軸上,這是常常被詬病的一類圖表。

如立法會秘書處這個示範一樣,雙縱軸圖很容易過度複雜。簡單清楚的做法是將兩幅圖分開,政府收入一幅圖,各類收入百分比則畫另一幅圖。如果要將兩類東西合併在一起,那就必須是想帶出兩種資料之間的相互關係。可是,在這幅圖中,兩者之間的關係並不明顯。例如紅色線的投資收入所佔的是愈來愈多,淺藍色的地價收入總體則是愈來愈少,可是和灰色棒形圖的政府收入先跌後升,卻扯不上甚麼明顯關係,其他顏色的折線也如是。所以,為甚麼要強行將兩幅圖畫成一幅圖呢?

沒有標示縱軸的刻度

雙縱軸圖出名糟糕,更是因為這類圖表很容易製造不同的誤會。例如看看灰色棒形圖所表示的政府收入在 6 年間的高低起跌比較大,相對下,黑色虛線所代表的印花稅就好像相對平穩。但其實印花稅的百分比最低是 11%,比重最高是 16%,相差 5%。相反,政府收入最低是 5,642 億,最高 7,159 億,也只是升了約 21%。

因為在雙縱軸圖,設計師可以決定 2 條縱軸的比例和刻度,而造成這種視覺上的誤差。例如灰色棒形圖的起點在這裡並不是零,不然 2020 年到 2022 年開上來的差距不會這麼遠。特別是因為沒有了縱軸更沒有了刻度,令人容易在視覺上以為政府收入變化很大。這樣的誤會,我不覺得是畫圖的人有心所致,往往只是 Microsoft Office 的預設。至於如何故意設計雙縱軸圖去顯示想要的正比或反比關係,今後再找機會詳談。

第二最怕就是圖例(legend)相隔這麼遠

這幅圖表除了合併太多資料,又沒有標纖縱軸以外,另一個主要問題就是圖例放在下方,每次讀者想知道每種顏色代表甚麼,都必須來來回回看下方,再回頭看圖表。除了用顏色去區分不同稅收的類別,這幅圖表的設計師還用上不同類型的線條,配不同形狀的標記(marker),例如淺藍色線配交叉、紫色線配黑色圓點、黃色線配藍色鑽石形狀;再加上紅色線是空心、黑色線則是虛線,彷彿要用上了 Excel 報表畫圖的所有功能。但是其實單是顏色,已經足以讓人分別出不同的稅收類別了。

怎樣才可以做到一石二鳥

如果你有幸要畫這幅政府收入及各類收入百分比的圖表,要怎樣做才可以畫得清楚呢?首先,假如你有絕對的自由,最容易當然是畫 2 張圖:政府收入一幅圖、各類收入百分比則畫另一幅圖。反正兩者的走勢之間,沒有甚麼明顯的關連。但你的老闆或教授未必明白「less is more」的道理,可能覺得只是你懶惰或者無能力畫一張複雜的圖表,才要畫 2 張。這個時候就是要好好發揮你製作圖表的能力了!

第一,既然雙縱軸圖這麼難處理,那樣在 2 種資料中,就只可以二選一,要麼實質數字,或是百分比。實際數字往往都比百分比重要,所以就畫實際數字,百分比我們可以再標記上去。第二,要將政府總體收入和各類不同收入串連起來,就要放棄不同的顏色線。我們可以用堆疊棒形圖(Stacked Bar Chart),將每類收入疊起,就是政府的總體收入。最後,將圖例刪走,直接在每一段棒形圖的左面寫上標籤,就完成了,不用再來來回回看每種顏色代表甚麼。

進階級別:如何畫龍點睛

如果你覺得上面的圖表看起來只是一張普通棒形圖,不足以展示你的圖表技術。我們可以再挑戰一下。立法會秘書處那張圖表用顏色線來表達不同年份,所以年份與年份之間的趨勢較為明顯,可以通過折線的斜度來觀察,這也是折線圖的好處。

如果要配搭上面畫的圖表,我們可以用一樣的資料,畫一個堆疊面積圖(Stacked Area Chart)。當然,你要修正一下數據表,每個年份都重複一次,才可以畫成以下的樣子,怎麼做就不詳述了。

最後,將 2 個圖表疊起來,就是下面的最後製成品!這樣看來,又可以一目了然,看到政府的整體總收入,又可以看到每個類別的百分比在年份之間的變化。

當然,我們循例還是要自己檢討一下,因為沒有圖表是完美,當中必須有取捨。堆疊面積圖如之前說過的雙縱軸圖,這是容易令人誤會的一種數據表達方式。為甚麼這樣說呢?例如看看上圖的投資收入,從 2020 年至 2021 年的 9%,上升到 2021 年至 2022 年的 12%,那條斜線很斜,好像很大,其實不然。要完全憑斜線判斷得到收入的趨勢,只有最底的地價收入比較容易。但既然以上的圖表主要希望表達的是政府總收入的實質數字變化,其次才是各類收入的百分比分佈,所以我們還是覺得這個設計比較合適。

※ 此欄文章為作者觀點,不代表本網立場。 ※

與很多從事設計的朋友不同,ExplainerHK 的團隊成員大多都是來自科學,工程和金融背景。著重邏輯的訓練讓我們對數字更敏感,對設計原理更執著。