巨量資料POWER BI案例實作

Page 1

巨量資料

蘇聖珠 博士 著 陳妙盈 博士

POWER BI案例實作

•引導認識最新的數位領域中「大數據」 科技應用,並引導學會使用大數據分 析軟體BI •大數據應用於實際案例分析 •剖析從數據中掏金的祕訣,進而提升 大數據分析和數位決策能力 •應用資料挖礦與大數據分析技術以解 決眞實問題的能力


Power BI 概論 ........................................................................................... 1 案例一 全台死因大掌握 .......................................................................... 3 一、前言 ..................................................................................................................... 4 二、研究問題 ............................................................................................................. 4 三、資料來源 ............................................................................................................. 4 四、資料說明 ............................................................................................................. 4 五、資料匯入 ............................................................................................................. 7 六、資料分析 .......................................................................................................... 14 七、結語 .................................................................................................................. 59 八、參考資料 .......................................................................................................... 59

案例二 旅台觀光新契機 ........................................................................61 一、前言 .................................................................................................................. 62 二、研究問題 .......................................................................................................... 62 三、資料來源 .......................................................................................................... 62 四、資料說明 .......................................................................................................... 63 五、資料匯入 .......................................................................................................... 73 六、資料分析 .......................................................................................................... 78 七、結語 ................................................................................................................ 133 八、參考資料 ........................................................................................................ 133

案例三 美國女鞋大比拚 ..................................................................... 135 一、前言 ................................................................................................................ 136 二、研究問題 ........................................................................................................ 136 三、資料來源 ........................................................................................................ 136 四、資料說明 ........................................................................................................ 136


五、資料匯入 ........................................................................................................ 137 六、資料分析 ........................................................................................................ 138 七、結語 ................................................................................................................ 164 八、參考資料 ........................................................................................................ 164

案例四 新北交通事故率 ....................................................................... 165 一、前言 ................................................................................................................ 166 二、研究問題 ........................................................................................................ 166 三、資料來源 ........................................................................................................ 166 四、資料說明 ........................................................................................................ 167 五、資料匯入 ........................................................................................................ 170 六、資料分析 ........................................................................................................ 176 七、結語 ................................................................................................................ 198 八、參考資料 ........................................................................................................ 198

案例五 日本櫻花追追追 ....................................................................... 199 一、前言 ................................................................................................................ 200 二、研究問題 ........................................................................................................ 200 三、資料來源 ........................................................................................................ 200 四、資料說明 ........................................................................................................ 203 五、資料匯入 ........................................................................................................ 213 六、資料分析 ........................................................................................................ 216 七、結語 ................................................................................................................ 250 八、參考資料 ........................................................................................................ 251


Power BI 概論 Power BI 是 Microsoft 推出的可視化數據商務分析工具套件,可用來分析資料 及共用深入資訊,將複雜的靜態數據資料製作成動態的圖表,或將它們內嵌在應用 程式或網站中。連線至數百個資料來源,並以即時儀表板和報表呈現資料。

Power BI 提供了多種視覺效果類型,如:橫條圖、直條圖、折線圖、區域圖、 圓形圖、環圈圖、漏斗圖、地圖、區域分佈圖、卡片、量測計、樹狀圖、資料表、 矩陣、交叉分析篩選器、KPI 等。

1


在 Power BI 要於報告檢視模式中的畫布建立視覺效果,報表可以有一個或多個 頁面,就像 Excel 活頁簿可以有一或多個工作表一樣;而一個報表畫布內可以有多 種視覺效果類型。Power BI 中在進行跨資料表分析前,也可設定資料表之間的關聯 性,讓不同資料表可以進行串聯的資料分析。

Power BI Desktop 提供了線上學習文章、影片及 Power BI 部落格等,在學習的過 程中,若有遇到什麼問題,可以先進入相關的教學網站,看看官方提供的教學影片, 讓學習更快速。於「說明」索引標籤,即可看到官方所提供的資源。

以下五個案例利用政府公開資訊的資料進行探討,透過 Power BI 視覺化的呈 現,簡單易懂的呈現大數據的資料,案例包含「案例一-全台死因大掌握」 、 「案例二 -旅台觀光新契機」 、 「案例三-美國女鞋大比拚」 、 「案例四-新北交通事故率」以及「案 例五-日本櫻花追追追」。

2


案例一

案例一

全台死因大掌握

學習目標 1. 資料處理 ---資料分群 ---資料關聯 2. 視覺效果 ---交叉篩選器、橫條圖、環圈圖、折線圖、圓餅圖 卡片、多列卡片、區域圖、100%堆疊直條圖、功能區圖表 ---Infographic Designer 1.8.0 (Market Place 匯入) 3. 實務應用 ---全台死因盤點 ---台灣年輕人的死亡分布 ---住那裡活的最好呢?

3


一、 前言 死亡是每一個寶貴生命的終點,而人們中透過相異的方式到達盡頭,生老病死 例子俯拾即是,而不同的年齡層、地區有著相異的結果。 在台灣這塊土地上,四方各地的人們是以何種姿態離開人間?我們利用 Power BI 這套視覺化資料分析軟體,解析 106 年度台灣人的死亡狀況。

二、 研究問題 1. 106 年度全臺灣死亡狀況為何? 2. 年齡區間二十歲至二十四歲在新北市中和區死亡狀況為何? 3. 年齡區間二十歲至二十四歲在全台灣的死亡狀況為何? 4. 臺北市哪個年齡層因為蓄意自我傷害(自殺)而死亡人數最多? 5. 因為衰老/老邁而死亡的人數在哪個地區最多?且其年齡層為何者數量最多?

三、 資料來源 分析案例採用的資料是來自於政府資料開放平台,由衛生福利部統計處彙整, 原始檔案裡含括民國 81 年至 106 年度的全台灣死亡人口統計,包含了性別、年齡、 死亡原因,以及全台灣各縣市鄉鎮市區等項目。而這次的分析只採用 106 年度的統 計檔案,共計 64840 筆資料,故在原始檔案裡頭的欄位說明資料中刪減了 96 年(含) 以前死因代碼以及 100 年度以前的鄉鎮市區代碼,留下適用 106 年度的項目。 (Data: dead106.xlsx)

四、 資料說明 變數名稱

變數說明

資料類型

變數數值

year

年份

名目型資料

106=106 年度

county

鄉鎮市區

名目型資料

101=臺北市松山區、102=臺北市 大安區、109=臺北市大同區、

4


變數名稱

變數說明

資料類型

變數數值 110=臺北市中山區、111=臺北市 內湖區、112=臺北市南港區、 115=臺北市士林區、116=臺北市 北投區、117=臺北市信義區、 118=臺北市中正區、119=臺北市 萬華區、120=臺北市文山區、 301=臺中市豐原區、302=臺中市 東勢區、303=臺中市大甲區、 304=臺中市清水區、305=臺中市 沙鹿區、306=臺中市梧棲區、 307=臺中市后里區、308=臺中市 神岡區、309=臺中市潭子 區、……。 01=腸道感染症、02=結核病、 03=敗血症、04=病毒性肝炎、 05=人類免疫缺乏病毒(HIV) 疾病、06=惡性腫瘤、07=原位與 良性腫瘤(惡性腫瘤除外)、08= 貧血、09=糖尿病、10=血管性及 未明示之癡呆症、11=腦膜炎、 12=椎骨肌肉萎縮及有關聯之症 候群、13=帕金森病、14=阿茲海

cause

死亡原因

名目型資料

默病、15=高血壓性疾病、16=心 臟疾病(高血壓性疾病除外)、 17=腦血管疾病、18=動脈粥樣硬 化、19=主動脈瘤及剝離、20=流 行性感冒、21=肺炎、22=急性支 氣管炎及急性細支氣管炎、23= 慢性下呼吸道疾病、24=塵肺 症、25=肇因於吸入外物之肺部 病況(塵肺症及肺炎除外)、26= 胃及十二指腸潰瘍、27=疝氣及

5


變數名稱

變數說明

資料類型

變數數值 腸阻塞、28=慢性肝病及肝硬 化、29=膽結石及其他膽囊疾 患、30=皮膚及皮下組織疾病、 31=骨骼肌肉系統及結締組織之 疾病、32=腎炎、腎病症候群及 腎病變、33=妊娠(懷孕)、生產及 產褥期、34=源於周產期的特定 病況、35=先天性畸形變形及染 色體異常、36=衰老/老邁、37= 嬰兒猝死症候群(SIDS)、38=事 故傷害、39=蓄意自我傷害(自 殺)、40=加害(他殺)、41=其 他。

sex

性別

名目型資料

1=男、2=女。 01=新生兒﹝未滿四週﹞、02=嬰 兒(滿四週至未滿 1 歲)、03=1 歲、04=2 歲、 05=3 歲、06=4 歲、07=5-9 歲、 08=10-14 歲、09=15-19 歲、 10=20-24 歲、11=25-29 歲、

age_code

年齡

順序型資料

N

死亡人數

數量型資料

6

12=30-34 歲、13=35-39 歲、 14=40-44 歲、15=45-49 歲、 16=50-54 歲、17=55-59 歲、 18=60-64 歲、19=65-69 歲、 20=70-74 歲、21=75-79 歲、 22=80-84 歲、23=85-89 歲、 24=90-94 歲、25=95-99 歲、 26=100 歲以上、99=不詳。


五、 資料匯入 5.1 匯入資料 (1) 點選「取得資料」,於選單中選取「文字/CVS」。

(2) 選取「dead106」,並點選「開啟」。

7


(3) 選取「編輯」。

(4) 頁面右方「套用的步驟」有一行「已變更類型」代表的是:當匯入資料時, 系統會先判斷資料的類型,畫面中顯示出各個欄位的類型被更改為數字。先 按下「已變更類型」左方紅色叉叉圖示取消更改。

8


(5) 點選圖示「ABC」後,將資料類型更改為「整數」。

(6) 點選「關閉並套用」。

9


(7) 回到主頁面匯入新的資料,點選「取得資料」,於選單中選取「Excel」,再選 取「欄位說明」後點選「開啟」。

(8) 勾選全部欲匯入的資料後,選取「編輯」。

10


(9) 於頁面左方點選「age_code」後,先按下「已變更類型」左方紅色叉叉圖示取 消更改後,並將兩欄資料類型皆改為「文字」。

(10) 於頁面左方點選「cause」後,先按下「已變更類型」左方紅色叉叉圖示取 消更改後,並將兩欄資料類型皆改為「文字」。

11


(11) 於頁面左方點選「sex」後,先按下「已變更類型」左方紅色叉叉圖示取消 更改後,並將兩欄資料類型皆改為「文字」。

(12) 於頁面左方點選「County」後,先按下「已變更類型」左方紅色叉叉圖示取 消更改後,將兩欄資料類型皆改為「文字」。

12


(13) 點選「關閉並套用」。

(14) 回到主頁面後,點選左方「模型」。

13


5.2 設定資料關聯 此處建立資料連結,將「dead106」方塊中的「county」點擊拖曳至「county」 方塊中;並以此相同方式將「dead106」方塊中的「cause」點擊拖曳至「cause」方 塊中。

六、 資料分析 6.1. 建立群組 (1) 點選頁面最左方第二個圖示「資料」後;於頁面最右方欄位下方點選「county」 後,點擊「column2」旁邊的箭頭,再點選「建立群組」。

14


(2) 將名稱欄位改成「各縣市」後,選取臺北市所有轄下區域後,點選「群組」 。

(3) 重複上述步驟,將所有各縣市的轄下區域建立群組,完成後點選確定。

15


(4) 點選「各縣市」旁邊的箭頭,再點選「新增群組」。

(5) 將名稱改為「臺灣五大區域」後,依照上前述方式建立群組。 1. 臺灣北部:臺北市、新北市、基隆市、桃園市、新竹市、新竹縣、宜蘭 縣。 2. 臺灣中部:苗栗縣、臺中市、彰化縣、南投縣、雲林縣。 3. 臺灣南部:嘉義市、嘉義縣、臺南市、高雄市、屏東縣、澎湖縣。 4. 臺灣東部:花蓮縣、臺東縣。 5. 臺灣外島:金門縣、連江縣。 完成後點選確認,並點選頁面最左方第一個圖形「報告」回到主頁面。

16


6.2 儀表板製作 6.2.1 篩選器設定 (1) 在視覺效果中點選「交叉分析篩選器」。

(2) 於整個頁面最右方「欄位」下方處,在「county」的子目錄中點擊並拖曳 「臺灣五大區域」至剛剛點擊的「交叉分析篩選器方塊」中。

17


(3) 點選「交叉分析篩選器」成功再新增一個篩選器後,在「county」的子目 錄中點擊並拖曳「各縣市」至「交叉分析篩選器方塊」中。

(4) 點選「交叉分析篩選器」成功再新增一個篩選器後,在「county」的子目 錄中點擊並拖曳「Column2」至「交叉分析篩選器方塊」中。

18


(5) 點選「交叉分析篩選器」成功再新增一個篩選器後,在「age_code」的子 目錄中點擊並拖曳「年齡代碼」至「交叉分析篩選器方塊」中。

(6) 點選「格式」。

19


(7) 將「交叉分析篩選器標題」切換成「關閉」。

(8) 將「標題」切換成開啟後,將「標題文字」中鍵入「年齡」。

20


(9) 將「顏色」改為黑色,將字型大小改為「20pt」。

(10) 將「邊界」切換成開啟後,將「RADIUS」改為大小「30」。

21


(11) 依照上述方式將「臺灣五大區域」、「各縣市」、「Column2」以及「年齡代 碼」共四個篩選器更改為下方圖示的樣貌。

6.2.2 匯入視覺效果 Inforgraphic Designer (1) 在「視覺效果」區塊中點選「…」後,點擊「從 Marketplace 中匯入」。

22


(2) 登入帳戶。如沒有帳戶,請點選「需要 Power BI 帳戶嗎? 免費試用」進行 辦理(方法略)。

(3) 登入成功後,將「Infographic Designer」新增到視覺效果裡。

23


(4) 於視覺效果欄位中點選「Infographic Designer 1.8.0」。

(5) 在「dead106」的子目錄下點擊並拖曳「N」至「Measure」欄位、在「county」 的子目錄下點擊並拖曳「各縣市」至「Row By」欄位中。

24


(6) 點選 Infographic Designer 方塊下方的「焦點模式」,放大視窗。

(7) 選取「Edit mark」。

25


(8) 在「Mark Designer」中,將「Horizontal Align」更改為「Left」。

(9) 在「Text」行列中,點擊最右方的「Data-Binding On」。

26


(10) 在「Decimal Places」中,將「Unrounded」改為「0」。

(11) 點選「Apply」套用剛剛的設定。

27


(12) 在「Mark Designer」中,點選「Insert shape」。

(13) 點選「People」後,選取「Contact」圖示。

28


(14) 將「Fill Percentage」改為「N」。

(15) 將「Value Color」切換成「On」後,點選「Data-Binding Off」。

29


(16) 將「Data-Binding Field」改為「各縣市」後,選取「Apply」套用剛剛的設 定,再點選「Back」回到上一頁。

(17) 將「Keep Ratio」切換成「On」。

30


(18) 點選「格式」,點擊「Small Mutiple」。

(19) 將「Front Size」改為「18%」 。

31


(20) 將「標題」切換為「關閉」後,將「邊界」切換為「開啟」 ,最後將「RADIUS」 更改為「30」 。結束後,將「Mark Designer」關閉,點選「回到報表」回到 主頁面。

(21) 回到主頁面後,將 Infographic Designer 方塊調整成適宜大小。

32


(22) 新增一個「Infographic Designer 1.8.0」後,將在「county」的子目錄下點擊 並拖曳「臺灣五大區域」至「Category」欄位、在「dead106」的子目錄下 點擊並拖曳「N」至「Measure」欄位中。

(23) 到「格式」中,點擊「Chart」,將「Type」改為「Bar」。

33


(24) 將「標題」切換為「關閉」,切換「焦點模式」,並點選「Edit mark」。

(25) 點選「Delete element」。

34


(26) 點選「Insert shape」,選取「People」後,選擇「Man」。

(27) 將「Multiple Units」切換成「On」 ,點選「Value Color」右方的「Data-Binding off」。

35


(28) 將「Data-Binding Field」改為「臺灣五大區域」後,點選「Apply」 ,再點選 「Back」回到上一頁,就可以將「Mark Designer」關掉,並點選「回到報 表」回到主頁面。

6.2.3 圓餅圖及卡片 (1) 將 Infographic Designer 方塊調整好適當大小後,點選視覺效果中的「圓形 圖」。

36


(2) 將「dead106」子目錄下的「cause」點擊並拖曳至「圖例」欄位;再將「dead106」 子目錄下的「N」點擊並拖曳至「值」欄位。

(3) 於「格式」中,將「標題文字」 、 「字型顏色」、 「對齊方式」以及「文字大 小」改為圖片中的樣式。

37


(4) 於視覺效果區中選取「卡片」。

(5) 將「dead106」子目錄的「N」點擊並拖曳至「欄位」中。

38


(6) 於「格式」中,點選「資料標籤」,將「顯示單位」改為「無」。

(7) 將「類別標籤」切換為「關閉」。

39


(8) 將「標題」切換為「開啟」後,將「標題文字」 、 「字型顏色」 、 「對齊方式」 以及「文字大小」改為圖片中的樣式。

(9) 選取「圓形圖」。

40


(10) 將「dead106」子目錄中的「sex」點擊並拖曳至「圖例」 , 「dead106」子目 錄中的「N」點擊並拖曳至「值」兩個欄位裡,最後將「sex」子目錄中的 「性別」點擊並拖曳至「詳細資料」。

(11) 點選「值」下方右邊的箭頭後,選取「總計百分比」。

41


(12) 在「格式」中點選「資料色彩」,可以依自己喜好更改顏色。

(13) 點選「詳細資料」,將「標籤樣式」更改為「類別、總計百分比」。

42


(14) 將「標題」切換為「關閉」。

(15) 在視覺效果區中選取「多列卡片」。

43


(16) 將「cause」子目錄中的「97 年以後 cause」以及「死因分類」分別點擊並 拖曳至「欄位」中。

(17) 在「格式」中,將「類別標籤」切換成「關閉」。

44


6.2.4 Infographic Designer (1) 調整版面後,新增視覺效果「Infographic Designer 1.8.0」 ,並將「dead106」 子目錄下的「cause」點擊並拖曳至「Category」 ,以及「N」點擊並拖曳至 「Measure」。完成後,點擊「焦點模式」,再點選「Edit mark」。

(2) 點選「Delete element」。

45


(3) 點選「Insert shape」,選取「Transportation」後,選擇「Ambulance」。

(4) 將「Multiple Units」切換成「On」 ,點選「Value Color」右方的「Data-Binding off」。

46


(5) 將「Data-Binding Field」改為「cause」後,點選「Apply」 ,再點選「Back」 回到上一頁,就可以將「Mark Designer」關掉。

(6) 在「欄位」,「篩選」裡「視覺效果層級篩選」中,將「cause 是(全部) 篩 選類型」改為「前 N 項」。

47


(7) 將「顯示項目」裡數字欄位中鍵入「10」,並在「dead106」子目錄中點擊 並拖曳「N」至「依值」欄位,完成後點選「套用篩選」。

(8) 到「格式」中,將「標題」切換為關閉,動作完成後,即可點選「回到報 表」回到主頁面。 6.2.5 功能區圖表 (1) 在視覺化效果中,選擇功能區圖表,將「county」子目錄下的「各縣市」點 擊並拖曳至「軸」 、與「dead106」子目錄下的「cause」點擊並拖曳至「圖 例」,最後將「dead106」子目錄下的「N」點擊並拖曳至「值」。

48


(2) 到「格式」中,將「標題」切換為關閉。

6.2.6 區域圖 (1) 在視覺化效果中,選擇區域圖。

49


(2) 將「age_code」子目錄下的「年齡代碼」點擊並拖曳至「軸」 、與「dead106」 子目錄下的「cause」點擊並拖曳至「圖例」 ,最後將「dead106」子目錄下 的「N」點擊並拖曳至「值」。

(3) 在「欄位」 , 「篩選」裡「視覺效果層級篩選」中,將「年齡代碼 是(全部) 篩選類型」改為「前 N 項」。

50


(4) 將「顯示項目」裡數字欄位中鍵入「10」,並在「dead106」子目錄中點擊 並拖曳「N」至「依值」欄位,完成後點選「套用篩選」。

(5) 到「格式」中,將「標題」切換成「關閉」。

51


(6) 到「圖案」項目中,將「筆觸寬度」以及「線條模式」更改為圖片的樣式。

6.2.7 100%堆疊直條圖 (1) 於視覺效果區中新增「100%堆疊直條圖」。

52


(2) 將「county」子目錄下的「臺灣五大區域」點擊並拖曳至「軸」 、與「county」 子目錄下的「各縣市」點擊並拖曳至「圖例」,最後將「dead106」子目錄 下的「N」點擊並拖曳至「值」。

(3) 於「格式」中,將「標題」切換為「關閉」。

53


(4) 點開「圖例」後,將「圖例名稱」改為空白。

6.2.8 完成儀表板

54


6.3 回答問題 問題 1: 106 年度全臺灣死亡狀況為何?

在臺灣五大區域中,死亡人數數量依序為臺灣北部、臺灣南部、臺灣中部、臺灣東 部、臺灣外島;男性與女性分別為 59.17%與 40.83%;死因前十名排序:惡性腫瘤、 心臟疾病(高血壓性疾病除外) 、其他、肺炎、腦血管疾病、糖尿病、事故傷害、慢 性下呼吸道疾病、高血壓性疾病、腎炎腎病症候群及腎病變;各縣市中死亡人數前 三名為:新北市、高雄市、臺北市;年齡區間死亡人數前三名為:75-79、65-69、6064;而在臺灣五大區域中,臺灣北部死亡人數最多的縣市為新北市,臺灣南部死亡 人數最多的縣市為高雄市,臺灣中部死亡人數最多的縣市為台中市,臺灣東部死亡 人數最多的縣市為花蓮縣,臺灣外島死亡人數最多的縣市為金門縣。

55


問題 2: 年齡區間二十歲至二十四歲在新北市中和區死亡狀況為何?

點選「臺灣北部」 、 「新北市」 、 「鄉鎮市區」以及「20-24 歲」後,可發現 106 年度此 年齡區間死亡總數為 9 人,死亡原因前六名為:事故傷害、其他、敗血症、惡性腫 瘤、腦血管疾病、蓄意自我傷害,男性與女性分別為 77.78%與 22.22%。

56


問題 3: 年齡區間二十歲至二十四歲在全台灣的死亡狀況為何?

僅點選「20-24 歲」後,可發現臺灣五大區域中,臺灣北部人數佔最多;死亡總數為 686 人;前十大死因:事故傷害、蓄意自我傷害、其他、惡性腫瘤、心臟疾病(高 血壓性疾病除外)、腦血管疾病、骨骼肌肉系統及結蹄組織之疾病、加害(他殺) 、 肺炎、先天性畸形變形及染色體異常、原位與良性腫瘤(惡性腫瘤除外) ;男性與女 性分別為 70.12%與 29.88%;全臺各縣市中,新北市死亡人數為最多,比較特別的 是臺北市因為蓄意自我傷害(自殺)而死亡的人數在其區域中是排序第一的。

57


問題 4: 台北市哪個年齡層因為蓄意自我傷害(自殺)而死亡人數最多?

點選儀表板中任一代表「cause39」按鈕,全台 106 年度因為蓄意自我傷害(自殺) 而死亡的為 3871 人,而年齡層最多分布在 50-54 歲,人數為 387 人,男性與女性分 別為 66.49%與 33.51%。

58


問題 5: 因為衰老/老邁而死亡的人數在哪個地區最多?且其年齡層為何者數量最 多?

點選儀表板中任一代表「cause36」按鈕,在臺灣五大區域中,臺灣南部因為衰老/ 老邁而死亡的人數最多,再來為臺灣中部以及台灣北部;死亡總數為 1555 人;男性 與女性分別為 42.64%與 57.36%;年齡區間前十名排序為:90-94 歲、85-89 歲、9599 歲、80-84 歲、75-79 歲、100 歲以上、70-74 歲、65-69 歲、60-64 歲、55-59 歲。

七、 結語 臺灣雖為蕞爾之地,但各地的生活型態以及地理環境殊異,利用行政區的劃分 後,可以細查每個區域的死亡情況,了解在不同的位置有著不一樣的情形;雖然死 亡人數中普遍高齡且死亡原因大多為惡性腫瘤,但藉由多種死亡原因的分類並一一 點選後,可探究其中微妙的差異,利用這些蛛絲馬跡試想這些結果背後的原因。而 Power BI 活靈活現的資料視覺化功能,讓這一切的過程變得簡單又有趣。

八、 參考資料 衛生福利部統計處 死因統計 網址:https://data.gov.tw/dataset/5965 59


60


案例二 案例二 旅台觀光新契機

學習目標 1. 資料處理 ---資料分群 ---計算量值 ---資料取代 2. 視覺效果 ---交叉篩選器、長條圖、橫條圖、環圈圖、折線圖、量測計圖卡片、 100%堆疊直條圖、堆疊橫條圖、漏斗圖、地圖、散佈圖(加趨勢線)、 文字雲 3. 實務應用 ---來台旅客結構 ---觀光資訊效果評比 ---來台旅客最愛甚麼? ---來台旅客經驗回饋

61


一、 前言 臺灣是個美麗的寶島,除了人文薈萃、文化多元,也是著名的美食天堂;得天 獨厚的地理環境,鬼斧神工的自然景觀,同樣吸引世界各地旅客的目光。看著漫步 街道的異國面孔,總令人好奇究竟來臺的旅客為什麼而來、對這個地方有什麼想法、 喜歡在這裡做什麼?因此,我們透過交通部觀光局「106 年歷年來臺旅客消費及動 向調查」資料,結合 Power BI 開啟以下資料視覺化的分析。

二、 研究問題 問題 1:來臺旅客的組成結構為何? 問題 2:觀光客資訊取得情形? 問題 3:來臺觀光客的活動情形? 問題 4:對臺灣有何印象與經驗回饋?

三、 資料來源 本案例資料來自政府資料開放平台,由交通部觀光局彙整民國 103 至 106 年的 來臺旅客動向調查資料。此資料性質為觀光局於台灣各機場訪問來臺旅客的年度問 卷調查,本文僅取其中民國 106 年的原始資料,共計 7320 筆調查。

3.1 原始資料 原始資料為打包後的壓縮檔案,內含 103 至 106 年依照各年度分類的調查檔案。 每年度資料皆有 1 到 2 份編碼表,以及依該年度命名的逗號分隔值檔案(.csv)。以本 案例資料為例,有基本資料及內容 2 份逗號分隔值檔案,以及分屬 2 個原始資料的 編碼表參考,共四份資料。原始資料將所有調查的變數約超過 200 項變數置於同一 頁中,後續使用視覺化軟體分析時,在選擇變數時若能先將變數分組,可以減少變 數搜尋的時間。因此我們將資料進行相關編修,作為前置作業。

3.2 使用資料 本案例使用資料為原始資料修改後的版本,我們依據編碼表,取用本案例所需 62


變數後,將其複製於新增之 excel 工作表中,並依照研究問題分類與命名。並另外 自行至 google 地圖搜尋地區經緯度,新增至工作表中。各個工作表第一欄皆為各資 料的代碼(id),以便後續資料之間的串接;至於地理位置與匯率則依照特定變數 resid、 dollar,進行第一欄位的命名。原始資料調整後的檔案,共分為 7 個工作表、137 個 變數,並儲存為 excel 工作表檔案(.xlsx)。 (Data: 106 年來臺旅客消費及動向調查原始資料.xlsx)

四、 資料說明 工作表

變數名稱 id

變數說明 樣本編號

資料類型 名目型資料

變數數值 7碼 1=日本,2=中 國,3=香港.澳 門, 4=韓國, 50=馬來西亞,

resid

居住地

名目型資料

1 基本資料

51= 新 加 坡 , 52= 印 尼 , 53= 菲律賓,54=泰 國,55=越南, 59=東協其他 4 國,60=美國, 70= 歐 洲 , 80= 紐澳,90=其他 地區。

age

年齡

順序型資料

1=12-19 歲 , 2=20-29 歲 , 3=30-39 歲 , 4=40-49 歲 , 5=50-59 歲 , 6=60-65 歲 , 7=66 歲以上, 99=未回答。

income

年收入(美元)

63

順序型資料

1=9,999 美元以


工作表

變數名稱

變數說明

資料類型

變數數值 下 , 2=10,00014,999 美 元 , 3=15,00029,999 美 元 , 4=30,00039,999 美 元 , 5=40,00069,999 美 元 , 6=70,00099,999 美 元 , 7=100,000 美元 以上, 8=無固 定收入,99=未 回答。 1=小學、中學

educ

最高學歷

順序型資料

肄畢(含高職), 2=大專,3=碩、 博士,4=其他, 99=未回答。 1=民意代表、 主管及經理人 員, 2=專業人 員,

occup

職業

名目型資料

3=技術員及助 理專業人員, 4=事務支援人 員, 5=服務及 銷售工作人員, 6=農、林、漁、 牧生產人員, 7=技藝有關工 作人員, 8=機 械設備操作及

64


工作表

變數名稱

變數說明

資料類型

變數數值 組裝人員 9=基 層技術工及勞 力工,10=家庭 管理,11=學生, 12=退休人員, 13= 其 他 , 99= 未回答。

gender

area

性別

名目型資料

調查區

名目型資料

1=男性,2=女 性。 1=臺灣桃園國 際機場, 2=高雄國際航 空站, 3=臺北國際航 空站, 4=臺中國際機 場。

stay

停留夜數

數量型資料

freq

來台次數

數量型資料

plan

出發之前多久 數量型資料 計畫此次行程

id

樣本編號

名目型資料

7碼

是否看過臺灣

2 廣告

ad

觀 光 宣 傳 廣 告 名目型資料 或旅遊報導

ad1

報章雜誌

ad2

地鐵、廣告燈 箱、巴士車廂

ad3

電視、電臺

ad4

國際旅遊展覽

ad5

戶外廣告或看 板

ad6

旅行社宣傳行 65

順序型資料

1=是,2=否

1=非常低,2= 稍低,3=普通, 4=稍高,5=非 常高, 0=沒有 看過


工作表

變數名稱

變數說明

資料類型

變數數值

名目型資料

1=是,0=否

名目型資料

7碼

名目型資料

1=是,0=否

名目型資料

1=是,0=否

程、摺頁 ad7

親朋好友來臺 口碑宣傳

ad8

網際網路

ad8_1

入口網站

ad8_2

社群網站

ad8_3

觀光業者官網

ad8_4

3 旅遊資訊

部落格或 BBS 討論板

ad8_5

其他

id

樣本編號

itm01

旅行社服務及 旅遊產品

itm02

大眾交通資訊

itm03

租車資訊

itm04

旅遊地圖或開 車路線圖

itm05

餐飲資訊

itm06

住宿資訊

itm07

主題旅遊建議

itm08

旅遊景點簡介

itm09

節慶活動簡介

itm10

其他

att01

風光景色

att02

購物

att03

美食或特色小 吃

att04

水果

att05

花卉

att06

距離居住地近

att07

氣候宜人

att08

歷史文物

66


工作表

變數名稱

變數說明

att09

夜間休閒活動

att10

節慶活動

att11

遊憩設施

att12

保健醫療

att13

台灣民情風俗 和文化

att14

人民友善

att15

治安良好

att16

民主政治

att17

公司安排

att18

其他

id

樣本編號

purp1

此次來臺主要 目的 1

purp2

此次來臺主要 目的 2

資料類型

名目型資料

名目型資料

變數數值

7碼 1=觀光,2=業 務, 3=國際會 議或展覽, 4= 探親或訪友, 5=求學,6=醫 療,7=其他 1=參加旅行社 規劃的行程,由 旅行社包辦(參 加旅行團), 2=自行規劃行

4 旅遊動向

type

旅行方式

名目型資料

程,由旅行社包 辦(如交流團、 修學 旅行、獎勵旅 遊、親友團等), 3=自行規劃行 程,由旅行社安 排或代訂住宿 地點(及機票) 4=未請旅行社

67


工作表

變數名稱

變數說明

資料類型

變數數值 安排、代訂住宿 地點及機票,抵 達後曾參加本 地旅行社安排 的旅遊行程, 5=未請旅行社 安排、代訂住宿 地點及機票,抵 達後未曾參加 本地旅行社安 排的旅遊行程

money

在我國期間費 數量型資料 用 1=日圓,2=人 民幣,3=港幣,

dollar

幣制

名目型資料

4=新加坡元, 5=韓元,6=馬 來西亞幣, 7= 泰銖,8=美元, 9=加拿大幣, 10= 英 鎊 , 11= 歐元,14=澳大 利亞幣,16=新 台幣,17=印尼 盾,18=菲律賓 披索,19=越南 盾。

act01

生態旅遊

act02

運動或賽事

act03

泡溫泉浴

act04 act05

拍婚紗照或個 人藝術照 參觀展覽 68

名目型資料

1=是,0=否


工作表

變數名稱

變數說明

act06

參觀藝文表演 活動

act07

參觀節慶活動

act08

購物

act09

逛夜市

act10

參觀古蹟

act11

SPA、三溫暖

act12

按摩、指壓

act13

護膚、美容、彩 繪指甲

act14 act15

資料類型

變數數值

卡拉 OK 或唱 KTV 夜總會、pub 活 動

act16

遊湖

act17

主題樂園

act18

保健醫療

act19

其他

sp01 sp02

原始資料為已 編碼的景點項 目,本案例使用

sp03 sp04 sp05

「取代」功能將 其 轉 換 成

sp06 sp07 sp08

去過的景點

sp09 sp10 sp11 sp12 sp13 sp14 69

名目型資料

TRUE/FALSE 的邏輯值,以利 景點個數統計。 TRUE= 有 景 點 資料,FALSE= 無景點資料。


工作表

變數名稱

變數說明

資料類型

變數數值

名目型資料

1=是,0=否

名目型資料

3=一般旅館, 4=一般觀光旅 館, 5=國際觀光旅 館。

名目型資料

0=未申請, 1=1 星級, 2=2 星級, 3=3 星級, 4=4 星級, 5=5 星級。

名目型資料

1=是,0=否

名目型資料

7碼

sp15 slp1

htype

5 旅行滿意度

旅館

旅館類型

hstar

旅館星級

slp2

民宿

slp3

親友家

slp4

宿舍

slp5

租屋

slp6

寺廟、修道院、 教會

slp7

其他

id

樣本編號

again

是否再來我國 名目型資料 旅遊

1=是,2=否

recom

是否會推薦親 名目型資料 友來臺灣旅遊

1=是,2=否

s14

旅遊資訊取得 方便

s15

境內交通便利

s21

路標及公共設 施牌示易懂

s22

旅遊環境語言 溝通良好

s23

臺灣民眾態度 70

順序型資料

1= 非 常 不 滿 意,2=不滿意, 3=普通,4=滿 意, 5=非常滿 意, 0=沒有經 驗


工作表

變數名稱

變數說明

資料類型

變數數值

名目型資料

1=是,0=否

友善 s31

遊憩據點設施 安全

s32

設施治安良好

s33

住宿設施良好

s34

環境衛生良好

s35

餐飲衛生良好

sall

此次來臺整體 滿意程度

i01

美味菜餚

i02

海岸風光

i03

泡溫泉

i04

歷史古蹟

i05

逛夜市

i06

單車賞景

i07

地方特產

i08

寺廟參訪

i09

都會不夜城

i10

原住民文化

i11

美容醫療

i12

人情味濃厚

i13

24 小時書店

i14

便利商店

i15

水果

i16

節慶活動

i17

景點

i18

旅館(或民宿) 住宿體驗

i19

其他 1=日本,2=中

6 地理位置

resid

居住地

名目型資料

71

國,3=香港.澳 門, 4=韓國,


工作表

變數名稱

變數說明

資料類型

變數數值 50=馬來西亞, 51= 新 加 坡 , 52= 印 尼 , 53= 菲律賓,54=泰 國,55=越南, 59=東協其他 4 國,60=美國, 70= 歐 洲 , 80= 紐澳,90=其他 地區。

居住地

居住地中文名 名目型資料 稱

緯度

緯度數值

數量型資料

經度

經度數值

數量型資料 1=日圓,2=人

7 匯率

dollar

幣制

名目型資料

民幣,3=港幣, 4=新加坡元, 5=韓元,6=馬 來西亞幣, 7= 泰銖,8=美元, 9=加拿大幣, 10= 英 鎊 , 11= 歐元,14=澳大 利亞幣,16=新 台幣,17=印尼 盾,18=菲律賓 披索,19=越南 盾。

rate

匯率值

數量型資料

72


五、 資料匯入 5.1 匯入資料 (1) 在「常用」頁箋點選「取得資料」。

(2) 本案例使用資料格式為 excel 檔案,選取「excel」選項後點擊「連接」後, 即可選擇需要的檔案。

73


(3) 在導覽器視窗中,勾選欲載入的資料。資料載入前,可選擇「編輯」進入 編輯查詢,或亦可直接點選「載入」直接將資料匯入。

(4) 點選載入後,等待系統處理查詢後即完成。

74


5.2 編輯查詢 (1) 在「常用」頁箋點選「編輯查詢」。

(2) 顯示「Power Query 編輯器」視窗,進行修正資料型態等進階編輯。點擊資 料行標頭左側圖示,配合原始資料編碼,選擇該資料行類型。此處以教育 程度的「educ」變數為例,將自動設定為整數的格式,修改為文字格式。

75


(3) 點選後,顯示確認視窗。可選擇「取代現有」直接覆寫資料格式;或選擇 「新增步驟」 ,往後於編輯器右側的查詢設定中「套用的步驟」中修改復原。

(4) 修改完成後,點選「關閉並套用」即可完成儲存。

76


5.3 模型關聯 (1) 將各組資料間建立關聯性後,即可使用不同組別資料來產生視覺效果。 系統預設各組資料間相同的變數為連結;亦可手動拖放特定變數至另一 組資料的某一變數產生連結。此處將「8 匯率」工作表中的「dollar」,手 動拖曳至「4 旅遊動向」中的「dollar」變數上進行連結。

(2) 形成連結線即完成。若要進行刪除,則在連結線上點擊滑鼠右鍵選擇 「刪除」即可。

77


六、資料分析 6.1 方法 6.1.1 總覽 本視覺化案例依據 4 個研究問題分為 4 個儀表板製作,呈現主題的不同面向。 儀表板

視覺效果

使用變數

卡片、篩選器、漏斗 平均數:freq 1.

2.

基本資料

宣傳資訊

圖、環圈圖、100%堆 中位數:stay、plan 疊直條圖、地圖、散 變數:age、purp1、occup、gender、resid、 佈圖 經度、緯度 平均數:ad1、ad2、ad3、ad4、ad5、ad6、 ad7、ad8 變數:ad、att01、att02、att03、att04、att05、 篩選器、量測計、地 att06、att07、att08、att09、att10、att11、 圖、環圈圖

att12、att13、att14、att15、att16、att17、 att18、itm01、itm02、itm03、itm04、itm05、 itm06、itm07、itm08、itm09、purp1、resid、 經度、緯度

中位數:stay 變數:act01、act02、act03、act04、act05、 act06、act07、act08、act09、act10、act11、 篩選器、卡片、群組 act12、act13、act14、act15、act16、act17、 3.

4.

活動情形

經驗回饋

直條圖、環圈圖、文 act18、act19、type、htype、slp2、slp3、 字雲、地圖 slp4、slp5、slp6、slp7、sp01、sp02、sp03、 sp04、sp05、sp06、sp07、sp08、sp09、 sp10、sp11、sp12、sp13、sp14、sp15、 purp1、resid、經度、緯度 平均數:sall 篩選器、卡片、地圖、 中位數:money 群組橫條圖、環圈 變數:ad、again、dollar、i01、i02、i03、 圖、散佈圖

i04、i05、i06、i07、i08、i09、i10、i11、 i12、i13、i14、i15、i16、i17、i18、i19、 78


儀表板

視覺效果

使用變數 purp1、recom、resid、s14、s15、s21、s22、 s23、s31、s32、s33、s34、s35、經度、 緯度

6.1.2 量值說明 除了原始資料使用的變數外,若要深入分析則須建立量值、資料行等計算。以 下將列出新增的量值及其運算式。 量值 工作表 2 廣告

3 旅遊資訊

量值名稱 看過廣告比例

SUM('2 廣告'[ad])/COUNTROWS('2 廣告')

美食

SUM([att03]) + SUM([att04])

購物娛樂

SUM([att02]) + SUM([att09]) + SUM([att11])

自然景觀

SUM([att01]) + SUM([att05]) + SUM([att07])

文化風俗 其他

4 旅遊動向

SUM([att08]) + SUM([att10]) + SUM([att13]) + SUM([att14]) SUM([att06]) + SUM([att12]) + SUM([att15]) + SUM([att16]) + SUM([att17]) + SUM([att18])

觀光比例

SUM([觀光])/COUNTROWS('4 旅遊動向')

購物

SUM([act08])

古蹟

SUM([act10])

逛夜市

SUM([act09])

美容放鬆

SUM([act03]) + SUM([act11]) + SUM([act12]) + SUM([act13])

遊玩娛樂

SUM([act14]) + SUM([act15]) + SUM([act17])

藝文節慶

SUM([act05]) + SUM([act06]) + SUM([act07])

自然生態

SUM([act01]) + SUM([act16])

其他活動 5 旅遊滿意度

運算式

SUM([act02]) + SUM([act04]) + SUM([act18]) + SUM([act19])

再次來臺比例

SUM([again])/COUNTROWS('5 旅行滿意度')

推薦親友比例

SUM([recom])/COUNTROWS('5 旅行滿意度')

79


資料行 工作表

資料行名稱 匯率

運算式 LOOKUPVALUE('7 匯率'[rate],'7 匯率'[dollar],'4 旅 遊動向'[dollar])

在臺花費(新台幣)

[money]*[匯率]

觀光

IF([purp1] = ”1”,1,0) IF([htype]=5,"國際觀光旅館",(IF([htype]=4,"一般觀 光旅館",(IF([htype]=3,"一般旅館",(IF([slp2]=1,"民

住宿情形

宿",(IF([slp3]=1,"親友家",(IF([slp4]=1,"宿舍 ",(IF([slp5]=1,"租屋",(IF([slp6]=1,"宗教場所","

4 旅遊動向

其他"))))))))))))))) IF([sp01],1,0) + IF([sp02],1,0) + IF([sp03],1,0) + IF([sp04],1,0) + IF([sp05],1,0) + IF([sp06],1,0) +

參觀景點個數

IF([sp07],1,0) + IF([sp08],1,0) + IF([sp09],1,0) + IF([sp10],1,0) + IF([sp11],1,0) + IF([sp12],1,0) + IF([sp13],1,0) + IF([sp14],1,0) + IF([sp15],1,0)

6.1.3 量值建立操作 1. 取代 原始資料值若需修改為更符合所需內容,則可使用「取代」功能。此處以 看過廣告與否的「ad」為例,原始資料以 1 代表「是」 、2 代表「否」 。和其他變 數呈現不同,使用取代功能使 0 代表「否」,便於資料理解。 (1) 首先點擊進入「編輯查詢」後,在欲修改的變數資料行上點選滑鼠右鍵, 選擇「取代值…」

80


(2) 在取代值視窗中,輸入被取代值「2」為取代值「0」,點擊確定後完成。

2. 新增量值 使用新增「量值」,記錄單一資料行的運算結果,如:比例、總和。此處 以新增看過廣告比例為例進行說明。 (1) 首先在欲新增量值的工作表上點擊滑鼠右鍵,選擇「新增量值」。

81


(2) 畫面上方將顯示運算式輸入窗格。

(3) 將運算式輸入其中後,點選左方確認即可。此處輸入「看過廣告比例 = SUM('2 廣告'[ad])/COUNTROWS('2 廣告')」。 82


3. 新增資料行 使用「新增資料行」將整個資料行的各筆資料使用運算式進行轉換。此 處以新增「匯率」資料行為例。 (1) 首先在欲新增資料行的工作表上點擊滑鼠右鍵,選擇「新增資料行」。

(2) 在窗格中輸入運算式,此處輸入「匯率= LOOKUPVALUE('7 匯率'[rate],'7 匯率'[dollar],'4 旅遊動向'[dollar])」。點選確認後,在工作表末行將顯示新 增之資料列。

83


6.2 儀表板製作 6.2.1 基本資料 1. 頁面標題 首先建立頁面標題,點選常用標籤中的「文字方塊」進行新增;接著輸入文字 內容與調整文字格式。

2. 居住地 由於本案例資料主要依照受訪者居住地分類,因此建立居住地分類的篩選器可 獲得更詳細的圖表資訊。 (1) 首先點選視覺效果中的「交叉分析篩選器」,將變數「居住地」拖曳至視覺效 果中。

84


(2) 接著點擊篩選器右上方的箭頭,顯示篩選器格式選項。此處選擇「下拉式選單」 。

85


3. 平均停留天數 (1) 此處欲計算旅客停留天數「stay」的中位數,點擊「卡片」後拖曳變數至卡片 中。其預設計算為總和,點選欄位箭號選項選擇中間值。

(2) 雙擊「欄位」資料標籤,即可將「stay 的中位數」更改為「平均停留天數」。

86


4. 平均規劃天數 (1) 平均規劃天數同樣以中位數呈現。

(2) 如果欲修改視覺效果的格式如標題色彩等,可點擊油漆刷圖示的「格式」進行 編輯。

87


5. 平均來臺次數 使用變數「freq」,與中位數操作方式相同,點選「平均」即可。

6. 年齡結構 (1) 首先將年齡變數「age」建立群組,以呈現資料的別名或實際意涵。在變數上點 選滑鼠右鍵,選取新增群組。

88


(2) 顯示群組視窗後,點擊欲分組變數。再點選群組,接著修改名稱。全部完成後, 即可按下確定。

(3) 分組完成後,點選「漏斗圖」視覺效果,拖曳新增的「age(群組)」至「群組」 、 「值」欄位中。

89


(4) 如欲修改標題,同樣點選「格式」中的「標題」進行修改與文字輸入。

7. 主要來臺目的--此項目共分為「篩選器」、「環圈圖」呈現。 (1) 首先將來臺主要目的變數「purp1」依照編碼表進行分組命名。

90


(2) 命名完成後,選擇「交叉分析篩選器」並將「purp1(群組)」拖曳至「欄位」中。 可以點擊篩選器右上方的箭頭,修改篩選器格式顯示選項。

(3) 第二部分的環圈圖,同樣是選擇「環圈圖」視覺效果後,將「purp1(群組)」拖 曳至「圖例」、「值」中。

91


(4) 在「格式」中的「詳細資料標籤」可以修改資料標籤的顯示方式,此處選擇「類 別,總計百分比」。

8. 職業 (1) 職業變數「occup」同樣先依照編碼表進行分組與命名。

92


(2) 完成分組後,編輯方式與前述之「主要來臺目的」環圈圖相同。唯資料值為 「occup(群組)」。

9. 性別 (1) 將性別變數「gender」分組命名,並選擇「100%堆疊橫條圖」視覺效果後。將 「gender(群組)」拖曳至「圖例」、「值」中。

93


(2) 點擊放大鏡圖示的「分析」,新增一條常數線。此處在「值」欄位輸入 0.5,新 增 50%的常數線,更容易看出性別比例差異。

10. 旅客分布 旅客分布共分為「地圖」、「散布圖」二部分。 (1) 首先點擊「地圖」視覺效果。分別拖曳工作表「6 地理位置」的「居住地」、 「緯度」、「經度」與工作表「1 基本資料」的「resid」至「圖例」、「緯度」、 「經度」與「值」,即可完成地圖。

94


(2) 接著點擊「散布圖」視覺效果,此處的散布圖作為地圖的圖例。分別拖曳工 作表「6 地理位置」的「居住地」和工作表「1 基本資料」的「resid」至「X 軸」和「大小」欄位。

(3) 點選「格式」,將「依類別上色」、「彩色框線」項目開啟,「標題」項目關 閉。即可完成圖例的製作,也完成「基本資料」儀表板的內容。

95


6.2.2 宣傳資訊 1. 新增頁面 (1) 點擊左下方的黃色+號新增儀表板,雙擊頁面名稱即可將「第 1 頁」修改為「宣 傳資訊」。

(2) 由於畫面左上方的標題與居住地篩選器,為各頁面共有的項目,因此可直接由 他頁複製。值得注意的是,複製「交叉分析篩選器」時,會顯示「同步視覺效 果視窗」 。可視是否需要跨頁面連動篩選器選擇,若需要連動點選「同步」 ,若 不需要則點選「不要同步」。

96


2. 頁面層級篩選 此頁僅需呈現來台主要目的為「觀光」的旅客,使用「頁面層級篩選」將該頁 所有視覺效果限定於「觀光」。 (1) 在視覺效果攔下方有「篩選」項目,將代表主要目的的變數群組「purp1(群組)」 拖曳至「頁面層級篩選」欄位中。

(2) 勾選「觀光」即可完成。

97


3. 看過廣告比例 (1) 點選「量測計」視覺效果,將工作表「2 廣告」中的量值「看過廣告比例」拖 曳至「值」中。

(2) 點擊「格式」中的「量測計軸」自訂最大、最小值,與新增目標值。此處設定 最大值為 1;目標值為 0.66,在分析不同地區觀光客的該項指標時,可做為參 考。

98


4. 吸引來臺原因 (1) 使用「環圈圖」 ,將工作表「3 旅遊資訊」的「購物娛樂、美食、其他、文化風 俗、自然景觀」5 個量值拖曳至「值」欄位。

(2) 標題、資料標籤等編輯,同樣為點選「格式」進行。

99


5. 期待獲得之資訊 (1) 使用「環圈圖」 ,將工作表「3 旅遊資訊」的「itm01」至「itm10」共 10 個變數 拖曳至「值」欄位。

(2) 各個資料標籤名稱可透過雙擊「值」欄位中變數名稱依照編碼表來修改。如 「itm01」為「旅行社服務及旅遊產品」。

100


(3) 修改完成,結果如圖所示。

(4) 標題、資料標籤等編輯,同樣為點選「格式」進行。

101


6. 觀光資訊來源--使用「環圈圖」 (1) 由於此視覺效果僅需要顯示「看過廣告」的旅客結果,因此點擊視覺效果後, 將變數「ad」拖曳至「視覺效果層級篩選」欄位中,並勾選代表看過的「1」項 目。

(2) 篩選完成後將工作表「2 廣告」的「ad01」至「ad08」共 8 個量值拖曳至「值」 欄位。

102


(3) 由於原始資料指稱意涵為各觀光資訊來源的影響程度,問題屬性為「五度量表」 , 故將變數總和轉換為平均數,更能貼近其意涵。在「值」欄位中變數名稱上點 擊滑鼠右鍵,選擇「平均」即可。

(4) 各個資料標籤名稱可透過雙擊「值」欄位中變數名稱依照編碼表來修改。如「ad1 的平均」為「報章雜誌」。

103


(5) 修改完成,結果如圖所示。

(6) 標題、資料標籤等編輯,同樣為點選「格式」進行。

104


7. 觀光宣傳分布--選擇「地圖」視覺效果 (1) 將「居住地、經度、緯度、看過廣告比例」分別拖曳至「圖例、經度、緯度、大 小」欄位中。

(2) 在「格式」中,可進行新增標題、關閉圖例等操作。

105


6.2.3 活動情形 1. 新增頁面 新增頁面後,複製並修改標題與篩選器。此頁與上頁同樣針對來臺觀光旅客分 析,將代表主要目的的變數群組「purp1(群組)」拖曳至「頁面層級篩選」欄位中, 勾選「觀光」即可。

2. 觀光客平均停留天數--使用「卡片」視覺效果 (1) 和「基本資料」頁中的「平均停留天數」操作與使用變數「stay」相同。不過經 過頁面層級篩選為「觀光」,因此其指稱意涵有所不同。

106


(2) 拖曳「stay」至「欄位」中,點擊右鍵修改為「中間值」,雙擊變數名稱修改為 「觀光客平均停留天數」。

3. 來臺旅行方式 (1) 首先將工作表「4 旅行動向」中來臺旅行方式變數「type」依照編碼表進行分組 命名。

107


(2) 點選「堆疊直條圖」,將分組後的變數「type(群組)」,拖曳至「軸」、「圖例」、 「值」。

(3) 點選「格式」進行視覺效果細節編輯。

108


4. 觀光活動情形--使用「環圈圖」 (1) 將工作表「4 旅遊動向」的「購物、古蹟、逛夜市、美容放鬆、其他活動、藝文 節慶、遊玩娛樂、自然生態」共 8 個量值拖曳至「值」欄位。

(2) 標題、資料標籤等編輯,同樣為點選「格式」進行。

109


5. 住宿情形 此處使用的視覺效果「Word Cloud」為外部匯入,以下先進行匯入操作後,再 行操作視覺效果的呈現。 (1) 首先點擊「視覺效果」的「…」顯示更多選項後,選擇「從 Marketplace 匯入」 。

(2) 註冊登入 Power BI 帳號後,即可進入「Marketplace」選擇需要的視覺效果。 搜尋到「Word Cloud」後,點選「新增」即可完成。

110


(3) 選擇「Word Cloud」視覺效果,將「住宿情形」拖曳至「類別」 、 「值」欄位中。

(4) 在「值」欄位的住宿情形變數上點擊右鍵,選擇「計數」 ,顯示依照值多寡呈現 尺寸的大小。

111


(5) 在「格式」中,可編輯標題等格式細節;亦可關閉「旋轉文字」 ,提升文字可讀 性。

6. 參觀景點個數 (1) 使用「堆疊直條圖」 ,將變數「參觀景點個數」分別拖曳至「軸」與「值」中。

112


(2) 預設的「值」為總和,會使景點個數與人數相乘而顯示錯誤結果,應選擇「計 數」才正確。在「值」欄位的「參觀景點個數」的變數上點擊滑鼠右鍵,選擇 「計數」。

(3) 在「格式」中,可編輯標題等格式細節;在「資料色彩」選項中,將「全部顯 示」開關開啟,可依照不同資料內容,進行分組等個別色彩的調整。

113


7. 觀光人數分布--使用「地圖」視覺效果 (1) 與「基本資料」頁中的「旅客分布」操作與使用變數「居住地、緯度、經度、 resid 的計數」相同。不過經過頁面層級篩選為「觀光」 ,因此其指稱意涵限制 於觀光客的分布。

(2) 在「格式」中修改標題為「觀光人數分布」。

114


6.2.4 經驗回饋 1. 新增頁面 新增頁面後,複製並修改標題與篩選器。

2. 整體滿意度--使用「卡片」視覺效果 (1) 選擇整體滿意度變數「sall」拖曳至「欄位」。

115


(2) 在欄位的「sall」變數上點擊滑鼠右鍵選擇「平均」 。雙擊「sall」名稱,修改為 「整體滿意度」。顯示資料為五度量表的平均,即滿意度最高為 5 分。

3. 推薦親友比例 (1) 此變數原始資料「recom」意涵以「1」為「是」 、 「2」為「否」 。先以「取代值…」 功能將「2」取代為「0」後再行量值計算。量值計算式詳見 6.1.2 量值說明。

116


(2) 使用「卡片」視覺效果,選擇「推薦親友比例」拖曳至「欄位」後,透過「格 式」修改標籤色彩等細節。

4. 再次來臺比例 (1) 此變數原始資料「again」意涵同樣以「1」為「是」 、 「2」為「否」 。先以「取代 值」功能將「2」取代為「0」後再行量值計算。量值計算式詳見 6.1.2 量值說明。

117


(2) 使用「卡片」視覺效果,選擇「再次來臺比例」拖曳至「欄位」後,透過「格 式」修改標籤色彩等細節。

5. 在臺花費--使用「卡片」視覺效果 (1) 選擇「在臺花費(新台幣)」拖曳至「欄位」後,透過「格式」修改標籤色彩等細 節。

118


(2) 此處欲顯示旅客花費的中位數,而非總和。「欄位」的「在臺花費(新台幣)」點 擊滑鼠右鍵選擇「中間值」。

(3) 在「格式」中的「資料標籤」,可編輯顯示的單位、小數位數等。

119


6. 在臺花費分布--選擇「地圖」視覺效果 (1) 將「居住地、經度、緯度、在臺花費(新台幣)」分別拖曳至「圖例、經度、緯度、 大小」欄位中。

(2) 其中「在臺花費(新台幣)」變數以「中間值」呈現。在變數上點擊右鍵,選取「中 間值」;雙擊變數名稱,將「在臺花費(新台幣) 的中位數」,修改為「在臺花費 (新台幣)」 。

120


(3) 在「格式」中,可進行新增標題、關閉圖例等操作。

7. 滿意度指標 (1) 點選「群組橫條圖」 ,將各指標變數「s14、s15、s21、s22、s23、s31、s32、s33、 s34、s35」,拖曳至「值」欄位中。

121


(2) 雙擊「值」欄位中各個變數名稱,依照編碼表進行名稱修改。如「s14」為「資 訊取得」。

(3) 預設資料的顯示為總和,而原始資料為五度量表,此處欲顯示旅客的整體評價, 故於各變數上點擊滑鼠右鍵,選擇「平均」。

122


(4) 點選「格式」開啟「資料標籤」。

(5) 點選「格式」修改圖例。將位置調整於「靠左置中」。

123


(6) 在「格式」中展開「Y 軸」設定。將「最小類別寬度」設定為「180」 ; 「內部邊 框間距」設定為「0%」。將各資料可顯示範圍擴大,提升可讀性。

(7) 在「格式」中的「資料色彩」,依照不同資料調整不同顏色。

124


(8) 修改標題後即完成。

8. 印象深刻之處--使用「環圈圖」 (1) 將工作表「5 旅行滿意度」的「i01」到「i19」共 19 個變數拖曳至「值」欄位。

125


(2) 雙擊「值」欄位中變數名稱,依照編碼表進行名稱修改。如「i01」為「美味菜 餚」。

(3) 同樣可以在「格式」中進行新增標題、調整資料標籤顯示方式等設定。

126


9. 觀光宣傳與來臺比例比較--此處使用「散布圖」 (1) 透過「看過觀光宣傳比例」與「來臺觀光比例」2 個量值與「居住地」的差異, 來觀察其中的關係。 點選「散布圖」後,分別拖曳「居住地」 、 「看過廣告比例」 、 「觀光比例」至「圖 例」、「X 軸」、「Y 軸」欄位中。

(2) 點選「格式」,關閉「圖例」、開啟「類別標籤」、修改標題。

127


(3) 點選右側放大鏡圖示的「分析」功能,展開「趨勢線」項目後,點選+號即可 新增一條趨勢線。

128


6.3 回答問題 問題 1: 來臺旅客的主要人口組成結構為何?

「30 至 40 歲的青壯世代、女性、專業人員、觀光客」 ,可說是本調查對象整體 的圖像。在旅客的基本資料中,顯示民國 106 年多數來臺旅客是來自亞洲地區,其 中又以日本、中國與港澳地區佔多數。平均在臺停留 4 天、花費約 1 個月的時間規 劃行程;在整體調查對象的平均中來臺次數約 2 至 3 次。 透過點擊 Power BI 的互動性圖表,可檢視更多資料細節。由居住地區別分類 下,距離臺灣愈遠的地方如美洲、歐洲等地的旅客,其停留時間約 1 星期,而且主 要目的多為探親訪友或業務需要來臺,男性也稍多於女性。前述的資料圖像與整體 調查對象平均值間,可發現其有趣的差異。筆者認為這可能與資料值的數量多寡有 關,由於亞洲資料值相較之下佔大部分,且亞洲各地區調查與整體呈現結果接近, 因此產生差異。

129


問題 2: 觀光客資訊取得情形?

整體而言,約近七成的來臺觀光客曾經看過臺灣觀光廣告。在「宣傳分布」的 圖表中,可以觀察到鄰近臺灣的旅客接收到廣告的比例明顯大於其他地區,而且鄰 近地區多大於整體平均值(0.66)。值得注意的地方是,「紐澳」地區雖非鄰近的亞洲 地區,但其觀光客看過廣告比例高達八成。這可能與其觀光客樣本數偏少有關,因 為當以全體來自紐澳地區的旅客主要目的為總數時,其看過宣傳比例則下降至約 0.55。 至於吸引遊客來臺原因,以「美食」居首位,可見臺灣「美食天堂」的讚譽並 非浪得虛名。至於遊客期待獲得的資訊,以交通資訊、景點簡介為大宗,當然也少 不了餐飲資訊。現在的網路無遠弗屆,多數觀光客獲取觀光資訊或接受宣傳的相關 管道中,著實以網際網路的影響最大。而親友之間的分享在資訊來源的影響程度上, 雖與網路有段差距但也位居第二,如此「口碑行銷」可作為在觀光推廣的策略上的 參考。

130


問題 3: 來臺觀光客的活動情形?

誠如第一題旅客基本資料所示,多數來臺旅客居住地多分布於亞洲地區,而觀 光客平均停留天數則約為 4 天,比整體少 1 天。在旅行方式上整體以「自助旅行」 佔多數;行程的規劃則集中於購物、逛夜市,由此觀之可見臺灣的夜市特色,對國 外觀光客具有相當大的吸引力。景點也以 5 至 7 個為主,而 15 個以上的部分則又 稍有提升;住宿情形則以一般旅館為多數觀光客選擇。 在地區之間的差異上,筆者觀察到愈鄰近臺灣的觀光客,完全自助旅行的比例 愈低,多有經由相關業者安排。如中國觀光客多以參加旅行團形式、日韓及港澳觀 光客則偏好半自助旅行,即自行規劃行程,但透過旅行社安排機票或住宿等事宜。 除此之外,多數參加旅行團的觀光客,在參觀景點個數大於 15 個中所占比例最高, 從此種旅遊型態中觀察,不難理解此結果。

131


問題 4: 對臺灣有何印象與經驗回饋?

對於所有來臺旅客而言,對臺灣行程整體滿意度 4.55 分,即平均約 91%屬滿 意。對於再次來臺與推薦親友的意願,也表達高度同意。其中推薦親友的部分,與 資訊取得的口碑宣傳相互呼應,期待能達到良善的循環。除了主觀的調查評價外, 在臺的花費,也象徵透過身體力行的方式對在臺灣行程的評價。其中花費最高者為 新加坡、中國、馬來西亞等地區。 接著在各單項滿意度指標中,以「民眾友善」拔得頭籌,果然「臺灣最美的風 景是人」這段話名不虛傳;不過在「遊憩設施安全」則還有改善空間,相信多加維 護設施品質,更能提升旅客良好印象。以地區觀之,各國對於臺灣的人情味均留下 深刻印象。不過其中歐美國家對遊憩設施的重視程度高,僅給予小於 3 分的評價; 日韓旅客則對於環境、飲食的衛生給予低於整體平均的評價,此差異與品質缺點可 作為往後改進的參考。旅客的印象除了景點之外,誠如前述,臺灣的美食、人情味、 夜市文化對外國旅客而言,都是吸引目光的亮點。 最後筆者好奇觀光宣傳與來臺觀光比例間的關係,進而了解投放廣告的成效。 從散布圖中可以發現此二者呈現正相關,即呈現看過宣傳比例越高的地區,來臺觀 光的比例就越高的趨勢。因此廣告的宣傳,對臺灣推廣觀光具有一定程度效益。 132


七、結語 雖然臺灣在世界地圖上似乎是一個小點,但身在其中的人文特色與自然風光卻 吸引世界的目光。形形色色的來臺旅客,對我們而言只是匆匆經過的過客,不過從 本次的案例中卻可以發現其中的多樣性。當然本案例使用的資料樣本數約 7 千餘筆, 且調查地點多為機場等性質,相比實際來臺的旅客組成仍有一點差距,但這也足夠 我們一探究竟,滿足我們的好奇。而 Power BI 結合資料進行視覺化的過程,透過其 互動性的特點,點擊個別資料顯示相關結果與連動,針對單一面向呈現更為整體, 著實也使資料分析獲得更深入的結果。

八、參考資料 交通部觀光局 歷年來臺旅客消費及動向調查 網址:https://data.gov.tw/dataset/94141 Google 地圖 網址:https://www.google.com.tw/maps/

133


134


案例三 案例三 美國女鞋大比拚

學習目標 1. 資料處理 ---資料分群 ---計算量值 2. 視覺效果 ---交叉篩選器、長條圖、環圈圖、折線與堆疊直條圖、多列卡片 ---Infographic Designer 1.8.0 (Market Place 匯入) 3. 實務應用 ---盤點-尺寸、售價 ---品牌行銷力-折扣力度

135


一、 前言 現代是一個快速的消費市場,我們藉由一筆美國各款式女鞋的品牌、顏色、尺 寸、售價的資料,來探討各鞋款的樣式顏色及尺寸趨勢,做為未來生產新款式時的 參考。以及根據顧客的預算,推薦折扣力度較高的前十大品牌,作為消費參考。

二、 研究問題 1. 什麼顏色、尺寸製作的鞋子數量最多? 2. 在最高售價為 30 美金以下的款式中,哪一個牌子的平均最高售價最高? 3. 在最高售價為 100 美金到 130 美金區間的款式中,哪一個牌子的平均折扣力度是 第一名?

三、 資料來源 分析案例採用的國外一個公開資料的網站─data.world,原始檔案包含 2018 年 1 月至 2018 年 10 月,10000 筆美國女鞋的狀況。我們擷取出各款式的品牌、顏色、尺 寸、最高售價與最低售價。 (data: Womens_Shoes_201711-201810.csv)

四、 資料說明 變數名稱

變數說明

資料類型

brand

品牌

名目型資料

prices.amountMax

該款式最高售價

數量型資料

prices.amountMin

該款式最低售價

數量型資料

prices.color

顏色

名目型資料

prices.size

尺寸

數量型資料

變數數值

已把鞋碼都轉成美國鞋碼 (4.5 碼~13 碼及其他部分 則以 1 表示。)

136


五、 資料匯入 (1) 點選「取得資料」,於選單中選取「文字/CVS」。

(2) 選取「Womens_Shoes_201711-201810」,並點選「開啟」。

137


(3) 點選「載入」。

六、 資料分析 6.1. 資料轉換 6.1.1 設定群組 (1) 建立最高售價的「群組」,並命名為「價錢區間」。 (2) 點選左方第二個圖示「資料」後,接著點選頁面最右方「欄位」,按 「prices.amountMax」,選「更多選項」,選擇「新增新組」。

138


(3) 在「群組類型」的下拉式選單中選取「清單」。

(4) 在未分組的值選取 0~30,接著點選下方的「群組」。

139


(5) 在右方的「群組及成員」點取兩下重新命名為「30 美金以下」。

(6) 用同樣的方式製作「30~100 美金」 、 「100~130 美金」 、 「130~160 美金」 、 「160~200 美金」 、 「200 美金以上」這 6 個最高售價區間,然後把群組「名稱」改為「價 錢區間」。

140


6.1.2

新增「折扣力度」這一行資料行

(1) 在「欄位」中點選「prices.amountMax」 ,選擇「更多選項」 ,點選「新增資料行」 。

(2) 並於資料上方的空白處輸入 「折扣力度 = (( 'Womens_Shoes_201711-201810 '[prices.amountMax]-'Womens_Shoes_201711201810 '[prices.amountMin])/'Womens_Shoes_201711-201810 '[prices.amountMax])*100」 然後按下左邊的確定鍵(V)。

141


(3) 選取「模型」中的「資料類型」下拉後選取「整數」。

(4) 接著會彈出一個視窗,點選「是」確認變更資料類型。

142


6.2 儀表板製作 6.2.1 製作頁面一:鞋款趨勢分析。 (1) 點選左方的報告,開始準備製作儀表板。

(2) 點選頁面按兩下即可重新命名為「鞋款趨勢分析」。

143


(3) 點選右方「視覺效果」的「交叉分析篩選器」,並拖拉「brand」到「欄位」。

(4) 選「格式」中的「項目」去調整字型色彩及文字大小設為 12,然後點選「標題」 輸入「品牌」,並把文字置中、大小調整為 20。

144


(5) 點選右方「視覺效果」的「多列卡片」 ,並拖拉兩次「brand」到「欄位」 ,其中 一個點選右方下拉選單,改為「計數」。

(6) 在「篩選」中點選 brand 右邊展開,選取「篩選類型」的「前 N 項」。

145


(7) 「顯示項目」調整為 10,並把 brand 拖拉到「依值」,接著選取「計數」。

(8) 按下「套用篩選」。

146


(9) 點選「格式」中的「資料標籤」 ,調整字型顏色及大小設為 12,然後點選「標題」 輸入「資料量最多的前十大品牌」,並把文字大小調整為 20。

(10) 點選右方「視覺效果」的「環圈圖」 ,並拖拉「prices.color」到「圖例」和「值」 , 其中值的部分選取「計數」。

147


(11) 在「篩選」中點選 prices.color 右邊展開,然後選取「篩選類型」的「前 N 項」 , 接著把「顯示項目」調整為 5,並把 prices.color 拖拉到「依值」 ,接著選取「計 數」,最後按下「套用篩選」。

(12) 設定「格式」中的「資料色彩」。

148


(13) 點選「詳細資料」調整「標籤樣式」為「類別,資料值」 ,並把字型顏色選黑、 大小設為 12 以及「顯示單位」選無。

(14) 點選「標題」輸入「各種顏色生產的數量」,並把文字置中、大小調整為 20。

149


(15) 點選右方「視覺效果」的「折線與堆疊直條圖」 ,並拖拉「prices.size」到「共用 軸」和「直條圖值」,其中直條圖值的部分選取「計數」。

(16) 點選「格式」中的「X 軸」去調整字型顏色及大小設為 12,接著開啟軸標題 並輸入「USA 美國鞋子尺碼」,文字大小設為 16,「Y 軸」則是調整文字大小 為 12。

150


(17) 並點選「資料色彩」選擇長條圖的顏色,然後開啟「資料標籤」顯示數量,最 後點選「標題」輸入「各尺碼生產數量」 ,並把文字大小調整為 20,還可以選擇 背景顏色。值得注意的是,如果「X 軸」的鍵入選取「連續」 ,則資料會根據尺 碼大小來排序。而「X 軸」的鍵入選取「類別目錄」的話,資料則會由生產量 最多的尺碼遞減排序。

151


6.2.2

製作頁面二:折扣力度

(1) 點選左下角的「+新增頁面」,並把它命名為「折扣力度」。

(2) 點選右方「視覺效果」的「交叉分析篩選器」 ,並拖拉「價錢區間」到「欄位」 。

152


(3) 點選「格式」 ,然後把「選取控制項」的「顯示全選選項」打開、把「項目」的 文字大小調成 20、再把「背景」選一個顏色填滿整個框框。

(4) 點選右方「視覺效果」的「折線與堆疊直條圖」 ,並拖拉「brand」到「共用軸」 、 「prices.amountMax」到「直條圖值」 、 「prices.amountMin」到「折線圖值」 ,其 中直條圖「值」、折線圖「值」的部分選取「平均」。

153


(5) 點選「格式」中的「X 軸」去調整字型顏色及大小設為 12,接著調整「資料色 彩」及「圖案」中的標記圖形,再開啟「資料標籤」 ,並在「標題」輸入「各品 牌平均最高售價與平均最低售價」。

(6) 點選「視覺效果」中的「匯入自訂視覺效果」 ,接著選取「從 Marketplace 匯入」 。

154


(7) 在搜尋處輸入「Infographic」,接著按下黃色「新增」鍵。

(8) 接著會跑出匯入成功的訊息框。

155


(9) 點選新增的「視覺效果」─「Infographic Designer 1.8.0」,並拖拉「brand」到 「Category」、「折扣力度」到「Measure」,其中折扣力度的部分選取「平均」。

(10) 選取「焦點模式」。

156


(11) 按下右上方的「Edit mark」。

(12) 點選「Format」的「Shape」。

157


(13) 選取「People」內的「讚 Thumb Up」符號。

(14) 把「Multiple Units」開到「On」。

158


(15) 選擇一下「Value Color」。

(16) 「返回報表」後,點選「格式」,選取「Type」中的「Bar」,就可以讓圖案倒 過來。

159


(17) 點選「常用」中的「文字方塊」,並輸入「折扣力度:(最高價格-最低價格/最 高價格)*100」,這個數值主要是用來找出哪個品牌折扣的幅度最大,並給與 1 到 100 分的評價。

160


6.2.回答問題 問題一:什麼顏色、尺寸製作的鞋子數量最多?

在此資料中,我們可以得知,黑色鞋子賣的最多,最多人買的尺寸是 8 號。

161


問題二:在最高售價為 30 美金以下的款式中,哪一個牌子的平均最高售價最高?

在 30 美金以下的鞋款中,Nike 售價最高。 162


問題三:在最高售價為 100 美金到 130 美金區間的款式中,哪一個牌子的平均折 扣力度是第一名?

到「欄位」中去篩選 brand 根據平均折扣力度的前 10 名,可以看 100 美金至 130 美金區間款式中,Silver Lilly 平均折扣力度第一名。 163


七、 結語 在我們進行消費時其實留下了很多數據,如果可以結合視覺化軟體,設計一 個消費者為導向的模板,就會讓那些數據變成有價值的參考值。像是這個模板中 有設置一個價錢區間,就可以讓消費者根據自己的預算,去找出其中有更多折扣 的品牌,作為優先參考的依據。

八、 參考資料 ─data.world https://data.world/datafiniti/womens-shoe-prices#

164


案例四 案例四 新北交通事故率

學習目標 1. 資料處理 ---資料分群 ---新增資料行 2. 視覺效果 ---交叉篩選器、橫條圖、環圈圖、折線圖、漏斗圖、多列卡片 群組直條圖、堆疊橫條圖、樹狀圖、100%堆疊直條圖 3. 實務應用 ---新北市交通事故盤點 ---新北市那種交通最危險 ---安全帽重要嗎? ---酒駕罰則要不要再提高?

165


新北市 103-105 年各行政區交通事故調查分析

一、 前言 為減少交通事故,政府相繼修改相關法規,警察機關也做出相對應的配套措施, 致力於降低日後台灣的交通事故率。但相關措施是否能有效改善交通事故發生?我 們希望透過大數據分析,更明確的探討事故的調查。我們利用民國 103 年至 105 年 薪北市交通資料,包括新北市各行政區肇事時段、道路型態、乘坐車種、死亡年齡 層、事故導因…等,分析 103 年至 105 年各行政區道路交通事故情形,探討易發生 肇事的原因及死傷人數趨勢比對,並將資料以視覺化圖表呈現,期望能作為後續政 策改善與進步的參考。

二、 研究問題 1. 各行政區交通事故導因為何? 2. 各行政區肇事道路類別為何? 3. 各行政區肇事與死傷人數趨勢比對? 4. 各行政區交通事故乘坐車種為何? 5. 新北市各行政區肇事發生時段的分布為何? 6. 各行政區交通事故發生地點分布為何? 7. 各行政區戴安全帽與否及死亡結果兩者關係分布? 8. 各行政區因酒駕致死的案件分布?

三、 資料來源 本案例資料來自政府資料開放平臺,由新北市政府警察局彙整民國 102 年至 105 年的新北市 A1 類道路交通事故資料,本文擷取 103 年至 105 年的資料。

166


四、 資料說明 1. 各行政區道路類別 變數名稱

解釋內容

資料類型

年度

統計數據自 103 年起至 105 年

名目型資料

分局轄區

全新北市各行政區,共計 16 個

名目型資料

國道

道交事故發生於國道的案件數

數量型資料

省道

道交事故發生於省道的案件數

數量型資料

縣道

道交事故發生於縣道的案件數

數量型資料

鄉道

道交事故發生於鄉道的案件數

數量型資料

市區道路

道交事故發生於市區道路的案件數

數量型資料

村里道路

道交事故發生於村里道路的案件數

數量型資料

專用道路

道交事故發生於專用道路的案件數

數量型資料

其他

道交事故發生於其他道路類別的案件數

數量型資料

2. 每月新北市 A1 類道路交通事故-乘坐車種及死傷人數 變數名稱

解釋內容

資料型態

年度

統計數據自 103 年起至 105 年

名目型資料

分局轄區

全新北市各行政區,共計 16 個

名目型資料

大貨車

道交事故發生於大貨車的死傷人數

數量型資料

小貨車

道交事故發生於小貨車的死傷人數

數量型資料

大客車

道交事故發生於大客車的死傷人數

數量型資料

營業小客車

道交事故發生於營業小客車的死傷人數

數量型資料

自用小客車

道交事故發生於自用小客車的死傷人數

數量型資料

特種車

道交事故發生於特種車的死傷人數

數量型資料

機踏車

道交事故發生於機踏車的死傷人數

數量型資料

行人

道交事故發生於行人的死傷人數

數量型資料

其他

道交事故發生於其他類別的死傷人數

數量型資料

3. 每月新北市 A1 類道路交通事故-原因及傷亡 變數名稱

解釋內容

資料型態

年度

統計數據自 103 年起至 105 年

名目型資料

分局轄區

全新北市各行政區,共計 16 個

名目型資料

167


變數名稱

解釋內容

資料型態

超速失控

道交事故發生於超速失控的案件數

數量型資料

酒後駕車

道交事故發生於酒後駕車的案件數

數量型資料

未注意車前狀況

道交事故發生於未注意車前狀況的案件數

數量型資料

肇事逃逸

道交事故發生於肇事逃逸的案件數

數量型資料

未保持行車安全 間距

道交事故發生於未保持行車安全間距的案 件數

數量型資料

未依規定讓車

道交事故發生於未依規定讓車的案件數

數量型資料

行駛疏忽

道交事故發生於行駛疏忽的案件數

數量型資料

違反號誌管制

道交事故發生於違反號誌管制的案件數

數量型資料

違反標誌標線

道交事故發生於違反標誌標線的案件數

數量型資料

逆向行駛

道交事故發生於逆向行駛的案件數

數量型資料

轉彎不當

道交事故發生於轉彎不當的案件數

數量型資料

搶越行人穿越道

道交事故發生於搶越行人穿越道的案件數

數量型資料

駕駛人過失-其他

道交事故發生於駕駛人過失-其他的案件數

數量型資料

機件故障

道交事故發生於機件故障的案件數

數量型資料

行人過失

道交事故發生於行人過失的案件數

數量型資料

交通管制設施缺 陷

道交事故發生於交通管制設施缺陷的案件 數

數量型資料

其他

道交事故發生於其他類別的案件數

數量型資料

4. 每月新北市 A1 類道路交通事故-肇事者 變數名稱

解釋內容

資料型態

年度

統計數據自 103 年起至 105 年

名目型資料

分局轄區

全新北市各行政區,共計 16 個

名目型資料

肇事者-男

道交事故發生於男肇事者的案件數

數量型資料

肇事者-女

道交事故發生於肇事者-女的案件數

數量型資料

肇事者-不詳

道交事故發生於肇事者-不詳的案件數

數量型資料

死亡-男

道交事故發生於死亡-男的案件數

數量型資料

死亡-女

道交事故發生於死亡-女的案件數

數量型資料

受傷-男

道交事故發生於受傷-男的案件數

數量型資料

受傷-女

道交事故發生於受傷-女的案件數

數量型資料

168


5. 各行政區肇事時間 變數名稱

解釋內容

資料型態

年度

統計數據自 103 年起至 105 年

名目型資料

分局轄區

全新北市各行政區,共計 16 個

名目型資料

0~2

早上 0 點至早上 2 點發生之案件數

數量型資料

2~4

早上 2 點至早上 4 點發生之案件數

數量型資料

4~6

早上 4 點至早上 6 點發生之案件數

數量型資料

6~8

早上 6 點至早上 8 點發生之案件數

數量型資料

8~10

早上 8 點至早上 10 點發生之案件數

數量型資料

10~12

早上 10 點至中午 12 點發生之案件數

數量型資料

12~14

中午 12 點至下午 2 點發生之案件數

數量型資料

14~16

下午 2 點至下午 4 點發生之案件數

數量型資料

16~18

下午 4 點至晚上 6 點發生之案件數

數量型資料

18~20

晚上 6 點至晚上 8 點發生之案件數

數量型資料

20~22

晚上 8 點至晚上 10 點發生之案件數

數量型資料

22~24

晚上 10 點至晚上 12 點發生之案件數

數量型資料

6. 道路型態別 變數名稱

解釋內容

資料型態

年度

統計數據自 103 年起至 105 年

名目型資料

分局轄區

全新北市各行政區,共計 16 個

名目型資料

隧道

道交事故發生於隧道的案件數

數量型資料

橋樑

道交事故發生於橋樑的案件數

數量型資料

高架道路

道交事故發生於高架道路的案件數

數量型資料

彎曲路及附近

道交事故發生於彎曲路及附近的案件數

數量型資料

坡路

道交事故發生於坡路的案件數

巷道

道交事故發生於巷道的案件數

直路

道交事故發生於直路的案件數

其他

道交事故發生於其他道路類別的案件數

圓環

道交事故發生於圓環的案件數

廣場

道交事故發生於廣場的案件數

169


7. 安全帽配戴情形 變數名稱

解釋說明

資料型態

年度

統計數據自 103 年起至 105 年

名目型資料

分局轄區

全新北市各行政區,共計 16 個

名目型資料

駕駛人或被載人

發生事故者類別

數量型資料

有無戴安全帽

發生事故者配戴安全帽之情形

數量型資料

死亡人數

發生事故死亡人數統計

數量型資料

受傷人數

發生事故受傷人數統計

數量型資料

8. 駕駛人飲酒情形 變數名稱

解釋說明

資料型態

分局轄區

全新北市各行政區,共計 16 個

名目型資料

酒精濃度

發生道交事故駕駛人酒精濃度呈現狀態,共 計 11 種型態

名目型資料

年度

統計數據自 103 年起至 105 年

數量型資料

發生件數

道交事故發生案件數

數量型資料

死亡人數

道交事故發生案件數中之死亡人數統計

數量型資料

受傷人數

道交事故發生案件數中之受傷人數統計

數量型資料

五、 資料匯入 5.1 資料匯入 (1) 點選「取得資料」裡的「文字/CSV」

170


(2) 開啟「道路類別(大)」檔案

(3) 選取「載入」

171


依序上述方式匯入資料表:[每月新北市 A1 類道路交通事故-原因及傷亡]、[每月 新北市 A1 類道路交通事故-肇事者]、[每月新北市 A1 類道路交通事故-乘坐車種及 死傷人數]、「各行政區肇事時間別」、「道路型態別(小)」、「103-105 安全帽」、「103105 年 A1 酒駕事故」。

5.2 設定群組 5.2.1 針對工作表「各行政區肇事時間別」 (1) 點選最左邊第二個圖示,進行資料編輯整理。點選右手邊欄位的「年度」項 目,按下右鍵選「新增群組」。

172


(2) 將 103 年 1 至 12 月全選(滑鼠左鍵+Ctrl)後並按下右下方「群組」。

(3) 可圈選的項目便會出現在左邊欄位之中,並進一步重新命名群組名字為「103 年」 。(104、105 年的群組方式依此類推)。待將所有年度全部分好組別後,選取 右下方「確定」。檔案中九份資料的年度整理方式皆相同。

173


(4) 接著將資料所劃分時間之發生案件數重新分組,點選上方「新增資料行」。

(5) 調整資料為每 6 小時為一個單位: 在上方空白處將欲分組的「行」合併成另外 一新資料行, 0~6=[]+[]+[] ([]中點選出欲合併的資料) 共有 4 個新資料行,分別為 0~6、6~12、12~18、18~24。

174


5.2.2

針對工作表「103-105 年 A1 酒駕事故」分群

(1) 將「酒精濃度」項目重新編輯成新的群組,此處編輯係依據法規─道路交通 安全規則、刑法而分類。

(2) 最後共呈現五大群,分別為:未超過 0.15mg/L、0.16mg/L~0.25mg/L、0.25mg/L 以上、其他、無酒精反應。

175


六、資料分析 6.1 儀表板製作 6.1.1 各年度事故導因 (1) 點選「交叉分析篩選器」 ,做出年度篩選器。使用「頁面層級篩選」設定想要呈 現的年度,只勾選 103,104,105 年。點選「漏斗圖」 ,將各是各變項放入「值」 。

176


(2) 在「格式」,可細調自己喜歡的樣式,自行選擇標題名稱、字型色彩、對齊方 式、文字大小。

6.1.2 各年度肇事類別 點選「交叉分析篩選器」,做出年度篩選器。 (1) 使用「頁面層級篩選」設定想要呈現的年度,只勾選 103,104,105 年。選擇「多 列卡片」 ,將「村里道路」 、 「國道」 、 「市區道路」 、 「縣道」 、 「鄉道」 、 「專用道路」 、 「其他」放入「欄位」 。選擇「樹狀圖」 ,將「村里道路」 、 「國道」 、 「市區道路」 、 「縣道」、「鄉道」、「專用道路」、「其他」放入「值」。

177


(2) 在「格式」,可細調自己喜歡的樣式,自行選擇標題名稱、字型色彩、對齊方 式、文字大小。

178


6.1.3 肇事與死傷人數趨勢比對 使用「頁面層級篩選」設定想要呈現的年度,只勾選 103,104,105 年。 (1) 點選「折線圖」將「年月(群組)」放入「軸」 , 「肇事者-女」 、 「肇事者-男」放入 「值」 ,完成男女肇事人數折線圖。增加「折線圖」 , 「年月(群組)」放入「軸」 , 將「受傷-男」 、 「受傷-女」 、 「死亡-男」 、 「死亡-女」放入「值」 ,完成死傷人數折 線圖。

179


(2) 在「格式」更改圖表的符號及顏色。

6.1.4 各年度事故乘坐車種 使用「頁面層級篩選」設定想要呈現的年度,只勾選 103,104,105 年。 (1) 點選「交叉分析篩選器」,分別做出年度、死傷人數、行政區篩選器。

180


(2) 點選「環圈圖」將「大客車」 、 「大貨車」 、 「小貨車」 、 「自用小客車」 、 「行人」 、 「其他」、「特種車」、「機踏車」、「營業小客車」放入「值」,完成環圈圖。

181


(3) 在「格式」設定「詳細資料」其「標籤樣式」選擇「類別,總計百分比」,以 可調整顏色其細節。

6.1.5 各行政區肇事發生時段 使用「頁面層級篩選」設定想要呈現的年度,只勾選 103,104,105 年。 (1) 點選「交叉分析篩選器」 ,做出年度篩選器。點選「堆疊橫條圖」將「分局轄區」 放到「軸」,新資料行「0~6」、「6~12」、「12~18」、「18~24」放到「值」。

182


(2) 利用層級篩選,將各行政區所呈現之案件數都為大於一件的情形,故篩選 「大於 1」並按下套用篩選。

183


(3) 在「格式」依喜好作調整,可開啟圖例、Y 軸、標題…等,也可進一步選擇 字型大小與顏色。

6.1.6 各年度交通事故地點 使用「頁面層級篩選」設定想要呈現的年度,只勾選 103,104,105 年。 點選「交叉分析篩選器」 ,做出年度篩選器。點選「100%堆疊直條圖」將「分局 轄區(群組)」放到「軸」 ,將「高架道路」 、 「廣場」 、 「坡路」 、 「其他」 、 「橋梁」 、 「隧 道」 、 「彎曲路及附近」 、 「巷道」 、 「圓環」 、 「直路」放到「值」 。在「格式」部分同前 著所述,皆可依自己喜好調整各項目,如:字型、標題、XY 軸…。

184


6.1.7 安全帽與機車傷亡 使用「頁面層級篩選」設定想要呈現的年度,只勾選 103,104,105 年。 (1) 點選「交叉分析篩選器」,分別做出年度、戴安全帽篩選器。

(2) 點選視覺效果「群組橫條圖」 , 「分局轄區」放入「軸」 , 「死亡人數」放入「值」 (僅分析各行政區配戴安全帽及死亡人數之對應,故受傷人數不計入此圖)。

185


(3) 點選視覺效果「環圈圖」 , 「死亡人數」 、 「受傷人數」放入「值」 ,可依自己喜好 調整各項目,如:字型、標題、XY 軸…等。

6.1.8 安全帽與機車傷亡 使用「頁面層級篩選」設定想要呈現的年度,只勾選 103,104,105 年。 (1) 點選「交叉分析篩選器」,做出酒精濃度篩選器。

186


(2) 點選視覺效果「群組直條圖」 , 「分局轄區」放入「軸」 ,圖例放入「年度」 , 「死 亡人數」放入「值」 。可依自己喜好調整各項目,如:字型、標題、XY 軸…等。

187


6.2 回答問題 問題 1: 各行政區交通事故導因為何?

可從圖表看出,第一名至第三名,分別是「駕駛人過失」、「未注意車前狀況」、 「違反標誌標線、未依規定讓車」。

188


問題 2: 各行政區肇事道路類別為何?

佔新北市前三大宗交通事故案件數量的,分別是「蘆洲分局」、「新莊分局」、「三 峽分局」,又細分道路類別來看,以「市區道路」最常發生交通事故。

189


問題 3: 各行政區肇事與死傷人數趨勢比對

可從趨勢圖觀察出,交通事故肇事人數由逐年下降的趨勢,而死傷人數在 103~104 年有下降趨勢,但在 104~105 年有增長趨勢。

190


問題 4: 各行政區交通事故乘坐車種為何?

新北市全區域,交通事故乘坐車種第一多為「機踏車」,第二多為「自用小客 車」,第三多為「行人」。

191


問題 5: 新北市各行政區肇事發生時段的分布為何?

綜觀整體,以「蘆洲」案件量最高,第二為「新莊」,第三則為「新店」。進一步 分析各行政區發生道交事故集中的時間點,多落在 6~12 時、12~18 時。可推測應 為上下班的尖峰時段緣故。

192


問題 6: 各行政區交通事故發生地點分布為何?

透過交叉篩選分析出每年度交通事故地點分布情形,可以得知不論在哪一年,各 行政區多在「直路」發生事故較多(圖中粉色區塊),其次則為「彎曲道路」(圖中 橘色的區塊)。

193


問題 7: 各行政區戴安全帽與否及死亡結果兩者關係分布?

194


分析有無配戴安全帽與死傷比率二者間的對應關係,看出沒戴安全帽比有戴安全帽 多了約 22.5%的死亡率。進一步分析出,因為沒有配戴安全帽而發生死亡案件的行 政區,以「金山分局」為最多。

195


問題 8: 各行政區因酒駕致死的案件分布?

各行政區酒駕死亡車禍的分布情形,前三名依序為「蘆洲」 、 「新莊」 、 「三峽」 。進一 步分析前三名在三年內的變化: 「蘆洲」的死亡案件不減反增, 「新莊」 、 「三峽」二 者則有逐年下滑的趨勢。綜觀全體還可得知:除了少數中和、海山、瑞芳外,多數 行政區死亡案件從 103 年(黑色)到 104 年(綠色)有逐漸下滑的趨勢,然而,確實也有 相關報導指出警政署統計資料,104 年與 103 年相比,死亡案件有大幅下降的情形。 以下進一步用法規分析出各行政區因酒駕發生死亡的案件分布: (1) 道路交通安全規則第 114 條: 「汽車駕駛人飲用酒類或其他類似物後其吐氣所含 酒精濃度達每公升 0.15 毫克或血液中酒精濃度達 0.03%以上,不得駕車,違者 依道路交通管理處罰條例第 35 條舉發,處新臺幣 1 萬 5,000 元以上 9 萬元以下 罰鍰,並當場移至保管車輛,吊扣駕駛執照。」 (2) 刑法第 185 條之 3:「駕駛動力交通工具而有下列情形之一者,處 2 年以下有期 徒刑,得併科 20 萬元以下罰金: 吐氣所含酒精濃度達每公升 0.25 毫克或血液中酒精濃度達 0.05%以上。 196


有前款以外之其他情事足認服用酒類或其他相類之物,致不能安全駕駛。 服用毒品、麻醉藥品或其他相類之物,致不能安全駕駛。 因而致人於死者,處 3 年以上 10 年以下有期徒刑;致重傷者,處 1 年以上 7 年 以下有期徒刑。」

達罰緩程度(0.16~0.24mg/L)而生酒駕死亡案件的行政區為「新店」、「瑞芳」。

197


達刑罰程度(0.25mg/L 以上)而生酒駕死亡案件的行政區為「蘆洲」 、 「中和」 。進一步 發現:「中和」三年內每年至少一起死亡案的發生:「蘆洲」在 105 年更是二件死亡 案發生。

七、 結語 交通事故對於人的身命安全造成極大傷害,若能藉由數據資料來進行分析,更 能進行政策規劃,甚至預防事故的發生,藉由視覺化的報表呈現,可發現新北市各 行政區在何處易發生車禍、事故發生時運用的交通運輸工具,以及事故發生的導因 等,各行政區可依照不同的數據報表,調整需改善的地方,可以是很重要的數據依 據。而 POWER BI 提供了如此便利美觀的分析工具,能讓政策規劃時擁有更多資源, 如此便能準確地執行政策,有效地降低交通事故發生率。

八、參考資料 新北市政府警察局 新北市 A1 類道路交通事故 網址(政府資料開放平臺); https://data.gov.tw/datasets/search?qs=dtid%3A22026%20a1&page=0 酒駕死亡案件下滑趨勢 https://www.thenewslens.com/article/35252

198


案例五 案例五 日本櫻花追追追

學習目標 1. 資料處理 ---網頁資料下載與合併 ---資料分群 ---資料關聯 2. 視覺效果 ---交叉篩選器、卡片、多列卡片、折線圖、量測計圖、堆疊橫條圖、資 料表、地圖、群組堆疊直條圖 ---TimeLine Storyteller (Market Place 匯入) ---背景主題、工具提示 3. 實務應用 ---日本櫻花開花日大調查 ---日本櫻花預測準確嗎? ---去那裡看櫻花呢?

199


一、 前言 國人熱愛賞櫻,近年來有越來越多人前往日本,徜徉在一生中必見一次的櫻花 海 , 根 據 日 本 政 府 觀 光 局 (Japan

National

Tourism

Organization)

https://statistics.jnto.go.jp/graph/#graph--dashboard--basic--basic 公布之統計數據指出,台 灣旅客赴日賞櫻人數年年攀升,2019 年 3 月較前一年同月成長 3.9%,高達 40.24 萬 人,創下歷年同月新高。作者也非常嚮往粉櫻爛漫的櫻之國度,看過各篇旅遊達人 的賞櫻攻略後,蒐集歷年日本各地櫻花開花日的資料,以及每年開春由日本各間民 間氣象機構提供的「櫻前線預測」資料,整理並視覺化分析日本各地櫻花開花日, 當作未來賞櫻旅遊規劃的參考。

二、 研究問題 問題 1:歷年日本各地開花日整理與分析,找出櫻花早開年或晚開年。 問題 2:歷年櫻前線預測誤差整理與分析,找出預測誤差最少與最多的年。 問題 3:舉例將賞櫻資料分析實際應用到賞櫻旅遊規劃。

三、 資料來源 目前日本四大主要民間櫻前線預測機構有:Weathernews、Weather Map、日本氣 象協會、日本氣象株式會社。搜尋各機構櫻花開花相關資料後,選擇使用 Weathernews 與 Weather Map 官網上公布之櫻花資料進行整理與分析,Weathernews 官網提供歷 年百選賞櫻景點詳細介紹,Weather Map 官網比起其他機構還多提供歷年櫻前線預 測誤差總表,因此選擇二者進行日本賞櫻資料整理與視覺化分析。資料數據集中在 Weathernews 與 Weather Map 兩個官網中的 5 個主要的網頁,如下:

200


1. Weathernews 2019~2011 歷年百選櫻花表格

2. Weathernews 官網賞櫻景點的介紹

201


3. Weather Map 官網公布之 2019 年櫻花開花日

4. Weather Map 官網公布之歷年櫻花開花日與平年差

202


5. Weather Map 官網公布之歷年開花預測日差

四、 資料說明 我們將上述幾個網頁的資料數據複製下來,並在 excel 進行整理,最後整理成 一份 excel 檔,內有 9 個工作表。

4.1 工作表 1: News 百選基本資料 首先我們將 Weathernews 2019~2011 歷年百選櫻花表格 1 轉換到 excel 中,另外點 進每一列的「スポット名」欄位,連結到 Weathernews 官網各個景點的介紹資料,在 excel 表新增欄位經緯度、櫻花樹數量、櫻花樹種類、夜櫻點燈、櫻花祭典、入園費, 將這些資料一一填入,完成 Weathernews 百選資本資料的 excel 表格。

203


變數說明: 變數名稱 府縣 地點

解釋內容 各地點所位於的府縣 1

資料類型 名目型資料

1

百選賞櫻地點 ,共列出 134 個

名目型資料

2

經緯度

Weathernews 官網 中各地點的「所在地」之經緯度 地理型資料

櫻花樹數量

Weathernews 官網 2 中各地點的「桜の本数」

櫻花樹種類

2

Weathernews 官網 中各地點的「桜の種類」

數量型資料 名目型資料

2

夜櫻點燈

Weathernews 官網 中各地點有無「ライトアップ」 名目型資料

櫻花祭典

Weathernews 官網 2 中各地點有無「さくらまつり」 名目型資料

入園費

Weathernews 官網 2 中各地點有無「入場料」

2019_預開花

2019 年 3 月 26 日預測之百選地點櫻花開花日(日 日期資料 期格式)1

2019_預滿開

2019 年 3 月 26 日預測之百選地點櫻花滿開日(日 日期資料 期格式)1

2019_預落櫻

名目型資料

2019 年 3 月 26 日預測之百選地點櫻花落櫻日(日 日期資料 1

期格式)

2018_開花

2018 年百選地點櫻花開花日(日期格式)1

日期資料

2018_滿開

2018 年百選地點櫻花滿開日(日期格式)1

日期資料

204


變數名稱 2018_落櫻

解釋內容

資料類型 1

2018 年百選地點櫻花落櫻日(日期格式)

日期資料

其餘 同上述 2018 年解釋內容,為 2011~2017 年百選地 日期資料 2011~2017 年 點櫻花開花、滿開、落櫻日(日期格式)1 之變數 註:上標數字表示參考資料網址之編號。

4.2 工作表 2: News 開花日數字 將工作表 1.日期的部分轉換成數值。

變數說明: 變數名稱 府縣

解釋內容 各地點所位於的府縣

1

資料類型 名目型資料

1

地點

百選賞櫻地點

名目型資料

2019_預開花

2019 年 3 月 26 日預測之百選地點櫻花 日期資料(數值格式) 1

開花日(數值格式) 2019_預滿開

2019 年 3 月 26 日預測之百選地點櫻花 日期資料(數值格式) 滿開日(數值格式)1 205


變數名稱

解釋內容

資料類型

2019_預落櫻

2019 年 3 月 26 日預測之百選地點櫻花 日期資料(數值格式) 落櫻日(數值格式)1

2018_開花

2018 年櫻花開花日(數值格式)1

日期資料(數值格式)

2018_滿開

1

日期資料(數值格式)

1

日期資料(數值格式)

2018 年櫻花滿開日(數值格式)

2018_滿開

2018 年櫻花落櫻日(數值格式)

其餘 2011~2017 年

同上述 2018 年解釋內容,為 2011~2017 日期資料(數值格式) 年百選地點櫻花開花、滿開、落櫻日(數

之變數

值格式)1

註:上標數字表示參考資料網址之編號。

4.3 工作表 3: News 開花日分割 因為 excel 日期格式年份預設是 2019 年,2019 年之前的日期中年份需要修正, 所以我們要先把日期分割,更正年份後,再合併。這邊使用資料剖析進行分割,再 用 DATE 函數進行合併。

206


變數說明: 變數名稱 地點

解釋內容 百選賞櫻地點 1

資料類型 名目型資料

各地點櫻花開花日的年

1

名目型資料

各地點櫻花開花日的月

1

名目型資料

開花日_日

各地點櫻花開花日的日

1

名目型資料

開花日日期

使用 DATE 函數:=DATE(Y,M,D) 合併成的日期

開花日_年 開花日_月

日期資料

其 餘 落 櫻 日 同上述開花日解釋內容,為落櫻日之變數

名目型資料

之變數

與日期資料

註:上標數字表示參考資料網址之編號。

4.4 工作表 4: Maps 開花日 接下來我們把 Weather Map 官網的開花日資料 3.4 也整理成 excel 檔,點進網頁表 格中每一列「官署」的欄位,連結到 Weather Map 官網各官署的資料,在 excel 表新 增欄位經緯度。

207


變數說明: 變數名稱 官署

解釋內容 日本官署,共列出 58 個 3.4

資料類型 名目型資料

3.4

標本木種類

官網表格 附註提供各官署「観測対象」之櫻花 名目型資料 樹種類

緯度

標本木所在之緯度 3

地理型資料

經度

3

地理型資料

標本木所在之經度

1981 〜 2010 1981〜2010 年之平均櫻花開花日(日期格式) 3,亦 日期資料 年平均

稱平年日

2019 開花日

2019 年開花日(日期格式) 3

日期資料

2019 滿開日

3

日期資料

2019 年滿開日(日期格式)

其餘 同上述 2019 年解釋內容,為 2010~2018 年櫻花開 日期資料 2010~2018 年 花、滿開日(日期格式) 4 之變數 註:上標數字表示參考資料網址之編號。

4.5 工作表 5: Maps 開花日數字 (1) 將工作表 4.日期的部分轉換成數值。

208


變數說明: 變數名稱 官署 標本木種類

解釋內容

資料類型

日本官署,共列出 58 個 3.4

名目型資料

3.4

官網表格 附註提供各官署「観測対象」 名目型資料 之櫻花樹種類

1981 〜 2010 1981〜2010 年之平均櫻花開花日(數值 日期資料(數值格式) 年平均 格式) 3,亦稱平年日 2019 開花日

2019 年開花日(數值格式) 3

2019 滿開日

3

日期資料(數值格式)

2019 年滿開日(數值格式) 日期資料(數值格式) 同上述 2019 年解釋內容,為 2010~2018 日期資料(數值格式) 其餘 4 2010~2018 年 年櫻花開花、滿開日(數值格式) 之變數 註:上標數字表示參考資料網址之編號。

4.6 工作表 6: Maps 開花日分割 將日期分割,更正年份後,再合併。這邊使用資料剖析進行分割,再用 DATE 函數進行合併。

209


變數說明: 變數名稱

解釋內容

資料類型

官署

58 個日本官署 3.4,記錄從 2010 到 2019 年,共有 名目型資料 58×10 筆資料

開花日_年

各官署櫻花開花日的年 3.4

名目型資料

開花日_月

各官署櫻花開花日的月

3.4

名目型資料

開花日_日

各官署櫻花開花日的日

3.4

名目型資料

開花日日期

DATE 函數:=DATE(Y,M,D) 合併成的日期

其 餘 落 櫻 日 同上述開花日解釋內容,為落櫻日之變數

3.4

之變數 平年差 較早較晚

日期資料 名目型資料 與日期資料

該年櫻花開花日-平年日=平年差

3.4

3.4

根據官網表格 附註列出平年差階級: 階級

該年開花日 - 平年日

明顯較晚

晚 7 日以上 (+7)

較晚

晚 3 日以上 (+3)

數值資料 名目型資料

與平年一樣 相差 2 日以內 (±2) 較早

早 3 日以上 (-3)

明顯較早

早 7 日以上 (-7)

將平年差用 IF 函數分成五個類群: =IF(J2<=-7,"明顯較早",IF(J2<=-3,"較早",IF(J2<=2," 與平年一樣",IF(J2<=6,"較晚","明顯較晚")))) 註:上標數字表示參考資料網址之編號。

4.7 工作表 7: Maps 平年差比較階級 把上述提到的平年差階級表格複製到新工作表中,作為附註說明用。

4.8 工作表 8: Maps 歷年預測誤差 Weather Map 官網還有開花預測誤差資料表格 5 也整理成 excel 檔。

210


變數說明: 變數名稱

解釋內容

資料類型

官署

39 個日本官署 5,沒有列入北海道以及東北地 名目型資料 區的官署

年份

預測誤差的年份,2010~2018 年 5

第 1 次預測

Weather Map 每年會進行總共 6 次的預測,此 數值資料

名目型資料

欄為各官署各年份第 1 次預測開花的天數差, 預測開花日+差值=實際開花日,因此預測開花 日與實際開花日相同為 0,預測比實際早 1 天 為 1,預測比實際晚 1 天為-1,依此類推 5 第 2~6 次預測

同上述解釋,為第 2~6 次預測之變數 5

註:上標數字表示參考資料網址之編號。

211

數值資料


4.9 工作表 9: Maps_MAE 整理 Weather Map 官網開花預測誤差的表格下方所列之平均絕對誤差(mean absolute error, MAE),這裡的 MAE 是該年每一次預測當中,所有官署預測天數差取 絕對值後,算出來的平均誤差。

變數說明: 變數名稱

解釋內容

資料類型 5

年份

預測開花預測誤差的年份,2010~2018 年

名目型資料

第 1 次預測 MAE

該年第 1 次預測當中,所有官署預測天數差 數值資料 取絕對值後,算出來的平均誤差 5

第 2 ~ 6 次 預 測 同上述解釋內容,為第 2~6 次預測 MAE 之 數值資料 MAE 變數 5 註:上標數字表示參考資料網址之編號。

212


五、 資料匯入 5.1. 取得資料 開啟 Power BI 程式,點選取得資料,載入先前整理好的 excel 檔。

213


5.2. 資料關聯 載入 excel 檔後,點選左列模型

→ 用滑鼠點選並拖曳將資料欄位做連結。

下圖連結解釋: 「News 百選基本資料」與「News 日期數字」連結「地點」變數, 「News 百選基本資料」與「News 開花日分割」連結「地點」變數。

「Maps 開花日」 、 「Maps 開花日數字」 、 「Maps 開花日分割」與「Maps 歷年預測 誤差」互相連結「官署」變數。 「Maps 歷年預測誤差」與「Map_MAE」連結「年份」 變數。

214


5.3. 編輯查詢 「Maps 平年比較階級」資料表的欄位名稱需要修正,點選「編輯查詢」,最左 邊列表點選 Maps 平年比較階級,上方工具列點選使用「第一個資料列作為標頭」, 左上角點選「關閉並套用」。

215


六、 資料分析 6.1 主題與桌布 6.1.1 佈景主題與桌布 除了程式中內建的佈景主題,Power BI 官網上也提供多款佈景主題讓大家下載 使用(https://community.powerbi.com/t5/Themes-Gallery/bd-p/ThemesGallery)。

下載好佈景主題後,點選「常用」索引標籤下的「切換主題」 , 「匯入佈景主題」 , 顯示已成匯入佈景主題視窗即完成。

216


接下來進行桌布的更改,點選操作介面右方「格式」 , 「桌布」可以更改儀表板 桌布的色彩,或者是像範例使用新增影像匯入圖片作為桌布。

217


6.1.2 製作封面及目錄 點選「常用」索引標籤下的「文字方塊」 ,輸入文字,視覺效果可以更改背景顏 色或者是增加邊界等等。

218


6.2 儀錶板製作 6.2.1

Weathernews 基本資料 a.

g.

b. e.

c.

d.

f.

(1) 儀表板標題 點選「常用」索引標籤下的「文字方塊」 ,輸入此頁儀表板標題文字,右方視覺 效果更改背景顏色、增加邊界。

219


(2) 年份篩選 點選視覺效果的「交叉分析篩選器」,「News 開花日分割」資料表的「開花日_ 年」欄位用滑鼠拖曳至左邊視覺效果底下的「欄位」。 點「格式」 ,開啟「交叉分析篩選器」標題,滑鼠移到「下拉式清單」 ,更改好 以後可以關閉顯示交叉分析篩選器標題。

(3) 地區與府縣篩選 將府縣欄位依照 Weathernews 賞櫻百選歷年開花日表格做地區的分群,分成「北 海道・東北」、「関東」、「甲信越・北陸・東海」、「近畿」、「中国・四国」、「九州・ 沖縄」,共 6 個群組。 建立群組:滑鼠右鍵點選「News 百選基本資料」資料表的「府縣」欄位,新增 群組,以 ctrl 鍵選取多個府縣,點選「群組」選項,即完成建立 1 個群組,其餘 5 個 群組同步驟建立。

220


221


接下來,點選「交叉分析篩選器」 ,把剛剛建立的「府縣(群組)」用滑鼠拖曳至 左邊視覺效果底下的「欄位」。

點選「格式」 ,開啟交叉分析篩選器「標題」 ,滑鼠移到「下拉式清單」 ,更改好 以後可以關閉顯示交叉分析篩選器標題。

複製 1 個地區選擇的「交叉分析篩選器」 , 「府縣」用滑鼠拖曳至「欄位」 ,標題 改為府縣選擇。

222


(4) 旅遊資訊篩選 建立一個矩形底框:點選「常用」索引標籤下的「形狀」:矩形,右方視覺效果 更改背景顏色、開啟標題、增加邊界。點選「格式」索引標籤,移到最下層。

223


點選「交叉分析篩選器」 , 「News 百選基本資料」的「入園費」欄位用滑鼠拖曳 至「欄位」,選「格式」,開啟「標題」,複製 2 個相同的篩選器,「欄位」處改拖曳 「夜櫻點燈」,另一個改拖曳「櫻花祭典」,完成 3 個旅遊資訊的篩選器。

插入影像作為裝飾:點選「常用」索引標籤下的「影像」,插入影像。

(5) 櫻花樹數量橫條圖 點選「堆疊橫條圖」,「News 百選基本資料」的「地點」用滑鼠拖曳至「軸」, 224


「News 百選基本資料」的「櫻花樹數量」用滑鼠拖曳至「值」。選「格式」開啟標 題、背景、邊界。 點選「堆疊橫條圖」,「News 百選基本資料」的「地點」用滑鼠拖曳至「軸」, 「News 百選基本資料」的「櫻花樹數量」用滑鼠拖曳至「值」。選「格式」開啟標 題、背景、邊界。

(6) 府縣與地點資料表 點選視覺效果的「資料表」 , 「News 百選基本資料」的「府縣」與「地點」用滑 鼠拖曳至「值」。

225


(7) 百選賞櫻景點地圖 點選「Arc GIS Maps for Power BI」,「News 百選基本資料」的「經緯度」拖曳至 「位置」 , 「櫻花樹數量」拖曳至「尺寸」與「顏色」 →「開花日日期」拖曳至「時 間」 , 「地點」、 「入園費」 、 「夜櫻點燈」、 「櫻花祭典」 、 「櫻花樹種類」拖曳至「工具 提示」。

6.2.2

Weathernews 開花日

f.

a. b. e. c.

d.

226


(1) 儀表板標題 點選「常用」索引標籤下的「文字方塊」 ,輸入此頁儀表板標題文字,視覺效果 更改背景顏色、增加邊界,操作詳見 6.2.1-(1)。 (2) 年份篩選 點選「交叉分析篩選器」,「News 開花日分割」的「開花日_年」用滑鼠拖曳至 「欄位」,操作詳見 6.2.1-(2)。 (3) 地區與府縣篩選 點選「交叉分析篩選器」 , 「News 百選基本資料」的「府縣(群組)」用滑鼠拖曳 至「欄位」 ,複製 1 個地區選擇的交叉分析篩選器, 「府縣」用滑鼠拖曳至「欄位」 , 「標題」改為府縣選擇,操作詳見 6.2.1-(3)。 (4) 開花日篩選 點選「交叉分析篩選器」 , 「News 開花日分割」的「開花日日期」欄位拖曳至「欄 位」 ,選「格式」開啟交叉分析篩選器「標題」 ,滑鼠移到下拉選單,選取「之間」 。

227


建立一個矩形底框,點選「常用」索引標籤下的「形狀」:矩形,右方視覺效果 更改背景顏色、開啟標題、增加邊界。點選「格式」索引標籤,移到最下層,操作 詳見 6.2.1-(4)。 (5) 府縣與地點資料表 點選視覺效果的「資料表」 , 「News 百選基本資料」的「府縣」與「地點」用滑 鼠拖曳至「值」,操作詳見 6.2.1-(6)。 (6) 百選賞櫻景點開花到落櫻日 點選視覺效果「選項」,從 Marketplace 匯入「Timeline Storyteller」。 「News 百選基本資料」的「府縣」欄位拖曳至「Facet」 , 「地點」拖曳至「Content Text」 , 「News 開花日分割」的「開花日日期」拖曳至「Start Date」 , 「落櫻日日期」拖曳至 「End Date」。點選圖表中的

,可以讓紅色長條依照府縣分類分散開來。

228


6.2.3

Weathernews 歷年開花日折線圖

a. b.

c.

(1) 折線圖 點選「折線圖」 , 「News 日期數字」的「府縣」拖曳至「軸」 , 「2011~2019_開花」 共 9 個欄位拖曳至「值」 ,分別點選下拉選單選擇「平均」 ,滑鼠點兩下可以重新命 名圖例的文字。

229


點選「格式」,開啟「圖例」(靠左置中),關閉「Y 軸」,更改資料色彩。

點選「分析」,加入標示 1 月~5 月的常數線。

230


點選右上角更多選項

,排序依據選一個折線較平整的年,遞增排序,這樣可以讓

X 軸的府縣盡量依照由南到北的位置來排序。

(2) 地區篩選 點選「交叉分析篩選器」 , 「News 百選基本資料」的「府縣(群組)」用滑鼠拖曳 至「欄位」,操作詳見 6.2.1-(3)。 (3) 工具提示 當滑鼠放在折線圖的點上時,會跑出預設的工具提示。

231


i. 工具提示製作 因工具提示中顯示的是數值格式的日期,我們想要更換工具提示的內容,進行下列 步驟: 開一空白新分頁,點選「格式」 ,頁面資訊開啟「工具提示」 ,頁面大小先選工具提 示,若有需要調整可改用自訂大小,桌布更改成灰底。

點選檢視表索引標籤下的整頁模式,選擇實際大小。

232


ii. 開始加入工具提示中想要呈現的視覺效果 為配合圖表大小,點選「格式」,頁面大小改用自訂調整適合的大小。 點選「卡片」,「News 日期數字」的「府縣」拖曳至「欄位」。

點選「矩陣」,「News 開花日分割」的「地點」拖曳至「資料列」,「開花日_年」拖 曳至「資料行」,「開花日_月」與「開花日_日」拖曳至「值」。 點選「格式」,樣式(替換資料列),小計(關閉資料列小計與資料行小計)。

233


完成有顯示歷年日期的工具提示內容後,回到原本的折線圖。 點選「格式」 ,開啟「工具提示」 ,鍵入「報表頁面」 ,頁面選擇剛完成的工具提示(工 具提示 1) ,將滑鼠移到折線圖上的點就會出現工具提示 1 的圖表。

6.2.4

WeatherMap 基本資料 f.

a. b. e. c.

d.

234


(1) 儀表板標題 點選「常用」索引標籤下的「文字方塊」 ,輸入此頁儀表板標題文字,視覺效果 更改背景顏色、增加邊界,操作詳見 6.2.1-(1)。 (2) 年份篩選 點選「交叉分析篩選器」,「Maps 開花日分割」的「開花日_年」用滑鼠拖曳至 「欄位」,操作詳見 6.2.1-(2)。 (3) 地區與官署篩選 依據 WeatherMap 開花日表格,將官署分成「北海道」、「東北」、「關東甲信」、 「東海・北陸」、 「近畿」、 「中国・四国」、 「九州」 、 「奄美・沖縄」,共 8 個群組,建 立「Maps 開花日」的「官署(群組)」,操作詳見 6.2.1-(3)。 點選「交叉分析篩選器」,「Maps 開花日」的「官署(群組)」用滑鼠拖曳至「欄 位」 , 複製 1 個地區選擇的交叉分析篩選器,「官署」用滑鼠拖曳至「欄位」 ,標題 改為官署選擇,操作詳見 6.2.1-(3)。 (4) 開花日篩選 點選「交叉分析篩選器」 , 「Maps 開花日分割」的「開花日日期」欄位拖曳至「欄 位」,格式開啟交叉分析篩選器「標題」,滑鼠移到下拉選單選取「之間」。 建立一個矩形底框,點選「常用」索引標籤下的「形狀」:矩形,右方視覺效果 更改背景顏色、開啟標題、增加邊界。點選「格式」索引標籤移到最下層,操作詳 見 6.2.1-(4)。 (5) 官署與開花日卡片 點選「多列卡片」 , 「Maps 開花日分割」的「官署」 、 「開花日日期」 、 「滿開日日 期」拖曳至「欄位」。

235


(6) 各官署開花日地圖 地圖方面有一些不同之處,在這邊的經緯度是分開的兩個欄位,因此分別拖曳 至經度、緯度的格子裡;另外,這邊地圖上圈圈的顏色是依據「官署(群組)」做分類。 點選視覺效果的「Arc GIS Maps for Power BI」 , 把「Maps 開花日」的「官署」 拖曳至「位置」 , 「緯度」拖曳至「緯度」 , 「經度」拖曳至「經度」 , 「官署(群組)」拖 曳至「顏色」 , 「開花日日期」拖曳至「時間」 , 「滿開日日期」拖曳至「工具提示」 。

236


6.2.5

WeatherMap 歷年開花日折線圖

a. b.

c.

(1) 折線圖 點選視覺效果「折線圖」 , 「Maps 開花日數字」的「官署」拖曳至「軸」 , 「2010 ~2019 開花日」 、 「1981~2010 平年日」共 11 個欄位拖曳至「值」 ,滑鼠點兩下可以 重新命名圖例的文字。 點選「格式」,開啟「圖例」選「靠左置中」,關閉 Y 軸,更改資料色彩。 點選「分析」,加入標示 1 月~6 月的常數線。 滑鼠移到圖表右上角,點選更多選項

,排序依據選 1981~2010 平年日,「遞增」

排序,讓 X 軸的官署盡量依照由南到北的位置來排序,以上操作詳見 6.2.3-(1)。 (2) 地區篩選 點選「交叉分析篩選器」,「Maps 開花日」的「官署(群組)」用滑鼠拖曳至「欄 位」,操作詳見 6.2.1-(3)。 (3) 工具提示 開一空白新分頁,點選「格式」 ,頁面資訊開啟「工具提示」 ,頁面大小先選工 237


具提示,若有需要調整可改用自訂大小,桌布更改成灰底,點選檢視表索引標籤下 的整頁模式,選擇實際大小,操作詳見 6.2.3-(3)。 開始加入工具提示中想要呈現的視覺效果: 配合圖表大小,點選「格式」,頁面大小改用自訂調整適合的大小。 點選視覺效果「卡片」,「Maps 開花日」的「官署」拖曳至「欄位」。 點選視覺效果「多列卡片」,「Maps 開花日」的「開花日日期」拖曳至「欄位」。 點選視覺效果「群組直條圖」 , 「Maps 開花日分割」的「官署」拖曳至「軸」 , 「開花 日_年」拖曳至「圖例」 , 「平年差」拖曳至「值」 , 「格式」資料色彩每一年的顏色改 成與先前折線圖一致,並開啟「資料標籤」。 完成有顯示歷年日期的工具提示內容後,回到原本的折線圖。 點選「格式」 ,開啟「工具提示」 ,鍵入「報表頁面」 ,頁面選擇剛完成的工具提示(工 具提示 2) ,滑鼠移到折線圖上的點就會出現工具提示 2 的圖表,以上操作詳見 6.2.3(3)。 6.2.6

WeatherMap 平年差

g.

a. b. c.

f.

d. e.

238


(1) 儀表板標題 操作詳見 6.2.1-(1)。 (2) 年份篩選 操作詳見 6.2.1-(2)。 (3) 地區與官署篩選 操作詳見 6.2.1-(3)。 (4) 平年差階級篩選 操作詳見 6.2.1-(4)。 (5) 平年差階級說明資料表 點選「資料表」 , 「Maps 平年比較階級」的「階級」與「該年開花日-平年日」用 滑鼠拖曳至「值」。 (6) 官署計數卡片 點選「卡片」 , 「Maps 開花日分割」的「官署」用滑鼠拖曳至「欄位」 , 「較早較 晚」用滑鼠拖曳至視覺效果層級篩選,按下拉選單選擇「基本篩選」 ,勾選「明顯較 晚」 ,複製另外四張一樣的卡片, 「較早較晚」視覺效果層級篩選分別勾選其餘四 個條件。 (7) 各官署開花平年差 點選「群組值條圖」 , 「Maps 開花日分割」的「官署」用滑鼠拖曳至「軸」 , 「開 花日_年」拖曳至「圖例」 , 「平年差」拖曳至「值」 ,下拉選單選「平均」 , 「Maps 開 花日數字」的「1981 年〜2010 年平均」用滑鼠拖曳至「工具提示」,點選圖表右上 角

更多選項,排序依據「1981 年〜2010 年平均」 , 「遞增排序」 ,點選「格式」 ,資

料色彩改成與先前的折線圖相同,Y 軸開啟標題,軸標題輸入「天數」。

239


6.2.7

WeatherMap 預測誤差

f.

a. b. c.

d.

e.

(1) 儀表板標題 操作詳見 6.2.1-(1)。 (2) 年份篩選 操作詳見 6.2.1-(2)。 (3) 平均絕對誤差(MAE)群組直條圖 點選「群組直條圖」,「Maps_MAE」的「年份」用滑鼠拖曳至「軸」,「第 1~6 次預測 MAE」拖曳至「值」 ,點選「格式」 ,X 軸與 Y 軸開啟標題,軸標題輸入「年 份、天數」,開啟「資料標籤」,點選「分析」,加入標示 3 的常數線。 (4) 篩選預測開花日在理想範圍內的官署 點選「交叉分析篩選器」 , 「Maps 歷年預測誤差」的「官署」用滑鼠拖曳至「欄 位」 , 「第 1~6 次預測」用滑鼠拖曳至視覺效果層級篩選,6 個欄位分別點下拉選單 選擇「進階篩選」,選擇小於或等於並輸入 3,並且選擇大於或等於並輸入-3。 240


(5) 在理想範圍內的官署計數 點選「量測計」,「Maps 歷年預測誤差」的「官署」用滑鼠拖曳至「值」,點下 拉選單選「計數(相異)」,視覺效果層級篩選與 6.2.6-(4).相同,點選「格式」,「量測 計軸」「最小值」輸入 0,「最大值」輸入 39,並開啟「資料標籤」。 (6) 各官署預測天數差群組直條圖 點選「群組直條圖」 , 「Maps 歷年預測誤差」的「官署」用滑鼠拖曳至「軸」 , 「第 1~6 次預測」拖曳至「值」,點選「格式」, Y 軸開啟標題,軸標題輸入「天 數」,點選「分析」, 加入標示+3 與-3 的常數線。

241


6.3 回答問題 問題 1:找出櫻花早開年與晚開年。 ➢

儀表板分析:6.2.3、6.2.5、6.2.6

透過 6.2.3 Weathernews 歷年開花日折線圖,初步挑選出櫻花相對早開與相對晚開的 年,歸納出以下重點: i. 2012 年(黃色折線)大部分地區開花日偏晚。 ii. 2013 年(深藍色折線)從九州到北陸地區的開花日很明顯比其他年份要早, 然而 2013 年在北海道、東北地區的開花日卻是明顯比其他年份晚。 iii. 2018 年(淺藍色折線)大部分地區開花日偏早。

242


透過 6.2.5 WeatherMap 歷年開花日折線圖,初步挑選出櫻花相對早開與相對晚開的 年,並與 6.2.3 儀表板比較: 先前 6.2.3 儀表板呈現的是各景點的開花日,6.2.5 儀表版則是各官署櫻花觀測標 本木的開花日,6.2.3 和 7.2.5 的相對早開年與相對晚開年沒有矛盾。 i. 2012 年大部分地區開花日偏晚。 ii. 2013 年從九州到北陸地區的開花日很明顯比其他年份要早,然而 2013 年在北海 道、東北地區的開花日卻是明顯比其他年份晚。 iii. 2018 年大部分地區開花日偏早。

243


透過 6.2.6 WeatherMap 平年差,以平年日為基準更進一步來判斷櫻花早開年與晚開 年,點選左上角年份篩選器或者點選群組直條圖圖例的年份圓圈來選擇不同年份, 看看每一年各官署的平年差階級分布。 i.

2012 年的平年差階級有 10 個官署明顯較晚以及 29 個官署較晚,是這幾年當中 晚開花的官署最多的一年。

ii.

2013 年的平年差階級有 28 個官署明顯較早以及 13 個官署較早;6 個明顯較晚 與 6 個較早的官署集中分布在北海道及東北地區,是很特別的一年。

iii.

2018 年的平年差階級有 25 個官署明顯較早以及 27 個官署較早,是這幾年當中 早開花的官署最多的一年。

iv.

其餘早開日偏多的年為 2010、2014、2015、2016、2019;晚開日偏多的年為 2011、 2017。

v.

另外看到整體 10 年以來的統計資料,總共有 26 個官署明顯較晚,54 個官署較 晚,55 個官署與平年一樣,55 個官署較早,53 個官署明顯較早。整題而言我們 可以發現,櫻花開花日晚 7 天以上(明顯較晚)出現的次數最少,其餘平年差 階級出現的次數幾乎相同,也表示說近十年以來櫻花早開的情況比晚開的情況 容易發生。

綜合上述,2010 年到 2019 年當中,櫻花早開最明顯的年為 2013 年以及 2018 年,其 他櫻花早開日偏多的年為 2010、2014、2015、2016、2019,早開年總共 7 個;晚開最 明顯的年為 2012 年,晚開日偏多的年為 2011、2017,晚開年總共 3 個。

244


問題 2:找出預測誤差最少與最多的年。 ➢

儀表板分析:6.2.7

透過 6.2.7 WeatherMap 預測誤差,點選左上角年份篩選器來選擇不同年份,看看每 一年預測誤差天數。 i.

2014 年所有官署每次預測的平均絕對誤差(MAE)在 1.3~2 之間,全部 6 次預 測誤差皆在 3 天以內的官署共有 26 個。看到右邊的群組長條圖可以發現 2014 年的長條較少,也就是有較多預測誤差為 0,另外還可以觀察到 2014 年預測誤 差超過 3 天以上的集中在第四次預測。

ii.

2015 年所有官署每次預測的平均絕對誤差(MAE)在 1.2~2.4 之間,全部 6 次 預測誤差皆在 3 天以內的官署共有 31 個。看到右邊的群組長條圖,2015 年長條 數量比 2014 年多,不過長條較集中在誤差 3 日以內,因此 6 次預測誤差皆在 3 天以內的官署比 2014 年多 5 個,另外可以很明顯看到 2015 年當中長野和德島 這兩個官署的預測誤差比其他官署大很多。

iii.

2013 年所有官署每次預測的平均絕對誤差(MAE)在 0.7~7.7 之間,全部 6 次 預測誤差皆在 3 天以內的官署只有 1 個。看到右邊的群組長條圖可以發現幾乎 所有的長條都是負值,也就是預測的日期比實際上晚。另外還有一點很有趣, 2013 年第 6 次預測的平均絕對誤差(MAE)是 0.7,表面上看似是這幾年當中預 測誤差最小的一次,但其實是因為 2013 年是極端早開年,在 39 個官署當中有 245


28 個官署在第 6 次預測之前就已經開花了,有進行到第 6 次預測的官署只有 11 個,而這 11 個官署當中有 8 個預測誤差為 0,因此導致 2013 年第 6 次 MAE 的 值是這幾年當中預測誤差最小的一次。 iv.

2018 年所有官署每次預測的平均絕對誤差(MAE)在 1.6~6.4 之間,全部 6 次 預測誤差皆在 3 天以內的官署只有 2 個。看到右邊的群組長條圖可以發現 2018 和 2013 年很像幾乎所有的長條都是負值,也就是預測的日期比實際上晚。

v.

預測誤差最多的 2018 和 2013 年,同時也是 2010 年到 2019 年當中櫻花最明顯早 開的兩個年。

綜合上述,2010 年到 2019 年當中,預測誤差最少的年為 2014 年,其次是 2015 年。 預測誤差最多的年為 2013 年,其次是 2018 年。

246


問題 3:舉例將賞櫻資料分析實際應用到賞櫻旅遊規劃。 兔兔明年 4 月清明連假預計去日本賞櫻,因此在尋找可以看到很多櫻花樹、免 費觀賞、又能夠賞夜櫻的地點,讓我們使用日本賞櫻資料分析提供兔兔一些建議吧! ➢

儀表板分析:6.2.1、6.2.2、6.2.3、6.2.4

i.

首先透過 6.2.4 WeatherMap 基本資料,看看歷年哪些地區是 3 月底到 4 月初(清 明連假前幾天)開花。左上角篩選器選擇年份,地圖下方時間軸拉到 3 月底到 4 月初的區間,看歷年結果顯示,選擇早開年與晚開年都差不多會開花的地區為 佳 ,地區決定是關東甲信、東海北陸地區。

247


ii.

再來透過 6.2.2 Weathernews 開花日,進一步挑選出開花日在 3/28~4/2 的百選賞 櫻景點。年份篩選 2019(一般早開年)做為參考,地區選擇篩選器選甲信北陸 東海、關東,開花日輸入 2019/3/28~2019/4/2 ,點選 府縣分類分散開來。

248

,可以讓紅色長條依照


這邊所篩選出來的百選景點利用檢視表索引標籤下的同步交叉分析篩選器,同步到 6.2.1 Weathernews 基本資料

iii.

接下來透過 6.2.1 Weathernews 基本資料,根據兔兔所找的景點條件(有很多櫻 花樹、免費觀賞、能賞夜櫻)做篩選。入園費篩選器選「無」 ,夜櫻燈篩選器選 有,地圖上 6 個點當中,櫻花樹最多的景區為櫪木的太平山県立自然公園以及 新瀉的高田公園。

最後再透過 6.2.3 Weathernews 歷年開花日折線圖看看櫪木的太平山県立自然公園以 及新瀉的高田公園歷年的開花日。地區選擇篩選器選甲信北路東海、關東, 滑鼠放 在櫪木以及新瀉上看看兩個景點歷年的開花日,太平山県立自然公園一般的早開年 大部分是在 3 月底開花,而高田公園大部分是在 4 月初以後才開花,所以比較適合 兔兔的賞櫻景點為櫪木的太平山県立自然公園。

249


綜合上述,根據兔兔要去賞櫻的時間(4 月清明連假) ,以及其他景點條件(有很多 櫻花樹、免費觀賞、能賞夜櫻),透過 PowerBI 整理出來的 Weathernews 以及 WeatherMap 資料,比較了歷年開花日以及篩選的結果,最後比較推薦給兔兔的地點 為櫪木的太平山県立自然公園。

七、 結語 本範例整理了 Weathernews 以及 Weather Map 官網上公布之歷年日本櫻花開花 的相關資料,透過 PowerBI 與 Tableau 把這些資料視覺化,原本網頁上那些不會動的 密密麻麻的數據搖身一變成為互動式的圖表,不僅讓歷年開花日狀況一目瞭然,還 讓使用者能夠一邊參考歷年櫻花開花資料,同時篩選出下次旅遊時較適合的賞櫻日 以及地點。雖然篩選的結果不是專業的櫻花預測,但是經過 PowerBI 彙整與視覺化 後,近十年以來的資料在短時間內即可看出重點,讓自己能夠更了解歷年來日本櫻 花開花的狀況。

250


八、 參考資料 ➢

Weathernews

1. 賞櫻百選歷年開花日 https://docs.google.com/spreadsheets/u/1/d/1n8zk1mwaAhlfUCimqYTjlGepNsoEZFOooCN0SP0q-Q/pubhtml?widget=true#gid=0 2. 賞櫻百選基本資料 http://weathernews.jp/s/sakura/spot/3/ ➢

Weather Map

3. 櫻花開花日 2019 https://sakura.weathermap.jp/ 4. 歷年開花日 https://kishojin.weathermap.jp/topics/201901sakura.php 5. 歷年預測日差 https://sakura.weathermap.jp/result2018.php

251


252



Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.