Data Science
目錄
目錄
02
前言
04
籌辦單位 主辦單位 / 協辦單位 / 贊助企業
05
工作人員
06
總議程表
08
演講議程表
12
資料分析上手課程 課程介紹 / 課程表
18
g0v 黑客松 g0v 黑客松介紹 / 時程表
21
會場地圖
22
籌辦單位簡介 主辦單位 / 協辦單位 / 贊助企業
1
前言
關於本年會 台灣資料科學愛好者年會由一群愛好資料科學的同好們共 同舉辦,宗旨為推廣資料科學的認知、技術及應用,議題 將包含資料科學的各個層面,例如數理統計、資料視覺 化、資料處理及計算、資料儲存以及各領域裡的資料分析 應用等等,內容包羅萬象,期待能透過演講、課程及心得 分享等各種形式,將我們對於資料科學的熱情傳達給大 眾,一起來探索資料科學的潛力,將資料科學引入每個人 專業領域之中。
在兩天的會議中,我們將安排各產學領域中長期進行 / 推 動資料分析的先進來與聽眾分享資料科學的趣味、價值、 以及應用方式,也安排兩天的資料分析上手課程,幫助尚 在門外的資料科學愛好者快速上手。同時,我們將共同協 辦 g0v 零時政府黑客松,讓年會參與者也能觀摩 g0v 零時 政府長期以來為推動資訊透明化所做的努力及成績。
我們期待能夠讓資料分析在台灣不再是口號,而是大家手 邊隨時可用來解決問題及創造價值的工具。 2
前言
今年主軸 2014 台灣資料科學愛好者年會議程三軌並行,包含演講議程、資料分析上手 課程,以及 g0v 零時政府黑客松。
演講議程 : 我們邀請來自四方八方的資料科學家,與聽眾分享他們第一手的資 料分析經驗。我們的特點是,這些演講並不是宣揚資料分析即將帶來什麼好 處,而是告訴聽眾資料分析已經協助講者解決哪些問題以及創造多少價值。
上手課程 : 我們安排整整兩天的資料分析上手課程,帶領未入門者以 R 語言進 入資料科學的領域。
g0v 黑客松 : 我們協辦 g0v 零時政府黑客松,促進資料科學與開放資料 (Open Data) 的交流及結合。我們預期這樣的演講並不是宣揚資料分析處即將帶來什 麼好處,而是告訴聽眾資料分析已經幫助講者解決什麼問題。
我們相信不論你從事的是資訊科技、商業、金融業、公共行政、醫療、教育, 或只是對於「資料科學」的潛力感到好奇,必定可以從本年會得到對於資料科 學更進一步的認識。
3
DSC 2014
籌辦單位
籌辦單位 主辦單位 台灣資料科學愛好者協會籌備處
中華民國計算語言學學會
協辦單位 中央研究院資訊科學研究所
中央研究院資訊科技創新研究中心
中央研究院統計科學研究所
工業技術研究院巨量資訊科技中心
中華機率統計學會
Intel- 臺大創新研究中心
Taiwan R User Group
g0v 零時政府
贊助企業 1. 鑽石級
有的放矢行動行銷股份有限公司
2. 白金級
宇匯知識科技股份有限公司 精誠軟體服務股份有限公司 遊戲橘子數位科技股份有限公司 願境網訊股份有限公司 ?
網頁設計贊助
走著瞧股份有限公司 unfold
茶水贊助
琅茶 wolf
tea
媒體伙伴 癮科技
Inside
iThome
泛科學
TechNews
TechOrange
沃草
4
工作人員
工作人員 年會總召 陳昇瑋 / 中央研究院資訊科學研究所 課程召集 吳齊軒 / 台灣大學電機工程學研究所、Taiwan R User Group 課程召集 謝宗震 / 清華大學統計學研究所 行銷、行政 杜彥蓁 ( Erin ) 公關、會計 林宛瑩 ( Wendy ) 出納 洪雅瑄 資料組 王澤浩 ( 鮭魚 ) 網站組 康傑 網路支援 線路組 場務組 Zac ( 組長 ) Panmike 丞相 玠含 岱霖 賴佳宏
許懷中 ( 組長 ) Randy 余采蓉 林志昇 張家綺 蔡宗翰
羅經凱 ( 組長 ) Sophia Chiang 吳文心 林洧伊 莊馨儀 黃玟菁
Ning Chen 小企鵝 許之凡 阿傑 曾書庭 黃韋程
5
演講議程 / 國際會議廳 資料分析上手課程 / 第二會議室 g0v 黑客松 / 第一會議室
總議程表 8/30 第一天
演講議程
資料分析上手課程
08:00–09:00
報到
09:00–09:15 (15 mins)
開幕式
09:15–10:20 (65 mins)
Big-data analytics: challenges and opportunities
10:20–10:50
茶點與交流時間
10:50–11:35 (45 mins)
致詞貴賓:陳銘憲 (Ming-Syan Chen), 中央研究院資訊科技創新中心主任
林智仁 (Chih-Jen Lin), 國立臺灣大學資訊工程學系特聘教授
資料、社群、大協作 - 零時政府的數位 革命 高嘉良 (Chia-Liang Kao), g0v.tw 台灣零時政府共同創辦人
11:35–12:20 (45 mins)
讓你 Z > B 的資料科學
12:20–13:40
午餐
13:40–14:25 (45 mins)
14:25–15:10 (45 mins) 15:10–15:40 15:40–16:25 (45 mins)
16:25–17:10 (45 mins)
劉嘉凱 (Chia-Kai Liu), 御言堂總經理
Collaboration with Statistician? 矩陣視 覺化於探索式資料分析 陳君厚 (Chun-Houh Chen), 中央研究院 統計科學研究所研究員兼副所長 行動廣告與大數據資料分析策略與執行 趙國仁 (Craig Chao), Vpon 行動數據科 技數據科學家
上手課程 R 語言基礎 (1) 廖尹禎 (DBoy), 研究助理 孫玉峰 (Summit Suen), 中央研究院統計科學研 究所研究助理
18:30–20:30
6
黑客松
上手課程 R 語言基礎 (2) 廖尹禎 (DBoy), 研究助理 孫玉峰 (Summit Suen), 中央研究院統計科學研 究所研究助理
黑客松
茶點與交流時間 健康資料分析與應用 潘美連 (Mei-Lien Pan), 台灣醫學資訊學 會祕書長 資料科學於預防醫學之應用
R 語言資料處理
劉家宏 (Chia-Hung Liu), 華聯生物科技 股份有限公司研發部副理
陳嘉葳 (Jiawei), 電子商務軟體工程師 林鉦育 (aha), 銀行專員
17:10–17:55 (45 mins)
g0v 黑客松
野生動物喜歡住哪裡?探討野生動物與 棲地關係 林大利 (Da-Li Lin), 特有生物研究保育中心助理研究員 講師及 VIP 晚宴 ( 邀請制 )
黑客松
總議程表
8/31 第二天 08:40–09:15 09:15–10:20 (65 mins) 10:20–10:50 10:50–11:35 (45 mins)
11:35–12:20 (45 mins)
12:20–13:40
13:40–14:25 (45 mins)
14:25–15:10 (45 mins)
15:10–15:30
演講議程
資料科學在 Whoscall 產品體系中的角色 郭建甫 (Jeff Kuo), Gogolook 走著瞧公司創辦人兼執行長 高義銘 (Yimin Kao), Gogolook 走著瞧公司資料科學家 茶點與交流時間 天氣 / 氣候大數據的應用與展望 彭啟明 (Chi-Ming Peng), 天氣風險管理 開發公司總經理 一個賭徒的告白:從預測市場看金融 交易 吳牧恩 (Mu-En Wu), 東吳大學數學系助 理教授
R 語言資料分析 謝宗震 (Johnson), 清華統計所博士後研究員
黑客松
趙致平 (George), 工程師 / 資料分析員
午餐 從 2013 社群網絡活動看台灣社會發展 趨勢
R 語言資料視覺化 (1)
呂俊宏 (Enrico Lu), 資訊工業策進會創 新應用服務研究所研究顧問
陳奎銘 (Ben), 普生股份有 限公司研發工程師
從社群資料來看工人 ( 群眾 ) 智慧與人 工智慧的結合 洪進吉 (Gene Hong), 台灣數位文化協 會顧問
郭孟坤 (Mansun), 趨勢科技資深工程師
黑客松
鍾岳軒 (Kyle Chung), 工程師
茶點與交流時間
黃孝文 (Norman), Yahoo! Taiwan Senior Data Engineer 林于聖 (Jason Lin), Yahoo! Taiwan Senior Data Engineer
16:15–17:00 (45 mins)
g0v 黑客松
報到
天下武功唯快不破:利用串流資料實 做出即時分類器和即時推薦系統 15:30–16:15 (45 mins)
資料分析上手課程
讓數字說話:資料的公益責信應用 余孟勲 (Meng-Hsun Simon Yu), 台灣公 益責信協會發起人兼理事長
17:00–18:00 (60 mins)
g0v 黑客松成果展示
18:00–18:15 (15 mins)
閉幕式
R 語言資料視覺化 (2) 陳奎銘 (Ben), 普生股份有 限公司研發工程師 郭孟坤 (Mansun), 趨勢科技資深工程師
黑客松
鍾岳軒 (Kyle Chung), 工程師
7
演講議程表
全體活動 邀請演講
8/30 第一天
演講議程
08:00–09:00
報到
09:00–09:15 (15 mins)
/ 國際會議廳 / 國際會議廳
全體活動 開幕式
致詞貴賓:陳銘憲 (Ming-Syan Chen) 陳銘憲教授 1982 年畢業於臺灣大學電機系,1984 年赴美國密西根大學安那 堡分校就讀電機資訊工程系,於 1988 年獲得博士學位。其後,便加入 IBM 在 紐約州之 Thomas J. Watson Resarch Center 擔任 Research Staff Member。 1996 年返回任教於臺灣大學電機系,曾任副教授、教授、以及電信工程學研究所所 長。現任中央研究院資訊科技創新研究中心特聘研究員兼主任,並為臺灣大學 電機系特聘教授及中興大學講座教授。陳教授的研究領域為資料庫、資料探勘 和網路多媒體技術,已發表 300 餘篇學術論文,並有 20 餘件國際專利。其 在資料探勘與 Web 行為模式分析之數篇論文為 ISI 之高引用數論文。陳教授 在 IBM 之研究成果被該公司用於主要資料庫產品中,並獲得 IBM Outstanding Innovation Award 及數個 Patent Award 之肯定。返國後曾獲得教育部學術獎、 國科會傑出研究獎、東元獎、潘文淵研究傑出獎、中華民國資訊學會資訊榮譽 獎章、李國鼎穿石研究獎等獎項,亦被國際上之學術組織選為 ACM Fellow 和 IEEE Fellow。
09:15–10:20 (65 mins)
全體活動 Big-data analytics: challenges and opportunities 場次主持:陳銘憲 ( 中央研究院資訊科技創新研究中心 )
林智仁 (Chih-Jen Lin), 國立臺灣大學資訊工程學系特聘教授 林智仁教授畢業於台大數學系,之後前往美國密西根大學獲得碩士與博士學 位。他的研究團隊多年來致力於機器學習之相關研究,所發展的資料分類軟體 在世界上被廣泛使用,是台灣計算機科學界突出的重要成果。 10:20–10:50 10:50–11:35 (45 mins)
茶點與交流時間 邀請演講 資料、社群、大協作 - 零時政府的數位革命 場次主持:方新舟 ( 誠致教育基金會 )
高嘉良 (Chia-Liang Kao), g0v.tw 台灣零時政府共同創辦人 喜歡寫程式、泡湯。參加 1997 年國際資訊奧林匹亞後,進入台大資訊系就讀, 即活躍於國內外開放源碼社群,隨後旅居英國倫敦從事軟體開發及顧問工作。 現為美商 Socialtext Inc. 及台灣工業技術研究院軟體開發顧問。2012 年發起 g0v.tw 台灣零時政府。 11:35–12:20 (45 mins)
邀請演講 讓你 Z > B 的資料科學 場次主持:曾新穆 ( 成功大學資訊工程學系 )
劉嘉凱 (Chia-Kai Liu), 御言堂總經理 劉嘉凱 (CK) 曾經在美國從事產業分析與商業顧問諮詢工作多年,目前任職於 御言堂,提供企業資料分析顧問服務。他積極參與 Code for Tomorrow,並負責 「資料科學計畫」的課程研發工作。他目前關注群眾智慧、開放資料與開放發 展,不定時會將個人想法分享於〈城市格局〉部落格。
8
12:20–13:40
午餐
13:40–14:25 (45 mins)
場次主持:李育杰 ( 台灣科技大學資訊工程學系 )
邀請演講 Collaboration with Statistician?
陳君厚 (Chun-Houh Chen), 中央研究院統計科學研究所研究員兼副所長 美國加州大學洛杉磯分校數學博士,專長為 Bioinformatics, Data / Information Visualization, Dimension Reduction。 14:25–15:10 (45 mins)
邀請演講 行動廣告與大數據資料分析策略與執行 場次主持:陳維超 (Skywatch)
趙國仁 (Craig Chao), Vpon 行動數據科技數據科學家 趙國仁是 Vpon 行動廣告科技的數據科學家,中山大學資管系、資管所畢業, 並於 2006 年取得臺大商研所博士學位。曾創立台灣第一個中文 BBS 系統、發 展全球第一套中文套裝搜索引擎,以及創立龍捲風科技。在加入 Vpon 之前, 在國立高雄應用科技大學擔任專任助理教授,曾發表數十篇國際期刊與研討會 論文,並通過 20 項以上發明專利,喜歡創新、整合性資料分析與探索性研究。 15:10–15:40 15:40–16:25 (45 mins)
茶點與交流時間 邀請演講 健康資料分析與應用 場次主持:陳君厚 ( 中央研究院統計科學研究所 )
潘美連 (Mei-Lien Pan), 台灣醫學資訊學會祕書長 潘美連 2001 年畢業於陽明大學公共衛生研究所,取得碩士學位;2013 年取得 博士學位。目前是台灣醫學資訊學會秘書長,並曾經在 2009-2013 年擔任台灣 健康產業整合協會秘書長,也是該會的創會秘書長,積極參與各項醫學資訊的 推廣與研究工作。她同時也是台北護理健康大學兼任助理教授,主要教授醫學 資訊概論、健康照護資料處理、資料倉儲等課程。主要研究興趣包含健康照護 資料處理與分析、醫學資訊與標準、公共衛生。 16:25–17:10 (45 mins)
邀請演講 資料科學於預防醫學之應用 場次主持:何孟如 ( 中央研究院生物多樣性中心 )
劉家宏 (Chia-Hung Liu), 華聯生物科技股份有限公司 研發部副理 畢業於台大生醫電子與資訊學研究所,目前於華聯生技擔任數據分析部門主 管,進行高通量分析流程及軟體開發,於元智大學資工系擔任兼任助理教授, 曾於美國麻省理工與哈佛博德研究所、歐洲分子生物實驗室及中研院使用資料 科學方法進行疾病研究、檢測標記開發及新藥開發。 17:10–17:55 (45 mins)
邀請演講 野生動物喜歡住哪裡?探討野生動物與棲地關係 場次主持:陳昇瑋 ( 中央研究院資訊科學研究所 )
林大利 (Da-Li Lin), 特有生物研究保育中心助理研究員 國立臺灣大學森林環境暨資源學系碩士,目前於特有生物研究保育中心服務, 擔任自然保育季刊編審及泛科學專欄作者。主要研究鳥類、森林、野生動物棲 地以及生物的空間分布。目前嘗試以公民科學方式蒐集大空間範圍的生物分布 資料。出門一定要帶書、會對著地圖發呆很久、算清楚自己看過幾種鳥,是個 龜毛的讀者,認為龜毛是科學寫作的美德。 18:30–20:30
講師及 VIP 晚宴 ( 邀請制 )
9
DSC 2014
演講議程表
8/31 第二天
演講議程
08:40–09:15
報到
09:15–10:20 (65 mins)
場次主持:陳昇瑋 ( 中央研究院資訊科學研究所 )
全體活動 資料科學在 Whoscall 產品體系中的角色
郭建甫 (Jeff Kuo), Gogolook 走著瞧公司創辦人兼執行長 郭博士與鄭勝丰、宋政桓一同創立走著瞧 (Gogolook) 公司,目前擔任 WhosCall 開發團隊執行長。曾就讀於成大工業設計學系,畢業於清華大學工業工程研究 所,其專精領域為產品設計與使用者經驗研究。專業經歷為德國 Heinz Nixdorf Institute 研究員、先構技研 ( 股 ) 公司共同創辦人、安通國際 ( 股 ) 公司新事業 發展總監等。 高義銘 (Yimin Kao), Gogolook 走著瞧公司資料科學家 目前為走著瞧 (Gogolook) 公司數據分析科學家,畢業於美國北卡州立大學統計 系。專業研究領域包含統計分類與分群方法、貝氏模型和空間統計。應用於電 腦病毒封包偵測、基因關聯檢測和預測颶風路徑等。以散播音樂和歡樂為人生 志向。 10:20–10:50 10:50–11:35 (45 mins)
茶點與交流時間 邀請演講 天氣 / 氣候大數據的應用與展望 場次主持:劉嘉凱 ( 御言堂 )
彭啟明 (Chi-Ming Peng), 天氣風險管理開發公司總經理 全台第一間民間氣象公司「天氣風險管理開發股份有限公司」擔任總經理,任 職大愛新聞 氣象主播、中廣氣象達人節目主持人、中央、文化大學兼任教授、 環境保護學會 秘書長、OPEN DATA 聯盟會長。學術專長有天氣風險管理、大 氣化學、氣象數位媒體製作行銷與環境教育。 11:35–12:20 (45 mins)
邀請演講 一個賭徒的告白:從預測市場看金融交易 場次主持:何淮中 ( 中央研究院統計科學研究所 )
吳牧恩 (Mu-En Wu), 東吳大學數學系助理教授 從數理專業轉向資訊工程,近年著重於金融資料分析、博弈理論、預測市場等 研究。曾就讀於清大數學系、交大應數所,2009 年畢業於清華資工研究所。 喜愛探討期權交易知識、熱衷操練鐵人三項。另一身份為幣圖誌專欄〈謀權奪 利真英雄〉作家-牧清華。 12:20–13:40 13:40–14:25 (45 mins)
午餐 邀請演講 從 2013 社群網絡活動看台灣社會發展趨勢 場次主持:李怡志 ( 網路媒體工作者 )
呂俊宏 (Enrico Lu), 資訊工業策進會創新應用服務研究所研究顧問 畢業於國立臺灣大學建築與城鄉研究所,為資訊工業策進會創新應用服務研究 所資深工程師。專長為巨量資料、知識管理技術、網路服務技術、軟體研發組 織管理、自然語言處理。
10
演講議程表
14:25–15:10 (45 mins)
邀請演講 從社群資料來看工人 ( 群眾 ) 智慧與人工智慧的結合 場次主持:許永真 ( 台灣大學資訊工程學系 & Intel- 臺大創新研究中心 )
洪進吉 (Gene Hong), 台灣數位文化協會顧問 洪進吉 ( 食夢黑貘,Gene Hong),「部落格觀察」站長、台灣數位文化協會顧 問,協助架設「莫拉克民間災情網路中心」,亦建立「林克傳說」語意與資料 探勘等相關 Big Data 系統。主要專長是高有效性系統與高效能運算,以及行為 預測等資料探勘,社群行為與語意網路等研究。曾任職於下面公司顧問與工程 師做資料研究 : 網研 ( 魅力站 )、博客來、聯絡家 (Linkist)、網祿 ( 花蝶 )、創市 際 (ARO)、學思行 (Tazze)、資策會、EZPrice、潮網等公司。 15:10–15:30 15:30–16:15 (45 mins)
茶點與交流時間 邀請演講 天下武功唯快不破:
利用串流資料實做出即時分類器和即時推薦系統 場次主持:蔣居裕 (Etu)
黃孝文 (Norman), Yahoo! Taiwan Senior Data Engineer 熱愛透過資料的分析,找出其中隱藏的模式及可運用的知識,對解讀與詮釋資 料模型深深著迷。目前任職於 Yahoo! 奇摩,致力於從電子商務平台上混雜的行 為脈絡,經由分析消費者的購買偏好、商品特性及其交互影響的關係,在購物 過程中提供消費者即時且適合的推薦商品。 林于聖 (Jason Lin), Yahoo! Taiwan Senior Data Engineer 對於新技術科技都有特別的熱誠,喜歡寫程式,新科技,組裝 3D 印表機,對 於資料挖掘非常有興趣。在 Yahoo 擔任資料工程師,致力於設計架構平台,也 分析使用者在網站上的行為,研究商品,網站,使用者之間的關聯及影響性。 在資訊爆炸的時代 , 如何將繁雜的資料抽絲剝繭 , 當使用者瀏覽時 , 能精準預測 準確且即時地推薦使用者所需要的商品。 16:15–17:00 (45 mins)
邀請演講 讓數字說話:資料的公益責信應用 場次主持:江彥生 ( 香港中文大學社會系 )
余孟勲 (Meng-Hsun Simon Yu), 台灣公益責信協會發起人兼理事長 木柵大學畢業,不熱衷賺錢的 finance major,曾就任會計師事務所查帳員,每 年考績第一名卻離職跑去環島及擔任志工。到鹿特丹唸 MBA 時,以背包客的 方式遊歷十三國,學習從脈絡看人生。想要用更有效率的方式改變世界,發起 台灣公益責信協會,投入公益團體財務透明及治理能力基礎建設。擅長思考傾 聽說話寫字及教導,喜歡動手解決問題介入現實。 17:00–18:00 (60 mins) 18:00–18:15 (15 mins)
全體活動 g0v 黑客松成果展示 場次主持:高嘉良 (g0v) 全體活動 閉幕式
11
資料分析上手 課程 課程介紹
面對龐大與多元的資料浪潮,資料科學世代已經興起,近 年來國外企業應用 R 語言進行資料分析已經相當成熟, 包含 Google, Facebook, Agoda, Intel, Pfizer, Bank of America 等企業,都採用 R 語言進行資料分析。國際知名 的 KDnuggets 論壇最新統計,R 語言已經連續三年獲得資 料科學家採用資料分析語言第一名的殊榮。 在眾多的資料分析工具中,R 語言在統計分析上最為知 名,除了具備物件導向的開發環境、擁有強大的資料視覺 化能力、更有支援跨平台與免費等優勢,R 語言專注在資 料分析上的特性,使它已經成為目前資料分析和繪圖的主 流軟體之一。 本年會的「資料分析上手課程」將帶領有志成為資料科學 家,參與本年會的朋友們,透過 R 語言進入資料分析的 殿堂。 課程首先介紹 R 常使用的基礎語言,接著引導學員們從 真實生活中發想問題,針對問題去進行資料收集、萃取、 清理,最後以資料視覺化與統計去探討資料的涵義。課程 12
資料分析上手課程
中將由來自中研院、清華大學、露天拍賣、趨勢科技、普生和玉山銀行等 9 位 產界與學界的講師聯手出擊,除了豐富的教學與互動,更要讓大家體驗資料科 學中跨界的精采。 「資料分析上手課程」除了基礎內容之外,課程中也精心安排一連串處理結構 化、半結構、非結構化的資料處理技巧。第一天課程內容包含基本語法、資料 輸入、資料型態、流程控制、套件教學、資料轉換、資料整併、資料爬取等項 目。第二天課程內容則包含資料探索、統計推論、機器學習、基本繪圖、進階 繪圖、報表展現等項目。課程核心囊括撰寫網頁爬蟲程式、運用 R 語言將新 聞進行斷詞、各項非結構化資料轉結構化資料的解決方案。課程也精心安排各 項實作,課程中講師會引導學員以 R 語言建立各項圖表與報告,協助學員在 未來能立即將 R 語言整合到自己的工作之中。為使得課程進行順利,也請學 員詳讀課前須知,並完成各項環境準備。 課程目標 3 快速熟悉 R 語言 3 學會利用 R 語言 進行資料分析 3 體驗資料科學的基本流程 3 利用 R 語言建立 reproducible 圖表和報告 13
DSC 2014
資料分析上手課程
課前須知
本課程著重於上課中的操作,為了達到最佳的學習效果,請學 員參加前做好以下的準備 ( 兩種方案擇一 ): 1. 基礎課程(自備筆電並安裝以下工具): 3 R-3.1.0 以上版本 (http://cran.rstudio.com/) 3 Rstudio IDE (http://www.rstudio.com/products/rstudio/) 3 課程教材套件 DSC2014Tutorial。 請依照套件說明網頁的指示進行安裝。有任何問題歡迎到 Issue 區回報錯誤訊息,我們會儘快回覆。 3 安裝可以瀏覽投影片的瀏覽器(建議使用 Firefox http://mozilla.com.tw/firefox/new/) 2. 進階課程:自備筆電並依照虛擬環境建置說明網頁: (https://github.com/taiwanrusergroup/R_Tutorial_Vagrant) 的方 法安裝我們準備的虛擬機器
課程大綱
1. 基礎教學 基礎教學課程主要提供無程式開發經驗的學員,藉由課程瞭 解 R 語言的基本操作,包含基本與常用的語法、資料的輸入 方式、各種資料型態與程式語言基本流程控制。本階段課程 目標將協助學員對於 R 語言有初步的認識,並對程式語言有 基本的概念。 基本語法 / 資料輸入 / 資料型態 / 流程控制 2. 資料 ETL ETL 為萃取 (Extract)、轉換 (Transform)、讀取 (Load) 縮寫, 是一種常見的資料流動轉換的過程。ETL 課程主要提供已具 備 R 語言基礎的學員,藉由課程瞭解資料收集、轉換、整併 的過程,課程中包含各類的套件介紹、資料爬取的方法、資 料的各種轉換技巧與各類資料格式整併的方式。本階段課程 目標將協助學員快速進入 ETL 的流程,並瞭解如何運用 R 語 言獲得資料以及整理資料,做進階分析的準備。在第一天的 最後,我們也請社群的嘉葳跟大家分享用 R 抓取網頁資料的 經驗,以及對文字資料做前處理的心得。 套件教學 / 資料轉換 / 資料整併 / ( 進階 ) 資料爬取與前處理
14
資料分析上手課程
3. 資料分析 為了翻動資料並找到其價值,資料分析就顯得相當重要。本 課程提供將要使用 R 語言做進階分析的學員,針對手上的資 料進行深入探討,課程中以「找問題」、「瞭技術」、「動 手做」三階段進行。包含如何探索資料並提出問題,以及各 類分析技術如統計推論、機器學習,最後再以個案實作的方 式,使學員能聚焦學習。本階段課程目標除了協助學員了解 常見的資料分析理論,並協助學員掌握 R 語言資料分析的要 領,一窺資料背後的端倪。 提出問題 / 資料探索 / 統計推論 / 機器學習 / 個案實作 4. 資料視覺化 資 料 的 視 覺 呈 現 是 掌 握 資 訊 的 重 要 關 鍵。 因 此 在 本 課 程 中,我們將協助學員運用 R 語言進行基本繪圖、進階繪圖 (ggplot2),以及透過 R 語言進行各類資料視覺報表的呈現。 基本繪圖和進階繪圖課程時,奎銘與岳軒將先解釋 R 繪圖功 能的基礎邏輯,再依據使用經驗跟學員們細解各種畫圖指令 的用法。視覺報表的課程中,孟坤會再幫大家複習繪圖的指 令,並且帶著學員們將成果置入報告中。本階段課程目標主 要協助學員運用 R 語言進行資料視覺化與報表製作,藉此提 升學員在資料的展現與溝通能力。 基本繪圖 / 進階繪圖 / 報表展現
15
資料分析上手 課程表
全體活動 上手課程
8/30 第一天
資料分析上手課程
08:00–09:00
報到
09:00–09:15 (15 mins)
09:15–10:20 (65 mins)
全體活動 開幕式
致詞貴賓:陳銘憲 (Ming-Syan Chen) 全體活動 Big-data analytics: challenges and opportunities 場次主持:陳銘憲 ( 中央研究院資訊科技創新研究中心 )
林智仁 (Chih-Jen Lin), 國立臺灣大學資訊工程學系特聘教授
10:20–10:50 10:50–12:20 (90 mins)
/ 國際會議廳 / 第二會議室
茶點與交流時間 上手課程 R 語言基礎 (1)
廖尹禎 (DBoy), 研究助理 台大經研所畢業。因工作需求,一頭栽進 R 的世界;也是業餘數學愛好者,因 此除了資料分析外,也很喜歡數學與程式的各式應用。 孫玉峰 (Summit Suen), 中央研究院統計科學研究所研究助理 對科學的興趣加上就讀數學系的訓練,使他熱衷於以數學方法建立模型,連結 科學研究與生活大小事。利用數學建模與統計分析進行過生態系統、生物代謝 網路及腦神經科學的研究;近來有感於資料科學正在快速地改變你我的生活, 一頭栽進了資料分析的世界裡。
12:20–13:40
13:40–15:10 (90 mins)
午餐 上手課程 R 語言基礎 (2)
廖尹禎 (DBoy), 研究助理 孫玉峰 (Summit Suen), 中央研究院統計科學研究所研究助理
15:10–15:40 15:40–17:55 (135 mins)
茶點與交流時間 上手課程 R 語言資料處理
陳嘉葳 (Jiawei), 電子商務軟體工程師 TW.R 社員,曾分享使用者手機 app 使用習慣分析與網路新詞探勘等主題,平 常喜歡研究機率圖模型、文字挖掘、搜尋引擎與網路意見挖掘等相關議題,歡 迎大家一起討論交流。 林鉦育 (aha), 銀行專員 熱衷於透過資料找到問題的答案。曾做過利用手機收集公車駕駛行為偵測城市 道路環境。現在對政治與金融議題資料很感興趣,正專注於政治獻金 (GovCash) 及台灣金融統計資料 (TWFS) 兩個專案。
18:30–20:30
16
講師及 VIP 晚宴 ( 邀請制 )
資料分析上手課程表
8/31 第二天
資料分析上手課程
08:40–09:15
報到
09:15–10:20 (65 mins)
場次主持:陳昇瑋 ( 中央研究院資訊科學研究所 )
全體活動 資料科學在 Whoscall 產品體系中的角色
郭建甫 (Jeff Kuo), Gogolook 走著瞧公司創辦人兼執行長 高義銘 (Yimin Kao), Gogolook 走著瞧公司資料科學家 茶點與交流時間
10:20–10:50 10:50–12:20 (90 mins)
上手課程 R 語言資料分析
謝宗震 (Johnson), 清華統計所博士後研究員 Johnson 熱衷利用統計思維幫助各個領域解決問題。在他的眼裡,數字是知識 的原石,透過統計工具的建模與分析,將數字琢磨成有意義的東西,就像文字 一樣具有生命力,述說著一個又一個現實世界的狀況,傳遞重要的訊息。 趙致平 (George), 工程師 / 資料分析員 清大統計所畢業,覺得統計方法應該要有程式語言來實現,目前對於大數據資 料分析方法,進一步改善產業行銷策略等議題有興趣。
12:20–13:40 13:40–15:10 (90 mins)
午餐 上手課程 R 語言資料視覺化 (1)
陳奎銘 (Ben), 普生股份有限公司研發工程師 畢 業 於 陽 明 大 學 生 物 醫 學 資 訊 學 研 究 所, 從 大 三 開 始 接 觸 R 的 世 界, 從 Microarray 到股票投資策略,從訊號分析到社會議題,都曾經試著以 R 摸索過。 目前在業餘的時間,持續以 R 探索這個世界。 郭孟坤 (Mansun), 趨勢科技資深工程師 畢業於政治大學統計研究所,興趣是將資料分析技巧應用在各種有趣的資料 上。曾經做過統計天氣預報系統、便利商店鮮食銷售預測、連鎖咖啡店會員分 析、青少年媒體使用行為調查和人口推估,目前任職於趨勢科技。 鍾岳軒 (Kyle Chung), 工程師 台大經濟研究所畢業,現任職趨勢科技,是個成分亂七八糟的人,目前的志願 是下班時可以搶到 Youbike。對了,喜歡方吉。
15:10–15:30
茶點與交流時間 上手課程 R 語言資料視覺化 (2)
15:30–17:00 (90 mins)
陳奎銘 (Ben), 普生股份有限公司研發工程師 郭孟坤 (Mansun), 趨勢科技資深工程師 鍾岳軒 (Kyle Chung), 工程師
17:00–18:00 (60 mins) 18:00–18:15 (15 mins)
全體活動 g0v 黑客松成果展示 場次主持:高嘉良 (g0v) 全體活動 閉幕式
17
g0v 黑客松
關於 g0v g0v.tw 是一個推動資訊透明化的社群,致力於開發公民 參與社會的資訊平台與工具。2012 年底開始成形,截至 2014 年中已有 30+ 場工作坊、受邀演講 40+ 場、媒體報 導 70+ 次、1000+ 遍佈三大洲的貢獻者,成果皆以自由 軟體模式釋出。
將 gov 以「零」替代成為 g0v,從零重新思考政府的角色, 也是代表數位原生世代從 0 與 1 世界的視野。g0v.tw 以 開放原始碼的精神為基底,關心言論自由、資訊開放,寫 程式提供公民容易使用的資訊服務。資訊的透明化能幫助 公民更確實了解政府運作、更快速了解議題,不被媒體壟 斷,也才可有效監督政府,化為參與行動最終深化民主體 質。
關注後續活動 請至台灣零時政府網站:g0v.tw
18
g0v 黑客松
g0v 黑客松 黑客松是兩個英文字的組合,hack marathon,簡稱為 hackathon。就是一群工 作者,在一個時空裡面(通常是一天到兩天),進行馬拉松式的協作活動。在 密集的時間、空間,大家把自己的腦力、體力全部貢獻在某個專案上面。
g0v 社群從 2012 年 12 月舉辦第零次黑客松,維持兩個月一回合的節奏,從 資訊人為主的社群出發,一開始便吸引不同專業的公民,並逐漸擴展至 NGO 與不同層級的公部門。產出成果包括了資訊透明、監督政府、跟新媒體的各種 資訊平台、推動開放資料(民間開放資料集及相關 API)、協力 NGO 運動、 提出政策建議、開設教學課程等。實體黑客松活動配合線上協作的虛實合一工 作方式,也促進了開放資料應用的想像,建立跨界協力的新模式。
活動形式 提出問題,討論解決方案,並將應該開放給社會大眾的資訊爬梳整理、建立 API,開發應用,提供不同議題、團體使用。也歡迎公民團體提出想法,找出 新的資訊應用。
如果手邊已經有正在進行的計畫,或期待某些功能的服務,上台作個三分鐘的 簡報,找幾個志同道合的夥伴組隊,然後開始 hack! 歡迎帶著自己的專案來尋 覓協作夥伴,資料爬梳、製作網站、懶人包、圖文創作、新媒體軟硬體、政策 建議共筆等。 19
g0v 黑客松時程表 8/30 第一天
g0v 零時政府黑客松
08:00–09:00
報到
09:00–09:15 (15 mins)
09:15–10:20 (65 mins)
全體活動 開幕式
全體活動 Big-data analytics: challenges and opportunities 場次主持:陳銘憲 ( 中央研究院資訊科技創新研究中心 )
林智仁 (Chih-Jen Lin), 國立臺灣大學資訊工程學系特聘教授 茶點與交流時間 黑 客 松 提案及自我介紹
12:20–13:40 13:40–15:10
午餐 黑 客 松 黑客松
15:10–15:40 15:40–17:55
黑 客 松
致詞貴賓:陳銘憲 (Ming-Syan Chen)
10:20–10:50 10:50–12:20
全體活動
茶點與交流時間 黑 客 松 黑客松
18:30–20:30
講師及 VIP 晚宴 ( 邀請制 )
8/31 第二天
g0v 零時政府黑客松
08:40–09:15
報到
09:15–10:20 (65 mins)
場次主持:陳昇瑋 ( 中央研究院資訊科學研究所 )
全體活動 資料科學在 Whoscall 產品體系中的角色
郭建甫 (Jeff Kuo), Gogolook 走著瞧公司創辦人兼執行長 高義銘 (Yimin Kao), Gogolook 走著瞧公司資料科學家
10:20–10:50 10:50–12:20
茶點與交流時間 黑 客 松 黑客松
12:20–13:40 13:40–15:10
午餐 黑 客 松 黑客松
15:10–15:30 15:30–17:00 17:00–18:00 (60 mins) 18:00–18:15 (15 mins)
20
茶點與交流時間 黑 客 松 黑客松 全體活動 g0v 黑客松成果展示 場次主持:高嘉良 (g0v) 全體活動 閉幕式
/ 國際會議廳 / 第一會議室
會場地圖
3F 媒體室
媒體室
貴賓及 講師 休息室 第二會 資料分
議室
析課程
化妝室
議室 第一會 黑客松
國際會議廳
g0v
演講議程
點心區
報到處
議室
遠距會
wolf
tea
點心區
攤位
化妝室
入口大門
4F 化妝室
用 餐 區
國際會議廳 演講議程
用 餐 區
用餐區 21
DSC 2014
主辦單位簡介
主辦單位 台灣資料科學愛好者協會籌備處 台灣資料科學愛好者協會籌備處由一群愛好資料科學的同好們共同舉辦,宗旨 為推廣資料科學的認知、技術及應用,議題將包含資料科學的各個層面,例如 數理統計、資料視覺化、資料處理及計算、資料儲存以及各領域裡的資料分析 應用等等,內容包羅萬象,期待能透過演講、課程及心得分享等各種形式,將 我們對於資料科學的熱情傳達給大眾,一起來探索資料科學的潛力,將資料科 學引入每個人的專業領域之中。
中華民國計算語言學學會 1988 年台灣舉辦了首次的計算語言學研討會 (ROCLING I),由陳克健、黃居 仁、李錫堅、林一鵬與蘇克毅等五位教授籌備發起。會中凝聚了發起學會的共 識,並推舉最早投入中文電腦研究的謝清俊教授擔任籌備委員會主席與首屆理 事長,在 1990 年正式成立中華民國計算語言學學會。目前本學會有 200 多名 會員,包含 142 位終身會員及 10 個團體會員 ( 包含 3 個永久團體會員)。
學會成立近二十年來主要宗旨一直在於推動計算語言學之研究、推行計算語言 學之應用與發展、促進國內外中文計算語言學之研究與發展與聯繫國際有關組 織並推動學術交流。每年舉辦的 ROCLING 年會是語言學學術界與業界發表與 交流成果的盛會。本學會也定期舉辦計算語言學相關的工作坊及研習營以提高 年輕研究人員對計算語言學的興趣與訓練。
22
主辦單位簡介 / 協辦單位簡介
學會另一個重要的工作項目就是推動中文語言處理資源的分享。發行的語料 庫,文字部分,包含了有標記一千萬詞的中研院漢語平衡語料庫、中文詞庫 ( 八 萬目詞 )、中文語料庫、中文句結構樹資料庫、及中文資訊檢索標竿測試集。 語音方面,包含符合 COCOSDA 格式的國語口語語料庫 (MAT、TCC)、台灣口 音英語語料庫 (EAT)、中文廣播新聞語料庫 (MATBN)、中研院現代漢語對話語 音語料庫 (MCDC) 及北科大電子書語音語料庫 (NTUT-AB01)。
協辦單位 中央研究院資訊科學研究所 中央研究院資訊科學研究所於 1977 年開始設立籌備處,歷經五年籌備, 於 1982 年 9 月正式成立研究所,是中央研究院數理組十一個單位之一。目前編 制內有 39 位研究人員,另外有 29 位博士後研究學者,將近 300 位專任之資 訊技術人員與非全時之研究助理,支援資訊領域之研究與系統之開發。「件件 工作,反映自我,凡經我手,必為佳作」是全體同仁一致秉持的工作信念,重 視工作之卓越品質,發揮最佳綜效之團隊精神。
資訊科學研究所依研究領域共有生物資訊實驗室、電腦系統實驗室、資料處理 與探勘實驗室、多媒體技術實驗室、語言與知識處理實驗室、網路系統與服務 實驗室、程式語言與形式方法實驗室、計算理論與演算法實驗室等八大實驗 室,研究重點包含生物資訊、平行及分散式運算、智慧代理人、文件分析與辨 識、多媒體系統、電腦視覺、影像處理及圖形識別、中文資訊處理、自然語言 理解、電腦通訊與網路、網路內容管理與 XML、網路與軟體安全、形式驗證、 演算法設計與分析、密碼學、機器人學等。
23
DSC 2014
協辦單位簡介
資訊科學研究所除了從事資訊科學領域的基礎研究之外,亦以開發具前瞻性之 尖端技術與發展以應用為導向的最先進系統為職志。身處學術重鎮,資訊科學 研究所認為有責任在國內資訊領域肩負起學術領導地位,提升本國資訊科技水 準,並躋身國際一流學術研究單位。
中央研究院資訊科技創新研究中心 「 資 訊 科 技 創 新 研 究 中 心 」(Research Center for Information Technology Innovation,簡稱 CITI) 的設立在於推展資訊科技的創新及應用,著重於關鍵 性的資訊通訊技術之研發,以及跨領域的資訊科技之整合,以求對現今知識經 濟及服務經濟體系裡的發展有進一步提升的作用,同時也致力於創意發展,為 人力資源儲備能量,維繫並提升我國總體的國際競爭力。
資訊科技創新研究中心目前包含『網格與科學計算』,『資通安全』,『智慧 優網運算』等三個專題中心。網格與科學計算專題中心為全球網格亞洲中心, 肩負亞太地區網格基礎架構維運與擴展、網格相關技術研究、促進亞太區域內 與全球 e 化科學應用研發合作。資通安全專題中心整合了國內各大學及研究機 構的資源與專家學者,目的在於強化我國資通安全之研究與發展,並促成政 府、學術機構以及民間企業間合作管道的建立。智慧優網運算專題中心之研究 涵蓋無線網路、雲端運算、嵌入式系統、多媒體技術、資料探勘,以及相關之 新興應用與創新,希能以創新之資通訊科技在網際網路新世代引領出嶄新而重 要之應用與服務。此外,本中心亦有自由軟體鑄造廠 (OSSF),臺灣創用 CC, Open ID,醫療支援系統,災防管理系統,及社群網路等任務導向研究計畫, 均已有很好之成果。
24
協辦單位簡介
中央研究院統計科學研究所 中央研究院統計科學研究所從事統計科學基礎研究,一方面尊重個人獨立研 究,一方面積極加強所內外合作研究群的建立,以推動跨領域、跨院際的研究 計畫。統計科學研究所目前有 38 位研究人員、22 位博士後研究人員以及 57 位研究助理,行政及資訊支援團隊約 20 人,研究領域涵蓋:
1.
機率論及其應用
2.
數理統計與推論
3.
生物醫學統計、生物資訊、系統生物學與統計遺傳學
4.
功能性腦影像統計分析
5.
教育與行為統計
6.
財務數學
7.
時間序列
8.
空間及環境統計
9.
實驗設計
10. 統計機器學習 11. 統計圖學與訊息視覺化 12. 社會網絡
研究成果多發表在重要的國際學術期刊,研究人員也經常主辦和參與國際學術 會議,進行學術交流。近 3 年共有 202 餘篇文章發表於 SCI 期刊上,同時亦 有 200 餘篇其他研究報告或專書。出版的《中華統計學誌》曾連續 8 年獲得 國科會頒發「傑出期刊獎」,為國際主要統計期刊之一。
25
DSC 2014
協辦單位簡介
工業技術研究院巨量資訊科技中心 面對全球巨量資料(Big Data)時代的來臨,工研院於一○二年五月一日成立 「巨量資訊科技中心」,為國內第一個以推動巨量資料技術與產業為任務的科 技研發中心。在工研院強化系統、軟體與服務研發之宏觀策略之下,期許巨資 中心成為台灣發展巨量資料技術與分析的研究重鎮,並藉由產業應用之方式, 將研究成果技轉至國內廠商,積極促成新創事業,以提升產業加值競爭力。
巨量資料已成為全球資訊及服務的新趨勢,資產價值從過去有形轉變至無形, 「資料」儼然成為企業最重要的資產之一,「資料」將成為資訊經濟時代的新 石油。面對全球化的國際競爭,巨量資料分析將對未來我國產業產生優化,台 灣長期以硬體組裝與生產為主,巨量資料分析技術將可強化我國在製造業,以 及服務業的競爭力。
巨資中心的成立任務有二,其一是建立智慧分析技術,協助資訊軟體業建立知 識經濟核心能力;其二,是切入智慧分析應用,協助相關產業提昇生產力、創 造新商機。巨資中心執行的策略將是善用工研院跨領域整合之優勢,選擇台灣 具獨特優勢之應用領域切入;並結合 Social, Local, Mobile, 智慧聯網 (Internet of Things, IoT), 開放源碼 (Open Source), 開放資料 (Open Data) 等重要趨勢,與 國內外產學研合作,加速帶動技術與產業的發展。
巨資中心技術核心能量將涵蓋跨領域的需求,提供產業所需的智慧分析與機器 學習演算法等核心技術,建構巨量資料及開放資料分析應用所需之運算平台, 以巨量資料之創新應用情境來進行服務設計與商業模式,提供全方位的巨量資 料解決方案。 26
協辦單位簡介
中華機率統計學會 中華機率統計學會 ( 以下簡稱本會 ) 成立於 1992 年 7 月,第一屆理事長周元 燊院士將本會比之為 IMS (Institute of Mathematical Statistics),非官方統計學 學界之組織。主要活動為促進國內機率統計交流活動,增進社會對機率統計的 認識,鼓勵人才培育,如每年例行協辦「南區統計研討會」、兩年一次的「兩 岸海峽兩岸機率與統計學術研討會」、設置「魏慶榮統計論文獎」等,並提供 本會團體會員申請舉辦學術研討會之補助。
本會之任務如下:傳播機率與統計之專業資訊。舉辦研討會以促進會員間之學 術交流,及增進社會對機率與統計新知的認識。承辦公私機構委託研究計劃, 期使機率與統計學理及實之結合。鼓勵並輔導機率與統計專業人員之培養。從 事本會與相關學術團體之交流事項。有助於達成本會宗旨之其他工作。
本會已與日本統計學會 Japan Statistical Society (JSS) 及韓國統計學會 Korean Statistical Society (KSS) 簽訂合作協議,期待推動國內外統計界的交流活動, 提升國家競爭力,對於學術推廣不遺餘力,期待統計界的蓬勃發展。
Intel- 臺大創新研究中心 自從網際網路興起,全球資訊已逐漸地改變人們生活,物聯網(Internet of Things,IoT)以及 M2M(machine-to-machine)感測運算技術已被視為下一波 改善人們生活的指標。想像數以萬計的感測器及電子裝置,在不需人力介入的 情況下,便利的相互連結並交換訊息,藉此提供人們智慧化生活。有鑑於此, 27
DSC 2014
協辦單位簡介
在科技部(前國家科學委員會)協助下,美商英特爾(Intel)公司與國立臺灣 大學(臺大)攜手成立 Intel- 臺大創新研究中心,心致力於研究開發物聯網以 及 M2M 技術。
由於全球資訊已逐漸地改變人們生活,智慧聯網以及 M2M 感測運算技術的需 求與日俱增,已被視為下一波產業發展之趨勢。Intel- 臺大創新研究中心經過 3 年的成長,已有成果產出。該中心將提供技術研發交流平台,與在地的企業 結合,加強整合研究在應用端的串聯,增加產學合作機會,進一步帶領臺灣產 業之創新發展,進而增進人類生活的便利。
Taiwan R User Group R 是 目 前 最 紅 的 Open Source 統 計 語 言, 不 只 對 於 傳 統 的 統 計 檢 定 來 說, 或 對 新 世 代 的 Machine Learning
和 Data
Mining 的許多技術而言,R 都 有很完整的套件支援。因此可 以很快速的在 R 上面運用各種 Machine Learning 的技術來分析 資料。另外,R 也被是在知名 的 Data Mining 網 站 kdnuggets 上,被評選為 2012 年最火紅 的 Data Mining 語言。
28
協辦單位簡介
相信在這個「大資料」時代崛起的「掏資料潮」中,應該也有許多 R 語言可 以大展長才的地方! Taiwan R User Group 是一個讓大家可以討論與交流 R 的 各種使用經驗的地方,希望大家可以來分享一下自己使用 R 的一些經驗或是 在開發 R 套件時所遇到的一些困難與經驗,相信藉由一起交流,一定可以快 速地幫彼此解決遇到的難題,增加彼此使用 R 的流暢度與開發速度。
另外,由於它是 Machine Learning 和 Data Mining 很強大的工具之一,因此聚 會主題也會有很多是聚焦在這兩個領域上頭,如果大家對於這兩個領域有興 趣,想要找同好一起討論或學習,也歡迎來到社群一起聚會 ( 不是用 R 語言來 做 ML/DM 的問題也沒關係 ),社群中有許多很多 ML/DM 的同好會很熱心地幫 助大家!
g0v 零時政府 g0v.tw 是一個推動資訊透明化的社群,致力於開發公民參與社會的資訊平台與 工具。2012 年底開始成形,截至 2014 年初已有 26 場工作坊、受邀演講 30+ 場、媒體報導 20+ 次、500+ 遍佈三大洲的貢獻者,成果皆以自由軟體模式釋 出。
將 gov 以「零」替代成為 g0v,從零重新思考政府的角色,也是代表數位原生 世代從 0 與 1 世界的視野。g0v.tw 以開放原始碼的精神為基底,關心言論自 由、資訊開放,寫程式提供公民容易使用的資訊服務。資訊的透明化能幫助公 民更確實了解政府運作、更快速了解議題,不被媒體壟斷,也才可有效監督政 府,化為參與行動最終深化民主體質。
29
DSC 2014
贊助企業簡介
贊助企業 鑽石級 有的放矢行動行銷股份有限公司 Vpon 威朋,成立於 2008 年,專注在行動裝置的數據分析及行動廣告領域, 憑藉強大的研發技術,及對品牌廣告主的商業拓展能力,Vpon 已服務超過 1,000 家知名品牌,包括:麥當勞、可口可樂、美國運通等,廣告業務涵蓋 750 多個城市,是亞洲地區成長最迅猛的行動廣告 / 行動數據公司。Vpon 並 入選為中國 2014 年《Forbes China 富比士中國》最具潛力中小企業 100 強, 並榮獲第 6 名殊榮。 Vpon 威朋在亞洲擁有超過 3.8 億不重複用戶數,是一相當有利的致勝關鍵。 在超過 1.28 億的月活躍獨立用戶前提下,對於發展行動數據的價值擁有更多 機會和優勢。Vpon 威朋全球研發中心位於台北,亞洲運營總部位於上海,並 在香港等地設有分公司,日本公司也即將正式開展業務。 2014 年 7 月份 Vpon 宣佈完成 B 輪千萬美金投資,投資方包括曾經投資 Facebook 的頂尖金融巨擘,以及亞洲知名資本。Vpon 將以此資金在亞太區積 極擴點,並擴大研發規模,預期將吸引大批國際研發、業務、以及產品技術等 人才加入。 同時,Vpon 威朋執行長吳詣泓亦對外宣佈,將對公司進行重新定位,從大家 熟知的行動廣告業務,更進一步邁向行動數據的領域,重新定義自己為一家 行動數據公司,主要商業模式為行動廣告,未來不排除在廣告以外的行業進 行更多類型商業模式的探索。初期會持續強化在行動廣告的數據價值變現能 力,藉由過去獨家發展的 LBS (Location-based service) 行動廣告、情境廣告 (Scenario-based ad) 的運營經驗,積極發展數據資料與廣告的結合。
30
贊助企業簡介
宇匯知識科技股份有限公司 宇匯知識科技成立於 1997 年,專心致力於概念搜尋及智慧推薦系統技術之研 究與發展;具備堅強實力的研發團隊運用自動分類、概念搜尋、機器學習及自 動配對等自行研發之核心技術發展出三大產品線,包含:「酷比精準廣告平 台」、「智慧型電子商務推薦系統」及「搜尋引擎」。 幾個畢業於台灣大學的年輕菁英在加入「宇匯知識科技」後的感受如下:吳齊 軒表示:「這裡應該是台灣最認真做機器學習的公司之一。」進入職場不到一 年,以初生之犢之姿,以新演算法“PK”現有演算法,一度提升廣告播放成 效 3% 至 5% ,吳齊軒笑說,進入公司至今只有一個字形容,就是「爽」, 他說:「即使我是新人,公司也願意支持我做實驗」。周谷駿附和:「公司需 要很大的勇氣,把重要的事情交在我們這些新人手中」。被主管形容「功力不 凡」的他坦言,一年多來,的確感受自己實力不可同日而語。周谷駿從擔任工 程師的第一天,便主動爭取加入多個專案。他說「多做多學,犯錯沒關係,反 正學到都是我的。」;「犯錯沒關係,把握犯錯所學到的東西,才沒有浪費了 犯錯產生的成本」正是宇匯知識科技創辦人周培林倡導的觀念,周培林說:「我 的願望,就是將公司變成一個學習如何對社會提出貢獻的載體。大家把學習當 目標,用對客戶的貢獻來檢驗自己學習的進度,這樣學得多,貢獻的也多,又 快樂,又成功,一舉數得。」。我們深信「人」是企業的本體;重視且開發公 司人員的素質,正是宇匯最大的特色。
精誠軟體服務股份有限公司 Etu is a Big Data pioneer in providing Big Data solutions that are primarily concerned with how customers to discover, capture and connect the valuable information hidden in the extremely large data sets with simple steps.
31
DSC 2014
贊助企業簡介
At Etu, our mission is to develop Big Data Killer Solutions with Appliances, centered on business development in Taipei and Beijing. Utilizing the Hadoop-related technologies, working closely with all Hadoop distribution and third party tool vendors, our Big Data business is dedicated to providing end-to-end solutions for customers to effectively harness the challenges of large sets of data. With our professionalism and expertise, our core competency in Big Data is to address specific business problems for customers from a diverse set of industries.
遊戲橘子數位科技股份有限公司 Gamania 憑藉著夢想與熱情,專注線上遊戲、多平台數位內容、動畫等數位娛 樂營運、研發。以提供全世界的人們,發現更多生活中的豐富趣味,並持續探 索歡樂的無限可能。 1995 年 Gamania 的前身「富峰群資訊」創立。1999 年發行自製遊戲「便利商 店」,在亞洲奠立開發與營運的根基;同年「Gamania 遊戲橘子」名稱正式誕 生,以國際化的發展,整合更多資源,致力於創造及發現更有趣的數位內容, 分享給全世界的人們。 現今的 Gamania,以開拓先鋒的步伐,逐步進軍國際市場。除囊括多樣熱門遊 戲代理、壯大營運實力外,更秉持 Love to Play 的精神,號召全球創意人才, 加上實力堅強的研發團隊,發展多平台數位內容、遊戲、動畫等多元娛樂原創 產品。我們也號召更多熱血的玩樂分子,一起尋找更多充滿想像力的故事、發 掘更多新奇好玩的事物。
願境網訊股份有限公司 KKBOX 是由一群熱愛技術及音樂的工程師於 2004 年創立的品牌,以獨創的 雲端技術提供音樂串流服務,讓使用者透過網路即可播放儲存在雲端的歌曲; 32
贊助企業簡介
並以技術加密媒體檔 (Digital Rights Management, DRM),成功地為線上音樂和 智慧財產權取得完美的平衡與保護,打開了線上音樂合法授權的版權觀念, 更在亞洲市場首度以此商業模式成為標竿品牌。至今,KKBOX 擁有超過 1000 萬首曲目 ( 包括全球最大的華語音樂曲庫 ),獲得超過 500 家主流及獨立唱片 公司合法授權,服務地區包括台灣、香港、日本、新加坡、馬來西亞及泰國。 KKBOX 的服務在電腦、智慧型手機或其他行動裝置上都能使用,不只能線上 聽音樂,還能下載到電腦或手機中離線收聽,給消費者一個方便自由、沒有界 限的音樂世界! KKBOX 致力打造一個不受時空限制、讓人們輕鬆享受聽音樂、並與同好分享 樂趣的平台。除了提供獨家影音、藝人專訪、演唱會現場報導、娛樂新聞、樂 評等豐富完整的編輯內容,KKBOX 「一起聽」也讓你可以跟著朋友、歌手、 名人一起聽同一首歌曲,並與對方即時聊天,讓聽音樂變得更互動、更有趣。 此外,KKBOX 在 2011 年推出了《Let’s Music! KKBOX 音樂誌》月刊,期望透 過不同的媒體將音樂推向更廣大的市場。而每年年初所舉辦的「 KKBOX 風雲 榜」頒獎典禮,因擁有每年超過 50 億次點播數的公信力,更樹立了 KKBOX 在亞洲音樂業界的領導地位。2014 年 KKBOX 推出「KKTIX 售票亭」線上售 票服務,以及「KKBOX Live 音樂現場」系列演唱會,讓會員除了線上聆聽千 萬曲庫,還能親臨現場享受近距離感動,提供全方位的娛樂體驗和服務,滿足 樂迷的多樣需求。
走著瞧股份有限公司
?
LINE whoscall 是台灣 Gogolook 公司所開發的免費智慧型手機應用程式服務。 透過網路搜尋,可協助使用者辨識陌生來電,提供陌生來電資訊,含來電者電 信公司門號以及撥號地區,並且擁有詐騙社群共同標記對方的社群,以及封鎖 對方電話及訊息的功能。讓這款應用程式在全世界廣受歡迎,尤其是在美國、 中東以及印度等地都開出漂亮的成績,也讓這款應用程式受到全世界的矚目。
33
DSC 2014
贊助企業簡介 / 網頁設計贊助 / 茶水贊助
目前下載量已突破一千萬大觀,資料庫內已蒐集 6 億筆電話號碼資料庫,每 天過濾 1,000 萬通電話,每日阻擋 30 萬通惡意來電與騷擾來電,其取名靈感 來自於英文「Who is calling」的縮寫。 Gogolook 目前員工約有 40 人左右,最年輕的員工才 23 歲,但其團隊開發 的防詐騙 app 軟體 LINE whoscall 被 Google 前執行長艾瑞克.施密特 (Eric Schmidt) 稱讚真好用,此後開始進行第一輪天使資金募資,隨後資鼎創投、國 發基金的挹注逐步穩定成長,於 2013 年 12 月,whoscall 已被 LINE 母公司 以新台幣 5.29 億元高價收購。
網頁設計贊助 unfold unfold 是一個著重策略思考的設計顧問團隊,視客戶的性質與需求,由數個不 同領域的菁英組成,各司其職無縫溝通,與客戶一同建立完整的品牌文化。
茶水贊助 琅茶
wolf
tea
「琅茶」想把台灣茶細膩之美傳遞給全世界!堅持「此刻此地・獨一無二」, 每季尋找上質茶園在最適天氣時辰,由優秀茶師採製的「單品茶」,不混茶, 唯有如此才能認識每片山林獨特純粹的美好。三位創辦人因為愛茶,擁抱「活 在當下」的哲學,邀你一起感受與茶的「一期一會」,找到屬於你琅琅上口的 好茶。
34
35
Memo
36
Memo
37
Memo
38
Memo
39
Memo
40