您現在是使用訪客身分登入 (登入)
略過課程導覽選單

課程導覽選單

略過系統管理

系統管理

主題大綱

 
 
1

BDSE01 專題一(大數據分平台架設)
班級導師:劉翰卿 老師
第一組

BDSE01-1

組員:鍾幸辰、陳耀威、鄭詩博、朱哲霆。

第二組
BDSE01-2

組員:周哲民、林晏妤、鍾育修、邱士丞。

第三組
BDSE01-3

組員:林佑任、傅珀瑩、徐銘谷、劉宗誼。

第四組 
BDSE01-4

組員:廖柏傑、宋念遠、張時瑜、謝耀賢。

第五組
BDSE01-5

組員:莊東霖、賴敬元、謝鎮宇、游少愷。

第六組
BDSE01-6

組員:石平、林彥廷、陳盈慈、朱致宏。

僅顯示主題 1
2

BDSE01 專題發表
班級導師:劉翰卿 老師
第一組 臉揪 Facebook文字探勘應用活動自動分類

BDSE01-1

組長:林佑任 組員:劉宗誼、傅珀瑩、徐銘谷、陳耀威、鍾幸辰。

透過文字探勘技術分析活動描述文字,再使用機器學習自動分類,讓使用者能快速的依分類找到喜歡的活動。

第二組 蔬菜行情季節與氣候之價量分析及預測
BDSE01-2

組長:周哲民 組員:林晏妤、邱士丞、石平。

透過農委會Open Data的資料,找尋出國內農產品交易的潛規則,為家庭食材採買提供寶貴的資訊。

第三組 大安索羅斯
BDSE01-3

組長:廖柏傑 組員:謝耀賢、莊東霖、張時瑜、宋念遠、游少愷。

深入研判期貨,將數據分析導入期貨市場,結合機器學習提高投資報酬率。

第四組 Drama Maker 關鍵字導向電影互動遊戲推薦系統
BDSE01-4

組長:石平 組員:朱致宏、陳盈慈、林彥廷。

透過關鍵字導向電影推薦系統,找到您最想看的題材,而不是大範圍的類型,有別於傳統被動的收視率調查。

第五組 台灣魔球 (提供YouTube 影片)
BDSE01-5

組長:鍾育修 組員:石平、朱致宏、朱哲霆、林彥廷、陳盈慈、賴敬元、鄭詩博、謝鎮宇。

利用Crawler程式從中職官網下載2014年逐場比賽記錄,轉換成結構化表格,進行得分矩鎮、Extra Base Running、Ranger Factor分析。

第六組 Movie Pusher (提供YouTube 影片)
BDSE01-6

組長:徐銘谷 組員:鄭詩博。

使用Python撰寫爬蟲程式,透過OMDB API蒐集IMDB電影資料,利用R語言擷取電影類型、演員及風格等屬性,以D3.js將熱門度及評價數據化,投影成探索地圖。

僅顯示主題 2
3

BDSE02 專題發表
班級導師:劉翰卿 老師
第一組 量化交易

BDSE02-1

組長:莊竣逸 組員:廖晉緯、高煌智、江家銘、吳孟耆、李致安、羅覺、蕭伯任、張庭菘。

提供量化交易交易平台,將技術指標程式化,分析2010~2012年歷史資料,找出統計上的相關性,建構出投資模型,並以Web App開發。

第二組 關鍵新聞指南針
BDSE02-2

組長:曾仲毅 組員:倪瑞伶、柯則宇、蔡佩珈、張庭瑋、王建雄。

透過爬蟲程式 抓取媒體新聞,清理資料,並以演算法實作及調整,提供新聞的關鍵字分析。觀察不同媒體在臉書的情緒反應及相關新聞報導,快速了解不同媒體的社群經營成效。

第三組 超級市場數據分析
BDSE02-3

組長:江家銘 組員:陳宥菘、蕭伯任、廖晉緯、吳孟耆、李致安、羅覺、王建雄、施懿芸。

量販店市場趨近飽和,消費者選擇變多,透過數據分析的優勢,提供店家策略上的創新建議,增進店家獲利空間,找出潛在會員,推出對應商品,取得最大效益。

第四組 英文論文剖析E-JAS
BDSE02-4

組長:洪振寧 組員:蔡宗翰、施懿芸、張凱嘉、黃煜凱、王雅軒、蔡佩珈。

透過 E-JAS,使用國人熟悉的詞庫,取代傳統方法以畫線取詞或google翻譯的方式,翻譯各個領域的英文論文,提供該領域的專有名詞,在短時間內,快速、大量的獲取論文中的知識。

第五組 道路坑洞感知系統(IoTFrequency)
BDSE02-5

組長:洪振寧 組員:莊竣逸、蔡宗翰、高煌智 羅覺、黃煜凱。

駕駛車輛於市區收集道路品質良莠數據,透過演算法排除駕駛行為、車況等等變因,將資料可視化,提供政府更全面客觀的城市道路健康檢查報告。

僅顯示主題 3
4

BDSE03 專題一(大數據分平台架設)
班級導師:劉翰卿 老師

BDSE03-1

僅顯示主題 4
5

BDSE03 專題發表
班級導師:劉翰卿 老師
第一組 商店智能選址評估

BDSE03-1

組長:吳宗翰 組員:王均、王臆詞、陳威宇、黃品真、童麟凱、盧芝穎。

大數據智能選址藉由蒐集開店、歇業歷史資料以及人口結構概況,讓使用者了解各區里生活型態和消費族群,不用再瞎猜預估。 利用機器學習建置模型,綜合評估同區段的店家經營狀況,協助業者預估成本和未來可能營收,選出使用者心中最理想的位置。

第二組 日本旅遊景點與路線之推薦系統與分析
BDSE03-2

組長:彭士軒 組員:劉世勛、林玉婕。

使用Python 的BeautifulSoup 套件撰寫網路爬蟲程式,爬取背包客棧、批踢踢實業坊(PTT)-Japan_Travel 看板,搜尋與日本旅遊相關之文章,讓使用者簡單而迅速的方式尋找熱門的旅遊路線。

第三組 文字探勘與數據挖掘的綜合應用:Amazon商品評論的萃取精煉-以吸塵器為例
BDSE03-3

組長:翁啟閎 組員:李思蓓、王易新、吳子桓、謝長恩、隋長志、曹廷。

以Python 爬蟲程式抓取Amazon 30萬筆商品資訊以及商品評論。透過演算法產生對消費者端購物決策時的參考。或從銷售端找出商品的Unique Selling Point,作為商品品牌定位的方向。

第四組 陸客減少在交通大數據的實證
BDSE03-4

組長:王均 組員:陳威宇。

透過觀光局20萬個資料檔案,約四億筆交通與旅次資料。交叉比對大客車減少區域與其他政府部門資料! 涵蓋觀光局陸客來台人數、旅館業家數,觀光旅館住用率等觀光資料,並與經濟部公司解散登記清冊探討其中相關性。

第五組 旅遊產業資料分析 (企業合作專題)
BDSE03-5

組長:呂紹瑄 組員:徐上雯、胡仁恩、韓奐宇、楊敬平、彭紀瑋。

利用企業所提供的資料建置模型,預測客戶在旅行前多久會產生購買行為,以協助企業去規劃相關行銷推廣方式,讓企業能預期原有客戶的行為,加強與原有客戶互動。

僅顯示主題 5
6

BDSE04 專題發表
班級導師:劉翰卿 老師
第一組 犯罪預測系統

BDSE04-1

組長:柯鈞贏 組員:蔣宜庭、梁承詠、賴姿妤、梁貽甯、陳思允。

透過犯罪熱點的分佈了解目前自身所處的環境是否有潛在犯罪風險,警方透過犯罪熱圖結合人口統計資訊、環境因素等可能影響犯罪的相關屬性,進一步了解未來可能發生犯罪的時間與地點,做警力資源上的調配。

第二組 BOSS!購物車裡有金礦
BDSE04-2

組長:陳晏清 組員:林泰延、蘇怡璇、王昱惟。

透過粉絲團用戶資訊找出精準行銷的對象。蒐集八類(手游、動漫、實況主、部落客、美食、服飾、日本旅遊)粉絲團成立以來的所有用戶資訊,接著透過分析用戶資訊及關聯分析找出為了要推銷手游,我們的目標客群是誰?該對誰行銷?

第三組 趴踢選新聞PartitionNews
BDSE04-3

組長:張文瀚 組員:毛聖棋、蕭又榮、林欣漢、林冠宇、洪韻鴻。

分類匯總使用者感興趣的新聞 趴踢選新聞透過使用者給予的興趣指標給予首次新聞匯總,並在使用網頁之後將新聞屬性傳入資料庫,並在每日固定時間以爬蟲技術取得新聞網第一手新聞,使用者可以省去為了特定面向新聞而跑遍各大新聞網的時間。

第四組 小編GOGOGO
BDSE04-4

組長:林易瑩 組員:張薇柔、賴韋伶、黃怡婕、湯佳澄、莊嘉富。

利用公開平台資料(Facebook, PTT)分析臉書運動用品店相關粉絲團之間的關聯性規則、貼文資訊與按讚數預估,以及運動品牌網路評價分析;並將結果以動態圖表呈現於網頁上,使粉絲團小編能輕鬆獲得參考資料,增加小編經營粉絲團的便利性。

第五組 交通事故熱點群集分析與鄰近醫療支援
BDSE04-5

組長:朱家昌 組員:林則余、鍾語農、王乃元。

利用103年到105年間的OpenData,進行台灣交通事故熱點群集與醫療服務範圍的交叉分析。我們為此架設了16台虛擬機的Hadoop Cluster,並結合R,透過RStudio Server進行K-means群集和決策樹分析。最後將分析產出資料導入MongoDB,再結合jQuery網頁技術、Leaflet等地理資料,展現視覺化的分析結果。

僅顯示主題 6
7

BDSE05 大數據分析Hadoop生態系平台架設(期中小專題)
班級導師:劉翰卿 老師

BDSE05-1

第一組~第五組。

僅顯示主題 7
8

BDSE05 專題發表
班級導師:劉翰卿 老師
第一組 Kaggle消費者回購行為預測分析 (企業合作專題)

BDSE05-1

組長:徐瑋呈 組員:朱建瑋、陳建廷、林瑋珍。

分析企業在 Kaggle 上的資料,選定 Acquire Valued Shoppers Challenge為主題,分析消費者回購行為的預測。

第二組 生活機能房價模型建置與實價分析預測-以台北市為例
BDSE05-2

組長:伍得凱 組員:江國源、李岳勳、楊晞、黃信豪。

以 java 及 python 撰寫網路爬蟲程式,透過內政部實價登錄資料以及政府公開資訊平台獲取房價資訊,同時搜尋其他網站取得生活機能設施及相關地理資訊,作為訓練分類模型的資料。

第三組 電商平台購物籃分析 (企業合作專題)
BDSE05-3

組長:吳韋慶 組員:郭軒宏、黃士修、陳建廷、蔣瑋玲、林素如。

依RFM 顧客資料模型找出 MVC(最有價值客戶),並分析此類客群之消費特性及購買關聯性,期望提供廠商客群個人化推薦資訊,並進行流失客戶分析。

第四組 台股選股與市場籌碼價量分析及預測
BDSE05-4

組長:林瑋珍 組員:蘇博彥、歐承勳、林萬凱、洪駿元。

以敘述統計方法進行數據探索,取得市場交易數據結構。再以市場上之三大法人與大股東之買賣動態數據為基礎,進而使用機器學習方法(類神經、時間序列分析、決策樹和關聯規則等)訓練模型,以達到個股、類股、大盤未來長跌趨勢之預測目的。

第五組 國道旅行時間預測
BDSE05-5

組長:曾晴 副組長: 陳中皇 組員:林廷、陳宏昇、鄭竹娟。

使用 R shiny 套件來製作網頁 透過使用者在頁面輸入的資料傳送給伺服器端先使用 KNN 方法來估計區間車流量,再使用先前訓練好的 RandomForest 模型來預測旅時間,再回傳給使用者端。

第六組 輕鬆擁有「一箱一櫃」
BDSE05-6

組長:陳建廷。

利用 Google 及 AWS 的所提供的免費雲端服務,配合 Hadoop 生態系的技術,教您如何擁有一個簡易的機房,再利用此大數據平台系統,參與 Kaggle 上所舉辦的 KKBOX 主題。

僅顯示主題 8