機器學習的問與答 ── 常見的開發問題和如何學習

November 09, 2018

最近有機會和一位朋友──鄭穎鍾──討論我們在做資料科學及機器學習上所遇到的一些問題。由於我們都是數學背景出身,所以在經歷和做事的方法上多少有些雷同。但因為我們在不同的產業工作,會遇到不同的問題,我和穎鍾討論後,決定把我們的想法寫下來,提供大家參考。

Read More

從鍵盤球迷到光芒球團

March 26, 2018

新一季的大聯盟又要開打了。想寫篇文來記錄一下:兩年前的我,作為一名鍵盤球迷,是怎麼陰錯陽差進到光芒球團實習的故事。

Read More

用 lubridate 處理時間序列(time series)中的日期

December 10, 2016

這學期讓學生作期末專題時,有幾位學生想處理的資料是內含日期的時間序列(time series)。因為日期讀入 R 以後會儲存成字串(如果有記得stringsAsFactor = FALSE),就算想畫一張時間序列圖,都需要將資料清理一下才行。這時 Hadley Wickham 開發的 lubridate 就相當好用。這篇文章用到的包裹如下

Read More

用broom畫殘差圖(residual plot)

November 02, 2016

在作迴歸分析時,常常會用殘差圖(residual plot)來當作模型是否有改進空間的依據。最近在教學時發現David Robinson作的broom套件相當好用,也可以拿來畫殘差圖。broom內的函數大多是拿來計算和model相關的數據,而它和R內建函數的不同之處是所輸出的物件通通都是data frame,所以能和Hadley Wickham的dplyrggplot2無縫接軌。

Read More

越寫越癢的 R

October 29, 2016

最近因為工作和教學的關係,一直在用 R。雖然英語世界很多 R 的資訊,但對於程式初學者如我來說,遇到問題往往連該用什麼關鍵字搜尋都不知道,遑論找到解決辦法。於是決定把我在教學時所見到學生的一些問題,和我自己在處理資料時遇到的一些問題的解決方法記錄下來。即便不是最佳解,如果這些 minimum viable products 能讓其他和我一樣的初學者從中得到解決問題的靈感,那也就夠了。

Read More