訪問人: Yen 主持/撰稿人: Zonghan 日期:2017/03/06
# 關於 R 與 Python
Zonghan:妳本身是以 R 做分析的,請問是在什麼樣的情況下會選擇使用 Python?妳覺得 R 與 Python 各適合用在什麼地方?
Yen:我本身做的是金融相關的工作,經常會研究到剛發表在 paper 上的統計模型,而 R 是統計學家常用的程式語言,當統計學家發表新的模型時,通常會同時附上 R 的程式碼。同時, R 語言上面各種統計方法的套件非常多,功能也非常完整強大。最方便的是,使用 R 可以直接拿別人發 paper 時寫好的程式碼來用,不用自己刻。相對的,在 Python 的領域,統計相關的套件就沒有這麼多。雖然 Python 在數值計算上面的基礎套件非常強大,但是如果要拿它來做統計研究,就必須自己參考 paper 再重新撰寫一次程式碼,這相對比直接用 R 來做耗工耗時。
不過, Python 的優勢在系統面,我通常拿 Python 來做資料的 ETL ,尤其 Python 有 Pandas 這個套件,資料處理非常的方便。所以我通常會透過 Python 先將資料整理好再用 R 做模型分析。
如果提到最近很夯的機器學習,則 Python 又再度勝出。 Python 的 scikit-learn 是一個很完整的機器學習套件,而且在 deep learning 方面,各家的套件幾乎都支援 Python。因此, Python 在機器學習上應該是比 R 好用的。
# 關於社群
Zonghan:妳本身是社群的 host 也參加過 PyCon APAC 2014 的籌備團隊,請問妳對於經營社群有什麼樣的看法?
Yen:我覺得參加社群給 talk 除了是讓講者有一個表演的舞台之外,也是讓雙方可以互相學習。講者增加經驗與曝光度,聽眾也長知識。最重要的是,大家都是利用剩餘的時間來參加這些 meetups,講者是利用額外的時間來準備投影片,聽眾也是利用下班或者是假日時間來做學習,所以經營與參加這些活動最重要的一點是不要對自己造成太多額外的負擔。不過,籌備像 PyCon APAC 這樣的活動就比較累。我在 PyCon APAC 2014 是擔任註冊組組長,註冊組在接近活動的那一段時間,非常的忙碌,幾乎必須在活動前後請一兩天假才能完整 support 這個 event。
# 關於社群國際化
Zonghan: 妳最近去西班牙馬德里來了一段 meetup travel?可以分享一下經驗?
Yen:我這次是去西班牙馬德里給 talk,雖然是去西班牙,但是並不會有語言不通的問題,因為大家都可以用英文來做溝通。到國外的社群給 talk ,不僅可以增加台灣社群的能見度,也能結交外國的社群朋友。像我這次去馬德里,因為我們 R-Ladies Taipei 社群最近在台灣跟台灣微軟走得比較近,透過這層關係,最後爭取到了西班牙的微軟對馬德里當地 R 社群的贊助,雖然馬德里微軟的總部距離他們 R 社群 meetup 的地方只有幾公里遠,但很妙的是雙方這層緣份卻是透過台灣人牽起來的。這對於增進雙方的關係,有非常大的幫助。當然,除了去社群演講、互相交流之外,當地人會當嚮導帶你去吃當地好吃的東西。根據我這一次的經驗,幾乎都是當地人點得才會好吃,自己看 menu 點的東西通常都很難吃 XD。
註:經驗分享投影片
# 結論
Zonghan:最後可以請你講一下,對於台灣各地社群的一些建議嘛?
Yen:我覺得台灣的社群需要盡量與國外的社群接觸。台灣有很多人才,但是對國外接觸太少,所以人才發展的空間與發揮的舞台都受限制。 open source 的社群本來就是全球化的,而且,軟體的工作機會也是國際的機會多過於台灣本地的。台灣的在地社群應該多多與外國社群接觸,才能增加自己的能見度,也才能提供台灣的人才更多成長與發揮的空間。