2016年3月18日 星期五

#3 當教室不只是教室的時候...


(From: http://edtechreview.in/dictionary/198-what-is-a-mooc)

開頭用這張圖簡潔的介紹什麼是MOOC下面就不廢話啦

以下是幾個我使用過的平台與課程
(裡面包含一些不算是MOOC的自學平台)

  • Coursera - 

  • edX - 

  • NCTU OCW 交通大學開放式課程

  • Codecademy

最後一定要貼一個網站給大家

https://mooc.guokr.com/



這網站絕對是經典中的經典
聽君一席話勝讀十年書
上面累積很多對於各平台的課評
(我是就太晚看到這個被JHU噱了一筆...)
看看人家對MOOC的風靡程度會發現自己如此渺小啊...


《一切都是由Coursera還沒變Cour$era開始...》
記得當時“翻轉”正夯時
我就跟著潮流去選了Prof. Benson的機率
上一上發現這種學習方式還真的不錯
每天花個30分鐘就能有些收穫
而且還能有一些互動模式,如:影片介面的Quiz、社群的討論...等等
重點是他跳脫了那種你一定得在何時何地學的教學方式
讓學習可以依自己的興趣調整課程與速度
(當然,如果要證書他還是有時間限制)

像我就很常在以下時間看個課程短片




















其實我機率沒上完,之後有一陣子沒碰了
直到修BIBA學程還有準備出國的時候
發現自己在prerequisites有些不足所以開始從MOOC補齊缺的課程也順便拿證書證明一下自己

《NCTU OCW 交通大學開放式課程》

我覺得交大的OCW台灣的小朋友真的很棒



裡面的課十分齊全又都是中文
老師應該也都是挑過,我有聽過幾門課都收穫很多
一定要推一下唐麗英老師的統計
這門果然是連大陸學生都在求的視頻
(p.s.很多人推薦的SAS123也是唐老師寫的書)
讓我在選計量經濟學之前能補足一下我統通忘計的知識

小缺點是這是課程錄影,不是為了MOOC量身訂做的課程
所以會比較像是看大學上課的VOD

《為了MSBA的Coursera & edX》

MSBA的prerequisites不出以下四個

  1. 微積分
  2. 統計學
  3. 線性代數
  4. 基本coding能力
由於缺了3.4.所以開始上網找相關課程
線代網上首推edX裡
UT的Linear Algebra - Foundations to Frontiers (LAFF)
內容滿循序漸進的,就前半部分有高中數學基礎應該都可以直做題目
整個上完會有一般的線代概念,不過我認為還是遠低於真正大學課程的程度
(可以點看看OCW就知道難度差得有點多.....XD)
而ASU的課應該是較基本,讓我6月上完再補心得

而上最多的Coursera最近開了超多專項課程*如下


*專項課程:通常會有4~6堂課(有多有少)不等的課程,全部上完並完成Capstone可以獲得專項課程的證書(類似學程)


最火紅的莫過於JHU以R為導向的Data Science課程(圖上第一個)
“BUT”這課程給完全沒有用過R的使用者來說根本是摧毀自信
裡面課程內容跟Assignment的強度不成正比
建議沒有用過R的人別輕易嘗試

而在被JHU的課輾壓後我開始上網站看課評選課
也發現真的不是我的問題後研究哪些課是真的值得上
畢竟每堂課要拿證書也是要2~3000台幣阿~~~~

之後去Codecademy摸看看各種語言後放棄R學Python
而Python網上推2個課程

  1. Rice U.的An Introduction to Interactive Programming in Python
  2. U Mich.的Python for Everybody
經我研究之後U Mich的課程更為DS導向所以就選了
上完第一堂後發現真的是人人都能玩巨蟒Python了



內容易懂而且授課的Prof. Charles Severance
也是很有喜感上課不會太無聊...XD
對於Python有興趣的可以上看看

最後是Duke的Excel to MySQL: Analytic Techniques for Business
這堂課較像是Business Analytics的課程
利用Excel + MySQL做Mining
非常適合想接觸Business Analytics的新手(尤其是只會用Excel)
上完前兩堂,內容基本上是講為何公司要走Data-dirven、有哪些做法
還有一些Data Insight,教你如何了解基本的Data
之後就是講一些Mining的觀念與Excel的Analytics手法
像Binary、Decision Tree、ROC Curve都有提到
(聽不懂嗎? 歡迎去上陳炫碩老師的商業分析資料探勘)
缺點就是...當你用過SAS、R、Python(我沒用過)後
Excel真的是很難用阿....Visualization也是不行

不過第三堂課就會教Tableau,應該會好很多
之後修完Tableau還有MySQL再跟大家分享


學藝不精的下台一鞠躬啦~
之後有修完的心得會盡速補上
希望大家也能修完跟我分享心得!



2016年3月16日 星期三

#2 Data Science? Computer Science? Statistics? ISyE? Business Analytics?

《引言》

千錯萬錯都是Harvard Business Review(哈佛商業評論)的錯













就是這篇文讓多少莘莘學子管你讀1.2.3.4還是不倫不類通通想出國讀個Computer Science (CS)或是Statistics (Stats)
(好啦...我誇大了...其實不只這個原因啦..)

究竟Data Science (DS)跟CS或是Stats有什麼關係呢?
讓我簡單的說下去...

《About DS》
基本上Data Science所包含的領域很廣
基本是一個團隊來進行,團隊需要CS、Stats專長及所應用領域(Domain Knowledge)的專家
要解釋DS必備Drew Conway 所提出來的Data Science Venn Diagram

















在DS之中,我們可以這三個部分來解說
  1. Hacking Skills - 使用CS工具的能力
  2. Math & Statistics Knowledge - 資料數學建模分析的能力
  3. Substantive Expertise - 對於資料本身與output所具備的解讀能力
這篇文章也點出幾個很重要的點:
http://ppt.cc/zeXf

以下是上面文章的重點整理:
對於要成為Data Scientist這三方面各方有各方的論點
但2與3是相對困難的
因為Hacking Skills如:R、Python的話可以自己學習
Data Scientist不需要了解電腦太底層的理論會應用就好
(當然,像Google或是Y!這種自己可以寫 Algorithm的強大公司除外)
程式語言就多練多熟
而最重要的是一些Modeling理論跟統計學方法
這些基本功夫需要花時間透過平時經驗的累積
得出對於該領域Modeling的sense還有分析出來結果的Insight

畢竟拿到資料就直接Modeling說結果怎樣
完全不考慮Model合適與否以及如何解釋成有價值的output
亦或是Model太複雜,即使有用可是成本太高不符合效益
那等於沒做還白花錢


下圖則畫出了成為一個Data Scientist所需的知識Metromap





(From : http://nirvacana.com/thoughts/becoming-a-data-scientist/)

寫到這,怎麼沒說到Industrial and Systems Engineering* (ISyE)
跟Business Analytics呢?
*ISyE其實也是Industrial Engineering and Operations Research (IEOR),說法不同而已


《About BA》
其實Business Analytics的產生跟我們上述有很大的關係“如何讓Data變成可利用且有價值的Output
價值的創造”在商業界絕對是最重要的指標
所以,在資本主義當道且高等教育已成賺外匯產業的美帝想當然爾不會放過此等機會
各學校開始如雨後春筍般戰備MS in BA


























以我對BA的個人解釋:

  •  BA人可看成是具技術與商業的Bridge,也就是專門溝通的一群人


同上所說,當對需要的目標群不夠熟悉,不知道顧客需求是什麼,那有數據有模型也是英雄無用武之地

因此訓練一群人了解基本工具的使用讓數據分析能迅速的商業運用(當然也產生些學藝不精等討論...不過我是認為師傅帶進門修行在個人...)

《那為什麼會提到ISyE呢?》

這要先上兩個聯結
1. http://ppt.cc/eCnSz
2. http://ppt.cc/UNK5o

第一個是我當時對BA/MIS/CS的小見解
第二是強者偶像illousion大的超專業開釋

【假設你沒興趣看全文我在下面幫你畫重點】


  • 美國作業研究與管理科學協會在1950年代建立,底下有個 Analytics Section,INFORMS當2000年開始"Analytics"這個字廣泛被使用時便意識到這個字開始去服務做 Descriptive & Predictive Analytics的專業人士
  • Operations Research(作業研究)另一方面則是和Prescriptive Anlaytics所做的是有相當多的重疊,OR使用Simulation (系統模擬)還有Optimization(最佳化)這兩種技術來協助制定評估決策
  • 這些課程在ISyE都會學到,只是解決問題的手法也不一樣,因為本質上一個屬商學院,一個屬工程學院
  • 在實際業界中,以US Airway航空排班來說,一次的線性規劃變數都是以萬為單位,生產排程少說也是幾千個變數,不太可能用Excel去解決這個問題
所以簡單而言BA就算是以商業問題為導向的平民閹割ISyE
(所以你會看到大數據競賽是在改善產線良率...之類的)

寫到這已經字多到不能再寫了
畢竟議題很多,像是 統計人的DS觀點、CS人的DS觀點...
要討論完這可能要三天三夜的三更半夜












當然我也不是專家中的專家
說了那麼多希望大家對這東西有些明瞭與概念
很多地方在不同領域的應用還是有差異存在

最後附上我覺得很不錯的一篇文章做結束






2016年3月15日 星期二

#1 Inception


話說故事都要有個開始,而這個開始在哪其實我也忘了
反正就大約在冬季吧...
不是,就是大三下的時候上了財資管和投組分析後接觸到了SAS這統計分析軟體



然後就發現其實自己對這頗有興趣這主題又夯爆就一頭洗下去研究了

(真相其實是讀STEM比讀完要打包的MSF較容易留美.....)



然後運氣很好,學校也跟著潮流開了第一屆的BIBA(商業智慧與分析)學程
瞬間下定決心要修完他了






















既然課表都貼了,只好來寫一下選課心得
在下的課表為:

商業分析程式語言
商業分析資料探勘
計量經濟學(上)(下)
投資組合分析
財務資訊管理
實證財務分析

七堂課共21學分

【學程簡介】
基本上BIBA是以SAS為中心的學程
當然,在其他課程中或多或少會碰到Excel、VBA等等的工具
但主要還是包括三大部分:

  1. SAS Programming
  2. SAS Enterprise Guide EG
  3. SAS Enterprise Miner EM


簡單而言,SAS的使用邏輯就是
用SAS Programming的程式語言將資料匯入整理
並輸出統計分析結果
然而語言不是那麼好學習,因此在2000年左右
SAS 開發了具拖拉點選視覺化介面的 EG提供使用者使用
(EG方便歸方便,有時候思考邏輯不通時利用Programming與EG結合還是比較快的)
而SAS EM就是利用上述資料整理的output來做Data Mining以及Analytics

商業分析程式語言】
授課老師:沈建文老師
推薦指數:★★★★☆
基本上這堂課就是苦難
對於沒有程式語言經驗的人這真的是十分痛苦的過程
不過既為必修就是得修
課中會學到基本的SAS Programming
而課程中應該已經包含SAS Certified Base Programmer for SAS 9 Credential* 證照40% 的知識
其他內容基本上就是靠熟讀教材跟考古題

*SAS在programming exam for SAS9有兩張證照

  • Base programmer credential for SAS9 
  • Advanced programmer credential for SAS9 

基本上要通過Base版才能考Advanced版的考試
據說在米國有這兩張面試的機會頗多


商業分析資料探勘】 
授課老師:陳炫碩老師
推薦指數:★★★★
神課!雖然loading很重
基本上老師會將Data Mining的觀念帶過一遍
實習課上 EG & EM,每周分組作project 
如果對上課內容不懂我是滿推薦這兩本的: 

  • 觀念不懂→《資料挖礦與大數據分析‧作者: 簡禎富、許嘉裕》 
  • EM不懂→《資料採礦應用:以SAS Enterprise Miner為工具‧作者:曾淑峰、林志弘、翁玉麟》 

然而選修部分見仁見智

基本上看自己系開什麼修什麼

由於統計不好所以加修了計量經濟學
比較後悔的是當時沒有修資料庫管理
如果加上SQL的話基本上可以上戰場沒問題了


洋洋灑灑寫了一堆不知道有沒有漏了什麼
反正就是個開始嘛....

下一篇會寫寫Data Science、ISyE還有Business Analytics的複雜關係,還有在Cour$era等自學平台心得

這部落格....
最重要的是寫些R跟Python的筆記
最重要的是寫些R跟Python的筆記
最重要的是寫些R跟Python的筆記
希望能持之以恆阿!