| Office | Phone | Office Hours | |
|---|---|---|---|
| chaolin at g dot nccu dot edu tw | 大仁樓 200310 | 67511 | 星期四下午十二到兩點或另約 | 
如果在上課時間之外有問題,你可以利用office hours來找我,或者利用email跟我聯絡。雖然任課老師在以上office hours大部份會在辦公室,但是有可能有臨時的系務會議或者其他會議,可能使得任課老師不能全程留在辦公室。 因此,有意前來同學盡量事先預約。如果沒有事先預約而須找我,請先打電話確認,以免任課老師因為臨時的會議不在辦公室。 寫電子郵件給我時,別忘了在Subject欄註明科目名稱[ML23],否則信件可能會被我忽略。 如果你的問題容易回答,我會直接用email回答。 如果問題複雜,我會在email上大略回答,並在課堂上詳細回答。
這一課程以介紹機器學習與深度學習的基本觀念和相關應用為目的。機器學習是人工智慧領域的重要區塊,近年以來因為計算技術的急速進步,許多過去的理論已經變成實用的技術。這一課程透過介紹許多基本的概念,期望讓選課同學了解機器學習技術的基礎觀念,並且進一步學習如何應用公開軟體來處理實際問題。這一課程將介紹機器學習的數個基本型態,包含監督式學習、非監督式學習、迴歸分析、及以類神經網路為基礎的深度學習。
課程中以講解基礎學理為主,同時伴隨程式實例的簡介。在幾乎每一個星期都有的 Moodle 作業中經常會使用到以Python為主的程式實例,期待大家都能兼顧學理與實例。
雖然我們會帶到一些關鍵的Python指令或者套件,但是這不是一門學習 Python 的課程。Python是選修這一門課程的先備能力。體驗機器學習的核心功能,而不建構整個應用系統的話,並不需要學會所有的Python指令。當然如果能隨心所欲應用Python是最好的。
如果以 Kaggle 公開課程做為參考比較的話,在假設同學不需要太多 Python、Pandas 和 Numpy/Scipy 的協助的前提之下,我們的課程計劃可以包含 Intro to Machine Learning 和 Intermediate Machine Learning 之外,還會接軌到深度學習入門 Intro to Deep Learning 的材料。2023學年可能繼續參考 Kaggle 的入門課程,也可能在開學之後更換對應目標;確定會有實作方向的對應目標。
   
     
 
 成績計算之項目與權重:課堂上參與討論、點名與問答 (5%)、Moodle 作業(20%);期末程式作業(25%);期中考試(25%);期末考試(25%)
 
 
課本及參考資料 
  
    
  
  
    
    
	 將適時補充其他新的材料
	 Yaser S. Abu-Mostafa, Malik Magdon-Ismail, and Hsuan-Tien Lin (林軒田). Learning from Data, AMLbook, 2012.
     Jiawei Han, Micheline Kamber, and Jian Pei.
         Data Mining: Concepts and Techniques, third edition. 
         Morgan Kaufamnn, 2011. (政大圖書館:第三版、第二版、第一版)
     Pang-Ning Tan, Michael Steinbach, and Vipin Kumar.
        Introduction to Data Mining.
        Addison-Wesley, 2006.
        (政大圖書館索書號006.312 T161)
    Pat Langley. 
       Elements of Machine Learning. 
       Morgan Kaufmann, 1995. 
       (台大圖書館索書號Q325.5 L36z 1996) 
    George F. Luger, 
        Artificial Intelligence: Structures and Strategies for Complex Problem Solving,  sixth edition,
        Addison Wesley, 2008.
       (新月代理) 
       (政大圖書館有第四版 (2002)、第二版)
        (第一到第三版之共同作者:William A. Stubblefield) 
    
  
	    將視修課同學程式語言學習狀況,將利用 Python 語言為基礎的公開軟體
        Weka 3, supported by Witten and Frank (有GUI、可透過JAVA自行操作)
	    scikit learn
	    TensorFlow	   
	    Keras
	    PyTorch
        Kaggle
        TBrain
        UCI KDD Archive
        UCI Machine Learning Repository
   
 先修課程
     程式設計、Python、線性代數、機率和統計:沒有修過這些科目的類似課程將影響上課內容的接受度
線上課程討論版與電子郵件
所有課程相關之最新消息會公告在政大Moodle網站的機器學習概論課程版,所有修課同學請密切注意相關通告。課程版上之公告與課堂上之公告有相同之效力。此外,任課老師也會透過 Moodle 所寄發測試的電子郵件與修課同學保持聯繫,在開學之初,任課老師會寄發測試的郵件。如果你從來沒有收到相關郵件,請你務必與任課老師聯繫。
成績計算
 
預計進度:政治大學本學期行事曆
 
以下所列進度,會依實際進度而有所調整。進度表也會反映實際進度。所列章節數目均是課本的內容,
我們用M代表Mitchell書中的章節,W代表Witten書中的章節,R代表Russell書中的章節,A代表Alpaydin書中的章節,G代表Goodfellow書中的章節。
 
日期
 週次
 課程主題
 課程內容與指定閱讀
 輔助參考章節
 教學活動與作業
 學習投入時數 
(含課堂及課程前後)
備用欄位
 
 
9月
 11日
 W1
 Introduction, Input, and Output
 W1, W2, W3 
 A1
 Moodle
 3小時/3小時
 調查程式設計能力
 
 
18
 W2
 Input, Output, Linear Regression, Python, & Tools
 W2, W3, W4.6 
 G2, Python, scikit learn, Weka
 Moodle
 3小時/3小時
 
 
25日
 W3
 From Logistic Regression to Classification
 W4 (4.1-4.4)
 課堂參考資料
 Moodle
 3小時/3小時
 
 
10月
 2日
 W4
  DT, kNN, and Naive Bayes
 W4 (4.6, 4.7), W6, W7
 M3, M8, R18, 課堂參考資料
 Moodle
 3小時/3小時
 
 
9日
 W5
 學校放假 
 視為彈性上課時間
 
 
16日
 W6
 Evaluation
 W5
 M5, 課堂參考資料
 Moodle
 3小時/3小時
 
 
23日
 W7
 Data Transformations
 W8
 A6, 課堂參考資料
 Moodle
 3小時/3小時
 
 
30日
 W8
 Artificial Neural Networks
 W10.1
 G6, A11, 課堂參考資料
 Moodle
 3小時/3小時
 
 
11月
 6日
 W9
 期中考試
 
 
13日
 W10
 Reviews & Artificial Neural Networks
 W10.1
 G6, A11, 課堂參考資料
 Moodle
 3小時/3小時
 
 
20日
 W11
 Deep Learning Topics
 W10 (TBD)
 M4, 課堂參考資料
 Moodle
 3小時/3小時
 
 
27日
 W12
 NLP, LM, LLM, and ChatGPT
 課堂參考資料
 課堂參考資料
 Moodle
 3小時/3小時
 
 
12月
 4日 
W13
 Clustering 
W4.8 
A7, 課堂參考資料 
Moodle 
3小時/3小時 
 
11日
 W14
  Probabilistic Methods
 W9
 A14, A15, 課堂參考資料
 Moodle
 3小時/3小時
 
 
18日
 W15
  Ensemble Learning
 W12
 A18, 課堂參考資料
 Moodle
 3小時/3小時
 
 
25日
 W16
 程式作業驗收與面談
 
 
1月
 1日
 W17
 學校放假 
 視為彈性上課時間
 
 
8日
 W18
 期末考試