Office | Phone | Office Hours | |
---|---|---|---|
chaolin at g dot nccu dot edu tw | 大仁樓 200310 | 67511 | 星期四下午十二到兩點或另約 |
如果在上課時間之外有問題,你可以利用office hours來找我,或者利用email跟我聯絡。雖然任課老師在以上office hours大部份會在辦公室,但是有可能有臨時的系務會議或者其他會議,可能使得任課老師不能全程留在辦公室。 因此,有意前來同學盡量事先預約。如果沒有事先預約而須找我,請先打電話確認,以免任課老師因為臨時的會議不在辦公室。 寫電子郵件給我時,別忘了在Subject欄註明科目名稱[ML24],否則信件可能會被我忽略。 如果你的問題容易回答,我會直接用email回答。 如果問題複雜,我會在email上大略回答,並在課堂上詳細回答。
這一課程以介紹機器學習與深度學習的基本觀念和相關應用為目的。機器學習是人工智慧領域的重要區塊,近年以來因為計算技術的急速進步,許多過去的理論已經變成實用的技術。這一課程透過介紹許多基本的概念,期望讓選課同學了解機器學習技術的基礎觀念,並且進一步學習如何應用公開軟體來處理實際問題。這一課程將介紹機器學習的數個基本型態,包含監督式學習、非監督式學習、迴歸分析、及以類神經網路為基礎的深度學習。
課程中以講解基礎學理為主,同時伴隨程式實例的簡介。在幾乎每一個星期都有的 Moodle 作業中經常會使用到以Python為主的程式實例,期待大家都能兼顧學理與實例。
雖然我們會帶到一些關鍵的Python指令或者套件,但是這不是一門學習 Python 的課程。Python是選修這一門課程的先備能力。體驗機器學習的核心功能,而不建構整個應用系統的話,並不需要學會所有的Python指令。當然如果能隨心所欲應用Python是最好的。
如果以 Kaggle 公開課程做為參考比較的話,在假設同學不需要太多 Python、Pandas 和 Numpy/Scipy 的協助的前提之下,我們的課程計劃可以包含 Intro to Machine Learning 和 Intermediate Machine Learning 之外,還會接軌到深度學習入門 Intro to Deep Learning 的材料。2024學年可能繼續參考 Kaggle 的入門課程,也可能在開學之後更換對應目標;確定會有實作方向的對應目標。
成績計算之項目與權重:課堂上參與討論、點名與問答 (5%)、Moodle 作業(20%);期末程式作業(25%);期中考試(25%);期末考試(25%)
課本及參考資料
以下提供適合大部分同學的基礎課本,也提供比較量化觀點的專書;上課時大部分時間會是自行整理過的投影片
Ian H. Witten, Eibe Frank, Mark A. Hall, and Christopher J. Pal.
Data Mining : Practical Machine Learning Tools and Techniques.
fourth edition, Morgan Kaufmann, 2017.(新月代理) //--[備註:雖然本書作者所介紹的軟體工具Weka是以Java來實作,但是會寫JAVA程式並非使用WEKA絕對必要的基礎;當然,如果會JAVA是最好的]//--->
(政大圖書館有第一版(索書號006.3 W829)、第二版(索書號006.3 W829 2005)、第三版(索書號006.3 W829 2011)與第四版(索書號006.3 W829 2017)。
Ethem Alpaydin, Introduction to Machine Learning, fourth edition, The MIT Press, 2020. (開發代理,政大圖書館:第一版 (索書號: 006.31 A456)、第二版 (索書號: 006.31 A456 2010)、第三版(索書號: 006.31 A456 2014)、第四版(索書號: 006.31 A456 2020))
Tom M. Mitchell.
Machine Learning.
McGraw-Hill, 1997.
(政大圖書館索書號006.31 M682)
Ian Goodfellow and Yoshua Bengio and Aaron Courville, Deep Learning, MIT Press, 2016.
Stuart Russell and Peter Norvig.
Artificial Intelligence: A Modern Approach, fourth edition,
Prentice Hall, 2020.
(政大圖書館有第一版(索書號006.3 R967-1)、第二版(索書號 006.3 R967-1 2003)、第三版 (索書號006.3 R967-1 2010)與第四版 (索書號006.3 R967-1 2021))
將適時補充其他新的材料
如果是要學習基礎觀念,一些比較早期的書本或許寫得比較容易懂 Yaser S. Abu-Mostafa, Malik Magdon-Ismail, and Hsuan-Tien Lin (林軒田). Learning from Data, AMLbook, 2012.
Jiawei Han, Micheline Kamber, and Jian Pei.
Data Mining: Concepts and Techniques, third edition.
Morgan Kaufamnn, 2011. (政大圖書館:第三版、第二版、第一版)
Pang-Ning Tan, Michael Steinbach, and Vipin Kumar.
Introduction to Data Mining.
Addison-Wesley, 2006.
(政大圖書館索書號006.312 T161)
Pat Langley.
Elements of Machine Learning.
Morgan Kaufmann, 1995.
(台大圖書館索書號Q325.5 L36z 1996)
George F. Luger,
Artificial Intelligence: Structures and Strategies for Complex Problem Solving, sixth edition,
Addison Wesley, 2008.
(新月代理)
(政大圖書館有第四版 (2002)、第二版)
(第一到第三版之共同作者:William A. Stubblefield)
競賽
軟體支援
Hugging Face
Keras
Python
PyTorch
scikit learn
TensorFlow
Weka 3, supported by Witten and Frank (有GUI、可透過JAVA自行操作)
有歷史的資料庫:UCI KDD Archive
先修課程
程式設計、Python、線性代數、機率和統計:沒有修過這些科目的類似課程將影響上課內容的接受度
線上課程討論版與電子郵件
所有課程相關之最新消息會公告在政大Moodle網站的機器學習概論課程版,所有修課同學請密切注意相關通告。課程版上之公告與課堂上之公告有相同之效力。此外,任課老師也會透過 Moodle 所寄發測試的電子郵件與修課同學保持聯繫,在開學之初,任課老師會寄發測試的郵件。如果你從來沒有收到相關郵件,請你務必與任課老師聯繫。
成績計算
預計進度:政治大學本學期行事曆
以下所列進度,會依實際進度而有所調整。進度表也會反映實際進度。所列章節數目均是課本的內容,
我們用M代表Mitchell書中的章節,W代表Witten書中的章節,R代表Russell書中的章節,A代表Alpaydin書中的章節,G代表Goodfellow書中的章節。
日期
週次
課程主題
課程內容與指定閱讀
輔助參考章節
教學活動與作業
學習投入時數
(含課堂及課程前後)
備用欄位
9月
9日
W1
Introduction, Input, and Output
W1, W2, W3
A1
Moodle
3小時/3小時
調查程式設計能力
16日
W2
Input, Output, Linear Regression, Python, & Tools
W2, W3, W4.6
G2, Python, scikit learn, Weka
Moodle
3小時/3小時
23日
W3
From Logistic Regression to Classification
W4 (4.1-4.4)
課堂參考資料
Moodle
3小時/3小時
30日
W4
DT, kNN, and Naive Bayes
W4 (4.6, 4.7), W6, W7
M3, M8, R18, 課堂參考資料
Moodle
3小時/3小時
10月
7日
W5
Evaluation
W5
M5, 課堂參考資料
14日
W6
Data Transformations
W8
A6, 課堂參考資料
Moodle
3小時/3小時
21日
W7
Artificial Neural Networks
W10.1
G6, A11, 課堂參考資料
Moodle
3小時/3小時
28日
W8
Artificial Neural Networks
W10.1
G6, A11, 課堂參考資料
Moodle
3小時/3小時
11月
4日
W9
期中考試
11日
W10
Reviews & Deep Learning Topics
W10
M4, 課堂參考資料
Moodle
3小時/3小時
18日
W11
彈性上課時間
提供網路學習資源
Moodle
3小時/3小時
25日
W12
Clustering
W4.8
A7, 課堂參考資料
Moodle
3小時/3小時
12月
2日
W13
Probabilistic Methods
W9
A14, A15, 課堂參考資料
Moodle
3小時/3小時
9日
W14
Ensemble Learning
W12
A18, 課堂參考資料
Moodle
3小時/3小時
有可能與W16對調,改為彈性課程
16日
W15
NLP, LM, LLM, and ChatGPT
課堂參考資料
課堂參考資料
Moodle
3小時/3小時
23日
W16
彈性上課時間
提供網路學習資源
有可能與W14對調,改為一般課程
30日
W17
程式作業驗收與面談
1月
6日
W18
期末考試