Office | Phone | Office Hours | |
---|---|---|---|
chaolin at g dot nccu dot edu tw | 大仁樓 200310 | 67511 | 星期四下午十二到兩點或另約 |
如果在上課時間之外有問題,你可以利用office hours來找我,或者利用email跟我聯絡。雖然任課老師在以上office hours大部份會在辦公室,但是有可能有臨時的系務會議或者其他會議,可能使得任課老師不能全程留在辦公室。 因此,有意前來同學盡量事先預約。如果沒有事先預約而須找我,請先打電話確認,以免任課老師因為臨時的會議不在辦公室。 寫電子郵件給我時,別忘了在Subject欄註明科目名稱[ML23],否則信件可能會被我忽略。 如果你的問題容易回答,我會直接用email回答。 如果問題複雜,我會在email上大略回答,並在課堂上詳細回答。
這一課程以介紹機器學習與深度學習的基本觀念和相關應用為目的。機器學習是人工智慧領域的重要區塊,近年以來因為計算技術的急速進步,許多過去的理論已經變成實用的技術。這一課程透過介紹許多基本的概念,期望讓選課同學了解機器學習技術的基礎觀念,並且進一步學習如何應用公開軟體來處理實際問題。這一課程將介紹機器學習的數個基本型態,包含監督式學習、非監督式學習、迴歸分析、及以類神經網路為基礎的深度學習。
課程中以講解基礎學理為主,同時伴隨程式實例的簡介。在幾乎每一個星期都有的 Moodle 作業中經常會使用到以Python為主的程式實例,期待大家都能兼顧學理與實例。
雖然我們會帶到一些關鍵的Python指令或者套件,但是這不是一門學習 Python 的課程。Python是選修這一門課程的先備能力。體驗機器學習的核心功能,而不建構整個應用系統的話,並不需要學會所有的Python指令。當然如果能隨心所欲應用Python是最好的。
如果以 Kaggle 公開課程做為參考比較的話,在假設同學不需要太多 Python、Pandas 和 Numpy/Scipy 的協助的前提之下,我們的課程計劃可以包含 Intro to Machine Learning 和 Intermediate Machine Learning 之外,還會接軌到深度學習入門 Intro to Deep Learning 的材料。2023學年可能繼續參考 Kaggle 的入門課程,也可能在開學之後更換對應目標;確定會有實作方向的對應目標。
成績計算之項目與權重:課堂上參與討論、點名與問答 (5%)、Moodle 作業(20%);期末程式作業(25%);期中考試(25%);期末考試(25%)
課本及參考資料
將適時補充其他新的材料
Yaser S. Abu-Mostafa, Malik Magdon-Ismail, and Hsuan-Tien Lin (林軒田). Learning from Data, AMLbook, 2012.
Jiawei Han, Micheline Kamber, and Jian Pei.
Data Mining: Concepts and Techniques, third edition.
Morgan Kaufamnn, 2011. (政大圖書館:第三版、第二版、第一版)
Pang-Ning Tan, Michael Steinbach, and Vipin Kumar.
Introduction to Data Mining.
Addison-Wesley, 2006.
(政大圖書館索書號006.312 T161)
Pat Langley.
Elements of Machine Learning.
Morgan Kaufmann, 1995.
(台大圖書館索書號Q325.5 L36z 1996)
George F. Luger,
Artificial Intelligence: Structures and Strategies for Complex Problem Solving, sixth edition,
Addison Wesley, 2008.
(新月代理)
(政大圖書館有第四版 (2002)、第二版)
(第一到第三版之共同作者:William A. Stubblefield)
將視修課同學程式語言學習狀況,將利用 Python 語言為基礎的公開軟體
Weka 3, supported by Witten and Frank (有GUI、可透過JAVA自行操作)
scikit learn
TensorFlow
Keras
PyTorch
Kaggle
TBrain
UCI KDD Archive
UCI Machine Learning Repository
先修課程
程式設計、Python、線性代數、機率和統計:沒有修過這些科目的類似課程將影響上課內容的接受度
線上課程討論版與電子郵件
所有課程相關之最新消息會公告在政大Moodle網站的機器學習概論課程版,所有修課同學請密切注意相關通告。課程版上之公告與課堂上之公告有相同之效力。此外,任課老師也會透過 Moodle 所寄發測試的電子郵件與修課同學保持聯繫,在開學之初,任課老師會寄發測試的郵件。如果你從來沒有收到相關郵件,請你務必與任課老師聯繫。
成績計算
預計進度:政治大學本學期行事曆
以下所列進度,會依實際進度而有所調整。進度表也會反映實際進度。所列章節數目均是課本的內容,
我們用M代表Mitchell書中的章節,W代表Witten書中的章節,R代表Russell書中的章節,A代表Alpaydin書中的章節,G代表Goodfellow書中的章節。
日期
週次
課程主題
課程內容與指定閱讀
輔助參考章節
教學活動與作業
學習投入時數
(含課堂及課程前後)
備用欄位
9月
11日
W1
Introduction, Input, and Output
W1, W2, W3
A1
Moodle
3小時/3小時
調查程式設計能力
18
W2
Input, Output, Linear Regression, Python, & Tools
W2, W3, W4.6
G2, Python, scikit learn, Weka
Moodle
3小時/3小時
25日
W3
From Logistic Regression to Classification
W4 (4.1-4.4)
課堂參考資料
Moodle
3小時/3小時
10月
2日
W4
DT, kNN, and Naive Bayes
W4 (4.6, 4.7), W6, W7
M3, M8, R18, 課堂參考資料
Moodle
3小時/3小時
9日
W5
學校放假
視為彈性上課時間
16日
W6
Evaluation
W5
M5, 課堂參考資料
Moodle
3小時/3小時
23日
W7
Data Transformations
W8
A6, 課堂參考資料
Moodle
3小時/3小時
30日
W8
Artificial Neural Networks
W10.1
G6, A11, 課堂參考資料
Moodle
3小時/3小時
11月
6日
W9
期中考試
13日
W10
Reviews & Artificial Neural Networks
W10.1
G6, A11, 課堂參考資料
Moodle
3小時/3小時
20日
W11
Deep Learning Topics
W10 (TBD)
M4, 課堂參考資料
Moodle
3小時/3小時
27日
W12
NLP, LM, LLM, and ChatGPT
課堂參考資料
課堂參考資料
Moodle
3小時/3小時
12月
4日
W13
Clustering
W4.8
A7, 課堂參考資料
Moodle
3小時/3小時
11日
W14
Probabilistic Methods
W9
A14, A15, 課堂參考資料
Moodle
3小時/3小時
18日
W15
Ensemble Learning
W12
A18, 課堂參考資料
Moodle
3小時/3小時
25日
W16
程式作業驗收與面談
1月
1日
W17
學校放假
視為彈性上課時間
8日
W18
期末考試