九十七學年度第一學期
國立政治大學 資訊科學研究所
753933: 自然語言處理 (Natural Language Processing)

(以下課程資料僅供參考,任課教師保留其權力,於課程進行過程中,合理地修改課程設計。)
(上次重要修改時間:2008年8月22日)

  1. 上課時間:星期三上午9-12點

  2. 教室:大仁樓200106

  3. 教師:劉昭麟

    email office phone # office hours
    chaolin@nccu.edu.tw 大仁樓200310 67511 星期四中午到下午兩點或另約

    以上office hours時間會因為公務會議而縮短或是取消,所以請有意前來同學務必事先預約,否則有可能撲空。如果在上課時間之外有問題,你可以利用office hours來找我,或者利用email跟我聯絡。 寫電子郵件給我時,別忘了在Subject欄註明科目名稱[NLP08F],否則信件可能會被我忽略。 如果你的問題容易回答,我會直接用email回答。 如果問題複雜,我會在email上大略回答,並在課堂上詳細回答。

    重要公告:修課同學如果有聽障、視障或其他須要特殊協助的情形,請告知任課老師。

  4. 課程簡介

    這一門課介紹利用計算機處理自然語言的相關技術。課程內容以處理英文文字資料為主,並且適時討論中文的處理。 我們將針對英文的構詞、語法、語意與文章結構探討演算法的設計。我們會討論到剖析(parsing)相關的技術。我們也會討論如何 在計算機中表示語意,並處理歧義的問題。除了討論基礎的技術問題之外,我們將討論自然語言處理在
    資訊檢索與粹取(Information Retrieval and Extraction)機器翻譯(Machine Translation)的應用。

    這一學期,我們將採用一種必較特殊的上課方式。主要的上課方式將是由研究生報告課本的內容,同時由任課教師和同學共同討論課本中比較難懂的部分。在每週主題下,我們計劃每一星期有兩個人次的報告參考章節的內容,每次不超過卅分鐘。我們會依進度每一星期討論課本的一章,上課如果沒有提出的問題,就當作是大家都會的材料,所以仍然會作為考試內容。每一位修課同學會輪到的次數將會因為修課同學的多寡而決定。此外,雖然教師上課會用投影片,但是為了激勵同學自我學習,上課投影片將不公開。

  5. 課本及參考資料

    課本
  6. Christopher D. Manning and Hinrich Schutze. Foundations of Statistical Natural Language Processing. The MIT Press. 1999. (政大圖書館:410.285 M283
  7. Daniel Jurafsky and James H. Martin. Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition. Prentice Hall. 2000. (全華圖書代理;這一本書的第二版已經上市,不過這一本書有比較多關於語音辨識與生成的材料,因此本課程仍然以第一本書為主,並且以這一本書的第一版的材料來作為輔助材料。)

    參考書籍
  8. James Allen. Natural Language Understanding. Second Edition. Benjamin/Cummings Publishing Co. 1995. (開發圖書公司代理)(政大圖書館005.13 AL53
  9. Eugene Charniak. Statistical Language Learning. The MIT Press. 1993. (政大圖書館:410.285 C483

  10. 先修課程

    機率統計,編譯器設計,人工智慧,機器學習或資料採掘 (如果你缺乏任何一科,請跟任課教師討論你是否適合修這一門課)

  11. 計分方式

    (計分方式可能會因為選課狀況再作調整,尤其是口頭報告和參與討論的比重;在上課情況適當的情境下,甚至可能取消期中考試,以持續論文討論進度)
    • 出席與參與討論 (30%),
    • 口頭報告 (20%)
    • 書面報告 (20%),
    • 期末考試 (30%)

  12. 預計進度

    以下所列進度,會依實際進度而有所調整。進度表也會反映實際進度。所列章節數目均是課本的內容。 MS代表Manning & Schutze的章節;JM代表Jurafsky & Martin的章節。 我們上課以Manning & Schutze的教材為主,Jurafsky & Martin為討論和基礎教材。

    日期 主題 參考章節 口頭報告 程式作業時程
    9月 17日 Introduction & Mathematical Foundations MS1+MS2+JM1 劉昭麟  
    24日 Mathematical Foundations & Linguistic Essentials MS2+MS3+JM2 劉昭麟  
    10月 1日 Linguistic Essentials & Corpus-Based Work MS3+MS4+JM3 劉昭麟  
    8 日 Collocations MS5    
    15 日 Statistical Inference MS6+JM6    
    22日 Word Sense Disambiguation MS7+JM17.1-2    
    29日 Lexical Acquisition MS8+JM16    
    11月 5日 TBD      
    12日 期中考試(注意日期)
    ------
    ------
    ------
    19 日 Markov Models MS9+JM7    
    26 日    
    12月 3 日    
    10 日 Part-of-Speech Tagging MS10+JM8    
    17 日    
    24 日 Probabilistic Context Free Grammars MS11+JM9+JM10    
    31 日    
    1月 7 日 Probabilistic Parsing MS12+JM12    
    14 日 期末考試(注意日期)
    ------
    ------
    ------

Last Updated: