資科系研究領域介紹

開場白 | 陳良弼 | 何瑁鎧 | 李蔡彥 | 沈錳坤 | 廖文宏 | 劉昭麟 | 連耀南

開場白 (連耀南 教授)

在以前,我們都請一些學術界或業界的專家來演講,可是,在我們系上許多老師的研究也都做的非常好,所以趁今天這個機會請系上的老師對自己的研究領域向大家做個介紹。目前有陳良弼院長、之前的計中主任李蔡彥老師、廖文宏老師、何瑁鎧老師、劉昭麟老師、以及沈錳坤老師,若結束之後還有時間,我也會介紹自己目前的研究狀況。那我們就請陳院長來為我們開場。

陳良弼 教授 Back to Top

各位老師同學大家好,奉連老師之命,來跟大家介紹我的研究。剛來連老師提到李老師、廖老師、何老師、劉昭麟老師、沈錳坤老師、和連老師,其實他們都可以不用講了,因為我會把他們的東西全部都講進來(好像有點誇口喔)。我先從 Data Management 的角度講起,它會 touch 到很多其他的領域,從好的方面來講就是說,它包含得很廣,從不好的方面來講,就是有時候會覺得很累,因為到網路層,也不是那麼懂網路,到 image processing 也不是那麼懂。而目的就是要讓大家知道 Data Management 的本質。(因為我沒有準備投影片,我就直接寫黑板)我現在開始講的是 Data Management,我們都知道資料是越來越多,除了說從網路上 WWW 所產生的資料量是非常大之外,其他相關的資料,譬如說用數位相機拍下來的照片、或是許多以前的古籍的數位典藏之下會將其數位化,經過數位化之後就能夠存下來,所以資料越來越大是一個很明顯的趨勢。所謂 Data Management 就是要去管理這些大量的資料,最早期我們稱之為 DBMS(Database Management System),以前資料庫管理的資料主要是叫作alphanumerical 的 data type,這種文數字的資料譬如老師開了哪些課、學生的成績,這些不是文字就是數字,我們把這些資料用關聯式資料庫儲存下來,之後我們就可以去存取或修改,並保存著不會遺失,這已經是很成熟的技術了,因此,從這個 Data type 的改變進行擴充,擴充之後就變成,例如一張照片也是一個資料、一首歌也是一個資料、一段影像也是一個資料、一個網頁也是一個資料,幾乎什麼東西都可以算是資料,因此就演化出 Multimedia 多媒體資料管理,可以稱為 Multimedia Database,從資料型態進行擴充,就可以到達這個地方。而很多的照片該如何儲存下來,並在之後能夠很快地搜尋,音樂也能夠儲存下來,並進一步進行分析,譬如去做分類,哪些是屬於爵士的,而爵士音樂的特色又是如何?爵士音樂對人的情緒的影響又為何?這可以牽扯到很遠。所以說,這邊就是從資料型態,我們可以擴充到各式各樣的多媒體。從 Database Management 到 Data Management 看起來字是減少了,但是東西是變多的,這是第一個方向,即 Data Type。第二個方向是屬於環境的(Environment),其中最重要的是 Networking 網路,環境的變化使得傳統的資料庫轉變為分散式資料庫,目前是 Web 的環境,到 Data Broadcasting,在無線環境下資料的廣播,以及 Sensor Network(感測網路),現在 Sensor Network 是很紅的東西,它就是我們現在可以到處安裝 sensors,這些 sensors 就會偵測到一些資料,而我們該如何管理這些資料。這種 Sensor Network 就會演化到 Data Stream 的 Management,叫做 Data Stream Management System,所以現在做資料庫的人已經不做 Database 的東西了,這已經很成熟了,有些人就轉向 Multimedia Database,有些則到 Data Stream Management。而李蔡彥老師做的電腦動畫、廖文宏老師做的影像處理、何瑁鎧老師做的地理資訊系統(GIS)其實都是屬於 Spatial Database(空間資料庫),而沈錳坤老師是和我同行的(大四的同學考上研究所,如果沈老師已經收滿了,可以來找我)。所以從網路一直到 Data Streaming之外,另外一個是 WWW 以及 Search Engine,例如 Google,所以我覺得從資料管理的角度來看,在台灣似乎不是很熱門,現在熱門的是連老師做網路的人,以及做 SOC、VLSI Design 的人。但事實上,我們可以看到許多大公司,像 Google、IBM、Yahoo,這些公司都是做 Search Engine,Search Engine 與資料庫是相近的,所以從這個地方開始,其實是有很多地方可以做的。剛剛講的這邊,不管是多媒體存下來的東西,如何又快又精準地取到自己想要的內容,這是這個地方的目的,同時在資料連續流過的環境下,如何去做資料的處理,這正是它的困難所在,此外,還有如何在 WWW 這麼龐大的地方做 Search,這幾個領域共同牽涉到的是怎麼去抓資料。另外還一個名氣很大的 Data Mining,Data Mining 不僅是去抓資料,還要去做分析,這種我們可以去跟其他領域做溝通,因此資料探勘其實也是其他許多系也有在做的。因為資料量很大,如果能夠仔細地去做分析,就能得到一些法則,這些法則就能幫我們做一些 Decision Making,譬如說音樂是可以來做分析的,去看某些音樂具有什麼特色,看看有沒有辦法對十一族原住民的音樂作分析,去分辨每一族音樂的特色,例如我現在哼一首以前的原住民歌曲,你們有沒有辦法告訴我這是哪一族的?類似這樣的東西。(那我就簡單介紹到這個地方)(連老師:關於情境計算,能否簡單說明。)我剛才有稍微 touch 到音樂與情緒的關係,謝謝連老師的提醒,目前我們資料系有一個頂尖大學計劃下的數位資訊發展計畫,強調的是跨領域的研究,分為三個主軸,一個與傳播,一個與社會科學,一個與教育語言學習關係的,其中劉昭麟老師是與語言學習有關的,李蔡彥老師、廖文宏老師、沈錳坤老師是與傳播有關的,何瑁鎧老師是與社會科學有關的,連耀南也是跟教育及校園網路建置有關係,這是一個比較大的計畫。另外我們有一個國科會計畫,是與心理系的老師共同提出的,並獲得通過。(這一期的政大校訓有報導)大標題是跨領域的合作,特別是智慧型生活空間,也就是未來的空間,包括居家、辦公室各方面,我們是著重在家庭,在家庭裡面有臥室,因此強調的是睡眠,又因為我們學校心理系有一位睡眠專家,他們有招募人去睡覺,以量測睡覺時的狀況,有些人就會很斤斤計較床是彈簧床還是什麼床。一個是與臥室有關,另一個是與客廳有關,客廳可能是娛樂,所以可能會有互動式電視。另一個是 Studying Room,在 Studying Room 中,看怎麼樣藉由 Computer Science 的方法或是心理學的方法或儀器,去偵測譬如說小孩的情緒或是注意力,假設他是看著電腦在學習,我們可以使用如眼動儀的儀器去偵測他的眼睛,如果他的眼睛閃來閃去或呆滯,可能就表示他目前的注意力不好,或者是目前碰到困難,因此我們在情緒上是不是能放一些音樂來調整他的情緒,或者是選一些相關但是比較簡單的教材來給他看。基本上,這個大的計畫是結合資科的老師與心理系老師的專長,在情緒以及注意力的偵測與紓緩,以改進他的娛樂、睡眠與學習,希望這個計畫在三年做下來能夠有一些成果。

何瑁鎧 教授 Back to Top

(不好意思,因為我跟學生有約,所以我得趕快講一些我做的東西)剛才陳院長提到睡眠專家,(我有一點powerpoint,不知道有沒有人能幫我安裝一下),睡眠專家可能一天到晚在睡覺,我剛好 GIS 做一個跟選舉有關的,並不是我一天到晚都到凱達格蘭大道喔!我只是偶而會去而已。GIS我們強調的其實是跨領域,我先舉幾個例子來說明 GIS 可能的應用。我接觸 GIS 的時間大概兩年左右,我第一次聽到關於 GIS 的報導(有一些同學可能都聽過這個東西),這個報導的 title 是「From trap to table」,trap 是 Computer Science 中 OS 的一個專有名詞,table 也是我們一天到晚都在用的,有沒有人想到「From trap to table」大概是怎樣的內容?(可能有十來位或者更多同學聽過)「From trap to table」的 trap 其實就是陷阱,table 就是餐桌,再美國東北角有一個緬因州,他們從 trap 裡面抓到龍蝦,送到餐桌之前有什麼樣的歷程呢?每一支被抓到的龍蝦東有一個編號,而龍蝦身上綁了一個網址,希望吃到龍蝦的人在網登記這支龍蝦在什麼時間什麼地點被吃的,它可以透過地圖上的分析來做一些產銷活動,這個產銷活動也許就是這些龍蝦被運送多久、多遠,或者其中的保鮮過程要怎樣,這是一個小學校以 GIS 對經濟活動進行分析的計畫,其中提到有四隻龍蝦送到南太平洋才被吃掉,大部分龍蝦是在美國東岸被吃掉的,剩下的 20% 才是在西岸被吃掉(中部的人可能都不吃龍蝦,都吃山產)。透過這種網路活動與 GIS 地圖的觀念,可以把這些資料做一個整體性的分析。講到 GIS,我們都知道有數位典藏、數位內容、以及數位學習,過去是說把博物館的東西放到電腦裡面去,這樣我們不用上博物館就可能上網瀏覽、觀看這些東西,後期我們就關心為什麼只放博物館,而不放其他地方,所以現在台灣的數位典藏計畫才會把動植物標本、古蹟或史籍文物資料掃描進電腦,一旦資料進去後,該如何去 organize 這些內容、如何從這些資料得到有用的 information以學習,這個東西大家都講的非常多,我個人的認為是說,勉強來說地理資訊系統相關的研究計畫也是一個數位典藏,只是說它裡面的資料 organize 起來都有非常嚴謹嚴密的關係,透過所有的地圖以及座標系統把所有的資料連結起來,在數位典藏中,任何兩筆資料可以完全獨立,唯一的關聯可能是建立一個 link 連接,在地理資訊系統裡面是有座標系統,它可以譬如說台北市所有的道路、街道、下水道、房屋、瓦斯管線、自來水管,每一種資料當作是一個圖層,把這些資料分門別類的存起來,並透過嚴謹的座標系統定位,把這些資料 merge 在一起、疊套在一起,就可以做一些分析。有了這些資料後,譬如說,從 A 點到 B 點我要開一條新路,就可以避免挖到這些地下管道,或者我們有台北市每一塊地的平均地價,我甚至可以在開一條新路的時候,再加上考慮徵收土地、地價相關的稅,以達到 minimum cost,此時就把人文社會的東西抓進來了。有人講過一些例子說(再這個範疇裡面可能有一些台北市的地圖),我們可以以村里作為一個單位,對各縣市的就讀所謂明星高中學生的數目,譬如我們現在這邊是指南里,指南里有多少人就讀明星高中學校,當然得先定義什麼叫做明星高中學校,如此可以看出台北市各村里中哪一個村里就讀明星高中學校的人數最多,光這樣的話也許不代表任何意義,但是我們如果把每一個里的平均收入或者父母親的教育程度或者其他資料也跟這個東西比對起來的話,也許就可以知道說父母親的教育程度與子女就讀明星學校有什麼程度的關連,這就是把兩種不同人文社會的資料串連起來。過去地理資訊系統可能只是針對單一的資料做分析,現在我們強調的是做不同資料領域之間的結合,這個是我當初想到的一個問題──選區重劃的分析與探討,另外一個我比較喜歡的 title 是──如何利用 GIS 來贏得選舉。(我也必須很坦白的說,剛才兩點零三分的時候,連老師打電話給我,我壓根兒完全忘記今天要來講,所以我就找了一個舊的資料,這是去年在 TAAI 發表的東西,今天來看的話,其實是有更豐富的層面的,我不會 go through 這裡面的內容)為什麼會有這個問題呢?是說明年的立法委員選舉整個結構改變了,過去台北市是分為南北兩區,每一區大概選 10 個左右的委員,明年台北市如果沒有憲改的問題,目前的制度是台北市應該畫分為八個選區,每一區選一個人,也就是有一個名額,如何劃分就相當於說,畫好了就大概知道這一區大概是泛藍或泛綠出線,以目前的政治型態大概是這樣子。把這個問題丟給政治學家或社會學家的話,他可能回去兩個月之後或者更久一點,他有一個 solution 出來,這樣的話他拿給馬英九,馬英九如果不滿意,他回去再過兩個月有第二個方法,如果馬英九還是不滿意,再過兩個月或更久,他每一種畫法大概需要差不多的時間,當然,馬英九滿意可能陳水扁不滿意。Computer Science 的人如果來看這個問題的話,政治學家三個月才可能有 solution,Computer Science 的人不見得三個月就有 solution,他可能第一個 solution 是一年之後,馬英九如果不滿意,他第二天給馬英九10個 cases,還不滿意的話,第三天給馬英九 100 個 cases,然後告訴馬英九這 100 個 cases 都可以保證泛藍比較佔優勢,如果他有機會碰到陳水扁時,他又拿另外 100 個 cases 說保證泛綠會佔優勢,這就是 Computer Science 比較好的地方。我們講求的時如何利用比較有系統的方式去找一些 solution 出來,我以台北市為例(有些同學知道我這個數量級的觀念),台北市有 449 個村里,要分成八個選區,中央選舉委員會規定最小的劃分單位是村里,449 個村裡丟給 8 個選區,或者可以說是 8 個口袋,每一個選區都可以丟進任何一個口袋,所以 search space 是 8 的 449 次方,我就問一個問題,假設你用目前最快的電腦,假設是 10 GigaHZ 的電腦,你要用窮舉法把每個 case 都搜尋一遍,那你大概需要多少時間?能不能估計一下(知道這個問題答案的人就先不要講),是一個小時、一天、一個月、一年、還是大於一年?(有人認為是大於一年的嗎?)你 search 這麼多 cases 去判斷那一個是可能合理的 solution、哪些是不合理的 solution?(認為小於一年時間的人舉手),很簡單的分析可以知道需要 10 的 380 次方年,才能夠 scan 所有的可能性,這是假設在 1 個 clock pulse 下就能決定這是一個 valid 或invalid 的 solution,當然我們知道這是不可能,所以如果我們要用窮舉法來做這樣的搜尋的話,簡直是不可能,最簡單的例子是,台南市你要一刀切下去,台南市是232 個村里,畫兩個選區,你要把所有 scan 的可能性列出來,如果用窮舉法大概需要 2 的 60 次方年,演算法加人工智慧可以告訴大家說 (n^3)*(logn) 才能夠解決台南市。我這邊說明一下,最後我們可以用不同的方式來解決,這裡是說假設有某一種方法(這個是去年的劉克礦跟我一起做的),利用砌磚法切割出來的話,選區人口的差距是在範圍之內,而另一個方法是稱作是鄉村包圍城市法(因為那邊的人是說農村包圍城市,這跟意識型態無關喔),此法切起來是比較沒有規則的,人口數也沒有合乎中選會的規定。對於這兩種方法,畫分好之後,我們再把過去歷史投票的行為加進來(支持泛藍或支持泛綠),如果差距是百分之十的話,我們比較認為是不會翻盤(當然我們知道台北市是泛藍居多)(指投影片:那個方法是確保六席,這個方法是確保五席),這只是說明以不同方式來劃分,我可以在席次上有不同的改變,而目前我們實驗室的研究生在做的是說能不能挖這邊的牆角來補這裡,如果我可以這樣做的話,原來確保六席者,就可以增加為七席,或者反過來說,我既然要輸了,那就多輸一點,我在這個地方輸的非常多,那我就在另一個地方贏回來,不同的政黨傾向可能有不同的看法,問題是能不能找到一個自動的方式,把東西丟進去,讓 solution 能自己跑出來,而不是用人為思考的方式。基因演算法也許可以達到,或者某些 AI 的演算法可以達到這樣的效果,所著重的是能不能夠有自動的方式去找到 100、1000、10000 個 solutions,而在這麼多的 solutions 中,找到最好的前 10 個 solutions,反過來對泛藍最好的 solution 也就是對泛綠最差的。因此,Computer Science 的人從某一個角度來講,似乎可以左右政局喔!(OK! 那我就講到這個地方。)

李蔡彥 教授 Back to Top

我想先謝謝連老師給我們這個機會,可以跟大家認識,那我其實也很…在系上這樣的機會是第一次,也可以說是首創,像這樣的機會跟系上的老師可以交流。

那今天來跟大家介紹是介紹我實驗室過去幾年來…這幾年前是可以追朔到大概第三屆…大學部第三屆,到現在應該有大概七八年。那我的實驗室是叫做Intelligent Media Lab,有些人說是智慧型多媒體實驗室,那我那個多是沒有的就是Intelligent Media Lab,因為我覺得沒有多,會比多來得更多一點,有多的話就代表說你一定要多才能叫多,那沒有多的話就代表有多沒多都可以,所以我覺得Media Lab是叫Media Lab比較適合我現在做的最像的,那大概跟各位...我跟前面兩個老師大概不太一樣的,我今天會show一些video給大家看,那這些video也沒辦法做很深入的說明,那但是我從這個video裡面大概可以了解說我的實驗室大概希望能達到的目標。

那大概分成下面這些項目,一個是自動導覽系統,這大概是剛才講過第三屆的大學部的專題做的,那到後來的這個自主式的數位演員,在電腦動畫裡面希望能夠創造一個會自己動的一個數位演員,然後…(這邊沒有pointer),那單一的演員就是說做一群人的演員,那鄰近的演員也會有一個環境讓它去演,這是後來的這個可延伸的虛擬環境,那到其他種類的虛擬演員,那到智慧型人機介面或是智慧型的一個tutoring教學系統大概是這些。

其實其他類的我就大概列了簡單列了一些,那第一個我想先看就是一個智慧型導覽系統,我覺得包…這個…那系統其實具有數位典藏的功能。像我們現在看到的這個(撥放video中),這是我們過去的大仁樓,大仁樓以前長這個樣子喔。這個大仁樓的四樓,那這四樓裡面,這個系統是自動瀏覽系統,所以使用者在這個下面的平面圖裡面去點,點選他想去的地方,那它就可以產生出一個客製化的導覽路徑。那後面就有一個攝影機是跟著前面這個人,前面這個人的動畫是動態產生出來的,所以希望能夠達到客制化的虛擬導覽…像這個系統,這大概是七八年前做的一個計畫,(撥放video中),那後來比較多的時間大概有三、五年的時間大概做這個自主式的虛擬演員,那虛擬演員其實一般演員要能夠讓它可以在一個動畫做自主式的運動,其實不是一件很容易的事情。這大概是用decapo的方式把它分成global的planning跟local的planning。

如我們要到校門口去,我會先規劃大概的路徑,那到那個地方我再決定說我這個地方是不是要下樓梯,給我一個環境給我一個人的運動的能力,希望能夠就透過global planning,那這global planning就送給local planning去產生新的動作,不成功的話再回饋回去,這大概是這系統的架構。

所以假設有一個環境像這個樣子…它有一些梅花樁它有一些樓梯,那希望對這個環境做一些分析,了解這個環境對這個結構是怎麼樣,然後呢這個有不同的層…一層一層的,希望說如果未來給我一個的這個人的模型,人的模型大概長這個樣子,然後可以做一些簡單的簡化,那他移動的方向不一樣的時候,它所需要的涵蓋面積可能也不太一樣。透過一些影像處理的方式,我們可以透過把這梅花樁這些中間空隙的部分,有些地方跨得過去的我們把它填起來,跨不過去的可能就…這是影像處理裡面的這個coding operation。然後在不同的…假設具有不同能力…不同能力之階段,某個地方可能要切換另外一種能力。希望在這個比較大的一個空間裡面去搜尋到一個演員可以運動的路徑,然後一旦有了以後,接下來就是說照這個環境底下有沒有可能去…去根據這個環境是這樣去做一些local的腳步運動規劃,就這個地方它可能就跨過去,可是如果它踩上去的話它就可以跨得過去。我們講這個其實是比較細的這個…到這個地方去再說的,不用現在就想這麼細,所以可以分成比較高層次的global planning跟比較低層次的這個local planning。

那這就另外一個例子,它可以比較輕鬆的跨上去,也可以比較費力的跨上去,這中間這個腳步都是不會撞到障礙物的。下面這個例子是說踏上去之後,如果它沒有想得很清楚,沒有想得很遠的話,它可能會掉下去,下去之後當然爬不上來。所以說可以想得…像我們人一樣,可以想個兩三步以後的話,它就知道很聰明的跨上去,否則你會失敗。那…這做出來的是一個即時的系統,就是人滑鼠在這邊控制,控制這個人的操縱方向,那它碰到的這個路面高高低低的,有些有地面有些是不平的。你可以看到這邊是它的剖面圖,那它的…可以看到這個performance是即時的,所以說在一個game裡面如果你有這樣的一個環境…凹凸的環境,那人去走的時候它事實上人的腳步會隨著環境而改變。

這是另外一個例子,就是剛剛講的這個planning,它假設有一個人在…就是控制介面的這個地方,在這附近它可以把這個人擺到這個地方來,然後它換到另外一層去…換到二樓去,好…這個人的目標擺到二樓上面…它跑到上面來,指定好以後它…那個plane它就開始…開始找出一條路徑,它知道說樓梯在這裡,所以這個樓梯可以上去。那這個時候如果你給它搗蛋,譬如說在前面放了一個小小的障礙物…看它的反應,把另外大的障礙物擺在樓梯地面處的地方…看它會怎樣反應,開始動了以後,這時候才開始去啟動這個local的planning,它看到這個地板,看到這個障礙物,它跨得過去它就跨過去,可是像這個紅色障礙物就跨不過去,那這怎麼辦…這個時候在這個地方它就開始做路徑的planning,它發現還有另外一條路徑是到得了的,這個時候它就走另外一條路,然後…就上去了。可能沒有時間把它撥完,不過相信我它後來是上去的(大家笑了)。

是另外一個例子,剛剛看到的是上樓梯,那這個例子的話…假設說這有個水塘,這水塘裡面有很多的浮萍。這跟剛剛的梅花樁是很像的,那這個人就負責在這個環境裡面…從這個地方走到這個房子前面。那它碰到挑戰是什麼,它要挑戰…第一個是上樓梯,第二個是走梅花樁,第三個要跳躍這個…這個溝塹,那最後要擠進這個…那個什麼…籬笆,籬笆比較窄,但它算出的路徑是真的找到了。那它中間的過程裡面可能動畫沒有做得很漂亮,因為切換得不是很…很好,那這攝影機也不是很聰明,因為攝影機…就是跟在這個人前面固定住這個角度,所以人一轉動這個攝影機就照著轉了,不是很聰明的攝影機。像這個地方,這攝影機是固定在人前面的。

那我們有做一些研究是有關攝影機…如何做一個聰明的攝影機,就是…在座有一些同學是看過的喔,有請這些同學見諒一下,那…這動畫有點久喔。這就不是很聰明的攝影機照著這個轉轉轉轉轉,那它踩上這個浮萍,這也不是很聰明的地方,它會走這個直角…對不對,像這個地方它會切換成用跳的方式跳過去,這很神喔。那到這邊(大家笑了)…不過硬著到耶,這是說它大概…會考慮不同的這個情境、有不同能力,然後走到它想到的地方,這就是自主式的,就是它自己會動,不用你跟它講。

那一樣會做一個人之後,那我們開始想說可不可以做很多個人,這是一張圖說四個人要交錯著走,該怎麼走,那其實四個人對我們來講已經開始搞不清楚了,就開始清不起,更何況說如果超過四個人怎麼辦。這個事實上規劃出一個路徑大概只要不到一秒鐘的時間,那這是當你很多人在…在這個環境裡面在做模擬的時候,假設有兩個人交錯著,這是我們把算出來之後把它用虛擬…這時候用一個虛擬系統去把它模擬出來,兩群人帶著走,那這兩群人的…真正有計畫能力的只有一個導遊。導遊具有計畫的能力,那其他人其實是跟著走而已,所以這個地方它的問題的困難度其實沒有很高,導遊可能需要幫後面的人規劃路徑…能夠兩群人可以怎樣交錯,那實際上這兩群人就兩個人在規劃而已。

下面這就比較難一點,下面這邊看到的…你看到的大概有一百多個人到兩百個人,像從剛剛看到的那個地方要過那個門到另外一個地方去,這裡每個人大概有兩個自由度。換句話說整個系統大概有…有大概三百個自由度左右,那三百個自由度要all guarantee說這群人通通帶到另外一邊去,而且這群人是不會打架的。有時候人…一群人擠在一起的時候其實非常容易的碰撞,在這個情況下,要能夠把這群人通通趕到這裡,像趕羊一樣趕到這裡來。這個…就計算度來講是非常高的 (Lien:如果有紅綠的話怎麼辦),你說什麼(Lien:紅跟綠呢),喔喔…紅跟綠(大家笑了),剛剛看到前面那兩群人喔,其實就有不同策略出來,有些是可以跑前面,有些跑後面。那有了這樣的環境之後,我們過去其實是用外面的資訊排列系統。後來我們覺得說假如靠別人…靠人還不如靠己,所以自己就開發了一個系統,那這環境系統目前還在持續延續當中。

那我們也做了一些這個…善盡的ignition,是用來描述這些人群的動畫。好…這邊就是一個例子,這個人叫…有一個scrip可以叫這個人到前面來,然後就…它會等候你一個命令,你可以跟它講說…它會跟你問好,然後…等一下我們還有一個例子可以給大家看。好…接下來這個例子就是…嗯…somehow這個go不出來,基本上這個是一個這個…這個聲音跟動畫結合的一個…一個demo,就是說那個人會出來跟你問好,然後你可以用聲音的方式來跟它講說…它會問你一個問題,然後你回答它,那它…它只懂得一些你給它的字彙。譬如說你要去哪裡,你可以跟它說我要去IM Lab,它會跟你講說IM Lab這邊走,大概是這樣簡單的demo。

那這個是延伸我們這個動畫語言,把它延伸出去加上一個v,就是代表這個…它這個plugin的模組,所以可以把這個系…這個系統具有延伸性就是這個意思,就是可以…可以把別的不同的系統plugin進來。這是另外一張圖我想就先跳過去,那我們也做了幾個這樣子的虛擬環境系統,所以你可以…在這環境裡面,可以跟其他人…其實這個人是誰控制還是NPC控制不曉得,但是它們其實是NPC控制。你可以跟它透過一些對談,指令就送過去,可以改變對方這個人的情緒狀態,所以你不要送它一個…你不要罵它那它最後就會變得沮喪,然後它看到你的時候就會繞路,它不會正面的面對你。

那…我們也…因為時間的關係喔,我們也做了一些這個表現中國舞獅動畫的一個…動畫,這個動畫基本上是後處理的,就是說它事實上是拿到動畫軟體裡面去random,才有這個鬚鬚那些東西才會動。這實際上它的動作是即時可以產生出來的。我們看下面這個例子,這個研究主要是在做這個動畫能夠…能夠比較有表達力,所以我們抓住了一些所謂的有節奏的這個參數,所以節奏參數包括了這個速度阿、它的強度、它誇張的程度、等等等,這三個不同強度做的這個比較。所以說你可以透過這些參數去產生比較有…所謂expressing,比較有表達力的這種狀況。所以這個是即時的介面,那個蝴蝶是使用者拖得動的,拖到不同地方去,它就會產生一條路徑,去跟這個…獅頭就會去跟著這個…這個在舞獅裡面叫踩青,就是要去吃那個食物。那這是show給大家看說這些動作包含它走的三七步,不是叫做三七步…叫七星步(大家笑了)。那個不同的步伐也可以動態的執行它,它是用scrip的方式去控制它的,那左邊是一些…這邊是一些這個剛剛講的那個旋律的參數喔…ok,可以來做一些調整,它就會把它即時的演出來。那我們把它即時演出來的東西錄起來,就剛剛前面看到那個動畫是這樣的。那現在也有同學,研二也在嘛對不對,研二同學…這邊有研二嗎?有阿…研二同學有一些在做這個研究,做這個延續…做這個什麼…梅花樁,舞獅踩在梅花樁上面。

那這是另外一個…也是跟傳統…傳統藝術比較有相關的,這個叫做…皮影戲…皮影戲。這皮影戲裡面就是說指定這個開始跟結束的位子,然後它就會自動幫你做出一個動畫,它會遵循你的…達到你的目的,但是它又蠻…會有一些皮影戲的一些效果。譬如說腳會晃,然後手會擺,可是你只有用滑鼠去做…你要去到哪裡,它自己就會擺。這個…這個其實是即時的,所以你可以看到這些控制項還在下面,那其實…那音樂是後製的,音樂是後來才配上去的。

那…除了這個之外,我們還做了一些…智慧型的人機介面。就是如何透過像錄像機這樣的去提升3D介面提供的效率。譬如說這個例子裡面,這是一個迷宮,它從這個地方走到這個地方來,這裡有個氣球,要走到這個地方來,然後如果沒有啟動輔助裝置的話,這個人可能要花一分五十幾秒,啟動這個輔助裝置的話,可以把時間減低到大概一分鐘左右。這其實就剪接過,所以一分鐘很快就過去了,那…這是…這是說怎麼算的,因為今天沒有時間所以說這邊就不一一講了。原則上就是當你發現碰到有東西的時候,它會起來幫你走一條…幫你規劃怎麼走,那使用者其實…希望達到目的是使用者不會感覺到說有人在推它,還是有一點…一點點的…那個順應使用者的意願。那個時間它如果把滑鼠放掉,它動作是平的,好…那這大概是…後面有一些…就是說把它延展到…延展到這個動態的去更新這個function,所以它可以適應大型的場景也可以用…這是另外一個。

那這個是另外一個智慧型人機介面,它是會適應使用者的行為,去調這些參數,這是在…模擬它說在走的過程裡面,它的這些參數會跟著變,這都第一人稱的。接下來看是第三人稱的,第三人稱的意思就是說這個攝影機是在人的外面,我們看到都是那個你控制那個攝影機的。那現在假設人的攝影機是在外面,那這個…你控制這個人往前動的時候,那理論上這些都會碰到障礙物,可是它自己會…你控制它說前進的時候,它自己也會規劃出一些動作避開這些障礙物。

那這是另外一個例子,頭上顯示是它啟動了哪一個機制,它是左手啦、右手啦、腰那些機制去避開障礙物,那使用者就是用滑鼠在控制這個遊戲裡面的人一樣,可是這個第三人稱理論上是有點靈魂出竅的第一人稱,不算真正的第三人稱,但是你卻可以看到這個人。所以說我要做的規劃是…以前是two D,現在其實是變成3D的。

那這是另外一個例子,在一個公園裡面,它要通過這個溜滑梯,你看它頭會低下來,如果它是一個完全被動的,它其實就不一定是這樣子的,可是它事先…快到了它頭會低下來,可見它是看了好幾步,事先就已經知道的。這是另外一個,作者應該在現場,他是研一的同學。我們最近做的一個…一個…做的一個video,他是從運動抓取的library去看怎麼把動作編起來,這是真正的第三人稱,人是完全脫離,攝影機是完全脫離這個人,攝影機…所以說攝影機是附在這麼多地方做切換。那他這個研究的也是跟智慧型人機介面是一樣的,它其實會去幫這個人去考慮到它未來可能去走的方向裡面,有這麼多可能性裡面,哪一個對它是最有利的。它會把它找出來,然後輔助它朝這個方向去運動。那它是real time的,所以它是這個incremental的,你給它時間越多它就算得越多,所以它是電腦變慢的…電腦比較慢的還是可以跑。

它就是看…這是另外一個例子,它是選了一個動作是趴著過去,它會繞路、左轉右轉,這些動作都是運動資料庫裡面抓出來的,看過…它穿過這個…它這個地方回饋過去的下面就是彎著腰穿過去。

那下面我想快一點介紹,我們還有另外一些研究做一些智慧型的這個…教學系統,那也有一些研究是在做創意的問題解決的方法,特別是簡答題這類的問題的研究。那其他還有譬如說碰撞偵測,這邊是一個碰撞偵測的例子,那大概是這些,註明就這重點,這邊是我們實驗室的網站,大家都知道,有空的話歡迎同學在到網站去看,今天大概就到這邊,不好意思耽誤大家這麼久(大家鼓掌)。

沈錳坤 教授 Back to Top

連老師、各位老師、各位同學,是接著李老師講的…不曉得怎麼接下去,那我想我就介紹一下有關做Data Mining跟Multimedia方面我們做了哪些東西,那事實上我們當初實驗是會取這個名字,就是Data Mining跟Multimedia兩個擺在前面,那後來是因為我們學生說這樣就簡稱DM Lab,DM就是一般廣告的DM,所以那我們就把Data Mining放在前面好了。那為什麼我們不把…不直接叫Multimedia Data Mining或者Multimedia Mining呢,就其實原因是因為我們不只做多媒體的Data Mining。那我想之前陳老師已經有介紹過有關一些Data Mining的研究,那因為我也不像李老師一樣有做出這麼多實用的…而且這麼炫的東西,那我等一下也會撥放一些,那些應該算是我們實驗室夢想中希望可以達到的,讓各位看到說我們到底想做到什麼。

好…那我主要其實有做幾個大的方向,第一個就是多媒體的Data Mining,那這部分主要其實是早期我有一個學生,是因為他鋼琴學了十年,那又因為他是我們…我們系乙組進來非資訊組的,他本來是念…念財經方面的,那所以我本來跟他是搭檔有關財經方面想做財經方面的Data Mining,其實才發現他不是很有…對財經方面其實沒有那麼有興趣。那我才問說…我說那你一向是做非資訊組領域的,那後來跟他討論了一下,他鋼琴學了十年,所以我們就開始做有關音樂風格Data Mining。所以像陳老師陳良弼老師剛剛提的,就是我們有時候聽到一些音樂,我們會感覺到說這個就很像是李宗盛做的曲子,那去說為什麼,所以我們就有去做…去Mining出說李宗盛做的曲子是什麼,有關曲風去哪一方面。

那第二個是我們有做有關印象畫派的一些畫風的Mining,那主要原因是因為我個人很喜歡印象畫派的畫,所以我特別會喜歡…喜歡莫內的畫。那我也想說為什麼我會喜歡莫內的畫,那莫內的畫有什麼風格,所以我們就有做一些這樣的。那做到後來之後,我們有開始想一些想結合音樂跟視覺方面的結合的Data Mining,那為什麼會想做這個,我想我就先放一段影片。這是我一個學生今天七八月去荷蘭參加會議,那回來以後在實驗室報告他的心得,那他自己做的,(影片撥放中),那這個就是…就是他…他照的一些照片搭配一些音樂,那不知道各位感覺怎麼樣,我那時候聽他報告我就覺得他這音樂跟他這…跟這相片搭配風格搭配非常好。

那我給大家看的…接下來給大家看的是另外一個,我那朋友他來我們實驗室演講時候撥放的,(影片撥放中),因為他這個檔案蠻大的,所以…。Ok不好意思我把它打斷,那各位可以發現這…這兩個照片還有音樂搭配的感覺怎麼樣,你們感覺音樂搭配蠻好的。那所以其實那時候…我們之前就有想研究說如何從圖片跟音樂找到一個很好的搭配。那事實上剛剛放的那個登山,那個他當初再找這音樂找了很久,這作者找了很久,那後來他才找到我朋友開的唱片公司,才發現…他們才幫他搭配了剛剛同學聽到的那一首。那我們響做到就是想做到那樣的功能,那為什麼會想要這樣呢,想要做這個東西呢。其實我發…我個人是認為說未來科技…其實就…我們要做到什麼,就是要做到像我們時常講的說”科技要始終來自於人性”,那到底什麼叫做”科技始終來自於人性”?我們講到一個很重要的就是人的感覺,就是說如果我們科技可以扣緊人的感覺,讓人可以感動,我覺得這樣才會是未來…未來人們都很需要的科技。

那譬如說什麼,譬如說我有一個朋友,他很喜歡照相,可是他喜歡照相,我後來發現他喜歡照相的原因是什麼,原因是因為他有一個女兒。他女兒還很小,那因為他做爸爸喜歡女兒,這時候他就會想辦法去買到最貴照相機,十幾萬都可以,只要照出來有那種沙龍照的效果,他都很高興。那他朋友也是聽到說...那你女兒怎麼照這麼漂亮,那他們都願意去花這個錢。那這背後代表什麼,代表就是我們每個人都…這是我們心靈上的需求…對不對。那或著譬如想是我們無名小站上大家都想把照片放上去,為什麼…其實那是扣緊我們人的心弦,所以我們想說今天每個人家庭都照很多張照片,那我們是…我們其實都很喜歡把照片跟大家分享,放在網站上面,我們是不是可以做成像PowerPoint撥放,那做成PowerPoint撥放的時候,如果可以搭配音樂是不是更好。那我們大部分人對音樂都是…都是音樂白痴,不曉得怎樣去找到一個最適合的音樂,那音樂可能聽了很久,聽了很多首,都覺得搭配的不好。因為搭配的時候你還要考慮到強度阿…考慮到場景,考慮到很多因素,所以想說是不是能夠做有關音樂…有關視覺方面之間的結合,而且這東西我們還可以做一些更複雜一點的。

譬如說我可以放一段影片,給各位可以看看,這可能很多同學以前都在網路上面看過。(撥放影片中)那你們就發現它就不只是一張一張的照片而已,而且它針對這些照片可以做一些我們平常影像處理上面常做一些動作…對不對,不管放大縮小啦、平移阿。Ok所以我們實驗是目前正在進行的就是想要做這一部分喔,就是怎樣讓視覺跟音樂之間可以結合,一起可以再搭上一些變化,那所以我們基本觀念based on什麼呢?based on就是因為影像會給我們一些感覺,音樂也是一樣會有給我們一些emotion。那我們透過這emotion,透過這emotion然後來抓出影像跟音樂的特徵去…,然後利用Data Mining方式去找它時間對應的關係。

我們基本上是希望可以做到這樣,那當然我們這幾天才很不幸的發現,因為台大他們已經把它做出來了,他有做出這樣的東西,而且還獲得今年ACM Multimedia的…那個award。那台大他們在去年有做出這樣的東西,但我們實驗室有一個大學部的專題學生一看到這樣,因為他想要做印象畫派跟這音樂搭配,他一看到這樣想說這下完了,怎麼會這樣呢。我想做研究本來時常就會這樣,不過我想我們也有我們的特點,那我們希望我們到時候能夠做出這樣的系統出來。

Ok所以前面這三部分是我們是有在做希望結合音樂跟emotion的關係,然後跟視覺搭配起來。那另外一面我們實驗室有一個學生,他本來是…很擅長…就是他平常在山葉音樂教室教人家吉他,教人家怎麼組樂團,他自己女朋友也是一個…也是一個作曲家。所以他進來實驗室的時候,我就問他說你想做什麼,他就說他想要做電腦音樂自動作曲,所以他後來也有做出這樣的一個系統。只是今天因為本來白天要找他,結果他今天不在,本來想要demo給大家看,他就做出一個利用Data Mining技術,就是因為資料庫裡面譬如說現在有兩千首音樂,你可以從裡面譬如說選出十首出來,把它選出來,那選出來之後呢,我們系統就會根據這十首的特性、它的風格,去產生一首跟這十首風格類似的音樂出來…產生這樣,然後我們用Data Mining的技術去產生這樣的音樂。

那另外我們實驗室也有學生在做environment音樂自動的伴奏,主要原因是我們時常聽到有一些人在唱些口水歌對不對,那你會發現其實這些歌的旋律都一樣,那很可能是在伴奏方面做一些變化。所以我們現在想要做這樣就是你給一個主旋律,我會根據你想要的風格產生另外一種風格的音樂。那這其實本來可以給大家demo,可是這一部分我沒有準備。那另外我們也有同學,因為她對室內設計很有興趣,然後她說室內設計也有分很多各式各樣不同的風格。譬如說最近常常在流行那個禪風,所以在想說我們能不能從這些設計圖中Mining,Mining出它的風格出來。所以第一大部分就是有關跟我們這部分的Mining。

那另外一部分就是我們有關…做有關多媒體之間的…多媒體的理論去run。我們主要是著重在音樂,那我為什麼對音樂特別有興趣,其實是源自於…其實在清大我教授有做出一篇音樂查詢系統,可以用哼歌的方式,哼一段歌的方式可以去把它找出來。那可是我個人就對這個系統…我就覺得這個系統對我沒有用,為什麼呢...因為我哼出來的歌就是五音不全,這影片就是找不到…ok。所以那時候我就想說可不可以根據風格的角度,譬如說情人節到了,那我不一定要每一首音樂都只想要說要浪漫的音樂,然後這系統會幫我找出來。所以我們也研究有關…待會也會提過。也就是說我們平常常常在下載音樂,可是是哪一種音樂,那系統可不可以learning我音樂的喜好,久了之後呢,它就會傳給我比較喜歡的音樂。或者像是手機鈴聲的下載也是一樣,常下載哪些手機鈴聲,那系統能不能Mining出我喜歡的風格,那做推薦就會推薦那些音樂。

那第三個就是我們做音樂的分段,就是有些音樂很長對不對,就是有些交響音樂長達幾分鐘,那我們能不能自動去把它做分段,使得我們user可以直接移到那段去聽。那另外也有去做…這個也是針對我來設計的,因為…因為我就是查不到嘛,那我們這個系統透過所謂relevance feedback,因為我怎麼哼就哼不到,那系統傳出來之後我是不是該給系統…給一些feedback,說像這首比較像,這首比較像我所要的,那系統能不能夠透過這樣去learning出來。所以第一個部分是有關音樂的retrieval。

那我們另外還有在做什麼,就是針對音樂跟視覺這邊的關係,我們現在還有從電影院去著手,主要原因是因為…因為我發現很多電影跟它的配樂都搭配的非常好。那我想說當初各位如果有機會去study這些配樂大師,你會發現這些配樂的大師,他們針對電影跟電影之間搭配的關係,他們其實都考慮很多因素,那搭配的效果真的非常好。所以我想說…換句話說這些視覺跟音樂搭配觀念已經有現成的資料在這邊,那我們只是從裡面Mining出他們電影…導演如何透過他的拍攝手法跟配樂之間作連結,所以我們事實上也有在這裡把有關電影拍攝的手法…,考慮電影…那很多導演拍攝的時候會有一些象徵,那我們如何透過這些象徵去找出…去找出那個視覺的特徵,然後跟音樂持續搭配起來。

那除了這個之外,我們也研究了一些跟web有關的,那以前我們有一個學生他就是在做這個個人化的E - News的系統,那它會自動去各大網站去收集新聞出來,然後會learning你的喜好,推薦你所喜歡的新聞,那也有學生做web資料Mining,就是針對我們資科系的網站,大部分人進到我們資科系上的網站到底是怎樣去瀏覽我們的網站的,那可以作為我們設計的參考。

那另外我們也有一個同學做…我們可以從搜尋引擎的Query的log裡面,因為我們通常在下關鍵字查詢時候,第一次、第二次、第三次在下查詢,彼此之間通常有關係對不對。譬如說我第一次下…我第一次下一個字,這個字可能譬如說我下Data Mining,結果發現說傳出來的結果大部分都不是我要的,那我是不是可能會把這個範圍縮小,Data Mining加上多媒體。ok所以我們就一看這兩個查詢詞中間的關係,所以可以建出所謂的ontology。

那另外我也有一個同學是做一個系統,這系統是因為以前也是同學進來,那我們做老師的可能也是比較強調這個Data Mining可能有哪些比較重要的會議對不對,有哪些重要的領域,然後Data Mining有哪些重要的期刊、重要的學者、重要的網站你要去看,我們…或者有些人的homepage就在做這樣的網頁,那我們想說那我們做這樣之後會有產生這樣的東西出來,所以這系統如果做出來之後,只要下任何一個領域的名稱,那我就會把這個領域相關的訊息找出來。好…那我們也有做出這樣的一個系統。那做出這樣的系統其實是有爭議性的,為什麼…有些人可能會說譬如說這些比較重要的paper、重要的網站,我們名字沒有在上面,是不是很不重要,我覺得…所以就是這一部分我們也有做這一部分。

那另外我們也有做有關搜尋引擎的自動修正,就是有時候我們下一些關鍵字,有些人比較不會下關鍵字。那可能我是…這個系統可以自動幫我們去找到。那另外還有一些我們是研究有關一些Data Mining的演算法。譬如說我們研究AVL Tree的Mining,那還有研究有關空間…空間時間的。譬如說…假設我現在有三部video,那每個video都有它的key frame,那key frame裡面假設我就知道它的object的空間位置是這樣子,所以它是在移動的。那我想看它大部分都是根據怎樣在移動的。

好…那這個其實…譬如說以這個例子來講,那它是…它都會先…它們都會先有這樣a、b、c這樣的關係,就是這樣然後有些線是移到這樣然後移到這樣,主要原因是就是我們可以應用在打籃球、籃球的戰術,因為它每一場的球賽,它的戰術就是它的隊形變化,所以我們可以Mining出它這個隊形的變化出來。

Ok那另外我們也做一些Data stream的Mining,就是當一筆新資料進來的時候,我們怎麼Mining它,還有工作流程怎麼去Mining它。那我的…因為我也有做一些生物資訊的東西,是我們可以把基因的資料表示成序列,那我們可能想說去Mining一些有什麼特性。譬如說舉個例子來講,我們下面有四條DNA序列,每個我們把它看成是一個stream,那…那…這四條stream它功能有相似的地方到底是因為什麼地方它多麼的相似呢?或許其實是因為這邊橘色的地方,它們都有這一小段,所以我們認為它們功能相似,那我們就想要發展Data Mining演算法去把它找出來。但是我們這個例子是找的剛剛好,就是每一段長得都一樣,但我們知道基因都會經過突變。換句話說,我們要做approximately stream matching去找,然後找到這些出來,所以我們也有做一些從生物資訊去Mining它。

那另外我有學生是教育背景的,所以也有從學習層去Mining大部分同學學習效果不錯的話,那也是經過怎樣背景下。那最後也是因為最近開始有跟研究生一起做Data Mining,我們實驗室也有同學從BBS的…譬如說最近最熱門的政治板Mine一些東西出來,那透過彼此之間的talk還有推文、噓文能夠Mine出彼此之間互動的關係。Ok所以那這就是我們實驗室最近在做的。

廖文宏 教授 Back to Top

聽了前面兩位老師精采的報告,覺得可以做個建議給連老師,就是這學期不用請外面的人了,系上老師可能就可以獨撐大局一個學期就給它講完了。

我得到的訊息是比較晚一點,因為我這個禮拜一晚上才從美國回來,所以說就我的認知大概是十到十五分鐘來報告目前的狀況,所以說我等會兒報告的重點會是把目前實驗室的狀況給各位說明,那之前的結果是有列了一些主題出來,但是我就沒有準備相關的資料報告,因為這樣報告下去的話可能到四點多也報告不完,這也是要彌補一下上禮拜的時候延一的新生座談因為那個場次我也沒有出現,所以趁這個機會就一起說明,至於之前的一些研究的成果,請各位如果有興趣的話到我實驗室來,我們再來做詳細的介紹。

先看一下實驗室的名稱,當初取這個名子,先有個想法是希望名子的縮寫要有特別的意義,另外一個是我本身研究所的階段背景做的是關於電腦視覺,而電腦視覺跟人的視覺顯然有直接的關係,所以做的是Visual Informtaion,但實際上做的範圍其實比這個還廣一點點,這樣的範圍大概可以用簡單的幾個字來表示---多媒體的訊號處理,剛剛各位已經聽到很多關於多媒體,而我這邊強調的是從訊號的層次來處理,所謂訊號層次就是從音波或影像的像素這個層次來做處理,目前所有的研究生都是以這個層次為基礎然後往上發展,包含的視訊、影像以及聲音的部份。另外,其實有個共通的原因,因為我希望能了解人是如何感受外在的世界,以及是否電腦也能模擬人的感官的能力來自動的幫助我們判斷,這跟陳院長剛剛提到的整型計畫其實有相當的關係,該整合型計劃的主軸希望透過各種不同的訊號資料來偵測人的情緒以及注意力,所以我們就會從聲音語音的部份以及視訊影像的部份再加上一些生理訊號的量測,這諸多資料的整合看能否稍微精確的知道人類情緒的狀態或是注意力的狀態。因此我們的研究對於多媒體的格式標準或壓縮這些方面的著墨就非常的少,我們主要都是在做內容的處理。

接下來我就跟各位報告一些實驗室相關的計畫。第一個是與Audio的分析有關,我常常開完笑的說,一樣是在做Audio,像樓上的DM-Lab,他們聽的是非常優美的音樂、聽的是好聽的古典音樂,而我們這邊也是Audio,但是這個Audio是跟心理系的睡眠實驗室合作,主要是在分析夜晚睡眠時間發出的聲音,那當然就是指酣聲為主,所以並不是非常悅耳的聲音,所以是不是因為這個樣子原來這個題目有位碩士班同學做得不錯,問他要不要留下來念博士班,如果我是做音樂的說不定他就會留下來。那我們目前的一些成果就是在實驗室的環境裡面去錄一個晚上監測整晚的睡眠,它可以知道哪一段的時候有聲音出來,可以知道這個聲音是否是酣聲、這個憨聲是否是規律亦或是嚴重不規律可能會有睡眠呼吸中止這樣的症狀出現。

剛剛少講了一個 Key Word,第一個是訊號層次,第二個是跨領域,基本上是與心理以及醫學的部份,這個部份其實還與長庚醫院合作。

第二個計畫是關於整合性計畫,基本上是有四個主軸。第一個主軸就是我剛剛講的,透過各種訊號的整合,來做情緒以及注意力的偵測。第二個是一個叫 triple-S,要頻估睡前能透過什麼幫助睡眠、睡覺時看看睡眠的品質如何、起床之後看看有沒有什麼方式讓人清醒的程度比較高或是叫醒人的方式讓人起床之後不會覺得那麼累。因此這個做出來之後,會有一些滿有趣的應用。

另外就是剛剛陳院長提到關於頂尖大學的數位資訊發展計畫的傳撥主軸裡面,今年剛好有位技職體系、電子系的同學,所以就可以真的來做一些硬體,我們的目標就是做一個比較低成本的眼動儀。所謂低成本,我們希望在十萬元之下,眼動儀主要是在追蹤眼球的動作,這個應用有非常的多,關於這我就先不詳細說明,至於強調低成本,昨天看到報價一台是一百八十萬到兩百多萬之間,我們希望十萬元可以做出一台堪用的東西。

除了與心理系合作之外,我們還與IM-Lab合作。有一個計畫是要把圖像作卡通化,之前有位研究生是做2D與3D人臉的卡通化,因此有人看到這個結果就問說能不能再做得更實用一點。另外一個就跟數位學習有關,要做線上的文字辨識以及3D幾何物件的辨識,這是跟李老師的IM-Lab以及外面的公司合作的產品,這個產品真的有在賣,每次學校的活動我們都會動員實驗室的同學做些展示,目前的計畫是要把這個應用移植到手機上面讓它也有一些成果。

因為時間的關係所以後面的東西我就先做暫停,今天先報告到這裡,謝謝各位。

劉昭麟 教授 Back to Top

大家好,我是劉昭麟,前面老師都有介紹他們的實驗室叫什麼名子,這個名子就只是好玩而已,如果你要看它的原因,我們網頁上有寫了一大推理由,米格實驗室、密西根實驗室、MIG實驗室,whatever,等下我要講的,其實連老師他給我們的訊息可能不太一樣,我等下會講一大堆計畫的名子,這一大堆計畫顯然不是劉昭麟一個人做的,是一大堆人做的,有些計劃現在還存活在下面,這是過去七年我們實驗室玩過做過混過的一些題目,從上面往下看我大概介紹一下。

我們有做過智慧型運輸系統的東西、法學資訊的東西、教學的東西,然後其他根據一些同學個別的興趣、個別環境的關係所以做這樣的一些內容。那我們用的一些技術大概根據你的題目就選用一些技術,大概是CBR、AI、Neural Network、SVM,其實大略的就是 AI 的 Machine Learning 的 Natural Language Processing,這下面有些細節,我現在大概就是讓大家知道說每個的 Input 及 Output 是怎麼樣,如果你真的有興趣我們再來看那些 paper 的東西。

公車系統其實是一開始我回來台灣的時候,我想在台北市搭公車總是找不到路線,所以一開始本來是想要做台北市公車的運輸系統,到最後我們做得有點瘋狂,我們可以在某些狀況之下把這個系統應用在世界上任何都市的公車系統,然後我們可以證明從A點到B點最少需要搭幾次公車,或者現在有個都市要規劃公車路線,然後你的公車路線應該如何擺才能讓你的都市,最多從任何A點到任何B點最多不超過三次轉乘或是兩次轉乘,我們可以證明這些的數學式子。所以最後比原來想的範圍要大很多。

那標誌這個是指交通標誌的辨識,這個比較短命沒有做很久,他當時是想要做開車的時候在車裡面裝個camera,這有點跨到廖老師踩到別人的地方去,不過這後面做得很爛很爛就是了,是希望說那個辨識系統可以幫我們警告說前面有個速限標誌、駕駛人速度的上限,然後提醒駕駛人減速一下,可以警告駕駛人以免一天到晚接到罰單,那東西在做警告標誌的辨識,希望能做晴天陰天雨天各種天氣下的辨識。

接下來這個車流是最近還有大四的同學在做的。就是台灣現在西海岸幾個主要道路偶而會有些堵車,台灣高速公路有個特設就是有在收錢,這邊其實去年現在已經畢業跟現在大四的同學做的嘗試是說,如果我在收費上有些折扣,換取駕駛人聽我的話說什麼時候從中山高轉到轉到一高,什麼時候從一高轉到西濱,什麼時候再從西濱轉到台一線,如果可以這樣的話其實台灣西海岸有五條主要的縱貫道路,這樣其實沒什麼道理會堵車。如果我們經濟動機夠高的話,所以這邊是在做這樣的幻想,所以這邊有些在做車流的模擬。

然後再往下訴訟文書的部份這邊是我們比較長期做的,可是太多種類的我就沒有把它再細分。這邊做了很多細分的東西,一開始做的是,如果給你一個法院的起訴書或是判決書,你有沒有辦法判斷說他是竊盜案、殺人案或是搶劫案。後來做得有一點點把握就去做比較細分的法條的分類,譬如說賭博有各種不同的賭法,那A賭法、B賭法、C賭法他們所觸犯的刑法是不一樣的,現在給我一個訴訟文書我想要去分說他觸犯到刑法第幾個法條,這邊比較難的是說,有些人犯罪他會同時犯到A跟B,有人是犯到B而已,那這些東西混在一起之後因為他們有重疊性,所以要確實的分類就不太容易,這邊我們大概做到百分之六十幾,六十幾雖然有點丟臉但我們覺得還滿不錯的。後來我們就做更難的,如果我現在有一百的案子在我手上,現在有個新的案子,有沒有辦法跟我講說這一個新的案子跟過去一百個案子犯罪的型態或是故事哪個是相近的 ,所以我們後來想要找相似案情的能力,有點像是說我現在有一百本故事書,有一本新的故事書,我讓你去找一百本裡面有哪一本是跟我手上這本故事差不多的,然後我們做得很高興,後來給個法官評分之後得到四十幾分,終於踢到鐵板知道這邊是很難的問題。所以這邊做了一些很有趣的東西,比較細,這種東西其實不適合在這短時間之內講。

那往下大概就是智慧型教學系統的部份。這邊比較偏重的是自然語言處理的基礎,我們可以幫老師去出大學聯考常見的克漏字的題目,克漏字大概就是一個句子被挖掉一個字下面找個意思對的來瑱入這樣的東西,這個版本在中文英文現在都有,然後中文這邊去年畢業的一個同學做得比較快,系統可以把一個中文句子切成幾塊幾塊,然後可以來考山上那些外國人,把它組合成原來的句子,這邊有些細節不過基本上就是說我們中期的目標大概就是要建立一個系統,幫教英語的老師、教中文的老師去出一份考卷。

然後這邊做的同學在現場,就是說我們幫師大在做一個國際性的科學物理化學數學題目的中文版本,做的同學應該在現場,我沒有看到他在不在,只是他應該在現場。這邊就是說如果教小孩一年級二年級的算術,他不太會的時候我們要間接的導引他,告訴他有些數學的觀念像是先乘除後加減這樣的觀念。

再來這部份是我自己在做的,就是做一些學習模型的建立,這邊比較高明的是如果現在有個觀念需要ABCD四個東西在一起,我們怎麼知道一個人他是把AB先綁在一起,再把CD綁在一起,然後再把AB加CD綁在一起;或者他一開始就是ABC丟在一個籃子裡就得到ABCD這樣的觀念。其實這裡面有些好玩的地方,我做到現在有些結論是說,除非運氣不錯、老師也很厲害,不然無論你是Machine Learning、XX Mining大概都沒什麼用,所以這是我現在在玩的。

再往下這邊,譬如說摘要就是說自動摘要,我們現在 Word 其實有一些現成的軟體,如果給你一份文件,那你沒有空仔細的讀完這些文件,那我們所謂的自動摘要比較多的大概就是從你的原始文件裡面挑出大概十句來做這個文件的代表。這跟我們一般大學老師、研究生、大學部學生要寫摘要是很不一樣的,大部分的摘要都是要你消化完之後讀過然後整理過那才叫做摘要,那東西比這東西難太多了,現在有人在做但效果都是很差,可以想像這需要很多的智力,現在電腦離這個還太遠。

再往下,就是今年年初剛畢業的同學在做,台灣或是世界各國的公司都有一些倒帳、公司有壞帳這樣的一些東西,然後最後它就會說我公司就關閉了投資人就賠大錢。那我們這邊再的就是說我們有沒有辦法透過他三年前的財報兩年前的財報一年前的財報,去預測這個公司如果財務報表快要出問題了。然後在來延二的同學是在做股價的預測。再來是 Sequence Alignment,如果有一篇中文一篇英文,我現在跟你講說,這個英文的文章是中文文章的翻譯,那你有沒有辦法寫個程式跟我講說哪一句是哪一句的翻譯,這是我們的計畫。

其實我只是讓大家知道,一個實驗室的研究計畫其實會隨著學生的來來去去而死掉而復活,這邊這個其實已經死掉了,後面大概也不會再繼續了,這邊有些大概還會再繼續,然後,如果你有什麼樣的興趣的話,其實都在系上的網頁,如果你是對實驗室的某個人有興趣那也是一樣。

在頂尖大學計劃裡面其實我們也分攤了一部分的工作,這邊是很粗略的寫在這個地方。那我的報告就到這邊結束。

連耀南 教授 Back to Top

謝謝劉老師留給我一點時間,讓我介紹我們網路與通訊實驗室的研究狀況,網路的技術進步太快了,最近十年來我們做了很多東西,其實都不值得再介紹,我們把最近我們比較有興趣、在做的東西,跟大家做個介紹。基本上,大家都有在打行動電話吧?有沒有人用過網路電話?應該有吧!主要的重點就在這,舉個例來講,(看投影片) 比如說這是一個國際電話,從台灣高雄經過 local 的地方,經過原來的這個 gateway,然後從國際海纜到美國原來的 gateway,然後走歐美國家長途電話公司,再接到 local 的電話公司,再接到 telephone 去,大家用網路的從來沒想到會這個樣子,只要上網一點,就跑到美國去了,從來沒想到說底下是這麼複雜的事情,那這個還是最 physical layer 的東西而已,我們電腦網路還有 data link layer,還有 network layer,還有 transport layer 對不對?這些都不要談,光 physical layer 就整死你了,那這一部分屬於 telecom 的部分,屬於 data 的部分,那裡面所有的技術,都是 telecom 的技術,中間還有法律的問題,很多...像這裡牽涉到多少東西,比如說,這裡可能是中華電信的電路,然後這個是亞太的國際 gateway,還有國際海纜是另外一家公司的,然後這個是 AT&T 的長途電話,然後這邊可能是 ISP,是 local 的,這牽涉到很多家公司,所以說這中間的法律分擔、這邊技術的 interconnection,大部分都是非常頭痛的問題。現在的網路電話更不一樣,更複雜了,為了要節省國際海纜的頻寬,就等於去走 Internet,黃色的部分是走 IP packet,然後從美國這樣打回來,然後利用紅色的地方是 superstation(?),傳統的電話網路,那又是不同的 scenario,那因為大家知道 IP 比較便宜,所以傳統上打電話,或是利用 superstation 來打電話,非常貴的,影音、multimedia 現在要整個切開來,上面這一部分把它搬到 IP 來,然後還有人做底下的部分,像是挖馬路、拉線、海底光纖這種保存類的東西,但是上面的電話、語音、media conference 這些東西把它搬到 IP 上面來,就像這個樣子,這是一個很簡單的 OR(?) 的 network,就是說將來全部用 IP 去跑,比如說有一個人要打一通電話,可能不能到那裡,那中間有人就用 call 那個 network,就是 IP 的 network,那 access network 可能是 IP LAN、可能是 3D、可能是一般的 local route、或 GPRS,大致上 OR network 可以看成這個樣子,那 IP 大家用過都知道,比起一般電話來講,時間或 quality 比較差,quality 牽涉到平均 time,牽涉到機殼,牽涉到 packet lost,那我們這個 lab 大多就在想辦法要提高它的 quality,那細節我們就不談了,牽涉到技術可能就用 queueing noy(?) 啦、可能用 resource management 啦、比方說我要好好規劃最快路徑要怎麼找啦、要讓多少輛車子要進來才不會爆掉啦,等所有的技術,所有提到的部分,有蔡老師在這部分做得偏向比較 prevent(?)、wireless LAN,那麼大家用 notebook 上網的時候,時間會不會互相綁掉?你又傳 data 又傳 module 又傳影像的話,是不是能夠把它調節分開來,讓 OS 先走,讓它時間可以比較短,諸如此類的技術,那行動電話還牽涉到定位的技術,比方說你的行動電話不管跑到天涯海角,人家都可以找得到你,那這個東西用 mobile management,那這一方面的問題幾乎是張老師這邊在做研究,基本上我們行動計算、行動通訊的 lab 所做的事,範圍都在這裡面,那因為時間的關係,所以很多細節我就不談了,這是...比方說 TCP,大家 TCP 太熟了,可是 TCP 它的 behavior 經常會造成很多困難,為什麼?因為 TCP 在有些電腦上面 run,它根本不知道說網路上的頻寬是多少,所以它就閉著眼睛在那邊送 data,到底要送多快它根本不知道,所以它用 try and error 的方式,慢慢增加速度,愈來愈快,可是你想想看,Microsoft Windows 裡面,TCP 這個 module 如果沒有寫好,寫成大家都送得太快的話,所有全世界 90% 以上的電腦他按一下,結果都送太快,網路馬上當掉,所以它那個 TCP module 要非常的 smart,要能夠好好控制它傳送的速度,可是問題是,每一個人的電腦不知道網路的速度到底是多快,Nobody knows! 你這個 packet 可能送到非洲、可能送到美國、可能送到太空、可能送到台灣,你不知道!所以閉著眼睛去送,所以它那個速度就會這樣,有時候太快,有時候太慢,好,大家有沒有用過 BT 去 download 什麼電影那些東西?全部人都有吧!在家裡如果用 ADSL 會碰到什麼問題?會太慢對不對?ADSL support 下載應該很快,但上傳應該很慢,可是為什麼這麼慢?一個很重要的原因就是,因為它在送的時候,它怎麼知道你這個速度太快了?或是太慢?它是看收到人要送一個 acknowledge 回來,所以 TCP sender 就知道說:「哦,這樣太快了」,可是你現在在 download 影片的時候,BT 可能會 upload 讓給人家抓東西,所以你的 upload 頻寬給人家佔住了,佔住以後你的 acknowledge 就回不去,回不去 sender 就以為是網路塞車,速度就掉下來了,所以像這樣的問題就屬於 quality 的問題,TCP 在這樣一個環境裡面,我要怎麼去解決?假如說在 sensor network 上面或 at-tom(?) network 上面,它的 behavior 跟一般網路又不一樣,那我們要怎麼改變,讓它處理得比較好?像這類問題就是我們研究的範圍,那接下來就是無線電定位,比方說我們今天拿一個 notebook 出去,我們只有 wireless LAN 在校園裡面,那是不是能藉由訊號強度來知道說你在什麼地方?比方說我今天...這個叫做 location of awareness of application,比方說我今天到一個博物館裡面,我拿一個 notebook,我走到這個地方,它自動知道說我位置在那裡,然後把資料庫裡的 data 直接拿出來給你看,比方說假如我們今天在動物園,走到每個動物前面,資料就秀出來,以方說我們政大植物,拿個 notebook 站在前面就知道那植物是什麼,好,這就是定位,那定位很簡單,基本上就是說,一個 unknown 的東西在這裡,然後收到三個不同的無線電訊號,來 measure 它的 distance,它就可以三角定位,那問題是,我們在做的一個就是幻影式定位,這個無線訊號會轉彎,可能會折射、可能會反射、可能會 whatever 不知道,所以你根據它的長度測量到的訊號不準,你以為說它在這個地方,可是它其實不在那裡,所以就會不準,那我所提出來一個方法就是幻影式定位法,假設它是在這個地方,一個 virtual 的 ??,那我根據它這個訊號,根據它的位置來計算,就會比較準。那大致上稍微簡介一下我在做的東西,有興趣的話,可以到我們 lab 跟我們幾位老師聊。好,那我們今天這個課大概就到這樣。