演講摘要
Database
資料庫簡單的說就是把資料組織成很好的結構然後加以管理。Database中的資料結構分做兩種,一種是Schema 方面,屬於比較 logical 的層次;另外一個結構是它的儲存的結構,是屬於比較底層的。
傳統資料庫的Data Management
資料管理,對傳統的文數字的資料庫來說是對比較上層的資料作模組化的工作。像是利用Relation data model跟各式各樣的資料結構跟table來達到query 的 optimization跟Transaction 的 management。在網路興起後,有分散式的資料庫、Multi-Database、平行電腦等技術來讓資料庫的技術更好。
多媒體資料庫
新興的資料庫例如像是Multimedia database,主要包含的是對影像或者各種聲音表達的資料處理。由於多媒體的資料,跟傳統的文數字資料不一樣,必需採用Content Based Retrieval的觀念來處理,先對media自動化的取出其中一個features,然後做出對應的index檔來。
Image:藉由color、shape、texture等features
Video:利用image的基本特性做分析,再加上一些方法,shot-cut detection,shot-change detection,key frame等做資料處理。
Music跟song:對melody,rhythm,chord,theme等作資料處理。
Web Mining
熱門的web上,可以研究access log看看是否有什麼資料可以從中發現,例如像是同一user的behavior,或者不同user之間會不會有類似的behavior或interest。Data mining主要就是希望能夠從大量的資料中"獲得knowledge",或者說是取得所要的information、rule、pattern;然後利用所取得資料,或者分析出來使用者的行為,像是做association rule的研究,或者sequential pattern的尋找,或者研究是否有任何的週期性等,然後設計出更符合使用者的web站台等等。
Mobile Database
在mobile方面,資料的處理第一個遇到的問題就是location management,有兩種處理方式,一個是當mobile在cell之中移動時候,做registration;或者是用track的方式來處理。藉由這樣的方式之後,可以對mobile的移動資料作個處理,然後就可以分析如何去做可以minimize location management cost。
另外一個問題是data broadcasting的問題,資料的廣播會不斷的循環,像一個圈圈一樣,當等到所要的資料時再把它抓出來;或者是用build index的方式告訴你所想要的 data 再過多久之後會來,但是只在資料量大時才會有其效益。最後希望可以做到的就是當broadcast的同時可以做data processing。
回主頁
演講內容
相關資料
相關網站