Seminar 報告
資科四 林逸文
這次報告的主題是有關搜尋引擎的搜尋方法,雖然說接觸搜尋引擎已經很久了,但是要說真正的開始會用搜尋引擎的話,對我而言也是上大學之後的事了,這次的演講,讓我對搜尋引擎又有更深一層的認知,為什麼大家都說GOOGLE好,想找都找的到,終於,在這裡我得到了答案。
首先是HITS algorithm,聽到這個演算法時真的讓我耳目一新,原本以為GOOGLE應該是用keyword-based algorithm,沒想到卻完全不是這麼一回事,HITS algorithm 目的事先找出最好的authority page 他主要的觀念是一個網頁若是被愈多網頁給鍊結到,那麼他的重要性就應該愈高,所以每個被指到的網頁(authority page)都有一個自己的點數,每個只到別人的網頁(Hub page)也有其點數,再藉由一些運算,就可以依照點數分出高低來,最後在依照這些順序將搜尋結果呈現出來。
演講的最後他舉了一個法國的例子,這是有關個人化的部分,但是卻引發了我另外一個想法,有沒有可能事先就把這些網頁做分類了,就好比說一樣搜尋法國,他會出現好幾大類,包括了法國的旅遊資訊啦,法國食物等等的幾個大類,在由使用這去點選其有興趣的方面,我想要做到這樣,網頁本身應該需要一些HTML標記的資訊,讓搜尋引擎能夠更簡單的判別這到底是屬於哪一類的。