Seminar report9:
Virtual Link Powered Authority Search in the Web
資科四 89703005 黃一哲
感想:
經過這一次的演講使我更了解search
engine所用的原理,傳統的keyword-based search engines其找到的內容其關鍵字雖然是我們要的,但其內容卻不一定是我們要的,因此延伸出更多其他的搜尋演算法。而陳教授也提到:一個好的網頁會被許多的nodes指到,也因此HITS
algorithm因應而生。
有了這樣的key point,讓使用者在搜尋時更加方便,不僅可以看到比較想要的內容,在搜尋上也更加快速。其中HITS algorithm用到了2種基本的pages:Authority pages和Hub pages,Authority pages是被許多網頁所指到的pages,而Hub
page則那些指向別人的網頁。而HITS的目標是找出最優良的網頁,不過這裡卻出現一些問題,陳教授提到,不管是自己人的網頁互指或是自己寫一個網頁瀏覽計數器,都會造成作弊不準確的現象。
後來的解法則是將user的觀點考慮進去,教授談到這裡,我也不僅會心一笑,有人提供準則,有人就會想出一些旁門左道:要防止投機者的作法,則是我們在去尋找更好的評估方式,以預防他們,不過投機者卻還會再繼續尋找漏洞繼續投機,然後就要再想出辦法來預防,這樣就是不斷循環的現象。
另外,search
engine或許還能夠再提供些額外的功能,例如偵錯的功能,讓使用者在打錯字時,提供許多所要查詢的關鍵字選項,此外我們也可以加入其他功能,例如:是關於什麼方面,時間、地點或其他額外資訊的加入,讓搜尋時能提供更快速更相關的資訊,而我想如果真能作細部上的切割的話,還可建立各種主題式的相關搜尋資料庫,這樣便能更方便使用者的查詢,以及在資訊的收集方便就更完整,也較具擴充性,我們就可以照時間上作排序,在每個網頁資料項前面加上時間,更方便我們查詢及使用。
資訊在不斷暴增,有了搜尋引擎讓我們更加方便,但是如能建立各類資料庫已提供多方面訊息,這也是我們樂見的成果:不斷有網頁以及知識的產生,也不斷增加到各式資料庫以擴大各類知識的內容與記錄下來,這將使我們在未來的資料搜尋上更為完整也更方便,我想這大概是因為,許多時候我難以找到想要的資料而想到的突發奇想吧!