Seminar report9: Virtual Link Powered Authority Search in the Web

Seminar report9:

Virtual Link Powered Authority Search in the Web

資科四 89703005 黃一哲

感想：

經過這一次的演講使我更了解search engine所用的原理，傳統的keyword-based search engines其找到的內容其關鍵字雖然是我們要的，但其內容卻不一定是我們要的，因此延伸出更多其他的搜尋演算法。而陳教授也提到：一個好的網頁會被許多的nodes指到，也因此HITS algorithm因應而生。

有了這樣的key point，讓使用者在搜尋時更加方便，不僅可以看到比較想要的內容，在搜尋上也更加快速。其中HITS algorithm用到了2種基本的pages：Authority pages和Hub pages，Authority pages是被許多網頁所指到的pages，而Hub page則那些指向別人的網頁。而HITS的目標是找出最優良的網頁，不過這裡卻出現一些問題，陳教授提到，不管是自己人的網頁互指或是自己寫一個網頁瀏覽計數器，都會造成作弊不準確的現象。

後來的解法則是將user的觀點考慮進去，教授談到這裡，我也不僅會心一笑，有人提供準則，有人就會想出一些旁門左道：要防止投機者的作法，則是我們在去尋找更好的評估方式，以預防他們，不過投機者卻還會再繼續尋找漏洞繼續投機，然後就要再想出辦法來預防，這樣就是不斷循環的現象。

另外，search engine或許還能夠再提供些額外的功能，例如偵錯的功能，讓使用者在打錯字時，提供許多所要查詢的關鍵字選項，此外我們也可以加入其他功能，例如：是關於什麼方面，時間、地點或其他額外資訊的加入，讓搜尋時能提供更快速更相關的資訊，而我想如果真能作細部上的切割的話，還可建立各種主題式的相關搜尋資料庫，這樣便能更方便使用者的查詢，以及在資訊的收集方便就更完整，也較具擴充性，我們就可以照時間上作排序，在每個網頁資料項前面加上時間，更方便我們查詢及使用。

資訊在不斷暴增，有了搜尋引擎讓我們更加方便，但是如能建立各類資料庫已提供多方面訊息，這也是我們樂見的成果：不斷有網頁以及知識的產生，也不斷增加到各式資料庫以擴大各類知識的內容與記錄下來，這將使我們在未來的資料搜尋上更為完整也更方便，我想這大概是因為，許多時候我難以找到想要的資料而想到的突發奇想吧！