Virtual Link Powered Authority Search
in the Web

Chi-Chun Lin and Ming-Syan Chen
Network Database Laboratory
National Taiwan University

資科四 89701001 蕭向彥

 

感想:

網路發展至今,其資源的取得確實不是一件容易的事。自從搜尋引擎出現之後對某類的資訊的確更容易找到,但是有時對使用者也是一個很大的負擔,其主要原因是關鍵字搜尋會多出很多原來不想取得的資訊。Google出現之後大幅改變了網路資源整合的方式,因為搜尋技術改變,也讓使用者更能取得想要的資訊。

由於Google的市場太大,所面臨的商業問題很多。例如一位資料復原集團(Data Recovery Group)的總裁表示說,向來他們在Google搜尋引擎上名列第四,而2002年一月,Google在無預警的情況下將他們公司排除在搜尋結果之外,結果公司業務馬上下跌了30%。這表示由於Google異常的準確度讓使用者非常依賴且相信Google所搜尋的排行,也就是說,若有公司的名字沒在其搜尋名單中出現,該公司就像不存在一樣。

另一個問題是在Google所用的Hits技術,Goolge有提到很多業者採用的「大量散發」與「大量連結」策略來導至搜尋結果不精確,進而影響Google信譽。Hits技術的缺失也暗示若由商業因素考量,是很容易讓Google精確度下降的。Hits技術還有一個問題,那就是讓不常找的資料更不容易找到,有時即使加了其它的關鍵字後,搜尋排名還是很後面。

關於技術上的問題我覺得網路上的資源應該也要從資料的角度來整理,就像圖書館一樣為網路資源編目一般,也許在HTML中用固定格示標明等等。雖然這些部份可行性都有待質疑,但我希望能朝資料本身的自我描述來增加讓資料被找到的唯一性這方向來思考,也可以提供一個非關鍵字搜尋的方法。

若要達到網路資源整合的話,非熱門資料的問題是必需要解決的,反之便是熱門資料過多的問題。當我們在用Google查資料時會發現其中有很多筆資料是重覆的,我覺得這些都應該想辦法過濾掉,或是可讓使用者自行決定要不要列出的相似度高的搜尋。我想這些都是可以思考與改進的。