Virtual Link Powered Authority Search in the Web

Chi-Chun Lin and Ming-Syan Chen

                Network Database Laboratory National Taiwan University

姓名:江孟芬

系級:政大資科四

學號:89703042

Summery


        所謂的key word-based search enging是用user輸入的key word來找尋user想找的網頁。這種找尋方式可以找出含有關鍵字的頁面,但可能miss掉那些user想找卻不包含這關鍵字的網頁(relevant pages)。link-ahalysis可以解決這個層面的問題,link-analysis的做法是計算用key word搜尋出來的pages各包含多少被參考到的link數,舉例來說,一個不包含key word的pages如果被參考到的link數目很多,那麼這個relevant page就能被搜尋到。解決搜尋問題後,再來是被找出來的pages排序問題(rank)。以google來說,它認為使用者最想找的pages一定會大量被link參考到(authority pages)或參考到別人的link(hub pages),如此,構想就是從計算出來的link數來解決排序問題。

        這種做法(google的HITS)會反映出page creator的觀點,但這也表示creator可以因為競爭或敵對關係使得這個觀點的代表性變質,因為它的代表性受到質疑,所以陳教授它們從另一個角度切入(page reader/user),也就是找出最能符合user期望的pages,而非反映page creator觀點的pages。他們提出所謂virtual link的觀點,virtual link如何產生見圖1,將virtual link也一並列入link的計算,陳明憲教授聲稱如此明顯達到他們的期望。

        這個improved version of HITS 稱為VIPAS(Virtual lInk Powered Authority Search),大致勝分成三個步驟,第一個步驟是找出a base set of pages,做法是套用HITS,儲存pages的authority&hub scores。第二步驟是create virtual links,做法是將使用者時常點閱的pages蒐集形成hot set,再從hot set裡的pages製造virtual links。第三個步驟是updating scores of pages,也就是重新計算hot set pages的score,並逐次地更新base set。

 
圖1 Two way of creating virtual links

Ideas



        陳老師這項研究針對User-behavior Observation有幾個基本假設,第一:使用者先點閱的pages代表較符合使用者期望的pages。第二:根據自己定義的"使用者的期望"這項假設,繼而計算他們做法的效果。

        我覺得主觀意識比較重的研究較難取得大眾認同,如果得從事這種特性的研究議題,其實驗的scale就很重要,但從陳明憲老師提出的實驗報告看出實驗scale很小也很主觀,也就是必須先認同某些假設才能著手計算效果,我覺得很難說服我認同它的效果優於尚未改良的google搜尋引擎。


Relevant Sources


        Survey on Behavioral Observation Methods in Virtual Environments
        http://graphics.tudelft.nl/~vrphobia/research-samson.pdf