專題研討學習反思2010/10/12
撰寫人:于第
主題:Automatic Query Reformulation—鄭卜壬教授
鄭教授今天所談的主題對我來說很新,從未聽過,所以剛開始真的很緊張,很怕不知所云。但就真如小蝶老師介紹時所講的,鄭老師的演講功力很不錯,其實就用很簡易的表達,至少讓我對這個主題,及其所做的研究大致有一認識。
聽了老半天,好像重點就是如何運用自動化的方式讓query經過不斷的reformulation, 最後能夠讓query更精準,讓結果更貼近user所要的東西。鄭教授也提到,information retrieval的結果很難評定好壞,所以需要有benchmark來評定,但又由於下關鍵字不是很確定,因為search engine是機器做的,所以最好用automatic的方式來做。(這好像有一點兒以其人之道還至其人之身的感覺)
鄭教授提到通常Semantic 對search engine是很難做的,尤其是visual的資料。Search engine要如何縮減user的gap? 因為user並不知database裏面的data到底有些什麼,所以當然就不知道如何formulate query。故在他研究中提到二種query formulation的方法:一是query expansion,如可用同義詞或是利用search results再去延伸 search;另一是relevance feedback,當給一個query下下去, search engine就會給一個relevant feedback,而這種feedback對於影像的檢索更是需要。其間鄭教授舉了一個例子,有一個人要Find articles containing the reasons for NBA Star Michael Jordan’s retirement and what effect it had on the Chicago Bulls,那麼到底要下什麼字才會得到最好的結果呢?他就是用query reformulation的方式,慢慢將最適合下的關鍵字做了一個排序,聽完這一段覺得好有意思。但到了後面研究結果的分析時,還好有老師的解釋,否則這麼多數據分析圖表,讓我自己看還真的很不容易懂。
最後,雖然對Visual image的研究介紹,因時間的關係有一點兒趕,但至少瞭解到Image search與text search是不太一樣的,image search要的是一張好的圖,而不是要一些相關性高的資訊或資料。此外,由鄭教授的研究方享,可以感受到,不論哪一個領域的研究,廣度與深度都是研究成功的重要關鍵。
沒有留言:
張貼留言