課程討論

請各位每週發表聽講心得,並將演講名稱以及姓名加入標籤。

2010年10月29日 星期五

[轉貼]Automatic Query Reformulation 演講心得

聽了鄭卜任教授的演講,得到了很多對於檢索的詳細概念,鄭教授用三個研究的解說來介紹近來對於檢索有哪些新的研究方向。我認為很棒的是,技術界也開始考慮到user,把原本屬於資工領域的研究帶入圖資,也把圖資領域的觀點帶入資工。鄭教授講解機器學習的過程概念是很清楚的,讓我知道其實每個系統複雜的演算也是為了解決最開始那個單純的問題,而剩下的就是從我們既有的資源去解決這個問題,換句話說,其實是讓機器從簡單的邏輯中學習人的想法。

帶回今天的主題,我們要解決的問題就是如何讓機器學習降低user檢索過程產生的user gap,由於user常常對於自己要檢索的資料因為認知和知識背景不同,而下不同的關鍵字,這些關鍵字中很可能有一些是雜訊(noise),將使系統產生混淆,而找出許多不符合她需求的資料。因此他要教導機器如何去判斷哪些字在一個query中是重要的。鄭教授利用統計的方法,一個最簡單的原則--拿掉某個關鍵字看他的結果會不會使相關性往下掉,如果掉了很多,就表示這個字是一個很重要的關鍵字。這些背後的統計特徵是user通常不知道的,而我們很難去告訴每一個user這些,因此就必須設計這樣的自動化過程。

除了這個研究之外,鄭教授還簡單介紹了幾個很有趣的研究,其中我對於語意視覺化的主題很有興趣,最重要的是鄭教授告訴我們一件事,也就是怎麼作研究。其實身邊有很多很多的現象存在,而我們唯一要做的就是找出解決的方法,儘管研究過程中,教授需要靠很多很多的例子去觀察,在從中發現一些問題和驗證,他仍然會一步一腳印的將研究像是築磚牆一般得築起來,也是他年紀輕輕就能夠發表許多重要的論文的原因。

除了跟鄭教授學習,也給予自己像他帶出來多位優秀學生這樣的期望,希望自己在未來研究路上也能有同樣的研究精神和創意。

轉貼自http://libraripeople.blogspot.com/2010/10/automatic-query-reformulation.html

沒有留言:

張貼留言