課程討論

請各位每週發表聽講心得,並將演講名稱以及姓名加入標籤。

2010年11月3日 星期三

[轉貼]1012 Automatic Query Reformulation

查詢是很多現代人有經驗,而有人總疑惑著為什麼你找的到,為什麼我找不到;好的資訊檢索技能也是圖資人很重要的能力。

講者試圖點出一些問題幫助我們思考,對於關鍵字的獨特性與非獨特性該不該翻譯,有的不翻可能還能找到更好的資訊,若為影像又該如何處理……,冥冥之中都顯示著搜尋引擎對資料語意的描述很重要。

於是有一天,想到從使用者回饋系統的方式,對資料給與評判。在檢索行為上,講者與我們分享很多經驗,從詞性辨別關係、字詞取代、文章脈絡等……,目標是要想盡方法讓最相關的排在最前面越好,而若能夠挖出誰是垃圾,那也有助於讓好的詞彙往上爬,利檢索。

這天講者透過很多實例跟我們分享,看著他們發展自動化智慧檢索,且精打細算這些詞彙的同時,讓我想起國內某些資料庫商致力於發展號稱很智慧的自然語言檢索,據說是智慧到把一整句人話輸進去也很OK,不過這OK的品質……呵呵。兩種很不一樣的感覺。

轉貼自http://zxcv418.pixnet.net/blog/post/19899804

沒有留言:

張貼留言