本週鄭卜壬老師以「Automatic Query Reformation」為題進行專題演講,分享了3篇資訊檢索的相關論文內容,說明了如何提供有效的檢索詞彙,協助網路使用者在網路搜尋引擎中,找到最相關的結果。在此次演講內容中,可以發現:
1. 鄭老師常在一般人認為不可能有問題之處,找出問題,也就是採取逆向思考方式,進而發展成正式的學術研究問題,充分體現「做學問要在不疑處有疑。」其研究成果往往令人驚喜,且十分實用。
2. 在發展出研究問題後,鄭老師可以進一步將研究問題轉化為「更為有趣」的問題。
3. 解決問題的方法以簡馭繁,且是有效的方式為主要特色,亦即利用基本的統計與數學為基礎,發展出相關的演算法而找出解答方式,同時加上多重觀點的驗證,求取研究結果的信度與效度。
4. 鄭老師的研究結果顯示,詞彙類型在網路搜尋引擎的重要性排序為「context→co-occurrence→linguistic」,及其兩兩組合的效果。此一研究結果值得在檢索策略方面的注意,提供圖資界教學與研究上的參考。此外,亦可作為在檢索策略實務上,有關關鍵字詞的選取或萃取之參考,作為組合與建立檢索策略之用。
5. 在IO方面,上述研究結果也提供十分寶貴的建議,亦即在IO建立與組成時,必須留意相關脈絡化(contextualized)資料元素的安排與建立;例如:Contextualized Attention Metadata(http://www.dlib.org/dlib/september07/wolpers/09wolpers.html)。
6. 基於上述詞彙類型在網路搜尋引擎的重要性排序,以及有關Linguistic名稱實體(name entities)的進一步研究建議,有關權威檔與索引典的內容取向及其功能定位等兩方面,也值得IO研究方面作更進一步的探究。
沒有留言:
張貼留言