查詢是很多現代人有經驗,而有人總疑惑著為什麼你找的到,為什麼我找不到;好的資訊檢索技能也是圖資人很重要的能力。
講者試圖點出一些問題幫助我們思考,對於關鍵字的獨特性與非獨特性該不該翻譯,有的不翻可能還能找到更好的資訊,若為影像又該如何處理……,冥冥之中都顯示著搜尋引擎對資料語意的描述很重要。
於是有一天,想到從使用者回饋系統的方式,對資料給與評判。在檢索行為上,講者與我們分享很多經驗,從詞性辨別關係、字詞取代、文章脈絡等……,目標是要想盡方法讓最相關的排在最前面越好,而若能夠挖出誰是垃圾,那也有助於讓好的詞彙往上爬,利檢索。
這天講者透過很多實例跟我們分享,看著他們發展自動化智慧檢索,且精打細算這些詞彙的同時,讓我想起國內某些資料庫商致力於發展號稱很智慧的自然語言檢索,據說是智慧到把一整句人話輸進去也很OK,不過這OK的品質……呵呵。兩種很不一樣的感覺。
轉貼自http://zxcv418.pixnet.net/blog/post/19899804
沒有留言:
張貼留言