[IR] Ch2 User Interfaces for Search

使用者搜尋的種類

lookup task 單純查找任務,找已知存在的東西,例如:搜尋yahho首頁的動作

Exploratory search is divided into learning and investigating tasks

第一種: Learning
例如遇到bug,先把error message丟上去,再從找到的東西去加以整理
進一步找答案

第二種: 調查型 investigating tasks
Investigating refers to a longer-term process
每一天都在查,例如還沒去旅行前先查機票,查行程
每天都在查,更新資訊等等
可以會有一點點脫離原本的範圍去查
例如找一篇paper,又去調查其他相關的技術


如果用在圖書館裡面:
lookup : 找特定書
learning : 找這個主題相關的書
Investigation : 找這個圖書館裡這個作者的書有哪些



Sensemaking is an iterative process of formulating a
conceptual representation from a large collection :
針對query找一個好的表達法,例如你要找雅婷,但是世界上的雅婷有幾千人,此時就需要更進一步給明確的資訊

Classic notion of the information seeking process:
1. problem identification
2. articulation of information need(s)
3. query formulation

4. results evaluation

面對重複性多的情況,會希望避免redundency


"Navigation: the searcher looks at an information
structure and browses among the available information"
使用者在搜尋時,先得到一個資訊結構,再從結構中找尋想要的資訊

"This browsing strategy is preferable when the
information structure is well-matched to the user’s
information need"
重要!!

台大圖書館目前的問題
上面的分類完全讓使用者搞不懂有什麼差別

學校附近的書店:誠品,金石堂,政大書城

誠品與金石堂:以類別來分
使用者在找書的時候,要先判斷這本書是什麼類別,每個人的判斷之間會有出入

政大書城:以出版社來分
使用者要先了解什麼出版社會出什麼樣的書


思考:描述一個網頁上的資訊,到底需要哪一些東西?


google 搜尋之下
第一名跟第二名的結果,通常是解決 Lookup 的問題
但是第四~第十名的結果上,可以採用的策略是每次給不同的相關結果
第一頁的十個名次當中,會避免同時出現兩個幾乎一樣的結果 redundancy

"Studies also show that people are poor at estimating
how much of the relevant material they have found"

"Other studies have assessed the effects of knowledge
of the search process itself"

"These studies have observed that experts use different
strategies than novices searchers"

例如
"expert searchers were more patient than novices"
"this positive attitude led to better search outcomes"

Search的結果:
同性質 homogeneous v.s. 異質 heterogeneous


google 給的結果是一系列一系列的 homogeneous
並且以 heterogeneous 的策略排列

台大圖書館的檢索策略是Heterogeneous


"Google also added term proximity information and page

importance scoring (PageRank)"

"The visual effect of query term highlighting can also

improve usability of search results listings"

"Determining which text to place in the summary, and
how much text to show, is a challenging problem"

"Often the summaries contain all the query terms in
close proximity to one another"
打錯字時 google會先幫你用正確的字先查一遍

"Term expansion: search interfaces are increasingly

employing related term suggestions"

"Relevance feedback is another method whose goal is
to aid in query reformulation"
利用你給的document來做expansion




留言

這個網誌中的熱門文章

[筆記] CRLF跟LF之區別 --- 隱形的 bug

[ML筆記] Batch Normalization

[筆記] 統計實習(1) SAS 基礎用法 (匯入資料並另存SAS新檔,SUBSTR,計算總和與平均,BMI)

[ML筆記] Ensemble - Bagging, Boosting & Stacking