我們生活在算法的黃金年代。盡管我們擁有搜索引擎、語音識別以及計(jì)算機(jī)視覺系統(tǒng)等技術(shù)長達(dá)數(shù)十年,但也只是在最近幾年中它們才變得足夠的優(yōu)秀,好到可以走出實(shí)驗(yàn)室,并應(yīng)用于我們?nèi)粘J褂玫墓ぞ咧?,?a href="index.html">Google Now(谷歌即時(shí)資訊,一款由谷歌開發(fā)的智能個(gè)人助理),Siri(蘋果iOS系統(tǒng)中的人工智能助理)以及Cortana(微軟為Windows Phone開發(fā)的智能個(gè)人助理)。
盡管我們的算法已經(jīng)很優(yōu)秀,它們?nèi)匀豢赡芡ㄟ^更好的人機(jī)交互進(jìn)行改進(jìn)。特別是,如今大部分搜索引擎都追求基于一次性交互的優(yōu)化,而不是讓人們參與到人機(jī)對話中來提高搜索體驗(yàn)。
在過去的十年中,信息科學(xué)家們一直提倡和擁護(hù)在信息尋找過程中讓人們參與到更有意義的層面上來。尤其是,來自北卡羅來納大學(xué)教堂山分校信息與圖書館系主任加里?馬查尼尼(Gary Marchionini),他提倡“人機(jī)信息檢索系統(tǒng)”來提高用戶的責(zé)任和掌控力。
這聽上去是個(gè)不錯的主意。但是我們?nèi)绾螌?shí)行呢?
將搜索視作對話:基于交流的優(yōu)化
自從比爾?馬龍(Bill Maron)和拉力?庫恩(Lary Kuhns)在1960年發(fā)表了他們的里程碑式的論文《關(guān)聯(lián)性、概率檢索和信息檢索》。搜索引擎嘗試去判定集合中的哪些文檔是和用戶相關(guān)的,并將搜索結(jié)果基于相關(guān)性由高到低降序排列。之后的五十多年,大部分人理所當(dāng)然的認(rèn)為搜索引擎一直是這樣做的。但是科技的發(fā)展使得這一方法變得過時(shí)了。現(xiàn)在,搜索引擎可以向用戶反饋與其自身相關(guān)的問題。舉例來說,在亞馬遜上搜索“松露”會返回相關(guān)的結(jié)果,此外還會建議“巧克力松露”和“松露油”作為備選搜索。搜索引擎也可以在用戶查詢輸入的過程中提供查詢建議甚至是立即給出答案。(比如說谷歌即時(shí)搜索Google Instant)。理想的搜索引擎是一個(gè)會話伙伴,它知道什么時(shí)候答案對用戶來說已經(jīng)足夠,什么時(shí)候需要用戶進(jìn)一步的說明。
對話模型的應(yīng)用使得對搜索引擎質(zhì)量的關(guān)注點(diǎn)從結(jié)果的相關(guān)性轉(zhuǎn)移到交流的有效性。傳統(tǒng)的搜索質(zhì)量評估指標(biāo),比如“折扣累積收益”假設(shè)了一種搜索引擎一次就可以給出最佳結(jié)果的模型。然而,如今用戶擁有了進(jìn)一步進(jìn)行交互的機(jī)會,所以我們需要衡量其他的因素,比如用戶能夠多準(zhǔn)確的理解為何搜索引擎返回這些特定的結(jié)果、搜索引擎給用戶提供了多有效的控制權(quán),以及搜索引擎引導(dǎo)進(jìn)一步搜索機(jī)會的有效性等。換句話說,也就是改進(jìn)搜索質(zhì)量意味著提高搜索結(jié)果的透明度、用戶的控制力以及對用戶的引導(dǎo)能力。
我們已經(jīng)看到這方面的初步進(jìn)展:谷歌和必應(yīng)上的搜索結(jié)果摘要所提供的透明性,大部分電子商務(wù)網(wǎng)站上由分面搜索帶來的控制力和引導(dǎo)。但是我們還有更多可以做的。
聰明一點(diǎn),但是不要犧牲可預(yù)測性
優(yōu)化交流溝通的一個(gè)必然結(jié)果是我們的搜索引擎不應(yīng)該太過聰明以至于給出那些會破壞用戶肌肉記憶的不可預(yù)測的搜索體驗(yàn)。
比如說,如下面的截圖所示,在谷歌上搜索“let it be 歌詞”,返回將這首披頭士經(jīng)典曲目的歌詞顯示在最上面的搜索結(jié)果。但是搜索“let it go 歌詞”并不會返回這樣一個(gè)界面元素,盡管這首迪斯尼歌曲非常流行并且它的歌詞到處可見。也許這一區(qū)別有一個(gè)很合理的原因,但對用戶來說并不是顯而易見的。界面元素不應(yīng)該以不可預(yù)期的方式出現(xiàn)或消失,盡管有時(shí)候這一行為反映了基于某些規(guī)則的結(jié)果優(yōu)化。

在谷歌上搜索"Let it Be" 和 "Let it Go" 歌詞的搜索結(jié)果截圖
我并不是建議我們完全不發(fā)揮我們的算法的功效,而是說我們需要在我們的決定中將可預(yù)見性作為一個(gè)顯式的因素來考慮。這是優(yōu)化交流的核心關(guān)鍵。
幫助用戶提出好的問題,而不是盡力去回答不好的問題。
傳統(tǒng)的搜索方式是發(fā)送一個(gè)查詢,獲得一堆結(jié)果,將它們進(jìn)行評分并且由高到低依次排序并返回搜索結(jié)果列表。而現(xiàn)代搜索引擎通過使用基于機(jī)器學(xué)習(xí)的排名方法來實(shí)現(xiàn)這一傳統(tǒng)行為。毫無疑問,實(shí)現(xiàn)健壯的結(jié)果排名是重要的,但是更好的方法是通過幫助用戶提出更好的問題從而在搜索的更早階段提高搜索質(zhì)量。
搜索引擎正在越來越多的投資在“查詢理解”,從而幫助用戶更確切的表達(dá)所需要的查詢。查詢理解的相關(guān)成果包括拼寫校正、查詢重寫、智能搜索建議等。一個(gè)普遍的趨勢是幫助用戶得到一個(gè)結(jié)構(gòu)化的查詢,從而可以降低語言固有的模糊性并且更精確地表達(dá)對于信息搜尋的意圖。我們來看一下領(lǐng)英上的這個(gè)搜索行為,在搜索框中輸入“micr”會觸發(fā)諸如“Microsoft的職位”以及“在Microsoft工作的人們”等搜索提示。

在領(lǐng)英上輸入“micr”觸發(fā)的截圖
提供一個(gè)搜索框,但是將搜索體驗(yàn)分段
我們已經(jīng)習(xí)慣于使用通用搜索引擎,并且大部分面向消費(fèi)者的搜索引擎都只向用戶呈現(xiàn)一個(gè)搜索框,希望這一個(gè)框可以解決用戶所有的信息搜尋需求。但是,只有一個(gè)輸入入口并不意味著所有的搜索都應(yīng)該有相同的搜索體驗(yàn)。
我們來看一下已知項(xiàng)搜索,即用戶知道自己想要找的是什么。這類搜索與開放式探索式搜索是完全不同的。就算是在同類的搜索中,不同的垂直分類需要的是不同的搜索體驗(yàn)。這就是為什么當(dāng)用戶在亞馬遜上搜索“代數(shù)”和“舞鞋”會有非常不同的搜索體驗(yàn)。

在亞馬遜搜索“代數(shù)”和“舞鞋”的不同結(jié)果的截圖
這里的訣竅在于將搜索體驗(yàn)基于搜索查詢的理解進(jìn)行分段化。查詢理解發(fā)生在獲取結(jié)果或?qū)Y(jié)果進(jìn)行排序之前,在這一過程中搜索引擎建立起用戶正在搜索什么種類的結(jié)果、用戶是否已經(jīng)知道了一些特定的結(jié)果或者用戶是否只是想簡單的探索查詢的多種可能性。查詢理解使得搜索引擎可以從單個(gè)用戶輸入界面接受查詢之后將用戶轉(zhuǎn)發(fā)到恰當(dāng)?shù)乃阉黧w驗(yàn)分段。
意識到最佳搜索結(jié)果并不足夠好
搜索引擎旨在交付盡力而為的體驗(yàn):它們獲取結(jié)果并根據(jù)排名依次由上而下返回結(jié)果。這樣很好,除非這樣做并不是最佳的。不幸的是,如今的搜索引擎缺乏自我意識來感知到它們提供的所謂最佳結(jié)果并不足夠的好。舉例來說,在這么多年之后,谷歌對這類搜索仍然沒有應(yīng)對之策。當(dāng)我搜索“NLP”時(shí),我指的是自然語言處理(natural language processing)并不是神經(jīng)語言處理(neuro-linguistic processing),如下圖所示:

在谷歌搜索“NLP”返回的搜索結(jié)果截圖
查詢性能預(yù)測相關(guān)的各領(lǐng)域在信息檢索社區(qū)中得到越來越多的關(guān)注。各種各樣的技術(shù)使得搜索引擎在搜素結(jié)果獲取之前和之后都可以評估查詢的難易程度。識別查詢的難易度使得搜索引擎可以返回更簡潔的搜索體驗(yàn),甚至是簡單到告訴用戶:很抱歉我們不確定搜索引擎了解這次搜索的真正目的。一個(gè)經(jīng)典的例子是,當(dāng)搜索引擎詢問用戶,“你是不是要找……”,一個(gè)在谷歌流行起來并被廣泛應(yīng)用的問詢模式。
查詢性能預(yù)測也可以是更積極的方法的一部分。當(dāng)搜索引擎要決定如何解釋一個(gè)搜索查詢或提出其他的可選搜索建議,它應(yīng)該用查詢性能預(yù)測對搜索的可能性空間進(jìn)行剪枝。這是一大片未開發(fā)的領(lǐng)域,算法和界面創(chuàng)新的時(shí)機(jī)已經(jīng)成熟。
最后,我們要重新審視我們是如何評估搜索引擎的。交互式信息檢索系統(tǒng)的性能評估是一個(gè)熱點(diǎn)研究領(lǐng)域,它將信息檢索和人機(jī)交互的世界合而為一。而改進(jìn)我們的系統(tǒng)的第一步就是改進(jìn)我們評估它們的方法。
要明白,提高智力勝過人工智能
正如我在本文一開始所述,我們生活在一個(gè)算法的黃金年代。信息檢索領(lǐng)域各方面的進(jìn)展是非常驚人的。我們比任何時(shí)候都更接近于實(shí)現(xiàn)上一輩人僅在科幻小說中見到的那種人工智能系統(tǒng)。
但是我們不要忘記搜索是人和機(jī)器協(xié)同完成的。正如已故的道格?英格巴特(Doug Engelbart)所說的,解決問題最有效的方法是用計(jì)算來提高人類的智力水平。換句話說,最好的搜索引擎可以幫助和引導(dǎo)用戶,使得用戶可以幫助搜索引擎優(yōu)化自身。
丹尼爾?頓克朗(Daniel Tunkelang)
丹尼爾?頓克朗是萊拉健康(Lyra Health)公司的CTO,該公司致力于心理健康護(hù)理的轉(zhuǎn)型。之前他曾經(jīng)在領(lǐng)英任職數(shù)據(jù)科學(xué)工程的總監(jiān),他也曾在谷歌帶領(lǐng)一個(gè)搜索質(zhì)量團(tuán)隊(duì)。他曾是恩徳加(Endeca)公司的創(chuàng)始員工之一,該公司2011年被甲骨文公司收購。他寫了一部關(guān)于面搜索(faceted search)的教材,是人機(jī)交互和信息檢索(HCIR)的知名倡導(dǎo)者。他曾在四次Strata會議上發(fā)言,是《大數(shù)據(jù)》期刊的編輯委員會成員。他擁有卡內(nèi)基梅隆大學(xué)的計(jì)算機(jī)科學(xué)博士學(xué)位,以及美國麻省理工學(xué)院的學(xué)士和碩士學(xué)位。

