見習(xí)記者 郭建龍
“谷歌這一次是以小時為單位來做!笨禄商貏e向記者提到了兩個時間點:尋親搜索的原型系統(tǒng)只用了半個小時就開發(fā)出來了;到第一個正式版本做好,只用了短短的20個小時。
柯是谷歌中國負責(zé)尋親搜索項目的工程師。5月15日,谷歌的很多員工發(fā)現(xiàn),“5·12汶川大地震”發(fā)生后,由于通信、交通的不暢,失散的人們難以確知自己親人的下落。盡管有關(guān)政府部門、醫(yī)院、報紙、網(wǎng)站都在以不同的形式,發(fā)布著遇難者或幸存者的信息,但這些雜亂的信息即使用常規(guī)的搜索引擎也難以有效查詢。
能不能為地震受災(zāi)者提供一個專門尋找親人的搜索引擎?取得共識后,谷歌中國迅速行動起來。
谷歌中國的尋親搜索之所以顯得有些不同尋常,主要是在外界看來,這家全球最大搜索引擎運營商在中國的分支機構(gòu)一直被其本土競爭對手所壓制著,而造成這種局面的重要因素就是不夠本土化。
而在此次地震后的不到10天時間內(nèi),谷歌中國已經(jīng)相繼推出地震形勢圖、全球募捐平臺、尋親搜索、災(zāi)區(qū)衛(wèi)星地圖等多項產(chǎn)品。這些產(chǎn)品顯然對中國眾志成城的抗震救災(zāi)很有幫助,但它是否也預(yù)示著谷歌中國的新圖景?
尋親搜索始末
“我們當(dāng)時都是在熬夜干活兒。”柯化成向記者說。在發(fā)現(xiàn)尋親搜索的需求后,他和幾個同事通過簡單的聯(lián)系,花半個小時的時間就做出了產(chǎn)品的原型系統(tǒng),并在內(nèi)部進行了討論,認(rèn)定這樣的產(chǎn)品能夠幫助救災(zāi)。
與此同時,尋親搜索也得到了谷歌全球副總裁兼大中華區(qū)總裁李開復(fù)的支持。于是,這個自發(fā)的項目迅速啟動,并加班做出了產(chǎn)品的第一個版本。5月16日早上6點,尋親平臺正式發(fā)布。此時距離項目動議恰好20個小時。
對于能夠迅速開發(fā)出尋親搜索的原因,柯化成總結(jié)道:谷歌有獨特的技術(shù)結(jié)構(gòu),例如CSE、AppEngine等,這些提供了快速開發(fā)的工具,節(jié)省了大量的時間。
同時,谷歌全球范圍的配合也提供了幫助。在這次開發(fā)中,谷歌分布在美國、中國、瑞士等地的工程師進行了不間斷地接力式開發(fā),保證了每時每刻都有人參與到開發(fā)中來。
當(dāng)然,即使是在谷歌這樣的高科技公司,面對緊急任務(wù)時,也不得不部分依賴于最原始的方式。
從5月16日凌晨3點開始,谷歌的尋親搜索團隊發(fā)動了幾十人一起開始了浩如煙海的“人肉搜索”,從各大門戶、論壇、特別是四川的各主要網(wǎng)站上,收錄了近3000條URL pattern。
在柯化成看來,當(dāng)前的網(wǎng)絡(luò)和搜索技術(shù)雖然達到了一定程度的自動化,但距離全自動還有很遠的距離。于是,當(dāng)面臨緊急任務(wù)的時候,開發(fā)人員不得不放下架子,做一些手工查找的工作。這種在網(wǎng)絡(luò)上如同爬蟲一般尋找信息資源的作業(yè)方式,對他們來說是一種“體力活”。
谷歌中國的尋親搜索平臺發(fā)布后,流量迅速增長。根據(jù)谷歌中國方面提供的數(shù)據(jù),該平臺發(fā)布的第一天,用戶使用次數(shù)就達到10萬次,第二天就已經(jīng)漲到4倍以上。
工程師們還在不斷對該平臺進行改進。5月17日11點,尋親搜索平臺的第二個版本發(fā)布,更多的網(wǎng)站信息被加入了進來。同時,用戶也可以通過發(fā)手機短信的方式在平臺上發(fā)布信息。
“有的醫(yī)院和安置點的消息都是以紙質(zhì)形式發(fā)布的,有的就直接貼在門外的電線桿子上,再由好心的網(wǎng)友用手機拍攝成圖片發(fā)布在了網(wǎng)絡(luò)上。我們要負責(zé)查找這樣的圖片,并且手工錄入這些數(shù)據(jù),這又是人肉部隊干的活兒,太辛苦了。”柯化成說。
截至5月21日凌晨,谷歌中國的這個平臺已經(jīng)收錄了344個網(wǎng)站的147473個網(wǎng)頁,以及80家醫(yī)院的38284條記錄。
志愿者的工具
除了谷歌的開發(fā)人員之外,對于這個尋親搜索平臺有強烈參與意識的還包括那些抗震救災(zāi)中的志愿者。
在美國卡耐基梅隆大學(xué)(Carnegie Mellon University)上學(xué)的錢敏杰告訴記者,他在5月12日當(dāng)天就從豆瓣網(wǎng)知道了汶川地震,并迅速在海外發(fā)起了“汶川需要你的幫助”的小組,聯(lián)系香港的救援組織,并且匯總國內(nèi)的災(zāi)情報道。
當(dāng)天晚上,這個小組已經(jīng)有了5000人。5月14日,人數(shù)進一步增加到12000人。分布在世界各地的這些小組成員紛紛把和災(zāi)情相關(guān)的消息,聚合到該小組開發(fā)的主頁上。開始的時候,這些消息集中于血庫信息,后來由于災(zāi)區(qū)缺乏物資,內(nèi)容也慢慢轉(zhuǎn)到了物資需求信息上。
“開始我們的信息發(fā)布平臺在豆瓣網(wǎng)。但豆瓣的發(fā)布方式是文字的,前方人員看起來不直觀!卞X敏杰告訴記者,“我們在17號,開始意識到需要利用地圖更好的顯示信息,為前方提供第一線消息!
此后,他們聯(lián)系了谷歌中國,并加入了其尋親平臺的運行,把得到的消息發(fā)布在平臺上。
“我們希望全國其他各地的捐物者能了解前方的信息,讓捐物更有針對性一點!卞X敏杰說。各地的志愿者或能夠獲得信息的網(wǎng)友,通過現(xiàn)場調(diào)查或者從可靠的渠道得到消息后,在平臺上發(fā)布物資緊缺消息并留下聯(lián)系方式,后方擁有資源的人們可以根據(jù)網(wǎng)絡(luò)上的消息和前方取得聯(lián)系,提供物資。
一位在成都的NGO負責(zé)人也對記者表示,其也把所獲得的情況,發(fā)布到谷歌的平臺上。
“我們的主要精力放在了學(xué)校救助方面,調(diào)查地震災(zāi)區(qū)的學(xué)校毀損情況,把主要精力放在災(zāi)后校舍的重建。”這個主要針對學(xué)校救助的NGO人士表示,其把前方人員派到各個災(zāi)區(qū)調(diào)查學(xué)校的毀損情況,獲得關(guān)于校舍的第一手的資料,同時也能獲得其他的情況,他們把這些情況發(fā)布在網(wǎng)絡(luò)平臺上,不僅包括物資,也包括校舍的資料。
在這位人士看來,救災(zāi)已經(jīng)離不開網(wǎng)絡(luò)了。
開放平臺的問題
然而,目前評估網(wǎng)絡(luò)救災(zāi)的效果似乎還為時過早。
當(dāng)記者問谷歌中國和志愿者們,他們是否可以評估自己在救災(zāi)中起到了多大的作用,雙方都沒有明確答復(fù)。事實上,到目前為止,還沒有足夠的反饋讓人們做出一個合理的評價。
網(wǎng)絡(luò)只是提供了一個必要的平臺,并且展示了利用這個平臺能夠做出什么樣的事情。至于該平臺最后能起到什么樣的作用,還在于使用這個平臺的機構(gòu)和個人的共同配合和協(xié)調(diào)。
網(wǎng)絡(luò)數(shù)據(jù)由于海量和分散的特點,給信息查詢和整合帶來了麻煩。谷歌力圖在定向檢索上為人們提供一個集中的便捷的查詢平臺,把所有分散的信息統(tǒng)一在一個數(shù)據(jù)庫中。
然而,這同時也帶來了數(shù)據(jù)的不準(zhǔn)確性。比如,如何判斷從網(wǎng)絡(luò)上檢索的信息是準(zhǔn)確的?據(jù)記者了解,谷歌中國已經(jīng)采取了技術(shù)手段,避免虛假數(shù)據(jù),但目前這并不能完全杜絕不真實消息的存在,其搜索出來的數(shù)據(jù)也都已經(jīng)標(biāo)明“僅供參考”。
“在目前階段,我們寧肯把可能的答案都告訴尋親的人們。在快速的基礎(chǔ)上再提高準(zhǔn)確性!笨禄烧f。
在他看來,如果要讓數(shù)據(jù)更加準(zhǔn)確,還需要更多的官方或者半官方機構(gòu)參與,“一方面,我們離不開民間的參與,如果沒有民間志愿者,就沒有足夠的材料;另一方面,由于無法完全過濾掉錯誤信息,如果有比較權(quán)威的機構(gòu)參與更新數(shù)據(jù),會讓信息更加可靠”。
“最起碼谷歌給人們帶來了想象力,它的開放性真的有點兒維基百科的味道了。只是如何保證垃圾信息的過濾還是一個問題!币晃粯I(yè)內(nèi)人士如此評價。
[ 作者:零度網(wǎng)絡(luò)科技 類別:互聯(lián)網(wǎng)新聞 ]