搜索引擎(Search Engines)是一個(gè)對(duì)互聯(lián)網(wǎng)上的信息資源進(jìn)行搜集整理,供用戶查詢的系統(tǒng)。由于互聯(lián)網(wǎng)已經(jīng)成為人類(lèi)最大的信息源,所以搜索引擎被科學(xué)界定義為人類(lèi)發(fā)現(xiàn)新知識(shí)最有效果的手段,作為僅次于電子郵件的應(yīng)用之一,搜索引擎已經(jīng)成為不可替代的信息查詢工具。互聯(lián)網(wǎng)提供了即時(shí)豐富的信息(以及人與人溝通參與/娛樂(lè)的平臺(tái)),深層影響著現(xiàn)代人的生活。但隨著網(wǎng)站數(shù)量和內(nèi)容的急增,互聯(lián)網(wǎng)就像是沒(méi)有目錄的巨大百科全書(shū),讓人們無(wú)法找尋自己想要的信息。搜索引擎的出現(xiàn),為這本百科全書(shū)加上了目錄和索引。不論我們想從互聯(lián)網(wǎng)中尋找什么,只需要在搜索框中敲入關(guān)鍵詞匯,就能夠獲得相關(guān)的信息或網(wǎng)址。
因此他對(duì)我們?nèi)祟?lèi)科學(xué)進(jìn)步的影響意義深遠(yuǎn)。
搜索引擎的發(fā)展經(jīng)歷了三個(gè)階段:
第一代搜索是主要依靠人工分揀的分類(lèi)目錄搜索,目錄搜索引擎是把搜索到的信息資源按 一定的主題進(jìn)行分門(mén)別類(lèi),建立目錄,大目錄下面包含子目錄,子目錄下又包含子目錄……如此下去,建立一層層具有包含關(guān)系的目錄,用戶查找信息時(shí),采取逐層瀏覽打開(kāi)目錄,逐步細(xì)化,就可以查到要找的信息。無(wú)論是純技術(shù)型的搜索引擎還是分類(lèi)目錄,都可以認(rèn)為是互聯(lián)網(wǎng)上的第一代搜索引擎,出現(xiàn)于1994年前后,以Altavista、YAHOO和Infoseek為代表,搜索結(jié)果的好壞往往用反饋結(jié)果的數(shù)量來(lái)衡量,也就是說(shuō),第一代搜索引擎“求全”。
第二代搜索是依靠機(jī)器抓取,建立在超鏈分析基礎(chǔ)上的網(wǎng)頁(yè)搜索”,1998年,以Google和DirectHit為代表的第二代搜索引擎出現(xiàn)在互聯(lián)網(wǎng)上,這些引擎的主要特點(diǎn)是提高了查準(zhǔn)率,可以用“求精”來(lái)描述。
第三代搜索引擎是互動(dòng)式搜索,在用戶輸入一個(gè)查詢?cè)~時(shí),嘗試?yán)斫庥脩艨赡艿牟樵円鈭D,給與多個(gè)主題的搜索提示,引導(dǎo)用戶更快速準(zhǔn)確定位自己所關(guān)注的內(nèi)容。GOOGLE推出全文檢索技術(shù)后,人們對(duì)搜索的需求已經(jīng)不再是能提供多少 包含了“關(guān)鍵詞”的網(wǎng)頁(yè)了,而是能不能以最快的方式提供最有價(jià)值的信息,并能彌補(bǔ)“人”本身在關(guān)鍵字描述方面的欠缺。因此,以人為本的智能搜索技術(shù)便 出線了,雖然看上去智能搜索引擎更象是第二代搜索引擎的補(bǔ)充和完善,但已經(jīng) 在不知不覺(jué)中改變了人們的搜索習(xí)慣。中文智能搜索引擎的代表是——中國(guó)搜索。
第三代搜索引擎的優(yōu)勢(shì):
1.中文輸入智能查詢:當(dāng)用戶輸錯(cuò)了關(guān)鍵字、或用拼音、以及南方口音輸入關(guān)鍵詞時(shí),智能搜索引擎都能自動(dòng)提示用戶正確的結(jié)果。大家都知道在語(yǔ)言中漢語(yǔ)是最復(fù)雜的,地域性質(zhì),后鼻音的因素,使得在用戶在輸入信息的時(shí)候出現(xiàn)差錯(cuò)。
2.區(qū)域智能查詢:智能搜索卻能按照區(qū)域進(jìn)行查詢,只要先確定查詢的區(qū)域,直接輸入關(guān)鍵字就可以了。
3.分類(lèi)智能搜索技術(shù):當(dāng)用戶在輸入“綠茶”,在結(jié)果選項(xiàng)中會(huì)出現(xiàn)只能導(dǎo)航條目。這樣可以讓用戶直接體會(huì)到智能帶來(lái)的信息準(zhǔn)確性。
4.內(nèi)容聚類(lèi)搜索:
就是自動(dòng)分析搜索結(jié)果,再把所有與某個(gè)搜索結(jié)果內(nèi)容 相關(guān)的網(wǎng)頁(yè)聚集在一起。
5.專(zhuān)業(yè)搜索功能
智能搜索不僅是搜索技術(shù)上的智能化,還包括服務(wù)方面的專(zhuān)業(yè)化。 因?yàn)橛行┧阉餍枨笫恰爸刭|(zhì)量、不重?cái)?shù)量”,比如歌曲下載、FLASH、圖片搜索, 有些則對(duì)信息的時(shí)效性要求很高,比如新聞搜索。中國(guó)搜索將網(wǎng)民的一些常用搜索專(zhuān)業(yè)化,直接給出下載地址,無(wú)須再一條條地查找。
第三代搜索引擎的工作原理:搜索引擎大致可分兩大循環(huán)系統(tǒng)——檢索系統(tǒng)和網(wǎng)頁(yè)抓取系統(tǒng)(非標(biāo)準(zhǔn)名稱(chēng)),網(wǎng)頁(yè)抓取系統(tǒng)主要作用是收集互聯(lián)網(wǎng)中的網(wǎng)頁(yè)數(shù)據(jù)并存儲(chǔ)在數(shù)據(jù)庫(kù)中,而檢索系統(tǒng)主要是根據(jù)網(wǎng)民的要求把儲(chǔ)存在數(shù)據(jù)庫(kù)中的相關(guān)網(wǎng)頁(yè)提供給用戶。
時(shí)代在變遷,技術(shù)在飛躍。被成為中國(guó)搜索引擎第一人的陳沛曾說(shuō)過(guò):“搜索無(wú)處不在”搜索的發(fā)展將是整個(gè)互聯(lián)網(wǎng)技術(shù)的前沿代表。
未來(lái)的搜索的發(fā)展趨勢(shì)就是搜索引擎越來(lái)越平臺(tái)化,互聯(lián)網(wǎng)的很多應(yīng)用是逐漸建在一個(gè)平臺(tái)化之上,并且使得搜索引擎公共化,個(gè)人化,個(gè)性化。
安徽新華電腦學(xué)校專(zhuān)業(yè)職業(yè)規(guī)劃師為你提供更多幫助【在線咨詢】