第284章 穀歌一下

還有比這更棒的東西麽?

凱瑟琳未來自己經常登陸的網站,大多都是通過“下”而知道的。凱瑟琳覺得,自己很有必要弄出一個搜索引擎來……

如果要追溯的話,比WorldWideWeb還要長。早在Web出現之前,互聯網上就已經存在許多旨在讓人們共享的信息資源了。這些資源當時主要存在於各種允許匿名訪問的FTP站點。

就目前而言,大多數網站都是大學的門戶網,其他的網站實在是太少了,於是搜索引擎的存在意義就被淡化了。

但是未來肯定不會如此。

且不說自己想要將這網上這些蛋疼的人分開,從另一方麵而言,因為和《洛杉磯時報》的合作也快要開始了,綜合類型的網站總是會出現的,於是搜索引擎就會變得必要起來。

“也許這是一個不錯的注意……”凱瑟琳撐著下巴,然後在思考著。

而艾爾莎看看時間,已經快到下午…了,於是就去泡紅茶了。

“什麽主意?”

艾爾莎一邊在拿著茶餅,一邊問著。

“一個搜索引擎,一個能夠讓我們知道各種網站的一個好東西。”

“我們可以將自己想要的網頁搜索出來?”

“對,就是這樣。”

“這能辦得到嗎?”

“當然……”

雖然是肯定的回答,但是凱瑟琳最後的語氣卻變得有些奇怪。

搜索引擎依靠的是網絡蜘蛛,即Weider。

這是一個很形象的比喻,就如同網絡被人稱為“”一樣(就是“網”的意思)。

準確一點來說,網絡蜘蛛就是通過網頁的鏈接地址來尋找網頁,從網站首頁開始讀取網頁的內容,找到在網頁中的其它鏈接地址,然後通過這些鏈接地址尋找下一個網頁,這樣一直循環下去,直到把這個網站所有的網頁都抓取完為止。如果把整個互聯網當成一個網站,那麽網絡蜘蛛就可以用這個原理把互聯網上所有的網頁都抓取下來。簡而言之,網絡蜘蛛就是一個爬行程序,一個抓取網頁的程序。

未來的“百度”、“穀歌”等等網站,都是建立在這樣的一個基礎之上的。

可是凱瑟琳突然想到自己似乎根本就沒有了解過“網絡蜘蛛”這個東西,雖然知道原理,但是想要弄出來……似乎還有些麻煩。

“看來還給成立一個工作組才行。”

開始了抱著雙手站了起來。

“我覺得我們公司的人才已經夠緊張的了。”艾爾莎將紅茶和茶餅放在了凱瑟琳的桌上。

“沒關係,到了五月份,這種情況就能得到緩解。”Intel與斯坦福大學的合作培養的第一批學生已經快要畢業了,有了他們的加入,公司的人才緊缺的問題必然能夠得到一定程度的緩解。

“至少在未來十年內,我們公司的人才都有可能是供不應求,這是一個急速擴張的產業,和那些傳統行業是不一樣的。”

——直到21世紀,這些行業對於人才的渴求依然是強烈的。

當然,中國除外——因為那裏的人實在是太多了,乃至於都有了“IT民工”的說法。

凱瑟琳坐了下來,然後喝了一口紅茶。

她一邊喝著茶,一邊在思考著應該如何寫一個網絡蜘蛛的程序出來。

評價一個網絡蜘蛛的好壞,有三個方式,一個是覆蓋率,網絡蜘蛛的首要目標是抓取互聯網上所需的信息。因此,有價值的信息是否都收錄,收錄的比例是網絡蜘蛛的基本評價指標;第二個則是時效性,即事件發生並在互聯網上傳播後(以新聞、論壇、博客等各種形式),用戶需要通過搜索引擎盡快能檢索到相應內容。而索引的前提是收錄,因此需要網絡蜘蛛盡快的抓取互聯網上最新出現的資源;最後則是重複率,互聯網上重複的內容很多,如何盡早的發現頁麵重複並消除之,是網絡蜘蛛需要解決的問題。除轉載導致的重複外,重複總能體現為各種不同的模式,站點級重複,目錄級重複,CGI級重複,參數級重複等等,及早發現這些模式並進行處理,能節省係統的存儲、抓取、建庫和展現資源。

第一個問題最好解決,因為美國電信的根服務器就在諾亞。網頁的覆蓋率永遠都是100。

需要解決的是第二和第三個問題。

事實上這也不是個大問題,原理很容易解決,最重要的一環在於需要一個高效率的程序。

光憑自己一個人的話,可能需要不少的時間。凱瑟琳一直夢想的是當一個甩手掌櫃,這事怎麽能夠發生呢?——於是,找人就是必須的。

最後,凱瑟琳決定從微軟的PhoenixStargate開發組抽調了三個人出來,幫助開發這個網絡蜘蛛程序。

反正星門係統的開發已經差不多了,這個時候自己抽調一些人出來開發網絡蜘蛛完全不是問題。

網絡蜘蛛是搜索引擎的一個最核心的部分。有了這個程序之後,搜索引擎的建立就會非常簡單了。

那……自己的這個網站應該叫什麽名字呢?

百度?

她首先就想到了這個名字。

凱瑟琳搖了搖頭,與其叫百度,還沒有穀歌來得更有味道。畢竟,後者可是全球性的搜索引擎,而前者隻能局限在中國大陸地區嘛……而且更重要的一員原因是,凱瑟琳對於百度的某些功能非常的有怨念,而且還不能翻牆。

在這上麵,穀歌的搜索就方便多了——前提是用國外版,好孩子片什麽的,很容易就可以找到。雖然這是上輩子的情感,但是凱瑟琳覺得還是穀歌稍微要好那麽一點點。

最後,凱瑟琳決定將自己的這個網站命名為Google,也就是穀歌。

不過凱瑟琳並不打算如同曆史上的那個穀歌公司一樣去涉及各種的產業,什麽手機、辦公都一網打盡。

自己已經有了專門的手機部門,微軟也是自己的,穀歌公司所要做的事情,就是扮演好一個搜索引擎自己的角色。

這方麵凱瑟琳覺得還是去參考一下百度,還是一個不錯的選擇。

貼吧、知道、百科,這些都是必須的。

“穀歌貼吧……穀歌知道……穀歌百科……”凱瑟琳在筆記本上將關鍵詞一一寫下。

“唔……維基百科似乎也不錯……算了,還是穀歌吧。”

凱瑟琳決定不去占用“維基”的名字,看著阿桑奇如何將這些政撫的醜態全部挖出來,似乎挺有趣的。

但是如果自己占用了“維基”的名字,萬一以後阿桑奇做出了些什麽事情,那城門失火,殃及池魚,自己可就糟了。

“穀歌?那是什麽?”

艾爾莎將茶具收走。

“站的名字。”

“哦。”

有了站,大家就能夠找到和自己臭味相投的網站了,而那個時候,網絡上麵的火藥味大概也就不會這麽濃烈了。

“Google……”

凱瑟琳在筆記本上寫下了穀歌的幾個字母。

“這就是你說的那個穀歌?”

“是的,不僅僅隻有一個搜索引擎而已,這應該是一個綜合性的網站……當然,這個網站的大部分內容以搜索為主。”

貼吧、知道、百科,這些都是必不可少的。

“我的這個穀歌,在除去了搜索功能之外,還應該擁有替人們解決問題的功能。例如,大家有問題了,他們就可以到我們的穀歌網站來,然後就可以找到他們的問題的解決方法。”

“聽著可真不錯……是為了用戶的依賴度嗎?”

艾爾莎似乎看出了些什麽。

“對,對。用戶的粘性很重要。”凱瑟琳擺出了一副“孺子可教”的表情。

“我們可以在穀歌知道讓用戶提問,他們遇到了難以解決的問題,就可以在這邊尋求解決方案……當然,我們公司自身並不提供解決方案的辦法,而是讓網友們自己來,從而形成一種互動。而我們的穀歌百科,則是類似於百科全書的存在,大家想要找什麽知識,隻要到我們的穀歌百科來就好了。”

“那……貼吧又是什麽呢?”艾爾莎注意到凱瑟琳似乎好像沒有提及貼吧的功能。

“貼吧應該是和論壇差不多的功能,但是性質有些不太一樣。穀歌將會成為我們未來很重要的一個產品”

貼吧和論壇是存在很大不同的,但是凱瑟琳不知道怎麽和艾爾莎說明。

“穀歌……這名字越聽越覺得順耳,真不錯。”艾爾莎摸著下巴想了想。

“這是必須的。”

除了穀歌,Face也是一個不錯的東西,但是開設一個Face的網站……這根本不可能。現在的計算機根本不可能將人臉給完美的呃弄成圖片,圖像會有巨大的損失。更重要的是,現在根本沒有網絡攝像頭。

“凱特,你似乎很重視穀歌?”

“當然,我連廣告詞也想好了。”

“廣告詞?”