10.美國(guó)國(guó)會(huì)圖書(shū)館
盡管我們已經(jīng)步入數(shù)字時(shí)代,但這仍然不能阻止美國(guó)國(guó)會(huì)圖書(shū)館登上這份排行榜?上У氖,該圖書(shū)館并沒(méi)有將館藏內(nèi)容數(shù)字化的計(jì)劃(工作量之大光想想也很可怕)。
·1.3億件館藏品(包括書(shū)籍、圖片、地圖等等) ·2900萬(wàn)本書(shū)籍 ·每天新增10,000件新藏品 ·書(shū)架全長(zhǎng)530英里(852,952.32米) ·500萬(wàn)數(shù)字化文檔 ·20TB文本資料
9.美國(guó)中央情報(bào)局(CIA)
屢屢在好萊塢電影中出現(xiàn)的CIA其工作就是收集和發(fā)布有關(guān)人物、地點(diǎn)、事件的信息,因此該機(jī)構(gòu)進(jìn)入這份排行榜顯然毫無(wú)爭(zhēng)議。盡管很少有人了解CIA 數(shù)據(jù)庫(kù)的整體大小,但可以肯定的是該機(jī)構(gòu)通過(guò)外勤工作和數(shù)字入侵手段已經(jīng)積聚了數(shù)量驚人的信息,無(wú)論這些信息屬于公共還是私人。
·FOIA(信息自由法案,CIA的公共數(shù)據(jù)庫(kù)之一)每月新增100條新內(nèi)容 ·有關(guān)超過(guò)250個(gè)國(guó)家和地區(qū)的詳細(xì)情報(bào) ·不計(jì)其數(shù)的機(jī)密情報(bào)
8.亞馬遜(Amazon)
亞馬遜是全球最大的在線(xiàn)商店,該網(wǎng)站保存有其龐大活躍用戶(hù)數(shù)的個(gè)人信息、收據(jù)、期待貨物列表等數(shù)據(jù),另外還在線(xiàn)提供超過(guò)250,000本完整文字書(shū)籍;允許用戶(hù)在網(wǎng)站的每個(gè)頁(yè)面作評(píng)論或其他互動(dòng)。這令亞馬遜成為了全球最大的在線(xiàn)交流場(chǎng)所。
·5900萬(wàn)活動(dòng)用戶(hù) ·超過(guò)42TB的數(shù)據(jù)
7.YouTube
我們都親眼目睹了YouTube如何在不到兩年之中從無(wú)到有成長(zhǎng)為全球最大的在線(xiàn)視頻庫(kù)(也是最大的數(shù)據(jù)庫(kù)之一,而且還在飛速擴(kuò)張之中)。該網(wǎng)站目前每天的視頻瀏覽量達(dá)到1億次,每天新增65,000+新視頻,這也就意味著在最近五個(gè)月之內(nèi)該網(wǎng)站的數(shù)據(jù)庫(kù)可能已經(jīng)擴(kuò)大了不止一倍。
·每天1億次的視頻瀏覽量 ·每天新增65,000段新視頻 ·60%的視頻被在線(xiàn)觀看 ·至少45TB視頻數(shù)據(jù)量
6.ChoicePoint
ChoicePoint的工作是獲取美國(guó)公民的信息——包括地址、電話(huà)號(hào)碼、駕駛紀(jì)錄、犯罪記錄等等,ChoicePoint 全部囊括其中。ChoicePoint把這些數(shù)據(jù)中的大多數(shù)進(jìn)行拍賣(mài),價(jià)高者得,買(mǎi)家甚至包括美國(guó)政府。
ChoicePoint數(shù)據(jù)庫(kù)中的電話(huà)簿包含10億頁(yè)內(nèi)容,如果打印出來(lái),其長(zhǎng)度相當(dāng)于地球到月球距離的77倍。
·250TB個(gè)人信息 ·有關(guān)2.5億人的資料
5. Sprint
Sprint是全球最大的電信公司之一,為5300萬(wàn)用戶(hù)提供移動(dòng)服務(wù)。
·數(shù)據(jù)庫(kù)包含2.85萬(wàn)億欄 ·每天3.65億項(xiàng)通話(huà)詳細(xì)記錄 ·高峰時(shí)期每秒新增70,000項(xiàng)通話(huà)記錄
4. Google
Google將用戶(hù)提交的每次搜索都保存到數(shù)據(jù)庫(kù)中,一年就能積累33萬(wàn)億條數(shù)據(jù)庫(kù)條目,信息量可達(dá)數(shù)百TB。另外Google還有收集用戶(hù)信息的嗜好。Google通過(guò)分析用戶(hù)搜索請(qǐng)求和用戶(hù)計(jì)算機(jī)上的Google cookie為每個(gè)用戶(hù)生成一份虛擬profile。
目前,Google提供的服務(wù)越來(lái)越廣,涉及數(shù)字媒體(Google Video, YouTube),廣告(Google Ads),email(GMail)等,Google的數(shù)據(jù)庫(kù)正在以創(chuàng)紀(jì)錄的速度擴(kuò)張。就互聯(lián)網(wǎng)數(shù)據(jù)庫(kù)而言,Google是當(dāng)之無(wú)愧的王者。
·每天9100萬(wàn)次搜索 ·占據(jù)整個(gè)互聯(lián)網(wǎng)搜索量的一半 ·為無(wú)數(shù)用戶(hù)生成虛擬profile
3. AT&T
和Sprint類(lèi)似,AT&T是美國(guó)歷史最悠久的電信公司,也擁有全球最大的數(shù)據(jù)庫(kù)之一。其創(chuàng)造的記錄包括最大的單個(gè)數(shù)據(jù)庫(kù)(312TB)和單個(gè)數(shù)據(jù)庫(kù)列數(shù)全球排名第二(1.9萬(wàn)億列,AT&T的通話(huà)記錄數(shù)據(jù)庫(kù))
·323TB信息數(shù)據(jù)量 ·1.9億通話(huà)記錄
2.美國(guó)國(guó)家能源研究科學(xué)計(jì)算中心(NERSC)
全球第二大數(shù)據(jù)庫(kù)當(dāng)屬位于加州奧克蘭的美國(guó)國(guó)家能源研究科學(xué)計(jì)算中心(National Energy Research Scientific Computing Center),勞倫斯柏克萊國(guó)家實(shí)驗(yàn)室和美國(guó)能源部擁有并營(yíng)運(yùn)該機(jī)構(gòu)。該機(jī)構(gòu)的數(shù)據(jù)庫(kù)保存有原子能研究、先進(jìn)能源物理實(shí)驗(yàn)、早期宇宙模擬等相關(guān)數(shù)據(jù)。想要回到過(guò)去最好方式也許是開(kāi)動(dòng)NERSC的超級(jí)計(jì)算機(jī)來(lái)觀察宇宙誕生時(shí)的大爆炸。
·2.8PB(1PB=1024TB) ·2000名計(jì)算機(jī)科學(xué)家負(fù)責(zé)運(yùn)營(yíng)該中心
1.世界氣候數(shù)據(jù)中心(WDCC)
如果你擁有一臺(tái)價(jià)值3500萬(wàn)歐元超級(jí)計(jì)算機(jī)你會(huì)拿來(lái)干嘛?模擬股市?搭建自己的Internet?而現(xiàn)實(shí)中的這臺(tái)計(jì)算機(jī)用于氣候研究,比如說(shuō)研究大氣變暖問(wèn)題。擁有這臺(tái)計(jì)算機(jī)的世界氣候數(shù)據(jù)中心由德國(guó)馬普氣象學(xué)院和德國(guó)氣候計(jì)算中心運(yùn)營(yíng),而全球最大的數(shù)據(jù)庫(kù)也在此處。
|