物理學研究表明,在目前宇宙所有物質的總體質量中.星系等可見物質只占其中的20%,不可探測的暗物質則占據了總質量的大約80%。互聯網中的暗網可與宇宙中的暗物質相類比。而其所占網頁的比例.更是遠大于暗物質占宇宙質最的比例.大約百倍于目前的明網(Surfacingweb)網頁。
所謂暗網.是指目前搜索引擎爬蟲按照常規方式很難抓取到的互聯網頁面。如前所述.搜索引擎爬蟲依舊頁面中的鏈接關系發現新的頁面,但是很多網站的內容是以數據庫方式存儲的,典型的例子是壹些垂直領域網站,比如執程旅行網的機票數據,很難有顯式鏈接指向數據庫內的記錄,往往是服務網站提供組合查詢界面.只有用戶按照需求愉入查詢之後,才可能獲得相關數據.