CDN的概念最早于1995年由美國麻省理工大學(xué)提出,是一套能夠?qū)崿F(xiàn)用戶就近訪問的網(wǎng)絡(luò)解決方案。具體方法是:采用智能路由和流量管理技術(shù),將用戶的訪問請求指向 CDN網(wǎng)絡(luò)中健康且響應(yīng)最快的CDN節(jié)點(diǎn),用戶通過直接對此CDN節(jié)點(diǎn)的訪問,獲得所需要的內(nèi)容和數(shù)據(jù),就近訪問加速了訪問速度。
利用內(nèi)容分發(fā)與復(fù)制機(jī)制,客戶不需要改動(dòng)原來的網(wǎng)站結(jié)構(gòu),只需修改少量的DNS配置,就可以加速網(wǎng)絡(luò)的響應(yīng)速度。 當(dāng)用戶訪問使用CDN服務(wù)的網(wǎng)站時(shí),解析請求將最終由CDN服務(wù)商提供的DNS域名解析服務(wù)器來處理。它通過將當(dāng)時(shí)能夠最快響應(yīng)用戶的節(jié)點(diǎn)地址提供給用戶,使用戶可以有效準(zhǔn)確的得到快速的服務(wù)。同時(shí),它還與分布在不同地點(diǎn)的所有CDN節(jié)點(diǎn)保持是實(shí)時(shí)通信,搜集各節(jié)點(diǎn)的健康狀態(tài),確保用戶訪問的成功率。
上面的說明有些專業(yè),用戶訪問網(wǎng)站實(shí)際上就是用戶的電腦尋找網(wǎng)站服務(wù)器的一個(gè)過程。先讓我們看一下使用CDN服務(wù)之前,用戶訪問網(wǎng)站的流程:
1.用戶在自己的瀏覽器中輸入要訪問的網(wǎng)站的域名,瀏覽器首先查看本機(jī)系統(tǒng)目錄下的一個(gè)hosts文件。該文件位于WINDOWSsystem32driversetc下,沒有擴(kuò)展名,但是可以用記事本打開。里面一行對應(yīng)著域名和IP值。如果有域名對應(yīng)的IP,瀏覽器直接就用該IP訪問網(wǎng)站。
2.如果沒有域名對應(yīng)的IP地址,瀏覽器向本地DNS服務(wù)器請求對該域名的解析; 本地DNS服務(wù)器就是由當(dāng)?shù)仉娦呕蛘呗?lián)通給分配的DNS.
3.本地DNS服務(wù)器到根DNS服務(wù)器上找所授權(quán)的DNS記錄,記錄返回到本地DNS服務(wù)器;
4.本地DNS服務(wù)器按照記錄到網(wǎng)站授權(quán)的域名解析服務(wù)器請求解析主機(jī)名,域名解析服務(wù)器將IP地址作為解析結(jié)果送給本地DNS服務(wù)器。
5.本地DNS服務(wù)器將IP返還給用戶;
6.用戶在得到IP地址后,向該網(wǎng)站服務(wù)器進(jìn)行訪問,網(wǎng)站服務(wù)器將相應(yīng)的內(nèi)容和數(shù)據(jù)提供給用戶。
使用CDN服務(wù)之后,用戶訪問流程:
前三步流程相同,從第四步開始:
1.域名的解析請求在被發(fā)往CDN解析服務(wù)器后,服務(wù)器將此域名響應(yīng)速度最快的節(jié)點(diǎn)IP發(fā)送給本地DNS服務(wù)器,本地DNS服務(wù)器將此IP發(fā)給用戶。上圖的第四、五步。
2.用戶在得到IP地址后向CDN節(jié)點(diǎn)發(fā)出訪問請求第一次的訪問。
3.CDN節(jié)點(diǎn)將回源網(wǎng)站服務(wù)器取回內(nèi)容數(shù)據(jù)發(fā)給用戶。
4.CDN節(jié)點(diǎn)會(huì)緩存大量數(shù)據(jù),若有其他用戶訪問相同內(nèi)容時(shí),直接將內(nèi)容數(shù)據(jù)返回用戶,完成從請求到服務(wù)的全過程。
目前CDN服務(wù)的廠家大部分是收費(fèi)的,提供免費(fèi)CDN服務(wù)廠家不多,隨著這類產(chǎn)品的增多,廠家之間相互競爭也將逐漸激烈,服務(wù)內(nèi)容、服務(wù)項(xiàng)目、服務(wù)質(zhì)量也會(huì)隨之更上層樓!所以,相信會(huì)有更多、更好的免費(fèi)CDN的出現(xiàn)。
OK,上面說完了CDN的原理,現(xiàn)在我們再分析一下采用CDN服務(wù)對SEO(搜索引擎優(yōu)化)有沒有影響,因?yàn)閷DN技術(shù)實(shí)現(xiàn)并不是完全了解,所以只是猜測一下幾種情況:
1.首先要了解蜘蛛是怎樣爬過來的,抓取源服務(wù)器數(shù)據(jù)的。
對于已經(jīng)收錄的網(wǎng)站,蜘蛛肯定是直接抓取源服務(wù)器IP地址的數(shù)據(jù),不大可能每次抓取前再重新通過DNS服務(wù)器解析一次,所以我們不用擔(dān)心更新的數(shù)據(jù)會(huì)不會(huì)被抓取到。
2.CDN節(jié)點(diǎn)緩存的更新頻率。
如果蜘蛛抓取的是CDN節(jié)點(diǎn)里面的數(shù)據(jù),這里面數(shù)據(jù)都是存放在CDN緩存里面的,CDN既然是一種緩存技術(shù),那么它的實(shí)時(shí)性肯定是無法實(shí)現(xiàn)的,因此它的更新頻率就很重要了。在寫這篇文章的時(shí)候,我打電話咨詢了國內(nèi)最大CDN服務(wù)商網(wǎng)宿科技的客服,客服的說法是會(huì)根據(jù)訪問量及訪問行為自動(dòng)的設(shè)定更新頻率,也可以在后臺根據(jù)網(wǎng)站不同的欄目設(shè)定靈活多樣的緩存策略和主、被動(dòng)的數(shù)據(jù)更新方式;并進(jìn)行智能調(diào)控和緩存。所以,這里對于SEO的影響也是可以忽略的。
3.IP的變化對SEO的權(quán)重。
萬一蜘蛛抓取到各個(gè)節(jié)點(diǎn)的數(shù)據(jù)呢?會(huì)不會(huì)造成一個(gè)網(wǎng)站好像有不同的IP地址,搜索引擎會(huì)不會(huì)對這種情況有所懲罰呢?查看百度官方SEO指南 可以看到這樣的話:“Baiduspider對站點(diǎn)的抓取方式和普通用戶訪問一樣,只要普通用戶能訪問到的內(nèi)容,我們就能抓取到。不管是用什么技術(shù),只要能保證用戶能流暢的訪問網(wǎng)站,對搜索引擎就沒有影響。” 既然百度都這樣說,谷歌對于抓取和收錄更沒有問題。同時(shí),百度也提到“建議盡量選擇有實(shí)力的服務(wù)商和成熟的技術(shù),不成熟的技術(shù)容易導(dǎo)致訪問不穩(wěn)定,這就有可能影響搜索引擎的抓取了”,所以選擇一個(gè)安全,穩(wěn)定的CDN服務(wù)提供商仍然是很重要的。
CDN對SEO的影響是很多朋友都關(guān)心的問題,從網(wǎng)友的一些實(shí)驗(yàn)來看,無論是從抓取速度和頻率來說都沒有什么問題,甚至是有益的。另外即使存在一些問題,搜索引擎以及CDN提供商應(yīng)該會(huì)想到解決的辦法。