- 相關(guān)推薦
php抓取https的內(nèi)容的代碼
大家有時(shí)候需要獲取https網(wǎng)頁(yè)的內(nèi)容,下面得方法,可以參考下。就跟隨百分網(wǎng)小編一起去了解下吧,想了解更多相關(guān)信息請(qǐng)持續(xù)關(guān)注我們應(yīng)屆畢業(yè)生考試網(wǎng)!
直接用file_get_contents,會(huì)報(bào)錯(cuò);
復(fù)制代碼 代碼如下:
$url = (https://xxx.com");
file_get_contents($url);
錯(cuò)誤:
Warning: file_get_contents(https://xxx.com) [function.file-get-contents]: failed to open stream: No such file or directory in D:wampwwwgrabber_clientindex.php on line 3
用curl的方式是可以的:
復(fù)制代碼 代碼如下:
$url = (https://xxx.com);
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL,$url);
curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false);
curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, false);
$result = curl_exec($ch);
print_r($result);
?>
重點(diǎn)是以下兩句:
復(fù)制代碼 代碼如下:
curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false);
curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, false);
如對(duì)本文有疑問(wèn),請(qǐng)?zhí)峤坏浇涣魃鐓^(qū),廣大熱心網(wǎng)友會(huì)為你解答!! 點(diǎn)擊進(jìn)入社區(qū)
為方便說(shuō)明,先上代碼吧
復(fù)制代碼 代碼如下:
/**
* curl POST
*
* @param string url
* @param array 數(shù)據(jù)
* @param int 請(qǐng)求超時(shí)時(shí)間
* @param bool HTTPS時(shí)是否進(jìn)行嚴(yán)格認(rèn)證
* @return string
*/
function curlPost($url, $data = array(), $timeout = 30, $CA = true){
$cacert = getcwd() . '/cacert.pem'; //CA根證書
$SSL = substr($url, 0, 8) == "https://" ? true : false;
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_TIMEOUT, $timeout);
curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, $timeout-2);
if ($SSL && $CA) {
curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, true); // 只信任CA頒布的證書
curl_setopt($ch, CURLOPT_CAINFO, $cacert); // CA根證書(用來(lái)驗(yàn)證的網(wǎng)站證書是否是CA頒布)
curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, 2); // 檢查證書中是否設(shè)置域名,并且是否與提供的主機(jī)名匹配
} else if ($SSL && !$CA) {
curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false); // 信任任何證書
curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, 1); // 檢查證書中是否設(shè)置域名
}
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_HTTPHEADER, array('Expect:')); //避免data數(shù)據(jù)過(guò)長(zhǎng)問(wèn)題
curl_setopt($ch, CURLOPT_POST, true);
curl_setopt($ch, CURLOPT_POSTFIELDS, $data);
//curl_setopt($ch, CURLOPT_POSTFIELDS, http_build_query($data)); //data with URLEncode
$ret = curl_exec($ch);
//var_dump(curl_error($ch)); //查看報(bào)錯(cuò)信息
curl_close($ch);
return $ret;
}
如果URL地址是https打頭,那就走SSL,否則就走普通的HTTP協(xié)議。
是否走HTTPS的話就安全了嗎?其實(shí)SSL也有不同的驗(yàn)證程度。
例如需不需要驗(yàn)證證書中的公用名呢?(BTW:公用名(Common Name)一般來(lái)講就是填寫你將要申請(qǐng)SSL證書的域名 (domain)或子域名(sub domain)。)
需要驗(yàn)證主機(jī)名嗎?
是任何證書都信任呢還是只信任CA頒布的呢?
。ㄎ也拎,電池快沒(méi)點(diǎn)了,只撿關(guān)鍵地兒說(shuō)了 - -|||)
如果網(wǎng)站SSL證書買的是CA的(通常比較貴),那么訪問(wèn)時(shí)可以使用比較嚴(yán)格的認(rèn)證,即:
復(fù)制代碼 代碼如下:
curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, true); // 只信任CA頒布的證書
curl_setopt($ch, CURLOPT_CAINFO, $cacert); // CA根證書(用來(lái)驗(yàn)證的網(wǎng)站證書是否是CA頒布)
curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, 2); // 檢查證書中是否設(shè)置域名,并且是否與提供的主機(jī)名匹配
如果網(wǎng)站的證書是自己生成的,或者是網(wǎng)上的小機(jī)構(gòu)申請(qǐng)的,那么訪問(wèn)時(shí)如果使用嚴(yán)格認(rèn)證則不會(huì)通過(guò),直接返回false。(對(duì)了,返回false時(shí)可以打印curl_error($ch)查看具體錯(cuò)誤信息。)此時(shí)可以根據(jù)情況通過(guò)降低驗(yàn)證程度來(lái)保證正常訪問(wèn),例如:
復(fù)制代碼 代碼如下:
curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false); // 信任任何證書
curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, 1); // 檢查證書中是否設(shè)置域名(為0也可以,就是連域名存在與否都不驗(yàn)證了)
平時(shí)我們使用瀏覽器訪問(wèn)各個(gè)https網(wǎng)站時(shí),有時(shí)會(huì)遇到證書不受信的提示,其實(shí)就是因?yàn)檫@些網(wǎng)站的證書不是正規(guī)CA機(jī)構(gòu)頒布的。
市面上各種瀏覽器中都內(nèi)置了CA根證書列表信息,訪問(wèn)有CA頒布證書的網(wǎng)站時(shí),會(huì)根據(jù)根證書驗(yàn)證這些網(wǎng)站的證書,所以就不會(huì)有這個(gè)提示了。
關(guān)于CA根證書文件,其實(shí)就是包含了各個(gè)主要CA機(jī)構(gòu)的公鑰證書,用來(lái)驗(yàn)證網(wǎng)站的證書是否是這些機(jī)構(gòu)頒發(fā)的。
這里的這個(gè)文件是來(lái)源于mozilla的源碼樹,又轉(zhuǎn)換成PEM格式證書文件。(大家可以到這里下載現(xiàn)成的http://curl.haxx.se/ca/cacert.pem)
最后說(shuō)一個(gè)和SSL無(wú)關(guān)的東西:
復(fù)制代碼 代碼如下:
curl_setopt($ch, CURLOPT_HTTPHEADER, array('Expect:'));
這個(gè)主要是為了解決POST時(shí)數(shù)據(jù)過(guò)長(zhǎng)問(wèn)題
【php抓取https的內(nèi)容的代碼】相關(guān)文章:
PHP實(shí)現(xiàn)抓取HTTPS內(nèi)容09-17
php抓取頁(yè)面的方法08-24
php抓取頁(yè)面的的方法06-09
PHP代碼優(yōu)化技巧09-10
PHP實(shí)用的代碼實(shí)例08-12
php分頁(yè)類代碼09-08
PHP調(diào)用的C代碼08-05
PHP代碼運(yùn)行流程08-14
PHP代碼如何規(guī)范08-28