linux下 需要编译的时候加入curl库
windows下 只需要修改 php.ini 中的 扩展 把相应的.dll 加进去就行了
以下是来自php手册
cURL可以使用URL的语法模拟浏览器来传输数据,
因为它是模拟浏览器,所以呢它同样支持多种协议,
FTP, FTPS, HTTP, HTTPS, GOPHER, TELNET, DICT, FILE 以及 LDAP等协议都可以很好的支持,包括一些:
HTTPS认证,HTTP POST方法,HTTP PUT方法,FTP上传,keyberos认证,HTTP上传,代理服务器,cookies,用户名/密码认证,
到FTP服务器等等.
这就是我们为什么要使用cURL的原因!
使用cURL完成简单的请求主要分为以下四步:
①初始化,创建一个新cURL资源
我们来采集一个页面,通常情况下,我们会使用file_get_contents()函数来获取:
像这样:
php
$str = file_get_contents('');
//或者是:
$str = file("");
readfile("");
这样我们会发现,我们没有办法有效地进行错误处理,更重要的是我们没有办法完成一些高难度的任务:
如:处理cookies,验证,表单提交,文件上传等等.
好,现在我们来用代码完成上述cURL的四步:
//1.初始化,创建一个新cURL资源
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, "");
curl_setopt($ch, CURLOPT_HEADER, 0);
curl_exec($ch);
curl_close($ch);
上述四步中,其中第二步最为关键,可以设置一些高级选项:
例如上例中的CURLOPT_URL和CURLOPT_HEADER,分别代表"需要获取的URL地址"和"启用时会将头文件的信息作为数据流输出",这些只是冰山一角,我们还可以设置很多选项:
选项可选value值备注
CURLOPT_AUTOREFERER当根据Location:重定向时,自动设置header中的Referer:信息.
CURLOPT_BINARYTRANSFER在启用CURLOPT_RETURNTRANSFER的时候,返回原生的(Raw)输出.
CURLOPT_COOKIESESSION启用时curl会仅仅传递一个session cookie,忽略其他的cookie,默认状况下cURL会将所有的cookie返回给服务端.session cookie是指那些用来判断服务器端的session是否有效而存在的cookie.
CURLOPT_CRLF启用时将Unix的换行符转换成回车换行符.
CURLOPT_DNS_USE_GLOBAL_CACHE启用时会启用一个全局的DNS缓存,此项为线程安全的,并且默认启用.
CURLOPT_FILETIME启用时会尝试修改远程文档中的信息.结果信息会通过curl_getinfo()函数的CURLINFO_FILETIME选项返回. curl_getinfo().
CURLOPT_FOLLOWLOCATION启用时会将服务器服务器返回的"Location: "放在header中递归的返回给服务器,使用CURLOPT_MAXREDIRS可以限定递归返回的数量.
CURLOPT_FORBID_REUSE在完成交互以后强迫断开连接,不能重用.
CURLOPT_FRESH_CONNECT强制获取一个新的连接,替代缓存中的连接.
CURLOPT_FTP_USE_EPSV启用时,在FTP传输过程中回复到PASV模式前首先尝试EPSV命令.设置为FALSE时禁用EPSV命令.
CURLOPT_FTPAPPEND启用时追加写入文件而不是覆盖它.
CURLOPT_FTPASCIICURLOPT_TRANSFERTEXT的别名.
CURLOPT_FTPLISTONLY启用时只列出FTP目录的名字.
CURLOPT_HEADER启用时会将头文件的信息作为数据流输出.
CURLOPT_HTTPGET启用时会设置HTTP的method为GET,因为GET是默认是,所以只在被修改的情况下使用.
CURLOPT_HTTPPROXYTUNNEL启用时会通过HTTP代理来传输.
CURLOPT_MUTE启用时将cURL函数中所有修改过的参数恢复默认值.
CURLOPT_NETRC在连接建立以后,访问~/.netrc文件获取用户名和密码信息连接远程站点.
CURLOPT_NOBODY启用时将不对HTML中的BODY部分进行输出.
CURLOPT_NOPROGRESS
启用时关闭curl传输的进度条,此项的默认设置为启用.
Note:
PHP自动地设置这个选项为TRUE,这个选项仅仅应当在以调试为目的时被改变.
CURLOPT_POST启用时会发送一个常规的POST请求,类型为:application/x-www-form-urlencoded,就像表单提交的一样.
CURLOPT_PUT启用时允许HTTP发送文件,必须同时设置CURLOPT_INFILE和CURLOPT_INFILESIZE.
CURLOPT_RETURNTRANSFER将curl_exec()获取的信息以文件流的形式返回,而不是直接输出.
CURLOPT_TRANSFERTEXT启用后对FTP传输使用ASCII模式.对于LDAP,它检索纯文本信息而非HTML.在Windows系统上,系统不会把STDOUT设置成binary模式.
CURLOPT_UNRESTRICTED_AUTH在使用CURLOPT_FOLLOWLOCATION产生的header中的多个locations中持续追加用户名和密码信息,即使域名已发生改变.
CURLOPT_UPLOAD启用后允许文件上传.
CURLOPT_VERBOSE启用时会汇报所有的信息,存放在STDERR或指定的CURLOPT_STDERR中.
对于下面的这些option的可选参数,value应该被设置一个integer类型的值:
CURLOPT_CLOSEPOLICY不是CURLCLOSEPOLICY_LEAST_RECENTLY_USED就是CURLCLOSEPOLICY_OLDEST,还存在另外三个CURLCLOSEPOLICY_,但是cURL暂时还不支持.
CURLOPT_CONNECTTIMEOUT在发起连接前等待的时间,如果设置为0,则无限等待.
CURLOPT_HTTP_VERSIONCURL_HTTP_VERSION_NONE (默认值,让cURL自己判断使用哪个版本),CURL_HTTP_VERSION_1_0 (强制使用 HTTP/1.0)或CURL_HTTP_VERSION_1_1 (强制使用 HTTP/1.1).
CURLOPT_HTTPAUTH
使用的HTTP验证方法,可选的值有:CURLAUTH_BASIC、CURLAUTH_DIGEST、CURLAUTH_GSSNEGOTIATE、CURLAUTH_NTLM、CURLAUTH_ANY和CURLAUTH_ANYSAFE. 可以使用|位域(或)操作符分隔多个值,cURL让服务器选择一个支持最好的值.
CURLAUTH_ANY等价于CURLAUTH_BASIC | CURLAUTH_DIGEST | CURLAUTH_GSSNEGOTIATE | CURLAUTH_NTLM. CURLAUTH_ANYSAFE等价于CURLAUTH_DIGEST | CURLAUTH_GSSNEGOTIATE | CURLAUTH_NTLM.
CURLOPT_INFILESIZE设定上传文件的大小限制,字节(byte)为单位.
CURLOPT_LOW_SPEED_LIMIT当传输速度小于CURLOPT_LOW_SPEED_LIMIT时(bytes/sec),PHP会根据CURLOPT_LOW_SPEED_TIME来判断是否因太慢而取消传输.
CURLOPT_LOW_SPEED_TIME当传输速度小于CURLOPT_LOW_SPEED_LIMIT时(bytes/sec),PHP会根据CURLOPT_LOW_SPEED_TIME来判断是否因太慢而取消传输.
CURLOPT_MAXCONNECTS允许的最大连接数量,超过是会通过CURLOPT_CLOSEPOLICY决定应该停止哪些连接.
CURLOPT_MAXREDIRS指定最多的HTTP重定向的数量,这个选项是和CURLOPT_FOLLOWLOCATION一起使用的.
CURLOPT_PORT用来指定连接端口.(可选项)
CURLOPT_PROTOCOLS
CURLOPT_PROXYPORT代理服务器的端口.端口也可以在CURLOPT_PROXY中进行设置.
CURLOPT_RESUME_FROM在恢复传输时传递一个字节偏移量(用来断点续传).
CURLOPT_TIMEOUT设置cURL允许执行的最长秒数.
CURLOPT_TIMEVALUE设置一个CURLOPT_TIMECONDITION使用的时间戳,在默认状态下使用的是CURL_TIMECOND_IFMODSINCE.
对于下面的这些option的可选参数,value应该被设置一个string类型的值:
CURLOPT_CAINFO一个保存着1个或多个用来让服务端验证的证书的文件名.这个参数仅仅在和CURLOPT_SSL_VERIFYPEER一起使用时才有意义. .
CURLOPT_CAPATH一个保存着多个CA证书的目录.这个选项是和CURLOPT_SSL_VERIFYPEER一起使用的.
CURLOPT_COOKIE设定HTTP请求中"Cookie: "部分的内容.多个cookie用分号分隔,分号后带一个空格(例如, "fruit=apple; colour=red").
CURLOPT_COOKIEFILE包含cookie数据的文件名,cookie文件的格式可以是Netscape格式,或者只是纯HTTP头部信息存入文件.
CURLOPT_COOKIEJAR连接结束后保存cookie信息的文件.
CURLOPT_CUSTOMREQUEST
使用一个自定义的请求信息来代替"GET"或"HEAD"作为HTTP请求.这对于执行"DELETE" 或者其他更隐蔽的HTTP请求.有效值如"GET","POST","CONNECT"等等.也就是说,不要今天这一节输入整个HTTP请求.例如输入"GET /index.html HTTP/1.0 "是不正确的.
Note: 在确定服务器支持这个自定义请求的方法前不要使用.
CURLOPT_EGDSOCKET类似CURLOPT_RANDOM_FILE,除了一个Entropy Gathering Daemon套接字.
CURLOPT_FTPPORT这个值将被用来获取供FTP"POST"指令所需要的IP地址."POST"指令告诉远程服务器连接到我们指定的IP地址.这个字符串可以是纯文本的IP地址、主机名、一个网络接口名(UNIX下)或者只是一个'-'来使用默认的IP地址.
CURLOPT_INTERFACE网络发送接口名,可以是一个接口名、IP地址或者是一个主机名.
CURLOPT_PROXYHTTP代理通道.
CURLOPT_PROXYUSERPWD一个用来连接到代理的"[username]:[password]"格式的字符串.
CURLOPT_RANDOM_FILE一个被用来生成SSL随机数种子的文件名.
CURLOPT_RANGE以"X-Y"的形式,其中X和Y都是可选项获取数据的范围,以字节计.HTTP传输线程也支持几个这样的重复项中间用逗号分隔如"X-Y,N-M".
CURLOPT_REFERER在HTTP请求头中"Referer: "的内容.
CURLOPT_SSLCERT一个包含PEM格式证书的文件名.
CURLOPT_SSLCERTPASSWD使用CURLOPT_SSLCERT证书需要的密码.
CURLOPT_SSLENGINE用来在CURLOPT_SSLKEY中指定的SSL私钥的加密引擎变量.
CURLOPT_SSLENGINE_DEFAULT用来做非对称加密操作的变量.
CURLOPT_SSLKEY包含SSL私钥的文件名.
CURLOPT_SSLKEYPASSWD
在CURLOPT_SSLKEY中指定了的SSL私钥的密码.
Note: 由于这个选项包含了敏感的密码信息,记得保证这个PHP脚本的安全.
CURLOPT_SSLKEYTYPECURLOPT_SSLKEY中规定的私钥的加密类型,支持的密钥类型为"PEM"(默认值)、"DER"和"ENG".
CURLOPT_URL需要获取的URL地址,也可以在curl_init()函数中设置.
CURLOPT_USERAGENT在HTTP请求中包含一个"User-Agent: "头的字符串.
CURLOPT_USERPWD传递一个连接中需要的用户名和密码,格式为:"[username]:[password]".
对于下面的这些option的可选参数,value应该被设置一个数组:
对于下面的这些option的可选参数,value应该被设置一个流资源 (例如使用fopen()):
对于下面的这些option的可选参数,value应该被设置为一个回调函数名:
选项可选value值
CURLOPT_HEADERFUNCTION设置一个回调函数,这个函数有两个参数,第一个是cURL的资源句柄,第二个是输出的header数据.header数据的输出必须依赖这个函数,返回已写入的数据大小.
CURLOPT_PASSWDFUNCTION设置一个回调函数,有三个参数,第一个是cURL的资源句柄,第二个是一个密码提示符,第三个参数是密码长度允许的最大值.返回密码的值.
CURLOPT_PROGRESSFUNCTION设置一个回调函数,有三个参数,第一个是cURL的资源句柄,第二个是一个文件描述符资源,第三个是长度.返回包含的数据.
CURLOPT_READFUNCTION拥有两个参数的回调函数,第一个是参数是会话句柄,第二是HTTP响应头信息的字符串.使用此函数,将自行处理返回的数据.返回值为数据大小,以字节计.返回0代表EOF信号.
CURLOPT_WRITEFUNCTION拥有两个参数的回调函数,第一个是参数是会话句柄,第二是HTTP响应头信息的字符串.使用此回调函数,将自行处理响应头信息.响应头信息是整个字符串.设置返回值为精确的已写入字符串长度.发生错误时传输线程终止.
看到了吧,只要在第二个函数之内设置这些选项就可以完成相应的功能,cURL的功能是灰常强大滴,大家可以尝试一下哦!
例如,我们只想把获取到的内容输入到文件,而不是直接输出给浏览器,我们就可以使用CURLOPT_RETURNTRANSFER选项!
这样在curl执行的时候,就会把页面的内容输出到文件当中,我们就可以完成采集等功能
PHP 中执行系统命令有几种方式:
system():和 C 语言中的 system() 函数的用法是一样的,参数为命令行,成功则返回命令输出的最后一行,失败则返回 FALSE.
shell_exec():执行命令,然后返回命令执行后的 stdout 输出.
passthru():直接执行命令,然后将输出内容直接显示到网页上.
今天这一节,curl 的输出不用显示到网页上,所以 system() 可能比较合适.
PHP只要安装了curl扩展库在cli模式下就可以直接使用
可以在命令行中输入 php -i | grep curl 检查是否已经安装curl扩展,如果没有安装,可在php源码包中找到curl的源码进行编译扩展,编译完成后需要在php.ini中添加对应扩展
另外cli模式如果需要读取php.ini配置需要将php.ini放到固定路径中,具体路径可通过 php -i 查看Loaded Configuration File参数
输入phpinfo() 看curl扩展是否启用,没有启用的话需要启用才可以使用curl功能.
启用方法:
WINDOWS:找到正在使用的PHP.INI文件 去掉;extension=php_curl.dll 前面的;
Linux : 重新编译PHP ,–with-curl=/usr/local/curl 其中/usr/local/curl安装的curl的目录
以上就是土嘎嘎小编为大家整理的用curl编译php相关主题介绍,如果您觉得小编更新的文章只要能对粉丝们有用,就是我们最大的鼓励和动力,不要忘记讲本站分享给您身边的朋友哦!!