php file_get_contents()读取采集远程文件内容

file_get_contents() 函数是用于将文件的内容读入到一个字符串中的首选方法

上面是帮助手册的是一次性把内容全部读入内存了,后面的实例我们也会讲到

_get_contents可以将远程文件读入为一个字符串,
而文件行的分隔就是”rn”
explode将字符串按”rn”分隔

 代码如下 复制代码
$shadu_url = "http://localhost/demo.html";
$shadu_str = file_get_contents($shadu_url);
$line_arr  = explode("rn",$shadu_str);

远程请求地址,返回的处理结果信息为字符串,各字段以‘|’隔开,行与行用‘rn’隔开
分别返回内容为,id,name,time,email

内容示例
1|simaopig|2009-04-01|demo@simaopig.com
2|xiaoxiaozi|2009-04-02|demo@xiaoxiaozi.com
如我想要获得每个字段操作如下

 代码如下 复制代码
$shadu_url = "http://localhost/demo.html";
$shadu_str = file_get_contents($shadu_url);
$line_arr  = explode("rn",$shadu_str);
$result = array();
if(empty($line_arr))
{
return array();
}
foreach($line_arr as $line_str)
{
$record_arr = explode("|",$line_str);
if($record_arr[0] == "-1")
{
// log
continue;
}
$data = array();
$data['id'] = $record_arr[0];
$data['name'] = $record_arr[1];
$data['time'] = $record_arr[2];
$data['email'] = $record_arr[3];
$result[] = $data;
}
var_dump($result);

结果自己查看吧,哈哈。

实例2

采集html页面的内容

 

 代码如下 复制代码
<?php
//全国,判断条件是$REQUEST_URI是否含有html
if (!strpos($_SERVER["REQUEST_URI"],".html"))
{
$page="http://qq.ip138.com/weather/";
$html = file_get_contents($page,'r');
$pattern="/<B>全国主要城市、县当天和未来五天天气趋势预报在线查询</B>(.*?)<center style="padding:3px">/si";
//正则匹配之间的html
preg_match($pattern,$html,$pg);
echo "";
//正则替换远程地址为本地地址
$p=preg_replace('//weather/(w+)/index.htm/', 'tq.php/$1.html', $pg[1]);
echo $p;
}
//省,判断条件是$REQUEST_URI是否含有?
else if(!strpos($_SERVER["REQUEST_URI"],"?")){
//yoyo推荐的使用分割获得数据,这里是获得省份名称
$province=explode("/",$_SERVER["REQUEST_URI"]);
$province=explode(".",$province[count($province)-1]);
$province=$province[0];
//被注释掉的是我自己写出来的正则,感觉写的不好,但效果等同上面
//preg_match('/[^/]+[.(html)]$/',$_SERVER["REQUEST_URI"],$pro);
//$province=preg_replace('/.html/','',$pro[0]);
$page="http://qq.ip138.com/weather/".$province."/index.htm";
//获取html数据之前先尝试打开页面,防止恶意输入地址导致出错
if (!@fopen($page, "r")) {
die("对不起,该地址不存在!<a href=javascript:history.back(1)>点击这里返回</a>");
exit(0);
}
$html = file_get_contents($page,'r');
$pattern="/五天天气趋势预报</B>(.*?)请输入输入市/si";
preg_match($pattern,$html,$pg);
echo "";
//正则替换,获取省份,城市
$p=preg_replace('//weather/(w+)/(w+).htm/', '$2.html?pro=$1', $pg[1]);
echo $p;
}
else {
//市,通过get传递省份
$pro=$_REQUEST['pro'];
$city=explode("/",$_SERVER["REQUEST_URI"]);
$city=explode(".",$city[count($city)-1]);
$city=$city[0];
//preg_match('/[^/]+[.(html)]+[?]/',$_SERVER["REQUEST_URI"],$cit);
//$city=preg_replace('/.html?/','',$cit[0]);
$page="http://qq.ip138.com/weather/".$pro."/".$city.".htm";
if (!@fopen($page, "r")) {
die("对不起,该地址不存在!<a href=javascript:history.back(1)>点击这里返回</a>");
exit(0);
}
$html = file_get_contents($page,'r');
$pattern="/五天天气趋势预报</B>(.*?)请输入输入市/si";
preg_match($pattern,$html,$pg);
echo "";
//获取真实的图片地址
$p=preg_replace('//image//', 'http://qq.ip138.com/image/', $pg[1]);
echo $p;
}
?>
时间: 2024-10-26 01:10:28

php file_get_contents()读取采集远程文件内容的相关文章

PHP 获取远程文件内容的函数代码_php技巧

如下函数: 复制代码 代码如下: <? /** 获取远程文件内容 @param $url 文件http地址 */ function fopen_url($url) { if (function_exists('file_get_contents')) { $file_content = @file_get_contents($url); } elseif (ini_get('allow_url_fopen') && ($file = @fopen($url, 'rb'))){ $i

php获取远程文件内容的函数_php技巧

一个简单的php获取远程文件内容的函数代码,兼容性强.直接调用就可以轻松获取远程文件的内容,使用这个函数也可获取图片.代码如下: /** * 读远程内容 * @return string */ function get_url_content($url){ if(function_exists("curl_init")){ $ch = curl_init(); $timeout = 30; curl_setopt($ch, CURLOPT_URL, $url); curl_setopt

php读取torrent种子文件内容的方法(测试可用)_php技巧

本文实例讲述了php读取torrent种子文件内容的方法.分享给大家供大家参考,具体如下: <?php /** * Class xBEncoder * Author: Angus.Fenying * Version: 0.1 * Date: 2014-06-03 * * This class helps stringify or parse BENC * codes. * * All Copyrights 2007 - 2014 Fenying Studio Reserved. */ class

php curl采集远程页面内容演示代码

例  代码如下 复制代码 $curlPost = 'a=1&b=2';//模拟POST数据 $ch = curl_init(); curl_setopt($ch, CURLOPT_HTTPHEADER, array('X-FORWARDED-FOR:0.0.0.0', 'CLIENT-IP:0.0.0.0'));  //构造IP curl_setopt($ch, CURLOPT_REFERER, "http://www.111cn.net/");   //构造来路 curl_s

通过Javascript读取本地Excel文件内容的代码示例

 这篇文章主要介绍了通过Javascript读取本地Excel文件内容的代码示例,但需要一定的条件才可以使用js操作本地文件,需要的朋友参考下吧 读取本地Excel文件内容的Javascript代码:    代码如下: <script type="text/javascript"> function read_excel(){       var filePath="D:abcd9.com.xls"; //要读取的xls     var sheet_id

通过Javascript读取本地Excel文件内容的代码示例_javascript技巧

读取本地Excel文件内容的Javascript代码: 复制代码 代码如下: <script type="text/javascript">function read_excel(){     var filePath="D:\abcd9.com.xls"; //要读取的xls    var sheet_id=2; //读取第2个表    var row_start=3; //从第3行开始读取    var tempStr='';    try{    

buffer-将读取出的文件内容,分成多个部分,每个部分都是40字节发送,现在每次只发送了前40个字节的内容。

问题描述 将读取出的文件内容,分成多个部分,每个部分都是40字节发送,现在每次只发送了前40个字节的内容. 将读取出的文件内容,分成多个部分,每个部分都是40字节发送,现在无法遍历到所有的内容,每次只发送了前40个字节的内容,请帮忙看看哪里的问题,谢谢. String content = FileUtil.readFile(data);// 读取文本文件内容 // 将读取出的文件内容,分成多个部分,每个部分都是40字节发送 int number=40; byte[] buffer = new b

一个带采集远程文章内容,保存图片,生成文件等完整的采集功能

本文提供了一套完整的ASP采集功能函数,包含提取地址的原字符,保存远程的文件到本地模拟登录,获取网页源码等功能函数,阿里西西站长推荐收藏! '================================================== '函数名:GetHttpPage '作  用:获取网页源码 '参  数:HttpUrl ------网页地址 '================================================== Function GetHttpPage(

php几种采集远程服务器内容代码

//方法一模仿用户访问网页  代码如下 复制代码 function readpr($link,$url) {  $fp = fsockopen ($url, 80, $errno, $errstr, 30);  if (!$fp)  {   echo "$errstr ($errno) ";   exit(1);  }  else  {   $out = "get $link http/1.0 ";   $out .= "host: $url "