利用fopen函数采集新闻页面内容保存到本地函数

 <?
/ / PHP的新闻抓取由Neil Moomey,。
/ /你可以自由的使用此代码作为您的愿望。
/ /请确保您可以从任何网站,你抓从标题许可。
/ /你可能需要写上您的服务器上的标题,文件以加快速度。

/ /抓斗从文件或网页的源代码网站
if(!($myFile=fopen(http://www.111cn.net,"r")))
{
echo "The news interface is down for maintenance.";
exit;
}
while(!feof($myFile))
{
// Read each line and add to $myLine
$myLine.=fgets($myFile,255);
}
fclose($myFile);
/ /解压缩一切的开始和结束之间。您需要包括这些行
/ /在标题或选择一些独特的子在HTML庆祝开始
/ /和新闻结束。

$start="<hr align=";
$end="建立镜像";
$start_position=strpos($myLine, $start);
$end_position=strpos($myLine, $end)+strlen($end);
$length=$end_position-$start_position;
$myLine=substr($myLine, $start_position, $length);
// Display HTML
echo $myLine;
?>

时间: 2024-09-17 00:54:49

利用fopen函数采集新闻页面内容保存到本地函数的相关文章

利用curl抓取远程页面内容的示例代码

利用curl抓取远程页面内容的一个小示例,需要的朋友可以过来参考下   最基本的操作如下 复制代码 代码如下: $curlPost = 'a=1&b=2';//模拟POST数据 $ch = curl_init(); curl_setopt($ch, CURLOPT_HTTPHEADER, array('X-FORWARDED-FOR:0.0.0.0', 'CLIENT-IP:0.0.0.0'));  //构造IP curl_setopt($ch, CURLOPT_REFERER, "ht

php curl采集远程页面内容演示代码

例  代码如下 复制代码 $curlPost = 'a=1&b=2';//模拟POST数据 $ch = curl_init(); curl_setopt($ch, CURLOPT_HTTPHEADER, array('X-FORWARDED-FOR:0.0.0.0', 'CLIENT-IP:0.0.0.0'));  //构造IP curl_setopt($ch, CURLOPT_REFERER, "http://www.111cn.net/");   //构造来路 curl_s

php ob_start()函数实现当前页面内容缓存输出

例  代码如下 复制代码 <?php ob_start(); //打开缓冲区 phpinfo(); //使用phpinfo函数 $info=ob_get_contents(); //得到缓冲区的内容并且赋值给$info $file=fopen('info.txt','w'); //打开文件info.txt fwrite($file,$info); //写入信息到info.txt fclose($file); //关闭文件info.txt //或直接用 file_put_content('info

利用curl抓取远程页面内容的示例代码_php技巧

最基本的操作如下 复制代码 代码如下: $curlPost = 'a=1&b=2';//模拟POST数据$ch = curl_init();curl_setopt($ch, CURLOPT_HTTPHEADER, array('X-FORWARDED-FOR:0.0.0.0', 'CLIENT-IP:0.0.0.0'));  //构造IPcurl_setopt($ch, CURLOPT_REFERER, "http://www.jb51.net/");   //构造来路 cur

Google新闻学习百度的新闻 将内容存放在本地

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 之前百度将新闻存储于本地的消息,今天Google新闻也一样这么做了,它直接将抓取的新闻内容存储到自己的服务器上而不是指引读者去相应的网站. 与百度新闻一样,这一举动很快引起了争议,美联社,法新社,美联社等著名通讯社可能因此减少网络流量,报纸和广播公司的网站广告收入将出现下滑.Google表示新的方法不会改变抓取新闻的质量. 在过去的两年中,G

WordPress实现撮文章第一张远程图片作缩略图并保存到本地

某些项目中,网站允许用户使用外链图片发布文章,或者处于某些特殊原因,网站希望抓取文中的第一张远程图片作为特色图片,并像QQ空间一样,将这张图片保存到本地,并插入到数据库中.总之,完成一系列动作之后,网站希望发现这张原本是远程外链的图片被放在本地,并成为了文章的特色图片. 这个动作我们使用一个hook来实现:  代码如下 复制代码 add_action('publish_post', 'fetch_images',999); 再创建一个fetch_images函数,来实现本文所说的所有功能.  代

看了一篇文章,说天猫的商品详情页面是先存在本地,想请教这个想法的可行性

问题描述 我是初入行的实习生,比不了各位大牛,所以想请问一下,看了一篇文章,说天猫为了双十一,商品详情页这种访问量可以说是最大的类型页面,是先将页面框架保存在本地的,然后用户点开之后,请求数据时,将数据填充进去.我想了想,先用cookie保存现这种访问量超大的页面静态码html+js,然后ajax请求数据json,然后通过js动态绑定数据,感觉理论上好像可行,但是不知道具体实现是不是很难,还有这种做法对性能的提升和对服务器压力的影响有多大,望各位大牛指点一二 解决方案 解决方案二:文章的链接也共

java-Java源文件是如何调用本地函数的

问题描述 Java源文件是如何调用本地函数的 Java 源文件是如何调用本地函数的?我在代码中没有看到调用本地函数库的代码啊 解决方案 通过JNI,JNI为Java虚拟机打开一个通道,允许你访问本地函数. 解决方案二: 用java统计一个目录(含子目录)下所有java源文件中代码行数分割源文件的Java程序 解决方案三: 你是想问java程序执行过程,还是想问怎么使用本地的库函数啊,使用本地库函数的话,使用impot 导入需要的包,程序中即可使用该包中的类

php curl采集页面内容并提取所有的链接

本文承接上面两篇,本篇中的示例要调用到前两篇中的函数,做一个简单的URL采集.一般php采集网络数据会用file_get_contents.file和cURL.不过据说cURL会比file_get_contents.file更快更专业,更适合采集.今天就试试用cURL来获取网页上的所有链接.示例如下: <?php /*  * 使用curl 采集111cn.net下的所有链接.  */ include_once('function.php'); $ch = curl_init(); curl_se