如何跨站抓取别的站点的页面的补充_php基础

在实际的应用中，经常会遇到一些特殊的情况，比如需要新闻，天气预报，等等，但是作为个人站点或者实力小的站点我们不可能有那么多的人力物力财力去做这些事情，怎么办呢？
好在互联网是资源共享的，我们可以利用程序自动的把别的站点的页面抓取回来经过处理后被我们所利用。
用什么呢，那个战友给的是不行的，其实在Php有这个功能，那就是用curl库。请看下面的代码!
<?php

$ch = curl_init ("http://dailynews.sina.com.cn");
$fp = fopen ("php_homepage.txt", "w");

curl_setopt ($ch, CURLOPT_FILE, $fp);
curl_setopt ($ch, CURLOPT_HEADER, 0);

curl_exec ($ch);
curl_close ($ch);
fclose ($fp);
?>

但有时会出现一些错误，但实际上已经下载完了！我问了老外，他们没有给我一个答复，我想实在不行，就在函数前面加个◎;这样我们只要对$txt进行适当的分析后，我们就可以偷偷的抓取sina的新闻！不过，还是不用的为好！以免发生法律纠纷，这里只是想告诉你Php的功能非常的强大！你可以做许多事情！

【本文版权归作者与奥索网共同拥有，如需转载，请注明作者及出处】

时间： 2024-07-30 02:40:28

如何跨站抓取别的站点的页面的补充_php基础的相关文章

如何跨站抓取别的站点的页面的补充

在实际的应用中,经常会遇到一些特殊的情况,比如需要新闻,天气预报,等等,但是作为个人站点或者实力小的站点我们不可能有那么多的人力物力财力去做这些事情,怎么办呢? 好在互联网是资源共享的,我们可以利用程序自动的把别的站点的页面抓取回来经过处理后被我们所利用. 用什么呢,那个战友给的是不行的,其实在Php有这个功能,那就是用curl库.请看下面的代码! <?php $ch = curl_init ("http://dailynews.sina.com.cn"); $

php如何跨站抓取别的站点的页面的补充

在实际的应用中,经常会遇到一些特殊的情况,比如需要新闻,天气预报,等等,但是作为个人站点或者实力小的站点我们不可能有那么多的人力物力财力去做这些事情,怎么办呢? 好在互联网是资源共享的,我们可以利用程序自动的把别的站点的页面抓取回来经过处理后被我们所利用. 用什么呢,那个战友给的是不行的,其实在Php有这个功能,那就是用curl库.请看下面的代码! <?php $ch = curl_init ("http://dailynews.sina.com.cn");$fp

asp+ 如何跨站抓取页面

如何用 PHp 和 Asp 跨站抓取别的站点的页面,今天我们来测试一下 asp+是怎么实现跨站抓取别的站点的页面 Code Listing <%@ Assembly Name="System.Net" %><%@ Import Namespace="System.Net" %><%@ Import Namespace="System.IO" %><script language="VB&qu

在Asp中不借助第三方组件抓取别的站点的页面

微软在Asp中给我们提供了一种使用ActiveX的来做页面的方法,我们就用一个简单的抓取页面的例子来实际讲解一下这种方法,在本站的专栏的php版面中,我曾经讲过如何使用php来抓取别的站点的页面.<%url = "http://www.asp888.net/study/testSSi.txt"set inet = createobject("InetCtls.Inet")inet.RequestTimeOut = 20inet.Url = urlstrRet

jquery+thinkphp实现跨域抓取数据的方法_php实例

本文实例讲述了jquery+thinkphp实现跨域抓取数据的方法.分享给大家供大家参考,具体如下: 今天做一个远程抓取数据的功能,记得jquery可以用Ajax远程抓取,但不能跨域.再网上找了很多.但我觉得还是来个综合的,所以我现在觉得有点把简单问题复杂化了,但至少目前解决了: 跨域抓取数据到本地数据库再异步更新的效果我实现的方式:jquery的$.post发送数据到服务器后台,在由后台的PHP代码执行远程抓取,存到数据库ajax返回数据到前台,前台用JS接受数据并显示. //远程抓取获取数

python-scrapy如何循环抓取所有类似的页面

问题描述 scrapy如何循环抓取所有类似的页面我是刚刚开始学习爬虫,模仿网上一个例子自己写了一个,想循环抓取所有页面新闻标题和链接,但是只能抓取到起始页面的. 这是抓取的起始页面从下面可以看到列表有很多,我想抓取所有的新闻条目,每一页的地址仅一个数字不同 spider文件夹下的关键代码如下所示 # -*- coding:utf-8 -*- from scrapy.spiders import Spider from scrapy.selector import Selector from

http访问-人为编码实现网页页面内容的抓取与浏览器访问页面的区分点有哪些？

问题描述人为编码实现网页页面内容的抓取与浏览器访问页面的区分点有哪些? 请问大神们用浏览器访问页面与编码实现请求访问来获取内容有什么区分点吗?都是HTTP协议的情况下,希望大家能给分享下经验,谢谢! 解决方案是说爬虫吗?开发爬虫可以去神箭手云爬虫看看.很不错的爬虫云开发平台

百度谷歌对新站抓取和收录方面的几个差异

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断淘宝客云主机技术大厅 3月1日开始着手制作一个服装类型的新网站,在本地调试完毕后上传到空间.这个网站无论从域名.空间还有网站内容都是全新的,域名和空间是当天注册和购买的,我具体观察了百度和谷歌的蜘蛛抓取情况以及新站收录的整个过程.对于一个全新的网站,百度和谷歌在爬取网站内容和收录过程都有许多差异,主要表现在以下几个方面: 一.蜘蛛抓取差异我一直喜欢观察蜘蛛行踪,

PHP的cURL库功能简介抓取网页、POST数据及其他_php技巧

无论是你想从从一个链接上取部分数据,或是取一个XML文件并把其导入数据库,那怕就是简单的获取网页内容,反应釜cURL 是一个功能强大的PHP库.本文主要讲述如果使用这个PHP库. 启用 cURL 设置首先,我们得先要确定我们的PHP是否开启了这个库,你可以通过使用php_info()函数来得到这一信息. 复制代码代码如下: <?php phpinfo(); ?> 如果你可以在网页上看到下面的输出,那么表示cURL库已被开启. 如果你看到的话,那么你需要设置你的PHP并开启这个库.如果你是在

猜你喜欢

JSON介绍

JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式. 易于人阅读和编写.同时也易于机器解析和生成. 它基于JavaScript Programming Lan ...

基于Web的电子商务解决方案(2)

web|电子商务|解决统一安全服务体系结构的基本想法就是将系统的安全体系结构的复杂性迁移到所谓的统一安全服务层,因而使得系统的其他部分无须承担任何的安全职责. 在统一安全体系结构中,由一个单独的服务 ...

详细介绍ASP.NETWeb相关服务

经过长时间学习ASP.NETWeb,于是和大家分享一下,看完本文你肯定有不少收获,希望本文能教会你更多东西.学习ASP.NETWeb时,你可能会遇到相关问题,这里将介绍ASP.NETWeb问题的解决方 ...

ASP内置对象详解之Response对象

response|对象|内置对象|详解 Response对象用于向客户端浏览器发送数据,用户可以使用该对象将服务器的数据以HTML的格式发送到用户端的浏览器,它与Request组成了一对接收.发送数据 ...

八分页列表实例

分页 <?$conn = @mysql_connect('localhost:3306','test','test');include_once "js.class.php" ...

产品设计:情景设计应该注意的问题

前一阵看到UCDChina上讨论情景设计比较有意思我们组内也做了一个情景模拟实践男主人公小亮年龄26岁出生地山东学历本科职业公务员行业建筑公司性质事业单位工作地点北京爱好足球.游戏. 女主人公小莉年 ...

保护无线网络安全连接九个技巧

无线网络系统如果没有采取适当的安全措施,无论这个无线系统是安装在家中还是办公室里,都可能引发严重的安全问题.事实上,一些针对住宅区提供互联网服务的提供商已经在他们的服务协议中禁止用户和其它非授权人共享 ...

电脑DLL文件缺失怎么办

小知识:DLL文件的作用与好处大家都知道,软件的主程序一般为EXE类型的可执行文件,直接双击它可以启动一个软件.但对DLL文件,知道的可能不如EXE多.DLL是一种"动态链接库&quo ...

用公式查找Excel工作表中重复数据

前不久,一位网友求教,要求找出Excel工作表中的重复数据并在单元格中列出.我给出了一个数组公式供参考,但不是太符合要求,因为这个数组公式虽然找出了重复数据,但是如果将数组公式向下复制时超出了出现 ...

电脑如何安装win7/XP双系统

1.先装XP,再装Windows 7,最好不要反过来,不然XP不会把Windows 7的启动管理器给覆盖掉,会麻烦些.总之遵循"旧版本到新版本"安装原则. 2.如果分区不够大, ...

tor.exe是什么进程

进程 tor.exe 是附属于软件 Privoxy 或 Polipo 或 Hide My IP Address 或 Tor 0.2.0.2-alpha 由 IronKey 发行. tor.exe一般是 ...

U盘0字节错误的原因分析

一位朋友最近在使用一个8G的U盘时,插入U盘后发现U盘在电脑上显示的大小为0字节,之前还用得好好的,怎么会突然间就0字节了呢?经过详细的询问,才知道朋友经常是在没有安全退出情况下拔出U盘.这很可能 ...

Jquery倒数计时按钮—setTimeout

<head runat="server"> <title></title> <script type="te ...

Linux环境下网络性能测试

网络性能测试的几项重要指标 1.可用性测试网络性能的第一步是确定网络是否正常工作,最简单的方法就是使用ping命令,通过向远端的机器发送ICMP请求,并等待接收ICMP回应,来判断远端的机器是否连通 ...

一个简单的jQuery计算器实现了连续计算功能_jquery

一个简单的jQuery计算器,只是实现了一个连续计算的功能 <!DOCTYPE html> <html> <head> <meta charset=" ...

1.5 PCI-X总线简介

PCI-X总线仍采用并行总线技术.PCI-X总线使用的大多数总线事务基于PCI总线,但是在实现细节上略有不同.PCI-X总线将工作频率提高到533MHz,并首先引入了PME(Power Managem ...

FTP编程,,,,,,,请进~~~~~

问题描述谁有上传到FTP服务器的代码,,,,,,,,,,,,,,或贴子的~~~~~~~~~~~~下段代码不能正常工作========================================= ...

防火墙-公网内网IP映射，公网IP可以访问网址，但是登录时提示：http 404 未找到文件

问题描述公网内网IP映射,公网IP可以访问网址,但是登录时提示:http 404 未找到文件我在企业内部用内网发布了IIS网站,内网的IP都可以访问登录,一切正常. 做防火墙做公网映射后,在外部网 ...

巧用Word修订功能找回存盘前的文本

巧用Word修订功能帮你找回存盘前的文本. 如果你在修改稿件中将文中不用的段落删除去了,存盘退出之后又后悔了,想把这段文字找回来,此时用"恢复"命令已无效,当时的"灵感 ...

类似163或QQ上传附件那种文件选择框怎么实现的

问题描述需要做一个文件上传的功能,类似163或QQ邮箱,那种文件选择框的,可以一次选择多个文件.可以圈选的. 普通的表单<input type="file">只能选择 ...

文件上传视频播放-兼容性网页视频播放器，3gp

问题描述兼容性网页视频播放器,3gp 大哥们小弟最近做一个文件上传并在页面上展示, 图片显示做完了现在就视频这个在页面上播放不了找了好些资料, 各种不兼容, 现在ie用WMP可以但是谷歌上 ...

百度为佛山搭建首个无线生活门户实现搜索服务全方位植入

与手机终端厂商合作,实现搜索服务的全方位植入 □ 本报记者张志伟近日,记者获悉,广东省佛山市"无线城市"第一阶段工程已经基本搭建完毕,而作为佛山无线城市项目的重要战略合作伙伴, ...

inline和attachment的区别是什么？

问题描述 respose.setHead("Content-Disposition","inline;fileName=XXX")与respose.setHea ...

jquery获取自定义属性(attr和prop)实例介绍_jquery

$("form").attr("check"); $("form").prop("check"); 两种都可以,不过新版 ...

jQuery的显示和隐藏方法与css隐藏的样式对比_jquery

display:none与visible:hidden的区别 display:none和visible:hidden都能把网页上某个元素隐藏起来,但两者有区别: display:none ---不为被 ...

SQL 优化经验总结34条_数据库其它

(1) 选择最有效率的表名顺序(只在基于规则的优化器中有效): ORACLE 的解析器按照从右到左的顺序处理FROM子句中的表名,FROM子句中写在最后的表(基础表 driving table)将被最 ...

正则表达式的问题

问题描述 js下面有一个字符串内容如下:varaa="<imagesrc="a.jpg"></image>asdasd<imagesrc=& ...

能力全面提升华为存储助力某监狱技防设施

一.客户背景某监狱通过本项目的建设,利用基础技防设施.联动报警.有无线通信.地理信息.管理信息等各种资源和手段,结合市监狱局统一的数字化综合管理与应急联动管控体系,达到监狱"管理安防一体化 ...

携程回应高管减持：个人投资旗下邮轮公司

新浪科技讯 11月29日消息,针对日前媒体指出的多位携程高管减持股票,携程昨日晚间表示,高管套现的资金是用于对携程新成立的邮轮公司进行个人投资. 根据携程SEC文件,在今年6-8月携程股票攀升阶段,多 ...

简单WEB开发规范

一.页面设计部分1.img控件alt:所有展示类图片都要具有能简要描述图片内容的文字说明.2.Input控件maxlength:所有INPUT控件都需要制定maxlength属性,默认值为数据库中对应 ...

热搜

© 2024 iVAN | info#iamivan.net | 11 q. 0.022 s.