php结合正则批量抓取网页中邮箱地址

　　php如何抓取网页中邮箱地址，下面我就给大家分享一个用php抓取网页中电子邮箱的实例。

　　?

1
2
3
4
5
6
7
8
9
10
11
12
13

<?php
$url='http://www.3lian.net'; //要采集的网址
$content=file_get_contents($url);
//echo $content;
function getEmail($str) {
//$pattern = "/([a-z0-9]*[-_.]?[a-z0-9]+)*@([a-z0-9]*[-_]?[a-z0-9]+)+[.][a-z]{2,3}([.][a-z]{2})?/i";
$pattern = "/([a-z0-9-_.]+@[a-z0-9]+.[a-z0-9-_.]+)/";
preg_match_all($pattern,$str,$emailArr);

return $emailArr[0];
}
print_r( getEmail($content));
?>

　　方法2：

　　?

1
2
3
4
5
6
7
8
9
10

<?php
$url='http://www.j3lian.net'; //当页已留邮箱
$content=file_get_contents($url); //获取页面内容
function getEmail($str) { //匹配邮箱内容
$pattern = "/([a-z0-9-_.]+@[a-z0-9]+.[a-z0-9-_.]+)/";
preg_match_all($pattern,$str,$emailArr);
return $emailArr[0];
}
print_r( getEmail($content));
?>

　　以上所述就是本文的全部内容了，希望大家能够喜欢。

时间： 2024-10-03 15:14:19

php结合正则批量抓取网页中邮箱地址的相关文章

ASP.NET实现抓取网页中的链接

asp.net|链接|网页输入一个地址,就可以把那个网页中的链接提取出来,下面这段代码可以轻松实现,主要的是用到了正则表达式. GetUrl.ASPx代码如下: <%@ Page Language="<a href="http://dev.21tx.com/language/vb/" target="_blank">VB</a>" CodeBehind="GetUrl.aspx.vb&

求教如何通过python抓取网页中表格信息

问题描述求教如何通过python抓取网页中表格信息刚刚开始学习python 不清楚如何通过python抓取网页中的表格信息比如给定一个student.html 里面有学号.姓名.性别等信息怎么样写才能够输入学号读出其他信息? 解决方案用正则表达式,表格数据放在table->tr->td中解决方案二: 输入学号然后服务器在给你其他数据,应该是一个post的过程-你可以抓包看一下整个过程-至于提取特定的信息,你可以先看下整个表格的结构,再有针对性的写个正则表达式来提取出信息- 解决方

使用HtmlAgilityPack批量抓取网页数据

原文:使用HtmlAgilityPack批量抓取网页数据相关软件点击下载登录的处理.因为有些网页数据需要登陆后才能提取.这里要使用ieHTTPHeaders来提取登录时的提交信息. 抓取网页 HtmlAgilityPack.HtmlDocument htmlDoc; if (!string.IsNullOrEmpty(登录URL)) { htmlDoc = htmlWeb.Load(登录URL, 提交的用户验证信息,

关于使用webbrowser控件批量抓取网页时遇到的问题

问题描述由于有很多网址,并且很多都是带有js跳转的动态页面,于是只能使用浏览器对象.现在的工作方式是,以每个线程配备一个browser对象,所有线程依次从文件中获取需要访问的网址,并且访问时间是被限定的如果超时,则判定访问失败,然后将访问成功与否的结果输出到另一个文件进行汇总.这样的工作方式就是,当启动50个线程时,就有50个webbrowser在运行然而现在遇到的问题是,不同的线程数抓取的成功率也会不同.比如现在有100个网址,2个线程时只失败6个:而20个线程时则失败17个.这是为何?是网

怎样用Java代码抓取网页中的iframe中的数据

问题描述最近老大让我做一个深度搜索功能,但是不知道怎样获取网页中iframe中的数据,求大神指教! 解决方案解决方案二:看看吧解决方案三:iframe里面也是src的地址啊.解决方案四:有了src不就有地址了?继续下载啊,一个递归处理就行

抓取-网页同一请求地址两次的网页显示不同，源码也不一致

问题描述网页同一请求地址两次的网页显示不同,源码也不一致本人最近在尝试网页抓取,发现当当店铺的商品列表页面每次请求的结果都不相同. 举个例子:韩都衣舍 = http://shop.dangdang.com/4609/list.html. 多次请求这个地址会发现每次的商品页数可能不同,源码也不同.实际结果就是明明应该有几十页的内容,却只显示有几页.这是什么原因导致呢?因为我是通过页面内的下一页来抓取下一页内容,这样的话必然导致抓取不足,甚至有时候明明下一页是第三页,却显示了第一页的内容,望解答

抓取网页中的Silverlight数据初探

1.在浏览器中,打开Silverlight页面,点击右键,查看页面源代码: 2. 在html源代码中搜索"xap",很快就能定位出xap的位置.例如:<param name="Source" value="test/getdata.xap" /> 该value就是xap在服务器端的位置. 3.把它和网址域名地址拼接起来,来获取当前的xap文件.在地址栏输入: http://www.moumou.com/test/getdata.

采集邮箱的php代码(抓取网页中的邮箱地址)_php技巧

复制代码代码如下: <?php $url='http://www.jb51.net'; //这个网页里绝对含有邮件地址. $content=file_get_contents($url); //echo $content; function getEmail($str) { //$pattern = "/([a-z0-9]*[-_\.]?[a-z0-9]+)*@([a-z0-9]*[-_]?[a-z0-9]+)+[\.][a-z]{2,3}([\.][a-z]{2})?/i&qu

python抓取网页中的图片示例_python

复制代码代码如下: #coding:utf8import reimport urllibdef getHTML(url): page = urllib.urlopen(url) html = page.read() return html def getImg(html,imgType): reg = r'src="(.*?\.+'+imgType+'!slider)" ' imgre = re.compile(reg) imgList = re.

猜你喜欢

ASP如何利用XMLHTTP实现表单的提交以及cookies或session的发送和Referer

cookie|cookies|session|xml 利用XMLHTTP来制作小偷的具体细节落伍很多人都发过和讨论过了,但是在制作ASP小偷的过程中,很多人就发现ASP小偷不如PHP小偷的那么强大了 ...

详细了解HTC中的对象

htc|对象在微软(R)Internet Explorer 5中介绍,HTML组件(HTCs)提供一种机制来使用脚本作为动态HTML(DHTML)行为实现组件功能.以.htc扩展名保存,一份HTC是 ...

Photoshop惊魂一瞥—制作诡异的面具

1.找一个正面的人物图片(图1). 图1-1 图1-2 2.用钢笔工具依照人物脸部的轮廓勾勒出脸部轮廓的路径(图2). 图2 3.按CTRL+C复制脸部图象.新建一个文件,将图象大小设置为500X60 ...

CSS 循序渐进（二）字的艺术

css 说到CSS,笔者用的最多的还是它的排版和字型设计功能.因为网页嘛,最终还是要做给人家看的,要传递信息给对方的,所以不管怎么说,这种传递形式非常重要,具体说来,也就是字的控制和版面的控制.另外 ...

Photoshop入门教程:用滤镜制作玻璃材质效果

最终效果 1.新建画布 2.滤镜渲染云彩 3.像素化晶格化 4.USM锐化 [1] [2] 下一页

Ruby on rails开发从头来（windows）（十六）-登录

现在我们的购物车程序为两种用户提供了服务,一类是普通用户,一类是管理员.两类用户分别有不同的功能.上次我们又实现了添加用户的功能,这次我们来实现登录的功能. 1.给login_controller添加 ...

以JSon来实现TextBox可选择可输入

这里只是把主要的代码贴出来,不再进行过多的说明,重要的地方以注释的方式进行说明. <div id="pubDiv" style="background-positi ...

阿里云使用Windows系统安装程序有哪些问题

ECS Windows系统服务器使用FTP连接遇到530 Login incorrect错误无法登录phpmyadmin,报1130错误提升MongoDB安全性的十个技巧 IIS8/IIS7运行A ...

Win8怎么运行cmd？

方法一: 1.按Win键,进入Win8个性的XX菜单. 2.不用管,直接按键"cmd". 3.右键选择某个,可以在下方按"管理员身份"执行. 4.至此,调出 ...

Windows Vista系统中的日志查看器功能介绍

当我们的Windows 系统出现问题时,要分析与定位故障,最简单的办法莫过于使用事件查看器,如Windows XP中的事件查看器可以让我们分析系统日志.应用程序日志与安全性日志,以从中找出可能存在问题 ...

gcc-如何升级XCode内置的GCC版本？

问题描述如何升级XCode内置的GCC版本? 因为新版Django的需要,而Xcode的仍是4.2.1,最新的已经4.9.0了.

php 接口类与抽象类的实际作用_php技巧

1.php 接口类:interface 其实他们的作用很简单,当有很多人一起开发一个项目时,可能都会去调用别人写的一些类,那你就会问,我怎么知道他的某个功能的实现方法是怎么命名的呢,这个时候php接口 ...

一个挺有意思的Javascript小问题说明_javascript技巧

先来看以下3段代码复制代码代码如下: var firstName = "Mark"; (function DisplayFirstName() { console.log(fi ...

一次关于DNS服务器的故障排错记录——RNDC故障

原创作品,允许转载,转载时请务必以超链接形式标明文章原始出处 .作者信息和本声明.否则将追究法律责任.http://dgd2010.blog.51cto.com/1539422/819526 说明: ...

Ext实现滚动条一直处于底部的方法

在我们的实际开发应用中,经常会使用到ext的常用控件textarea.对于一些form表单,录入信息的备注,简介等等信息较多的时候就会使用的textarea.最近在所一个全网拓扑图的时候,以及网络诊断 ...

chatactivity中save了自己createsendmsg、createreceivemsg几条消息，调用刷新，界面显示的只有createsendmessage并且没有按时间排序排列

问题描述 chatactivity中调用了 msg1 = EMMessage.createSendMessage(Type.TXT); TextMessageBody body = new Tex ...

薛东阳：“百度输入法”测试版用户之体验

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断淘宝客云主机技术大厅百度输入法测试版在9月17日正式上 ...

Findbugs异常总汇

FindBugs是基于Bug Patterns概念,查找javabytecode(.class文件)中的潜在bug,主要检查bytecode中的bug patterns,如NullPoint空指针检查 ...

mfc求助-MFC 发送或接受文件时需要另外增添线程吗?

问题描述 MFC 发送或接受文件时需要另外增添线程吗? 我写的是局域网聊天程序,由客户端发送文件给服务器,再由服务器发送给另一个客户端,但是会一直卡,没用响应,需要另外增添线程吗?本人初学,不懂什么线 ...

Windows 8怎么设置计划任务？

谈起计划任务我想很多用户都知道一点,它是Windows自带的一个程序,这个程序主要是帮助我们在设定的时间启动我们需要的程序,虽然很好用,但是很多用户不知道Win8怎么设置计划任务?为此小编赶紧整理了W ...

Response.Redirect用法详解

The Redirect method causes the browser to redirect the client to adifferent URL. EG: string C ...

centos更改时区的方法_Linux

对于中国用户,如果centos默认使用UTC时区,那时间相差八个小时,其实可以通过简单的设置,变为中国时区,这时候机器上的时间和本地手表上的时间就是一致的.执行如下命令: 复制代码代码如下: cp ...

tomessage-关于kafka的Encoder问题

问题描述关于kafka的Encoder问题我在编写producer的时候想自己序列化消息,就按照这段话: 自己编写Encoder来序列化消息,只需实现下面这个接口.默认的Encoder是kafka ...

IT发展对大型数据中心需求猛增

世纪互联云计算首席专家李志霄博士日前表示,用数据爆炸来形容当前的IT发展一点也不为过,数据增长永无止境.而数据的几何级增长导致了对于可支持云计算的大型数据中心需求猛增,谷歌.微软.苹果等IT巨头都在部 ...

聊聊身份欺诈和窃取那些事

很多人都认为"个人隐私"不过是一纸空谈而已,引用老炮儿中六爷的一句被删台词:"我活那么大,我TM都不知道自己还有隐私?" 目前社交媒体如此发达,而社交平台上又存 ...

领跑2008----酷源CMSv1.0版全面免费！

中介交易 SEO诊断淘宝客站长团购云主机技术大厅自酷源科技(http://bbs.kycms.com).net版KYCMS v1.0版正式版本发布以来,凭借产品的灵活性和易用性,深受到广大用户 ...

喜临门全球首个智能床垫健康睡眠系统见证睡眠3.0时代

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断淘宝客云主机技术大厅 9月10日,喜临门携全球首个智能床 ...

php与php MySQL 之间的关系_php基础

本教程并不想让你完全了解这种语言,只是能使你尽快加入开发动态web站点的行列.我假定你有一些HTML(或者HTML编辑器)的基本知识和一些编程思想.简介 PHP 是能让你生成动态网页的工具之一.PHP ...

PHP生成静态页面详解_php基础

版权声明:可以任意转载,转载时请务必以超链接形式标明文章原始出处和作者信息及本声明本文出自:http://www.otm.cn 作者:Matrix@Two_Max 我们先回顾一些基本的概念. 一,PH ...

一个分享按钮的插件使用介绍（可扩展，内附开发制作流程）_jquery

前几天由于工作需要制作一个分享按钮,考虑到后续其他项目可能也会用到,于是就打算写成插件化,正好也给我自己的插件jquery.hooray增加一个新的功能,为了不浪费大家时间,我先把demo放出来,如果 ...

热搜

© 2024 iVAN | info#iamivan.net | 11 q. 0.022 s.