如何采集隐藏的联系方式?

问题描述

已知道代码:联系方式:<spanid="contact">&nbsp;</span>JS部分<scripttype="text/javascript">varinfoid=378553;$.get("http://life.lygbst.cn/General/ViewBack.ashx",{infoid:""+infoid+""},function(data,returnStatus){$("#contact").html(data);});</script>如何写成html,供采集入库?请高手赐教采集的原文:http://life.lygbst.cn/view_i378553/

解决方案

解决方案二:
这个是异步填充的数据需要相关技术才可以做的你用IE89点击F12调试工具可以找到数据
解决方案三:
跨域了,需要做代理采集这种事不是js做的,楼主搞错语言了
解决方案四:
同上,AJAX是AJAX,主要功能不是用在这方面,虽然你可以尝试,但有更好的方法不用而非另辟蹊径,不见得都是明智。楼主想研究就在目前基础上再去加上FSO功能看看。
解决方案五:
如果楼主说的意思是:这些代码是你要采集的页面里的代码。因此你无法直接从该页面里获得其用AJAX后加载的内容,即你标题里所说的“隐藏”。大概有两个方法可以实现:1。利用SELECT方法进行全选或范围选择(就象我们手工在网页里选择一样),然后复制到剪贴板,再读取剪贴板内容。2。加载该页面后,再用document.getElementById("contact").innerHTML可得到其内容。相对上面更直接一些。这个具体的用法由你具体的采集方式而定,自己先试试。
解决方案六:
方法1可省略剪贴板的环节,直接读选择内容即可,然后写入HTML。写入HTML的方法应该不用说了吧,原文头、原文尾加上你后得到的实际隐藏内容,三位一体写入文件。

时间: 2024-09-19 09:02:25

如何采集隐藏的联系方式?的相关文章

八大行业首创 酷源CMS打造底层网站应用解决方案

中介交易 SEO诊断淘宝客 站长团购 云主机 技术大厅 厚积薄发 酷源CMS树立全自定义概念----八大行业首创 打造底层网站应用解决方案 KYCMS V1.0 SP1功能介绍 众所周知,早期内容管理系统都是以管理员添加信息为主,程序开发商开发好一些功能,用户直接录入数据,此种方法虽然简单,但是经过一段时间的发展,这种模式的缺陷越来越多. 一个程序要支持房产.人才.供求.商城.分类.交友等信息,得多大的文件?开发.维护起来多大的工作量? 你不想要这么多模块行不行?答案是不行.开发商在开发的时候就

酷源CMS V1.0 SP1版将于12月18日发布.

中介交易 SEO诊断淘宝客 站长团购 云主机 技术大厅 最新消息: 酷源科技拳头产品酷源CMS V1.0 SP1版将于2007年12月18日正式发布, 以下为酷源官方论坛http://bbs.kycms.com信息: 经公司研究决定,酷源CMS(http://bbs.kycms.com) V1.0 SP1版将定于12月18日正式发布. 此次发布的酷源CMS凝聚了酷源开发团队多年的心血,凭借八大行业首创,酷源CMS已经从功能的扩展性和易用性上,远超目前的主流CMS系统. 整个酷源系统已经成为底层核

领跑2008----酷源CMSv1.0版全面免费!

中介交易 SEO诊断淘宝客 站长团购 云主机 技术大厅 自酷源科技(http://bbs.kycms.com).net版KYCMS v1.0版正式版本发布以来,凭借产品的灵活性和易用性,深受到广大用户朋友的一致好评,为回馈广大用户朋友对KYCMS产品的支持与厚爱,经公司研究决定,酷源科技正式宣布:酷源旗下拳头产品KYCMS v1.0版将于2007年12月18日起全面免费.开放所有功能. 届时您可以充分的体会到酷源CMS全力打造的底层核心建站程序,同时我们在发布sp1版本后即启动大型教学活动,一方

防采集代码[推荐!]

人工复制文章采集是没办法防止的,也有些站长用换行加隐藏字符的方法来防止直接复制,但这类方法也会严重影响搜索引擎的收录.下面我说说我自己在做站过程中,想过的一些防采集个人经验和心得吧.总结了一下,有三种实用的方法.1.文章头尾无唯一特征代码后加自己网站随机广告广告..2.文章列表加随机不同的链接标签,比如<a href="",<a class="dds" href=''3.正文头尾或列表头尾添加和文章头尾一样的重复特征代码<!--重复特征代码--&g

如何让网站防采集?

网站|采集 很多防采集方法在施行的时候需要考虑是否影响搜索引擎对网站的抓取,所以先来分析下一般采集器和搜索引擎爬虫采集有何不同. 相同点: a. 两者都需要直接抓取到网页源码才能有效工作, b. 两者单位时间内会多次大量抓取被访问的网站内容; c. 宏观上来讲两者IP都会变动; d. 两者多没耐心的去破解你对网页的一些加密(验证),比如网页内容通过js文件加密,比如需要输入验证码才能浏览内容,比如需要登录才能访问内容等. 不同点: 搜索引擎爬虫先忽略整个网页源码脚本和样式以及html标签代码,然

防止别人采集网站内容的几种方法

1.搜索自己独有的文章,找到别人采集的联系方式,加他,恐吓他,吓唬他. 2.修改程序,让他采集不完整,故意弄乱序列号.列表也程序化+手工化 3.将自己网站多增加一些内联+外链,用同列网站,交织的让他采集不了 4.增加部分图片,图片带上自己的标识 5.设置修改为一个ip 最多只能读取50页,要他采集不完 6.故意弄几篇非法色情的的,等他采集走了,自己给删除,网监就封了他 7.多弄点对自己网站有用的软文,让别人去采集吧 或弄成自己的镜像网站域名,担心自己的域名被人批量替换掉了 8.dim onlyU

怎样防止原创内容被采集

在百度不断的更新,不断的重视用户体验之后,网站的质量成为了重中之重,对于以前的做法,搜索引擎不给与支持,不少站长为此不断坚持撰写原创文章,原创文章对于新站的意义非常重大,虽然原创的文章会消耗掉不少的时间与精力,但百度对原创内容非常喜欢,如今的新站若抄袭或伪原创,就很容易让百度认为是采集站.所有的新站面临一个头疼的问题:就是站长本身辛苦写的原创文章,被采集或者是被盗用,这样的情况一出现,对新站十分的不利,新站没有什么权重,收录很慢,不管是哪一个网站采集了你网站的内容,首先收录的肯定不是站长自己的网

网站生成静态页面攻略 -- 防采集策略

采集|策略|攻略|静态|页面 目前防采集的方法有很多种,先介绍一下常见防采集策略方法和它的弊端及采集对策: 一.判断一个IP在一定时间内对本站页面的访问次数,如果明显超过了正常人浏览速度,就拒绝此IP访问 弊端:1.此方法只适用于动态页面,如:asp\jsp\php等...静态页面无法判断某个IP一定时间访问本站页面的次数.2.此方法会严重影响搜索引擎蜘蛛对其收录,因为搜索引擎蜘蛛收录时,浏览速度都会比较快而且是多线程.此方法也会拒绝搜索引擎蜘蛛收录站内文件采集对策:只能放慢采集速度,或者不采建

百度十一位现象背后隐藏的大机会

如果有一天你在搜索关键词时发现自己的网站排名突然掉出第一页,排在了第二页的首位,也就是百度搜索结果的第十一位,这就意味着你遇到了传说中的"百度十一位"现象,这也是相对于Google而言,百度自己的一种类似于Google"沙盒"的机制.许多站长在遇到这种现象时会感觉到网站受到了百度的惩罚,似乎情况非常严重,事实上并非完全如此,面对十一位现象不必过度担心,事实上这其中不是满含危险,而是隐藏着大机会! 根据笔者的统计和分析,对于许多排名稳定的老站而言,基本上不会遇到百度十