关于采集程序的登陆问题

问题描述

现在要采集一个网站的数据，前提是这个网站需要登陆才能看到企业的联系方式，原以为只要我在这个网站注册登陆了用WebClient类就可以直接采集，但是发现下载的源代码企业联系方式区域还是看不到，这个网站用户信息是保存在Session中。要想看到企业联系方式区域的源代码在程序怎样实现？我在网上看了好像用Ethereal侦测Session信息，请问各位大侠具体应该怎么实现？在线跪求答案！！！

解决方案

解决方案二：
不能去抓取网页读取吗？
解决方案三：
mark
解决方案四：
http://www.cnblogs.com/hongyin163/archive/2009/02/11/1388615.html这个应该能解决你的问题
解决方案五：
保存在Session中也没有关系，可以实现抓取的功能，可能有一些必要页面没有访问，比如在Login.aspx登陆后，跳转到Main.aspx中去记录Session信息，然后又跳到Index.aspx中，如果你没有访问Main.aspx，当然你就不能保存用户信息,建议你使用Fiddler2来截获网站地址，从而分析网站的登录流程，这样你就可以抓取到页面了。使用HttpWebRequest,HttpWebResponse来抓取页面

时间： 2024-10-28 06:58:21

关于采集程序的登陆问题的相关文章

php 论坛采集程序模拟登陆，抓取页面实现代码_php实例

复制代码代码如下: <?php // 吴燕军 // 2009-06-27 // 采集程序php set_time_limit(0); //cookie保存目录 $cookie_jar = '/tmp/cookie.tmp'; /*函数------------------------------------------------------------------------------------------------------------*/ //模拟请求数据 function req

怎么优化采集程序

问题描述自己写了个采集程序练手,初学者近几天测试的时候发现个问题,一开始采集A站的时候数据和速度还可以,但越往后采集越慢,数据越少,最后IE打开A站的时候比原来的电话线还要慢后来问用其他采集程序的朋友,他们说访问还可以,不慢:后来发现重起自己的路由再次采集速度又好了,但再经过几次采集,速度又降下来了,应该得知,采集变慢的并不是服务器而是我本地的网络,程序里已经将reader.close(),response.close,request.abort(),不知道是哪里的问题导致出来这种情况但访问非

用xmlhttp编写web采集程序_小偷/采集

晰带语法着色的版本:http://gwx.showus.net/blog/article.asp?id=229 原创很辛苦,转载请注明原文链接:http://gwx.showus.net/blog/article.asp?id=229 web采集程序?网页抓取程序?小倫程序?不管怎么叫,这种程序应用倒是蛮广的.本文不讨论这种使用这种程序引起的版权或道德问题,只谈这种程序在ASP+VBScript环境下的实现 :-) 预备知识:除了一般的ASP+VBScript的知识外,你还需要了解xmlhttp

用xmlhttp编写web采集程序

晰带语法着色的版本:http://gwx.showus.net/blog/article.asp?id=229 原创很辛苦,转载请注明原文链接:http://gwx.showus.net/blog/article.asp?id=229 web采集程序?网页抓取程序?小倫程序?不管怎么叫,这种程序应用倒是蛮广的.本文不讨论这种使用这种程序引起的版权或道德问题,只谈这种程序在ASP+VBScript环境下的实现 :-) 预备知识:除了一般的ASP+VBScript的知识外,你还需要了解xmlhttp

浅谈自动采集程序及入库ASP的实现

采集|程序|采集最近网上流行着一些采集程序,更多人拿着这些东西在网上叫卖,很多不太懂的人看着那些程序眼羡,其实如果你懂一些ASP,了解自动采集程序的原理后,你会感觉实现自动化也是那么的简单. 原理及优点:通过XML中的XMLHTTP组件调用其它网站上的网页,然后批量截取或替换原有的信息使其转化成变量后再一一储存到数据库中.其主要的优点便是无需再手工添加大量的信息了,可以指定对某一个站信息的截取进行批量录入,达到省时省力的目的.与其单纯的ASP小偷程序不同的是:它已经不再依赖其目标网站.

浅谈ASP自动采集程序及入库

采集|程序最近网上流行着一些采集程序,更多人拿着这些东西在网上叫卖,很多不太懂的人看着那些程序眼羡,其实如果你懂一些ASP,了解自动采集程序的原理后,你会感觉实现自动化也是那么的简单.原理及优点:通过XML中的XMLHTTP组件调用其它网站上的网页,然后批量截取或替换原有的信息使其转化成变量后再一一储存到数据库中.其主要的优点便是无需再手工添加大量的信息了,可以指定对某一个站信息的截取进行批量录入,达到省时省力的目的.与其单纯的ASP小偷程序不同的是:它已经不再依赖其目标网站.简单事例: 1<

浅谈ASP程序实现自动采集程序及入库

采集|程序 <%'声明取得目标信息的函数,通过XML组件进行实现.Function GetURL(url) Set Retrieval = CreateObject("Microsoft.XMLHTTP") With Retrieval .Open "GET", url, False.Send GetURL = bytes2bstr(.responsebody)'对取得信息进行验证,如果信息长度小于100则说明截取失败if len(.responsebody)

浅谈自动采集程序及入库

采集|程序|采集 <SPAN id=ArticleContent1_ArticleContent1_lblContent><SPAN style="FONT-SIZE: 12px">最近网上流行着一些采集程序,更多人拿着这些东西在网上叫卖,很多不太懂的人看着那些程序眼羡,其实如果你懂一些ASP,了解自动采集程序的原理后,你会感觉实现自动化也是那么的简单.<BR>原理及优点:通过XML中的XMLHTTP组件调用其它网站上的网页,然后批量截取或替换原有的

ASP读取XML实例优酷专辑采集程序雷锋版_应用技巧

复制代码代码如下: <title>雷锋|优酷-专辑采集程序</title></head> <form name="form1" method="post" action="?action=add"> <table width="95%" border="0" align="center" cellpadding="0&q

猜你喜欢

各个Windows版本所占流量的比例

各个Windows版本所占流量的比例(腾讯科技配图) 据国外http://www.aliyun.com/zixun/aggregation/31646.html">媒体报道,市场调研机 ...

[UI] MFD UI kit

MFD UI kit https://dribbble.com/whaledesigned

Git远程10：搭建私有GitLab

上一篇博文介绍了搭建私有的Git Server.此方式适合小型团队使用,而且项目最好比较单一.如果是人数较多的团队,工程比较多,日常的维护工作量会很大.GitHub和GitLab很好用,但GitHub ...

Ajax跨域查询完美解决通过$.getJSON()实现

原因:浏览器安全上做了限制,禁止ajax跨域获得数据. 解决方法:通过jquery提供的$.getJSON()可以跨域获得JSON格式的数据.优点:兼容性强. Java后台代码: 复制代码代码如下: ...

PHP导出MySQL数据到Excel文件

// 输出Excel文件头,可把user.csv换成你要的文件名 header('Content-Type: application/vnd.ms-excel'); header('Conte ...

一个实现自定义event的文章。。。我还没有完全摸透。。不知道有没人有兴趣。。新手就不用看了，先学会

The latest offering from Microsoft to support software development is the .NET Framework. Inside thi ...

Now、Date、Time、CurrentYear

SysUtils.Now; SysUtils.Date; SysUtils.Time; SysUtils.CurrentYear; unit Unit1; interface uses Windows ...

WPS表格三秒钟获取字词对应的第一个字母

预览该模板: 在日常工作过程中,我们常需要获取汉字对应的第一个字母,比如,学生用音序查字法查字词典,医院建立药品查询系统,KTV建立歌曲查询系统--有没有办法轻松获取字词的第一个字母呢?大家都知道ET ...

word2013怎样在任意页插入页眉和页脚

在任意页插入页眉和页脚的步骤如下: 步骤一:首先用word2013打开要编辑的文档,将光标定位到要插入页眉和页脚的页首,如下图所示: 步骤二:切换到"页面布局"选项卡下,找到& ...

关于web字体的那些事儿

我曾与一位视觉设计师合作共同开发一款web应用.他提交给我的设计稿看起来非常带感,于是我根据他的设计稿,用HTML和CSS将web应用写了出来.当我以为一切都已完成,并且火急火燎地将产品给他看的时 ...

nt6 hdd installer怎么安装

nt6 hdd installer怎么安装硬盘安装Windows 8/7/2008 R2 一.将准备好的系统镜像ISO文件解压至一非系统分区的根目录.注意一定要是根目录!!非 ...

东芝tt301怎么样？

东芝推出的TT301安卓平板搭载24英寸1080P显示屏,真的是比大更大,可以称之为电视了,但东芝还是喜欢将其称为"商务平板". 然而其配置跟其身材相差很多,该平板搭载1GHz ...

Spring-Hadoop项目

作为Java攻城狮,以后不免要和Spring结下很深的情节,正式工作之后一定会基于Spring的许多内容做一系列的开发.还好,让我发现了基于Spring,已经有了和我喜欢的Hadoop相结合的项目. ...

23个超流行的jQuery相册插件整理分享_jquery

这些jQuery插件包括演示.文档说明等,欣赏吧! 1. Galleriffic 下载与文档查看演示 2. jPhotoGrid 下载与文档查看演示 3. Galleria 下载与文档查看演示 ...

SecureCrt 连接Redhat linux

1.Vmware虚机设置网络模式为桥接Bridge.保证linux中能ping通windows,windows中也能ping通linux. 2.修改sshd_config文件,命令为:vi /et ...

sql语句怎么来连接起来呀！

问题描述 sql语句怎么来连接起来呀! select t1.Nums1-t2.Nums2 Nums,t1.PRODUCTS_ID,t3.PRODNAME from (select sum(num) N ...

容器里面 ifconfig也没有?

问题描述容器里面ifconfig也没有?该问题来自CSDNDocker技术交流群(303806405),由版主xinshubiao整理. 解决方案解决方案二:没默认安装,装相关的软件包就可以.该解 ...

关于网络对人类思想造成负面影响的争论由来已久

2012年7月16日出版的美国<新闻周刊>杂志封面封面http://www.aliyun.com/zixun/aggregation/8732.html">文章:关于网络 ...

c语言%f奇怪的问题！打破常规！！！

问题描述 c语言%f奇怪的问题!打破常规!!! 以前一直以为会四舍五入,今天测试这个的时候,发现解释不了,希望有人帮帮忙! 解决方案从统计学的角度,"四舍六入五成双"比" ...

【算法导论】幻方算法

说起幻方,大家应该在小学时候就已经接触过了,最简单的就是九宫格,射雕英雄传中的那段至今还记得:戴九履一,左三右七,二四为肩,六八为足.下面我们就来看看这个有趣的问题. ...

sqlconnection-为什么会有use of unassigned local variable &amp;#39;result&amp;#39;

问题描述为什么会有use of unassigned local variable 'result' internal void check(string name,ref string resul ...

急速扩张让拉手迅速获得了市场份额

奠定了规模效应:一方面,唯IPO论的生存方式却让其难以进行精细化的管理,无法注重效率. "吴波已经投入到另一个垂直的服装类B2C项目中,这应该就是所谓的"业务创新".&q ...

如何让其它应用使用域账号登陆

问题描述搭建一个会议室预定系统,想让员工直接用域账号登陆,这个是怎么实现的具体一点,有知道的大神吗,求指点

DT科技评论：第3期

DT科技评论 Data Technology Review 第 3 期人民网研究院,阿里云研究中心本期目录美国五角大楼计划削减60%的数据中心设施微软收购AI日程安排公司Genee,优化Off ...

谷歌吹千兆光纤风暴被视为光纤市场的一条鲶鱼

硅谷网讯从去年以来,谷歌(微博)在美国堪萨斯城引爆了千兆光纤宽带"风暴",在谷歌的逼迫之下,美国的电信行业.有线电视行业纷纷提升用户上网带宽,部分推出千兆光纤宽带服务.谷歌被视为 ...

《构建实时机器学习系统》一第3章数据分析工具 Pandas 3.1　颠覆 R 的 Pandas

第3章数据分析工具 Pandas 3.1 颠覆 R 的 Pandas 进行机器学习应用的第一步是理解和探索数据,为此我们需要一套交互性很强的软件.一款理想的数据分析软件可以轻松地从多个来源读取数据. ...

分享十大购物网站

目前中国的电子商务已经发展的相当成熟,随着电子支付系统的不断完善和中国物流系统的不断扩张,购物网站也如雨后春笋般冒出,对于消费者如何选择自己喜欢又比较实惠的购物网站,大家面临着困惑,下面就让我介绍一下 ...

ASP.NET MVC中使用jQuery时的浏览器缓存问题详解_实用技巧

介绍尽管jQuery在浏览器ajax调用的时候对缓存提供了很好的支持,还是有必要了解一下如何高效地使用http协议. 首先要做的事情是在服务器端支持HTTP GET,定义不同的URL输出不同的数据( ...

jQuery等比例缩放大图片(jQuery.autoIMG.min.js)

介绍下autoIMG. autoIMG可以快速对文章图片进行尺寸自适应,它利用浏览器获取图片文件头尺寸数据,无需等待图片加载完成. autoIMG兼容:Chrome | Firefox | Sifar ...

《UX设计之道——以用户体验为中心的Web设计（第2版）》一第1章　用户体验设计之道1.1　什么是用户体验设计

第1章用户体验设计之道UX设计之道--以用户体验为中心的Web设计(第2版)好奇心+激情+同理心重要的是要永远保持质疑.好奇心自有其存在的理由.当人们思索永恒.生命和现实中不可思议的神秘事件时,难 ...

热搜

© 2024 iVAN | info#iamivan.net | 11 q. 0.023 s.