C#抓取财经网站中股票成交明细数据，总是出错“找不到文件”

问题描述

未能找到文件“d:我的文档VisualStudio2010ProjectsWindowsFormsApplication7WindowsFormsApplication7binDebughtmlPUBLIC”。代码如下：usingSystem;usingSystem.Collections.Generic;usingSystem.ComponentModel;usingSystem.Data;usingSystem.Drawing;usingSystem.Linq;usingSystem.Text;usingSystem.IO;usingSystem.Net;usingSystem.Text.RegularExpressions;usingSystem.Windows.Forms;namespaceWindowsFormsApplication7{publicpartialclassForm1:Form{publicForm1(){InitializeComponent();this.urlText.Text="http://vip.stock.finance.sina.com.cn/quotes_service/view/vMS_tradehistory.php?symbol=sz000725&date=2012-04-25";}publicstringGetPage(stringstrURL,stringstrReferer,stringcode){returnGetPage(strURL,strReferer,code,String.Empty);}publicstringGetPage(stringstrURL,stringstrReferer,stringcode,stringcontentType){stringstrResult="";HttpWebRequesthttpWebRequest=(HttpWebRequest)WebRequest.Create(strURL);httpWebRequest.AllowAutoRedirect=true;httpWebRequest.KeepAlive=false;httpWebRequest.Accept="*/*";httpWebRequest.Referer=strReferer;httpWebRequest.Headers.Add("Accept-Encoding","gzip,deflate");httpWebRequest.UserAgent="Mozilla/4.0(compatible;MSIE6.0;WindowsNT5.1;SV1;Maxthon;.NETCLR2.0.50727)";if(string.IsNullOrEmpty(contentType)){httpWebRequest.ContentType="application/x-www-form-urlencoded";}else{httpWebRequest.ContentType=contentType;}httpWebRequest.Method="GET";if(httpWebRequest.CookieContainer==null){httpWebRequest.CookieContainer=newCookieContainer();}HttpWebResponseresponse=null;System.IO.StreamReadersr=null;response=(HttpWebResponse)httpWebRequest.GetResponse();StreamstreamReceive;stringgzip=response.ContentEncoding;if(string.IsNullOrEmpty(gzip)||gzip.ToLower()!="gzip"){streamReceive=response.GetResponseStream();}else{streamReceive=newSystem.IO.Compression.GZipStream(response.GetResponseStream(),System.IO.Compression.CompressionMode.Decompress);}sr=newSystem.IO.StreamReader(streamReceive,Encoding.GetEncoding(code));if(response.ContentLength>1){strResult=sr.ReadToEnd();}else{char[]buffer=newchar[256];intcount=0;StringBuildersb=newStringBuilder();while((count=sr.Read(buffer,0,buffer.Length))>0){sb.Append(newstring(buffer));}strResult=sb.ToString();}sr.Close();response.Close();returnstrResult;}protectedvoidGetPath()//获取存储文件路径{FolderBrowserDialogfilepath=newFolderBrowserDialog();if(filepath.ShowDialog()==DialogResult.OK){this.fileSave.Text=filepath.SelectedPath+@"";}}privatevoidbutton1_Click(objectsender,EventArgse){if(this.fileSave.Text==null||this.fileSave.Text.Equals("")){MessageBox.Show("请选择存储路径");return;}stringstr=GetPage(this.urlText.Text,"","gb2312");MatchCollectionmatches=Regex.Matches(str,"<a.*?/a>");MessageBox.Show(matches.ToString());foreach(Matchmtinmatches){if(mt.Groups[0].ToString().EndsWith("明细下载</a>")){str=mt.Groups[0].ToString();}}str=str.Substring(9);//MessageBox.Show(str);str=str.Substring(0,str.IndexOf("""));//MessageBox.Show(str);stringdt=System.DateTime.Now.ToString();dt=Regex.Replace(dt,"","-");dt=Regex.Replace(dt,"/","-");dt=Regex.Replace(dt,":","-");File.WriteAllBytes(this.fileSave.Text+dt+".xls",newWebClient().DownloadData(str));//stringmaindata=Encoding.UTF8.GetString(newWebClient().DownloadData(string.Format(str)));//MessageBox.Show(maindata);}privatevoidbutton2_Click(objectsender,EventArgse){GetPath();}privatevoidForm1_Load(objectsender,EventArgse){}}}

解决方案

解决方案二：
错误提示不就是指定文件没有检索到吗？
解决方案三：
哥们仔细看下你的正则有问题
解决方案四：
"明细下载"根本就不存在你所获取的源码里,这个是靠js输出的,我也没细看它是怎么获取的有可能是ajax,你可以自己抓包分析下

时间： 2024-10-21 08:20:49

C#抓取财经网站中股票成交明细数据，总是出错“找不到文件”的相关文章

正则-java如何抓取不同网站不同网页的内容

问题描述 java如何抓取不同网站不同网页的内容请教大神们如何用java抓取不同网页(不同网站)相同属性的内容,如图: 用同一个java程序或正则一次性抓取图片上标注的内容(注:有很多这样的网页). 解决方案内容一般在table或者div中,找出特征匹配,截取字符串就行了解决方案二: 对于HTML标签,最好用XML解析类库,通过XPATH等方式来查找,这样简单,也不会容易出错,正则表达式处理这个比较麻烦,而且容易出错解决方案三: 应该用到了,网络请求协议http!

Java爬虫抓取视频网站下载链接_java

本篇文章抓取目标网站的链接的基础上,进一步提高难度,抓取目标页面上我们所需要的内容并保存在数据库中.这里的测试案例选用了一个我常用的电影下载网站(http://www.80s.la/).本来是想抓取网站上的所有电影的下载链接,后来感觉需要的时间太长,因此改成了抓取2015年电影的下载链接. 一原理简介其实原理都跟第一篇文章差不多,不同的是鉴于这个网站的分类列表实在太多,如果不对这些标签加以取舍的话,需要花费的时间难以想象. 分类链接和标签链接都不要,不通过这些链接去爬取其他页面,只通过页底的

Java爬虫实战抓取一个网站上的全部链接_java

前言:写这篇文章之前,主要是我看了几篇类似的爬虫写法,有的是用的队列来写,感觉不是很直观,还有的只有一个请求然后进行页面解析,根本就没有自动爬起来这也叫爬虫?因此我结合自己的思路写了一下简单的爬虫. 一算法简介程序在思路上采用了广度优先算法,对未遍历过的链接逐次发起GET请求,然后对返回来的页面用正则表达式进行解析,取出其中未被发现的新链接,加入集合中,待下一次循环时遍历. 具体实现上使用了Map<String, Boolean>,键值对分别是链接和是否被遍历标志.程序中使用了两个Map集

网络爬虫-怎么使用pycharm来抓取旅游网站的信息

问题描述怎么使用pycharm来抓取旅游网站的信息通过网络爬虫爬取来自不同旅游网站的网页,同时需将网页内容进行分布式存储,然后对网页内容进行抽取和分析,提取其中的关键数据,包括但不限于线路编号.产品名称.出发城市.目的地城市.价格.出发日期.交通方式.旅游景点.酒店.行程安排等信息.用户输入出发城市.出发日期.旅游目的地等条件后,系统能按照一定的逻辑进行线路的展示和比价,方便用户做出决策. 解决方案 Java 用jsoup 通过标签获取. 解决方案二: 用python的scrapy爬虫框架来

爬-请问如何抓下去抓取如下链接中的数据？搞了几天了，没有头绪啊，坐等大神帮忙。。。。

问题描述请问如何抓下去抓取如下链接中的数据?搞了几天了,没有头绪啊,坐等大神帮忙.... 各位大神好,我想抓取这个网站上http://xxfb.hydroinfo.gov.cn/ssIndex.html,大江大河的水文数据,,好像是用post方法才能返回表里的数据,但是小白实在是不会用,请各路大神帮忙看看,如何获取这个表中的数据,谢谢啦解决方案可以用浏览器控制台抓一下请求,post的各种参数需要你能够搞清,这样就可以构造对应的参数,一个个发送post获取返回数据,然后再解析结果. 解决方案

网络爬虫-用Java来抓取网页实例中HttpClient类的问题

问题描述用Java来抓取网页实例中HttpClient类的问题报这么一大堆错误我也是受不了了...... 主要的问题应该是HttpClient类这个东西,在网上查了这个类是httpclient-2.x.jar包的产物,我导入的是httpclient-4.2.2.jar和httpcore-4.2.2.jar包,而这两个新的工具包并不包含HttpClient类,查阅了Java API帮助文档后,自己并没有找到HttpClient类的替代类,而是一堆接口和抽象类,由于是刚开始写这个,所以有点懵.

请问各位牛人大侠，用离线浏览器抓取有网站限制多线程快速抓数据的网站该用那些软件

问题描述本人工作需要,下在一个网站完整的镜象离线浏览,所以用离线浏览器teleportpro抓取一个网站,结果遇到了棘手问题,该抓取网站有限制多线程快速抓数据的设置,结果抓取了一堆请稍候......的页面,请问该用那些软件下,或者teleportpro遇到这种网站该如何设置?补充一点若我发错地方请牛人大侠跟贴告知一下这样的问题去那里问比较好,谢谢了.

phantomjs 抓取html页面中所有h3标签

问题描述 phantomjs 抓取html页面中所有h3标签 var page = require('webpage').create();phantom.outputEncoding='gbk';page.open('http://baidu.com/s?wd=javascript'function(status) { console.log(page.title); page.evaluate(function(){ var len=document.getElementsByTagName

asp 抓取alexa 网站世界排名代码

asp 抓取alexa 网站世界排名代码 function Alexa(AlexaURL) on error resume next dim getsms,getstr,url dim star,endd url="http://data.alexa.com/data?cli=10&dat=snba&url="&AlexaURL getsms=getHTTPPage(url) if getsms<>"" then

猜你喜欢

XML“走进”数据库

xml|数据|数据库可扩展标记语言(XML,Extensible Markup Language)目前正在成为各种数据特别是文档的首选格式.由于它具有标记不同字段(field)的能力,使得搜索变 ...

Animation全接触（2）：ParentAnimation模型

ParentAnimation,顾名思义,是一组Animation的父亲,是所有需要包含其它Animation的父类,我们熟悉的ParallelAnimation(并行动画)和SequenceAni ...

浅析.NET开发中代理模式的使用

当我们需要使用的对象很复杂或者需要很长时间去构造,这时就可以使用代理模式(Proxy).例如:如果构建一个对象很耗费时间和计算机资源,代理模式(Proxy)允许我们控制这种情况,直到我们需要使用实际的 ...

用Delphi开发数据库程序经验三则

1.建立临时表数据输入是开发数据库程序的必然环节.在Client/Server结构中,客户端可能要输入一批数据后,再向服务器的后台数据库提交,这就需要在本地(客户端)建立临时数据表来存储用户输入的数 ...

Android应用中执行Linux命令

修改某一文件的权限为777为例: /** 执行Linux命令,并返回执行结果. */ public static String exec(String[] args) { String resul ...

好照片桌面版支持RAW文件格式对照表

好照片桌面版支持RAW文件格式对照表 RAW格式扩展名 Adobe Digital Negative DNG *.dng Canon Photo RAW *.crw / *.cr2 FUJI Pho ...

猎豹浏览器怎么添加自定义搜索引擎

猎豹浏览器添加搜索引擎:1:比如我这里想去淘宝买东西,想在搜索栏选择想要的搜索引擎,没有怎么办.这里可以直接点击"添加搜索引擎" 也可以"选项"--&quo ...

网络经典命令大全

1.最基本,最常用的,测试物理网络的 ping 192.168.0.8 -t ,参数-t是等待用户去中断测试 2.查看DNS.IP.Mac等 A.Win98:winipcfg B.Win2000以上: ...

用shell脚本和c语言将大写字母转成小写的代码

最近在学shell编程,在网上看到tr '[:upper:]' '[:lower:]' 可以把字符串中大写字母转换成小写字母,我就在这个的基础上写了一个脚本来自己学习学习复制代码代码如下: # ...

找出路由器的网关ip地址

第1步:打开你电脑的浏览器,在地址栏输入你的路由器IP地址,如果你的路由器没有设置过IP地址的话,一般默认的是192.168.1.1这个地址,在地址栏输入192.168.1.1. 第2步:屏幕会弹 ...

驱动人生6为您解决电脑黑屏花屏问题

一.硬件方面: 如果显示卡本身出现了问题,导致的电脑黑屏或是花屏,看不见屏幕的提示,即使是高手也很难排除故障,只能送到专业的维修中心进行检测维修.不过在很多情况下,电脑出现无法显示的故障并不是直接 ...

Win7系统怎么在库中添加和删除文件夹

一.将文件夹添加到库中的方法 1.首先你要先创建库,之后选中电脑桌面上的任意一个文件夹,比如"我的任务"文件,然后鼠标右击它选择"包含到库中--文档"选项; ...

怎样关闭处理器的睿频功能？

方法一,BIOS中关闭睿频功能. 进入BIOS中,将光标移动到Advanced 高级设置里面,先进Frequency/Voltage Control,然后到Power technology,找到用 ...

matlab滤波器设计

fdesign.bandpass是设置带通滤波的 filter函数用来滤波的,conv是做卷积的

事件-C# DataGridView 格式化单元格问题

问题描述 C# DataGridView 格式化单元格问题我用DataGridView做了分页查询,显示的列中有一列是数字值,要在绑定数据源后,对该列值进行格式化成字符串,我使用了CellForma ...

php-PHP中require_once不同目录下引用文件出错

问题描述 PHP中require_once不同目录下引用文件出错目录结构是这样的: 1.php 3.php 文件夹2 2.php 1.php中require_once 2和3文件 2.php中又re ...

求翻校内的墙，大神请进

问题描述求翻校内的墙,大神请进我所在的公司设置了网络墙,只能上规定的几个网站,其余的如知乎,豆瓣, 天涯之类的网站上不去,求破解. 解决方案 vpn搞起,豆荚加速器解决方案二: vpn呀,翻墙神 ...

告别可穿戴盘点九款可植入体内科技产品

当我们还在谈论可穿戴智能设备如何引领科技潮流时,智能纹身.医疗芯片等人体可植入设备已悄然来袭,逐渐成为科技弄潮儿们的新宠.人体植入智能产品,这无疑是一个既大胆又新鲜的科技创举. 现阶段,可穿戴设备的确 ...

CSS技巧（二）

1. CSS字体属性简写规则一般用CSS设定字体属性是这样做的: font-weight: bold;font-style: italic;font-varient: small-caps;fon ...

smack-ASAMCK+OPENFIRE+ANDROID

问题描述 ASAMCK+OPENFIRE+ANDROID 最近利用asmack做一个安卓im客户端. 但是遇到点问题. 在用RosterEntry.getUser的时候返回值和用RosterEntry ...

编程-为什么同样的一个txt文件，只有写字板的是对的？

问题描述为什么同样的一个txt文件,只有写字板的是对的? 为什么同样的一个txt文件,只有写字板的是对的?记事本里的字体设置跟写字板的一样啊为什么你们还老说跟字符集有关?要以实际情况啊! 解决方案 ...

DRaaS与业务连续性需要双赢

自从云计算灾难恢复即服务(DRaaS)出现,越来越多的组织减少了对灾难的思考,因为使用DRaas比给数据中心专门配备相应的灾难恢复站点要划算的多了.DRaaS的出现使首席财务处官将注意力从成本的资本预 ...

textarea换行问题-&amp;lt;textarea&amp;gt;换行问题。。。。。。。。。。。。。。。

问题描述 <textarea>换行问题............... 后台传来一个List,然后循环把list的值循环出来,放到 ${modu.moduleName },/s:iterat ...

移动APP成抄袭重地：版式功能雷同难判罚

网易告腾讯抄袭大众点评告网易侵权螳螂捕蝉黄雀在后.4月12日网易发表声明称,遭到腾讯新闻客户端全面抄袭,要求腾讯将产品从苹果应用商店下架.仅仅过了4天,大众点评网对外宣布,网易近日上线的移动客户 ...

5个容易引起用户反感的网站问题

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断淘宝客云主机技术大厅清楚了自己的网站运行的情况后,想必 ...

eclipse-Eclipse 导入Maven 项目第一次没作为Maven项目导入，删了之后第二次就可以了

问题描述 Eclipse 导入Maven 项目第一次没作为Maven项目导入,删了之后第二次就可以了虽然并不影响使用,但是还是想知道这是为什么? 解决方案 http://blog.csdn.net/ ...

数据源-Netbeans7.4 Jboss7.1 MySQL5.6从数据表生成实体类

问题描述 Netbeans7.4 Jboss7.1 MySQL5.6从数据表生成实体类如标题中的环境中,想从数据库表生成实体类表,NetBeans已经可以连接数据库里的表, ,总是出现如下图所示的问 ...

JavaScript删除指定子元素代码实例_javascript技巧

原生javascript删除指定子元素代码实例: 本章节介绍一下如何利用原生javascript实现删除指定子元素. 大家都知道使用jquery实现此功能更为方便,不过使用原生的javascript也 ...

“团跑跑”跑回互联网：从市梦率到市盈率

PE家笔记阚治东深圳东方汇富创业投资管理有限公司总裁过去一两周,由团宝网引发的"团跑跑"一词在网上盛行,曾经很热.很潮流的团购网出现了风险投资遇冷.企业大面积裁员.资金链断裂 ...

printf-下面的两个方法求n次方为什么都不正确？

问题描述下面的两个方法求n次方为什么都不正确? double x,y,p; scanf("%lf",&x,&y); p=pow(x,y); printf(&quo ...

热搜