我这个截取网页源代码之间怎么一直截取的不对呢?

问题描述

usingSystem;usingSystem.Collections.Generic;usingSystem.ComponentModel;usingSystem.Data;usingSystem.Drawing;usingSystem.Text;usingSystem.Windows.Forms;usingSystem.Net;usingSystem.IO;namespaceWindowsApplication2{publicpartialclassForm1:Form{publicForm1(){InitializeComponent();}privatevoidbutton1_Click(objectsender,EventArgse){System.Net.HttpWebRequestreq;System.Net.HttpWebResponseres;stringurl="http://fanyi.yahoo.com.cn/translate_txt?trtext="+richTextBox2.Text+"&lp=en_zh";req=(System.Net.HttpWebRequest)System.Net.WebRequest.Create(url);res=(System.Net.HttpWebResponse)req.GetResponse();System.IO.StreamReaderstrm=newSystem.IO.StreamReader(res.GetResponseStream(),Encoding.GetEncoding("UTF-8"));stringstr=strm.ReadToEnd();str=str.Substring(str.IndexOf("resultcon")+65,str.IndexOf("div"));richTextBox1.Text=str;}}}结果为:你好,怎么样您</div></div></div></div></form><!--}}}end:translated--><divclass="clr"></div></div><!--}}end:translatearea--><!--{{start:translatepage--><divclass="parea"><divclass="pform"><h2>翻译网页</h2>但是我指向要“你好,怎么样您”这个要怎么弄呢?

解决方案

解决方案二:
分析完整的返回的整体html,用正则匹配你这样肯定不精确的,页面肯定多个div

时间: 2024-11-10 02:25:54

我这个截取网页源代码之间怎么一直截取的不对呢?的相关文章

让别人看不到我的网页源代码的方法汇总

网页|源代码 1.将以下代码加入到HEML的<body></body>之间 <SCRIPT language=javascript> function click() {if (event.button==2) {alert('不许你偷看!');}}document.onmousedown=click </SCRIPT> ................................................................. 2.禁

爬虫-我有网页源代码,但我不知道网页的地址。源代码里面的js代码有个变量值是网页的地址,怎么能获取出来?

问题描述 我有网页源代码,但我不知道网页的地址.源代码里面的js代码有个变量值是网页的地址,怎么能获取出来? 解决方案 前后截取就好了或者用正则来获取 var s = 'sfeeaaxxx var msg_link = "xxafejfleajflajflafjalfjlxllx"'; var m = new RegExp('var msg_link = "([^"]+)"').exec(s); if (m) alert(m[1]); 解决方案二: 直接正

php查看网页源代码的方法

 这篇文章主要介绍了php查看网页源代码的方法,涉及php读取网页文件的技巧,具有一定参考借鉴价值,需要的朋友可以参考下     本文实例讲述了php查看网页源代码的方法.分享给大家供大家参考.具体实现方法如下: ? 1 2 3 4 5 6 7 8 9 <?php $url = "http://www.jb51.net"; $fp = @fopen($url, 'r') or die("Cannot Open $url via Get method"); wh

关于网页源代码屏蔽(2)

网页|源代码 那么,有些人就会想到,如果对方看不到框架网页的源代码.又何谈去直接打开被保护网页?对,这就是接下来我要讲的.如果要一个页面的菜单栏内的查看源代码失去效用.那最简单的办法就是去掉菜单栏.而这一点是可以通过弹出窗口来实现的.之所以不选用超链接打开无菜单栏窗口是因为那样会暴露目标地址,浏览者可以直接在浏览器中敲入地址,而绕过这个屏蔽的菜单栏.要使用超链接打开无菜单栏窗口,就必须在一个已受到源代码屏蔽保障的网页中使用相关链接. 那么,我们就看看如何利用弹出窗口来去掉菜单栏.其实,我们要做的

关于网页源代码屏蔽(1)

网页|源代码 很早就想写一篇关于网页源代码屏蔽的文章.是因为经常编出些JS脚本的之后,在沾沾自喜的同时,也在担心源代码会被人家看到,盗用我的脚本.所以一直以来,我都在尽力维护我的网页源代码的安全.虽然目前还没有找到完全安全的屏蔽方法(也就是说,这些方法在我想出来的同时,自己已经知道其弱点和破解方法了),但是,我这里有很多屏蔽的思路,来总结一下. 众所周知,要保护一个页面,最基础的就是要屏蔽右键.而现在网页上用得最多的是function click(),即下面这段代码: 〈script〉 func

关于网页源代码屏蔽(3)

网页|源代码 最后我们要做的工作,就是把每一页,或者你认为重要的关键的页面进行加密,就OK啦.怎样对网页的源代码进行加密就不用我多说了吧?网上到处都有,可以用工具,也可以自己写一个htm文件来转换.加密软件,我推荐"Batch HTML Encryptor",去google找吧.还有转换加密网页的代码如下: 〈HTML〉〈HEAD〉〈TITLE〉网页加密解密〈/TITLE〉 〈META http-equiv=Content-Type content="text/html; c

用XMLHTTP读取网页源代码

xml|网页|源代码     在VBScript中,我们用XMLHTTP组件来获取网页源代码,并可以赋给某变量从而动态保存为HTML文件.有关XMLHTTP对象的介绍请参考以下文章:http://www.webjx.com/htmldata/2005-10-17/1129556661.html:有关XMLHTTP的使用实例请参考以下文章:http://www.webjx.com/htmldata/2005-02-25/1109332374.html.    我按照第二篇文章的介绍写了一段代码: 

关于网页源代码屏蔽

网页|源代码 很早就想写一篇关于网页源代码屏蔽的文章.是因为经常编出些JS脚本的之后,在沾沾自喜的同时,也在担心源代码会被人家看到,盗用我的脚本.所以一直以来,我都在尽力维护我的网页源代码的安全.虽然目前还没有找到完全安全的屏蔽方法(也就是说,这些方法在我想出来的同时,自己已经知道其弱点和破解方法了),但是,我这里有很多屏蔽的思路,来总结一下. 众所周知,要保护一个页面,最基础的就是要屏蔽右键.而现在网页上用得最多的是function click(),即下面这段代码:  〈script〉  fu

挂QQ的网页源代码[ASP/PHP/JS]

js|网页|源代码 明:此代码适合你做网站用,普通朋友可以不用理这个东西! ASP: <%dim objXMLHTTP, qq, pwdqq = "10000"pwd = "123456"set objXMLHTTP = Server.CreateObject("MSXML2.XMLHTTP.5.0")objXMLHTTP.open "POST", http://211.139.167.71/waptest/TWF/qq