如果写采集程序,页面有相同的<div></div>多个,能不能做到只采集规定的前几个

问题描述

比如,页面里有多个这种相同的代码块(当然是循环出来的),能不能做到只采集规定的前几个(比如就想要前3个div或是前5个div)<div><ul其它属性><li....>......其他标签</div><div><ul其它属性><li....>......其他标签</div><div><ul其它属性><li....>......其他标签</div>

解决方案

解决方案二:
自己顶
解决方案三:
用正则匹配div{5}即可
解决方案四:
完全可以啊正则是首选其次用index也可以比如取第二个divstringstr=XX.indexof("<div>",XX.indexof("<div>"));
解决方案五:
如果那个层有特殊的属性比如id=“XX”那么你用indexof就更好了
解决方案六:
原r=newRegex("<listyle="width:200px;margin-top:21px;">.+?</div>");mc=r.Matches(tblb);应该改成下面这样?mc.count为0r=newRegex("<listyle="width:200px;margin-top:21px;">.+?</div>{5}");r=newRegex("<listyle="width:200px;margin-top:21px;">.+?</div>");mc=r.Matches(tblb+"{5}");=r.Matches(tblb);还是下面这样呢?这个也不对r=newRegex("<listyle="width:200px;margin-top:21px;">.+?</div>");mc=r.Matches(tblb+"{5}");
解决方案七:
????怎么实现呢
解决方案八:
楼上说的很清楚了啊?你要嫌正则表达式不好用就用index,别等被人给你写源码啊
解决方案九:
我能想到的及找到资料就是5楼写的那样了,但还是没有答案,所以继续等
解决方案十:
大半夜的了,继续等
解决方案十一:
能。别等了。
解决方案十二:
该回复于2011-12-08 08:52:14被版主删除
解决方案十三:
楼上不厚道,继续期待
解决方案十四:
如何用正则做到呢?
解决方案十五:
如果没有嵌套的话stringstr=@"<div><ul1><li....>......1</div><div><ul2><li....>......2</div><div><ul3><li....>......3</div>";Regexreg=newRegex(@"(?is)(?:<divb.*?</div>s*){2}");foreach(Matchminreg.Matches(str))Console.WriteLine(m.Value);

解决方案:
楼上可以解释一下(@"(?is)(?:<divb.*?</div>s*){2}");谢谢了

时间: 2024-10-22 01:55:17

如果写采集程序,页面有相同的&amp;lt;div&amp;gt;&amp;lt;/div&amp;gt;多个,能不能做到只采集规定的前几个的相关文章

实例-写WEB程序时,先获取type的值,然后写代码: 在新的页面完成操作后,页面无法跳转。

问题描述 写WEB程序时,先获取type的值,然后写代码: 在新的页面完成操作后,页面无法跳转. 写WEB程序时,先获取type的值,然后写代码: 在新的页面完成操作后,页面无法跳转. if (type.Equals("高校学生")) { this.LinkButton6.Visible = false; this.LinkButton2.Visible = false; this.LinkButton3.Visible = false; this.LinkButton4.Visibl

C# 写的Winform页面下载程序 在没有抛出异常的情况下退出程序

问题描述 C#写的Winform页面下载程序在没有抛出异常的情况下退出程序但是线程依然存在请问一下当正常与不正常的情况下,程序是不是都会通过CLoseing的事件退出程序呢谢谢~~!!在线等 解决方案 解决方案二:不一定,有些异常直接就强制退出程序,并没有执行Closing事件你trycatch一下吧解决方案三:有时是直接退出进程了解决方案四:关于正常退出程序,线程还没有退出的问题,你可以定义一个全局变量如boolm_bExited=false;在窗体Closed事件里把m_bExited=tr

mfc-用MFC写一个程序登陆到学校教务处,把成绩那个页面解析到自己的列表控件中

问题描述 用MFC写一个程序登陆到学校教务处,把成绩那个页面解析到自己的列表控件中 我想用MFC写一个程序登陆到学校教务处,把成绩那个页面解析到自己的列表控件中,有没有大神这方面的资料,或者有类似的源代码,给出一点点建议也好-- 解决方案 先用HTML View获取网页内容,再分析内容得到自己想要的信息放到控件中 解决方案二: 发送http请求,winhttp.获取内容.然后解析.再插入ListCtrl. SetItemText

初级的用php写的采集程序_php技巧

可以先用这个采集然后在用帝国处理 <?php #################################################################################### #作者:9elong #网站:个人小站不值一提 #时间:2007-01-01 #声明:仅用于学习php之用. #功能:采集单页面图片. #说明:3个示范表单已经写好正则用来示范.没有任何功能说明,一切都在源代码里.附加论坛图片采集正则示范 ######################

php 论坛采集程序 模拟登陆,抓取页面 实现代码_php实例

复制代码 代码如下: <?php // 吴燕军 // 2009-06-27 // 采集程序php set_time_limit(0); //cookie保存目录 $cookie_jar = '/tmp/cookie.tmp'; /*函数------------------------------------------------------------------------------------------------------------*/ //模拟请求数据 function req

Java实现一个小说采集程序的简单实例_java

被标题吸引进来的不要骂我. 只是一个简单的实现,随手写了来下载一部喜欢的小说的.示例中的小说只是示例,不是我的菜. 使用了jsoup.挺好用的一个工具. 有需要的话,参考下自己改吧.挺简单的,是吧. 代码如下: package com.zhyea.doggie; import java.io.File; import java.io.FileWriter; import java.io.IOException; import org.jsoup.Jsoup; import org.jsoup.n

PHP 采集程序原理分析篇_php技巧

苦想了几天,终于弄明白了里面的道理.在这里写出来,请高手指正. 采集程序的思路很简单,无非就是先打一个页面,一般都是列表页,取得里面全部链接的地址,然后打开逐条链接,寻找我们感兴趣的东西,如果找到,就把它入库或别的处理.下面以一个很简单的例子来说说. 首先确定一个采集页,一般就是列表面了.这里目标是:http://www.jb51.net/article/11/index.htm.这是一个列表页,我们的目的就是采集这个列表页上全部的文章. 有列表页了,第一步先打开它,把它的内容纳入到我们的程序中

在ASP程序页面中插入excel文件

excel|插入|程序|页面 <%set xlApp = Server.CreateObject("Excel.Application")''使服务端不出现Excel窗口xlApp.Visible = false''建立一个worksheetset myWorkbook = xlApp.Workbooks.Addset myWorksheet = myWorkbook.Worksheets(1)''建立表头myWorksheet.Range("A1").Val

如何mvc规范写jsp-view,action,service,dao,domain,如何按照mvc规范写jsp程序

问题描述 view,action,service,dao,domain,如何按照mvc规范写jsp程序 我现在开始学习mvc分层架构,但是是不知道如何下手,知道程序应该差不多是按照控制层action->显示层view->业务层service->数据处理层dao,我先写了domain层,但是又不知道要从哪里接着写了,总是写着写着逻辑就乱了,请问大概要按照什么顺序写逻辑清晰一点呢?各个层之间怎么联系起来?请大大侠们帮忙. 解决方案 domain层是??? 说说我自己的一点看法,可能有点不准确