Java利用正则表达式提取字符串中有用的信息

最近开发过程中碰到一个问题,就是将网页通过流读进内存然后记录表单中各个属性的id值。

例如:将<input type='text' id='baijinshan' name='baijinshan' >的id记录下来

java代码

package cn.bai.test;

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class RegexTest {

  /**
  * @param args
  */
  public static void main(String[] args) {
  // TODO Auto-generated method stub
  String str = "<input type='text' id='baijinshan' name='baijinshan' >";
// 正则表达式:以id='开头,以' name结尾。
  String regEx="(?<=id=')[\\S\\s]+(?=' name)";
  Pattern p=Pattern.compile(regEx);
  Matcher m=p.matcher(str);
  boolean result=m.find();
  System.out.println(m.group());
  }

}

时间: 2024-12-20 23:54:19

Java利用正则表达式提取字符串中有用的信息的相关文章

ASP.NET利用正则表达式提取字符串中的数字

一言不足以毕之,请LOOK代码:               string text = " 订单5|本次付款:4783|本单结清,";             string pat = @"(\d+)";             Regex r = new Regex(pat, RegexOptions.IgnoreCase);             Match m = r.Match(text);             int matchCount = 0;

php使用正则表达式提取字符串中尖括号、小括号、中括号、大括号中的字符

 PHP使用正则表达式提取字符串中尖括号<>.小括号().中括号[].大括号{}中的字符示例,需要的朋友可以参考下    代码如下: $str="你好<我>(爱)[北京]{天安门}";    echo f1($str); //返回你好  echo f2($str); //返回我  echo f3($str); //返回爱  echo f4($str); //返回北京  echo f5($str); //返回天安门    function f1($str)  { 

python利用正则表达式提取字符串_python

前言 正则表达式的基础知识就不说了,有兴趣的可以点击这里,提取一般分两种情况,一种是提取在文本中提取单个位置的字符串,另一种是提取连续多个位置的字符串.日志分析会遇到这种情况,下面我会分别讲一下对应的方法. 一.单个位置的字符串提取 这种情况我们可以使用(.+?)这个正则表达式来提取. 举例,一个字符串"a123b",如果我们想提取ab之间的值123,可以使用findall配合正则表达式,这样会返回一个包含所以符合情况的list. 代码如下: import re str = "

java中正则表达式提取字符串中日期实现代码

你可能需要从一段字符串String或者文本中抽取出或者说是过滤出日期或者时间,可以使用如下程序:  代码如下 复制代码 public String run(String text) {         String dateStr = text.replaceAll("r?n", " ");         dateStr = dateStr.replaceAll("\s+", " ");                   

Swift中利用NSDataDetector提取字符串中所有链接(URL验证)

NSDataDetector是继承于NSRegularExpression(Cocoa中的正则表达式)的一个子类,你可以把它看作一个正则表达式匹配器和令人难以置信的复杂的表达式,可以从自然语言(虽然可能更复杂)中提取你想要的信息. 1,NSDataDetector介绍 NSDataDetector 是继承于 NSRegularExpression 的一个子类.使用的时候只需要指定要匹配的类型(日期.地址.URL等)就可以提取的想要的信息,而不需要自己再写复杂的表达式. NSDataDetecto

JavaScript利用正则表达式替换字符串中的内容_javascript技巧

话不多说,请看具体实现代码 //从字符串'Is this all there is'中剪去'is': var str='Is this all there is'; var subStr=new RegExp('is');//创建正则表达式对象 var result=str.replace(subStr,"");//把'is'替换为空字符串 console.log(result);//Is th all there is var subStr=new RegExp('is','i');

JS正则表达式提取字符串中所有汉字的脚本

在网上发现有人用vbscript正则表达式实现了这个功能,但代码很厂,偶改成js的了,很短的一段代码: <script type="text/javascript"> var str="怎样从一个Html页面中提取所有汉字呢?不能有其它Html代码."; alert(str.replace(/[^\u4e00-\u9fa5]/gi,"")); </script> [Ctrl+A 全选 注:如需引入外部Js需刷新才能执行]

php正则表达式提取字符串中的数字例子

今天开发采集器,用到从字符串里取数字,后来想到了以下用正则表达式来取. 用正则  代码如下 复制代码 $str = ereg_replace('[^0-9]',",$str);和 $str = preg_replace( '/[^\d]/ ', ' ',$str); 例子  代码如下 复制代码 function findNum($str=''){ $str=trim($str); if(empty($str)){return '';} $reg='/(\d{3}(\.\d+)?)/is';//匹

JS正则表达式提取字符串中所有汉字的脚本_正则表达式

在网上发现有人用vbscript正则表达式实现了这个功能,但代码很厂,偶改成js的了,很短的一段代码: [Ctrl+A 全选 注:如需引入外部Js需刷新才能执行] 这里的关键是汉字escape后的编码范围是\u4e00-\u9fa5,知道这个问题就好解决了.