今天在写程序的时候,碰到了一个怪事。
我想采集一个网址的链接,然后提取链接文字。为了完成这一步骤,我分两步走:
1、提前<a>和</a>之间的内容。如 从 "p id=km> <a href=http://hi.baidu.com>空间</a> | <a ";提取;<a href=http://hi.baidu.com>空间</a>
2、提取出"空间"两个字。
以下是我的代码。
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class RegTest
{
public static void main(String[] args)
{
String s="<p id=km> <a href=http://hi.baidu.com>空间</a> | <a ";
String regex="<a.*?/a>";
//String regex = "<a.*>(.*)</a>";
Pattern pt=Pattern.compi
时间: 2024-12-27 22:08:23