Java 过滤html标签的正则表达式

Java代码

 代码如下 复制代码

 

  import java.util.regex.Matcher;

  import java.util.regex.Pattern;

  

  public class HtmlRegexpUtil {

  private final static String regxpForHtml = "<([^>]*)>"; // 过滤所有以<开头以>结尾的标签

  private final static String regxpForImgTag = "<]*)s">s*imgs+([^>]*)s*>"; // 找出IMG标签

  private final static String regxpForImaTagSrcAttrib = "src="([^"]+)""; // 找出IMG标签的SRC属性

  

  public HtmlRegexpUtil() {

  // TODO Auto-generated constructor stub

  }

  

  public String replaceTag(String input) {

  if (!hasSpecialChars(input)) {

  return input;

  }

  StringBuffer filtered = new StringBuffer(input.length());

  char c;

  for (int i = 0; i <= input.length() - 1; i++) {

  c = input.charAt(i);

  switch (c) {

  case '<':

  filtered.append("&lt;");

  break;

  case '>':

  filtered.append("&gt;");

  break;

  case '"':

  filtered.append("&quot;");

  break;

  case '&':

  filtered.append("&amp;");

  break;

  default:

  filtered.append(c);

  }

  }

  return (filtered.toString());

  }

  

  public boolean hasSpecialChars(String input) {

  boolean flag = false;

  if ((input != null) && (input.length() > 0)) {

  char c;

  for (int i = 0; i <= input.length() - 1; i++) {

  c = input.charAt(i);

  switch (c) {

  case '>':

  flag = true;

  break;

  case '<':

  flag = true;

  break;

  case '"':

  flag = true;

  break;

  case '&':

  flag = true;

  break;

  }

  }

  }

  return flag;

  }

时间: 2024-10-21 21:44:37

Java 过滤html标签的正则表达式的相关文章

PHP中过滤常用标签的正则表达式_正则表达式

我们常常会用到PHP过滤一些标签的功能,比如过滤链接标签.过滤script标签等等,下面就介绍一下PHP过滤常用标签的正则表达式代码: $str=preg_replace("/\s+/", " ", $str); //过滤多余回车 $str=preg_replace("/<[ ]+/si","<",$str); //过滤<__("<"号后面带空格) $str=preg_replace

PHP中过滤常用标签的正则表达式

我们常常会用到PHP过滤一些标签的功能,比如过滤链接标签.过滤script标签等等,下面就介绍一下PHP过滤常用标签的正则表达式代码: $str=preg_replace("/\s+/", " ", $str); //过滤多余回车 $str=preg_replace("/<[ ]+/si","<",$str); //过滤<__("<"号后面带空格) $str=preg_replace

JAVA过滤html标签的方法

例子 正则  代码如下 复制代码 re="<(\\s)*script[^>]*>([\\s\\S](?!<script))*?<\\/script>"; 例子  代码如下 复制代码 public class FilterHTMLTags {  public static String HtmlText(String inputString) {        String htmlStr = inputString; //含html标签的字符串   

java 过滤HTML标签

Java如何过滤掉HTML标签呢? java过滤html标记   java删除html标签 Java代码   /**       * 删除input字符串中的html格式       *        * @param input       * @param length       *            显示的字符的个数       * @return       */       public static String splitAndFilterString(String inpu

java使用正则表达式过滤html标签_java

前段时间开发的时候要读取一篇文章的简介内容(也就是前200个字符),使用了隐藏字段,可能有人就要问了,那后台也是可以截取字符的啊,那是因为编辑器里面包含了html标签,所以后台就需要处理html标签的正则表达式,前些天上网搜了下,发现有人写好的一个类,给大家共享下,不要闲小弟落伍了... import java.util.regex.Matcher; import java.util.regex.Pattern; /** * <p> * Title: HTML相关的正则表达式工具类 * <

php过滤HTML标签、属性等正则表达式汇总_php实例

$str=preg_replace("/\s+/", " ", $str); //过滤多余回车 $str=preg_replace("/<[ ]+/si","<",$str); //过滤<__("<"号后面带空格)   $str=preg_replace("/<\!--.*?-->/si","",$str); //注释 $str=p

Java正则表达式过滤html标签

原文:http://cooler1217.iteye.com/blog/1233670 import java.util.regex.Matcher; import java.util.regex.Pattern; /** * <p> * Title: HTML相关的正则表达式工具类 * </p> * <p> * Description: 包括过滤HTML标记,转换HTML标记,替换特定HTML标记 * </p> * <p> * Copyrigh

java 中正则过滤html标签

 代码如下 复制代码   public static String delHtml(String inputString) {         String htmlStr = inputString; // 含html标签的字符串         String textStr = "";         java.util.regex.Pattern p_script;         java.util.regex.Matcher m_script;         java.ut

PHP正则表达式过滤html标签属性(DEMO)_php实例

过滤html标签在php中可以有内置的函数了,但它过滤的太干净了,我们就整理了一下些利用正则来过滤指定html标签的例子,具体如下所示. 采集的时候有时候需要过滤掉多余的标签属性,比如 img标签过滤掉除了src属性之外的所有属性例如删除titile alt等属性以及一些脚的onclick属性等. 例如 过滤除了src之外的所有属性: 复制代码 代码如下: $str= preg_replace('/\s(?!src)[a-zA-Z]+=[\'\"]{1}[^\'\"]+[\'\&quo