问题描述
- 字符串去掉HTML标签但是保留样式(主要是换行样式),怎么实现,或者说在什么上面输出可以实现
-
字符串去掉HTML标签但是保留样式(主要是换行样式),怎么实现,或者说在什么上面输出可以实现
最好用C#实现
解决方案
private string RemoveHtml(Match m)
{
if (m.Groups[1].Value.ToLower() == "br") return "<br>";
return "";
}
public string RemoveHtml(string s)
{
s = Regex.Replace(s, @"</?([a-zd]+)[^>]*>", RemoveHtml, RegexOptions.IgnoreCase);
return s;
}
Response.Write( RemoveHtml("<div>a<br>b<b style='color:red'>c</b></div>"));//a<br>bc
解决方案二:
如果想获取网页内容的话,可以尝试截取<,这样就取出了每个标签的内容,然后再做相应的判断,如果是块级的话,加换行就行,不造是不是你想要的思路
时间: 2024-10-25 09:38:46