这篇文章我们来了解Java去除html标签的方法。在java中,我们可以使用replaceAll方法去除html标签,那么具体怎样实现呢?代码怎样写?下文有示例供大家参考,有需要的朋友就跟随小编来一起学习一下吧!
本教程操作环境:windows7系统、java10版、Dell G3电脑。
public static String stripHtml(String content) { // <p>段落替换为换行 content = content.replaceAll("<p .*?>", "\r\n"); // <br><br/>替换为换行 content = content.replaceAll("<br\\s*/?>", "\r\n"); // 去掉其它的<>之间的东西 content = content.replaceAll("\\<.*?>", ""); // 还原HTML // content = HTMLDecoder.decode(content); return content; }
扩展资料:
replaceAll() 方法使用给定的参数 replacement 替换字符串所有匹配给定的正则表达式的子字符串。
语法
public String replaceAll(String regex, String replacement)
参数
regex -- 匹配此字符串的正则表达式。
replacement -- 用来替换每个匹配项的字符串。
返回值
成功则返回替换的字符串,失败则返回原始字符串。
以上就是关于Java去除html标签的方法介绍,上述示例具有一定的参考价值,有需要的朋友可以了解看看,希望对大家学习Java有帮助,想要了解更多可以继续浏览群英网络其他相关的文章。
文本转载自PHP中文网
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:mmqy2019@163.com进行举报,并提供相关证据,查实之后,将立刻删除涉嫌侵权内容。