如何清理爬虫数据中一些不需要的 HTML 属性 只删除属性 不删除标签与标签体
发布日期:2022-11-07
|
最后更新:2026-03-23 14:42:29
|
阅读:16,587
|
状态:更新中
org.anyline.util.regula.RegularUtil
/**
* 删除所有标签的属性 只删除属性 不删除标签与标签体
* @param src html
* @param attributes 属性 如果不传则删除所有属性
* @return String
*/
public static String removeAttribute(String src, String ... attributes)
RegularUtil.removeAttribute("<div class='title'>主页</div>");
返回:
<div>主页</div>