jsoup 是一款 Java 的 HTML 解析器,可直接解析某个 URL 地址、HTML 文本内容。它提供了一套非常省力的 API,可通过 DOM,CSS 以及类似于 jQuery 的操作方法来取出和操作数据。
能用Jsoup实现什么?
1. 从URL,文件或字符串中刮取并解析HTML
2. 查找和提取数据,使用DOM遍历或CSS选择器
3. 操纵HTML元素,属性和文本
4. 根据安全的白名单清理用户提交的内容,以防止XSS攻击
5. 输出整洁的HTML
jsoup 是基于 MIT 协议发布的,可放心使用于商业项目。