jsoup 是一款 Java 的 HTML 解析器,可直接解析某个 URL 地址、HTML 文本内容。它提供了一套非常省力的 API,可通过 DOM,CSS 以及类似于 jQuery 的操作方法来取出和操作数据。

能用Jsoup实现什么?

    1.    从URL,文件或字符串中刮取并解析HTML

    2.    查找和提取数据,使用DOM遍历或CSS选择器

    3.    操纵HTML元素,属性和文本

    4.    根据安全的白名单清理用户提交的内容,以防止XSS攻击

    5.    输出整洁的HTML

    Jsoup 官网

jsoup 是基于 MIT 协议发布的,可放心使用于商业项目。