Tio Boot DocsTio Boot Docs
Home
  • java-db
  • api-table
  • Enjoy
  • Tio Boot Admin
  • ai_agent
  • translator
  • knowlege_base
  • ai-search
  • 案例
Abount
  • Github
  • Gitee
Home
  • java-db
  • api-table
  • Enjoy
  • Tio Boot Admin
  • ai_agent
  • translator
  • knowlege_base
  • ai-search
  • 案例
Abount
  • Github
  • Gitee
  • 01_tio-boot 简介

    • tio-boot:新一代高性能 Java Web 开发框架
    • tio-boot 入门示例
    • Tio-Boot 配置 : 现代化的配置方案
    • tio-boot 整合 Logback
    • tio-boot 整合 hotswap-classloader 实现热加载
    • 自行编译 tio-boot
    • 最新版本
    • 开发规范
  • 02_部署

    • 使用 Maven Profile 实现分环境打包 tio-boot 项目
    • Maven 项目配置详解:依赖与 Profiles 配置
    • tio-boot 打包成 FatJar
    • 使用 GraalVM 构建 tio-boot Native 程序
    • 使用 Docker 部署 tio-boot
    • 部署到 Fly.io
    • 部署到 AWS Lambda
    • 到阿里云云函数
    • 使用 Deploy 工具部署
    • 使用Systemctl启动项目
    • 使用 Jenkins 部署 Tio-Boot 项目
    • 使用 Nginx 反向代理 Tio-Boot
    • 使用 Supervisor 管理 Java 应用
    • 已过时
    • 胖包与瘦包的打包与部署
  • 03_配置

    • 配置参数
    • 服务器监听器
    • 内置缓存系统 AbsCache
    • 使用 Redis 作为内部 Cache
    • 静态文件处理器
    • 基于域名的静态资源隔离
    • DecodeExceptionHandler
  • 04_原理

    • 生命周期
    • 请求处理流程
    • 重要的类
  • 05_json

    • Json
    • 接受 JSON 和响应 JSON
    • 响应实体类
  • 06_web

    • 概述
    • 文件上传
    • 接收请求参数
    • 接收日期参数
    • 接收数组参数
    • 返回字符串
    • 返回文本数据
    • 返回网页
    • 请求和响应字节
    • 文件下载
    • 返回视频文件并支持断点续传
    • http Session
    • Cookie
    • HttpRequest
    • HttpResponse
    • Resps
    • RespBodyVo
    • 请求拦截器
    • Controller拦截器
    • LoggingInterceptor
    • 全局异常处理器
    • 异步处理
    • 动态 返回 CSS 实现
    • 返回图片
    • Transfer-Encoding: chunked 实时音频播放
    • Server-Sent Events (SSE)
    • 接口访问统计
    • 接口请求和响应数据记录
    • 自定义 Handler 转发请求
    • 使用 HttpForwardHandler 转发所有请求
    • 跨域
    • 添加 Controller
    • 常用工具类
    • HTTP Basic 认证
    • Http响应加密
    • 在 Tio-boot 中使用零拷贝发送大文件
    • WebJars
    • JProtobuf
    • Tio-Boot HTTP Speed Test
  • 07_validate

    • 数据紧校验规范
    • 参数校验
  • 08_websocket

    • 使用 tio-boot 搭建 WebSocket 服务
    • WebSocket 聊天室项目示例
  • 09_java-db

    • java‑db
    • 操作数据库入门示例
    • SQL 模板 (SqlTemplates)
    • 数据源配置与使用
    • ActiveRecord
    • Db 工具类
    • 批量操作
    • Model
    • 生成器与 Model
    • 异常处理
    • 数据库事务处理
    • Cache 缓存
    • Dialect 多数据库支持
    • 表关联操作
    • 复合主键
    • Oracle 支持
    • Enjoy SQL 模板
    • 整合 Enjoy 模板最佳实践
    • 多数据源支持
    • 独立使用 ActiveRecord
    • 调用存储过程
    • java-db 整合 Guava 的 Striped 锁优化
    • 生成 SQL
    • 通过实体类操作数据库
    • java-db 读写分离
    • Spring Boot 整合 Java-DB
    • like 查询
    • 常用操作示例
    • Druid 监控集成指南
    • SQL 统计
  • 10_api-table

    • ApiTable 概述
    • 使用 ApiTable 连接 SQLite
    • 使用 ApiTable 连接 Mysql
    • 使用 ApiTable 连接 Postgres
    • 使用 ApiTable 连接 TDEngine
    • 使用 api-table 连接 oracle
    • 使用 api-table 连接 mysql and tdengine 多数据源
    • EasyExcel 导出
    • EasyExcel 导入
    • TQL(Table SQL)前端输入规范
    • ApiTable 实现增删改查
    • 数组类型
    • 单独使用 ApiTable
  • 11_aop

    • JFinal-aop
    • Aop 工具类
    • 配置
    • 配置
    • 独立使用 JFinal Aop
    • @AImport
    • 原理解析
  • 12_cache

    • Caffine
    • Jedis-redis
    • hutool RedisDS
    • Redisson
    • Caffeine and redis
    • CacheUtils 工具类
    • 使用 CacheUtils 整合 caffeine 和 redis 实现的两级缓存
    • 使用 java-db 整合 ehcache
    • 使用 java-db 整合 redis
    • Java DB Redis 相关 Api
    • redis 使用示例
  • 13_认证和权限

    • FixedTokenInterceptor
    • TokenManager
    • 数据表
    • 匿名登录
    • 注册和登录
    • 个人中心
    • 重置密码
    • Google 登录
    • 短信登录
    • 移动端微信登录
    • 移动端重置密码
    • 微信登录
    • 移动端微信登录
    • 权限校验注解
    • Sa-Token
    • sa-token 登录注册
    • StpUtil.isLogin() 源码解析
  • 14_i18n

    • i18n
  • 15_enjoy

    • tio-boot 整合 Enjoy 模版引擎文档
    • 引擎配置
    • 表达式
    • 指令
    • 注释
    • 原样输出
    • Shared Method 扩展
    • Shared Object 扩展
    • Extension Method 扩展
    • Spring boot 整合
    • 独立使用 Enjoy
    • tio-boot enjoy 自定义指令 localeDate
    • PromptEngine
    • Enjoy 入门示例-擎渲染大模型请求体
    • Enjoy 使用示例
  • 16_定时任务

    • Quartz 定时任务集成指南
    • 分布式定时任务 xxl-jb
    • cron4j 使用指南
  • 17_tests

    • TioBootTest 类
  • 18_tio

    • TioBootServer
    • 使用 tio-core 在 tio-boot 中构建独立的 TCP 服务器
    • 内置 TCP 处理器
    • 独立启动 UDPServer
    • 使用内置 UDPServer
    • t-io 消息处理流程
    • tio-运行原理详解
    • TioConfig
    • ChannelContext
    • Tio 工具类
    • 业务数据绑定
    • 业务数据解绑
    • 发送数据
    • 关闭连接
    • Packet
    • 监控: 心跳
    • 监控: 客户端的流量数据
    • 监控: 单条 TCP 连接的流量数据
    • 监控: 端口的流量数据
    • 单条通道统计: ChannelStat
    • 所有通道统计: GroupStat
    • 资源共享
    • 成员排序
    • SSL
    • DecodeRunnable
    • 使用 AsynchronousSocketChannel 响应数据
    • 拉黑 IP
    • 深入解析 Tio 源码:构建高性能 Java 网络应用
  • 19_aio

    • ByteBuffer
    • AIO HTTP 服务器
    • 自定义和线程池和池化 ByteBuffer
    • AioHttpServer 应用示例 IP 属地查询
    • 手写 AIO Http 服务器
  • 20_netty

    • Netty TCP Server
    • Netty Web Socket Server
    • 使用 protoc 生成 Java 包文件
    • Netty WebSocket Server 二进制数据传输
    • Netty 组件详解
  • 21_netty-boot

    • Netty-Boot
    • 原理解析
    • 整合 Hot Reload
    • 整合 数据库
    • 整合 Redis
    • 整合 Elasticsearch
    • 整合 Dubbo
    • Listener
    • 文件上传
    • 拦截器
    • Spring Boot 整合 Netty-Boot
    • SSL 配置指南
    • ChannelInitializer
    • Reserve
  • 22_MQ

    • Mica-mqtt
    • EMQX
    • Disruptor
  • 23_tio-utils

    • tio-utils
    • HttpUtils
    • Notification
    • 邮箱
    • JSON
    • 读取文件
    • Base64
    • 上传和下载
    • Http
    • Telegram
    • RsaUtils
    • EnvUtils
    • 系统监控
    • 毫秒并发 ID (MCID) 生成方案
  • 24_tio-http-server

    • 使用 Tio-Http-Server 搭建简单的 HTTP 服务
    • tio-boot 添加 HttpRequestHandler
    • 在 Android 上使用 tio-boot 运行 HTTP 服务
    • tio-http-server-native
    • handler 常用操作
  • 25_tio-websocket

    • WebSocket 服务器
    • WebSocket Client
  • 26_tio-im

    • 通讯协议文档
    • ChatPacket.proto 文档
    • java protobuf
    • 数据表设计
    • 创建工程
    • 登录
    • 历史消息
    • 发消息
  • 27_mybatis

    • Tio-Boot 整合 MyBatis
    • 使用配置类方式整合 MyBatis
    • 整合数据源
    • 使用 mybatis-plus 整合 tdengine
    • 整合 mybatis-plus
  • 28_mongodb

    • tio-boot 使用 mongo-java-driver 操作 mongodb
  • 29_elastic-search

    • Elasticsearch
    • JavaDB 整合 ElasticSearch
    • Elastic 工具类使用指南
    • Elastic-search 注意事项
    • ES 课程示例文档
  • 30_magic-script

    • tio-boot 与 magic-script 集成指南
  • 31_groovy

    • tio-boot 整合 Groovy
  • 32_firebase

    • 整合 google firebase
    • Firebase Storage
    • Firebase Authentication
    • 使用 Firebase Admin SDK 进行匿名用户管理与自定义状态标记
    • 导出用户
    • 注册回调
    • 登录注册
  • 33_文件存储

    • 文件上传数据表
    • 本地存储
    • 使用 AWS S3 存储文件并整合到 Tio-Boot 项目中
    • 存储文件到 腾讯 COS
  • 34_spider

    • jsoup
    • 爬取 z-lib.io 数据
    • 整合 WebMagic
    • WebMagic 示例:爬取学校课程数据
    • Playwright
    • Flexmark (Markdown 处理器)
    • tio-boot 整合 Playwright
    • 缓存网页数据
  • 36_integration_thirty_party

    • tio-boot 整合 okhttp
    • 整合 GrpahQL
    • 集成 Mailjet
    • 整合 ip2region
    • 整合 GeoLite 离线库
    • 整合 Lark 机器人指南
    • 集成 Lark Mail 实现邮件发送
    • Thymeleaf
    • Swagger
    • Clerk 验证
  • 37_dubbo

    • 概述
    • dubbo 2.6.0
    • dubbo 2.6.0 调用过程
    • dubbo 3.2.0
  • 38_spring

    • Spring Boot Web 整合 Tio Boot
    • spring-boot-starter-webflux 整合 tio-boot
    • Tio Boot 整合 Spring Boot Starter
    • Tio Boot 整合 Spring Boot Starter Data Redis 指南
  • 39_spring-cloud

    • tio-boot spring-cloud
  • 40_mysql

    • 使用 Docker 运行 MySQL
    • /zh/42_mysql/02.html
  • 41_postgresql

    • PostgreSQL 安装
    • PostgreSQL 主键自增
    • PostgreSQL 日期类型
    • Postgresql 金融类型
    • PostgreSQL 数组类型
    • PostgreSQL 全文检索
    • PostgreSQL 查询优化
    • 获取字段类型
    • PostgreSQL 向量
    • PostgreSQL 优化向量查询
    • PostgreSQL 其他
  • 43_oceanbase

    • 快速体验 OceanBase 社区版
    • 快速上手 OceanBase 数据库单机部署与管理
    • 诊断集群性能
    • 优化 SQL 性能指南
    • /zh/43_oceanbase/05.html
  • 50_media

    • JAVE 提取视频中的声音
    • Jave 提取视频中的图片
    • /zh/50_media/03.html
  • 51_asr

    • Whisper-JNI
  • 54_native-media

    • java-native-media
    • JNI 入门示例
    • mp3 拆分
    • mp4 转 mp3
    • 使用 libmp3lame 实现高质量 MP3 编码
    • Linux 编译
    • macOS 编译
    • 从 JAR 包中加载本地库文件
    • 支持的音频和视频格式
    • 任意格式转为 mp3
    • 通用格式转换
    • 通用格式拆分
    • 视频合并
    • VideoToHLS
    • split_video_to_hls 支持其他语言
    • 持久化 HLS 会话
  • 55_telegram4j

    • 数据库设计
    • /zh/55_telegram4j/02.html
    • 基于 MTProto 协议开发 Telegram 翻译机器人
    • 过滤旧消息
    • 保存机器人消息
    • 定时推送
    • 增加命令菜单
    • 使用 telegram-Client
    • 使用自定义 StoreLayout
    • 延迟测试
    • Reactor 错误处理
    • Telegram4J 常见错误处理指南
  • 56_telegram-bots

    • TelegramBots 入门指南
    • 使用工具库 telegram-bot-base 开发翻译机器人
  • 60_LLM

    • 简介
    • AI 问答
    • /zh/60_LLM/03.html
    • /zh/60_LLM/04.html
    • 增强检索(RAG)
    • 结构化数据检索
    • 搜索+AI
    • 集成第三方 API
    • 后置处理
    • 推荐问题生成
    • 连接代码执行器
    • 避免 GPT 混乱
    • /zh/60_LLM/13.html
  • 61_ai_agent

    • 数据库设计
    • 示例问题管理
    • 会话管理
    • 历史记录
    • Perplexity API
    • 意图识别
    • 智能问答
    • 文件上传与解析文档
    • 翻译
    • 名人搜索功能实现
    • Ai studio gemini youbue 问答使用说明
    • 自建 YouTube 字幕问答系统
    • 自建 获取 youtube 字幕服务
    • 通用搜索
    • /zh/61_ai_agent/15.html
    • 16
    • 17
    • 18
    • 在 tio-boot 应用中整合 ai-agent
    • 16
  • 62_translator

    • 简介
  • 63_knowlege_base

    • 数据库设计
    • 用户登录实现
    • 模型管理
    • 知识库管理
    • 文档拆分
    • 片段向量
    • 命中测试
    • 文档管理
    • 片段管理
    • 问题管理
    • 应用管理
    • 向量检索
    • 推理问答
    • 问答模块
    • 统计分析
    • 用户管理
    • api 管理
    • 存储文件到 S3
    • 文档解析优化
    • 片段汇总
    • 段落分块与检索
    • 多文档解析
    • 对话日志
    • 检索性能优化
    • Milvus
    • 文档解析方案和费用对比
    • 离线运行向量模型
  • 64_ai-search

    • ai-search 项目简介
    • ai-search 数据库文档
    • ai-search SearxNG 搜索引擎
    • ai-search Jina Reader API
    • ai-search Jina Search API
    • ai-search 搜索、重排与读取内容
    • ai-search PDF 文件处理
    • ai-search 推理问答
    • Google Custom Search JSON API
    • ai-search 意图识别
    • ai-search 问题重写
    • ai-search 系统 API 接口 WebSocket 版本
    • ai-search 搜索代码实现 WebSocket 版本
    • ai-search 生成建议问
    • ai-search 生成问题标题
    • ai-search 历史记录
    • Discover API
    • 翻译
    • Tavily Search API 文档
    • 对接 Tavily Search
    • 火山引擎 DeepSeek
    • 对接 火山引擎 DeepSeek
    • ai-search 搜索代码实现 SSE 版本
    • jar 包部署
    • Docker 部署
    • 爬取一个静态网站的所有数据
    • 网页数据预处理
    • 网页数据检索与问答流程整合
  • 65_java-kit-server

    • Java 执行 python 代码
    • 通过大模型执行 Python 代码
    • MCP 协议
    • Cline 提示词
    • Cline 提示词-中文版本
  • 66_manim

    • Teach me anything - 基于大语言的知识点讲解视频生成系统
    • Manim 开发环境搭建
    • 生成场景提示词
    • 生成代码
    • 完整脚本示例
    • 语音合成系统
    • Fish.audio TTS 接口说明文档与 Java 客户端封装
    • 整合 fishaudio 到 java-uni-ai-server 项目
    • 执行 Python (Manim) 代码
    • 使用 SSE 流式传输生成进度的实现文档
    • 整合全流程完整文档
    • HLS 动态推流技术文档
    • manim 分场景生成代码
    • 分场景运行代码及流式播放支持
    • 分场景业务端完整实现流程
    • Maiim布局管理器
    • 仅仅生成场景代码
    • 使用 modal 运行 manim 代码
    • Python 使用 Modal GPU 加速渲染
    • Modal 平台 GPU 环境下运行 Manim
    • Modal Manim OpenGL 安装与使用
    • 优化 GPU 加速
    • 生成视频封面流程
    • Java 调用 manim 命令 执行代码 生成封面
    • Manim 图像生成服务客户端文档
    • manim render help
    • 显示 中文公式
    • manimgl
    • EGL
    • /zh/66_manim/30.html
    • /zh/66_manim/31.html
    • /zh/66_manim/32.html
    • /zh/66_manim/33.html
  • 68_java-llm-proxy

    • 使用tio-boot搭建多模型LLM代理服务
  • 69_ai-brower

    • AI Browser:基于用户指令的浏览器自动化系统
    • 提示词
    • dom构建- buildDomTree.js
    • dom构建- 将网页可点击元素提取与可视化
    • 提取网内容
    • 启动浏览器
    • 操作浏览器指令
  • 70_tio-boot-admin

    • 入门指南
    • 初始化数据
    • token 存储
    • 与前端集成
    • 文件上传
    • 网络请求
    • 图片管理
    • /zh/70_tio-boot-admin/08.html
    • Word 管理
    • PDF 管理
    • 文章管理
    • 富文本编辑器
  • 71_tio-boot

    • /zh/71_tio-boot/01.html
    • Swagger 整合到 Tio-Boot 中的指南
    • HTTP/1.1 Pipelining 性能测试报告
  • 73_tio-mail-wing

    • tio-mail-wing简介
    • 任务1:实现POP3系统
    • 使用 getmail 验证 tio-mail-wing POP3 服务
    • 任务2:实现 SMTP 服务
    • 数据库初始化文档
    • 用户管理
    • 邮件管理
    • 任务3:实现 SMTP 服务 数据库版本
    • 任务4:实现 POP3 服务(数据库版本)
    • IMAP 协议
    • 拉取多封邮件
    • 任务5:实现 IMAP 服务(数据库版本)
    • IMAP实现讲解
    • IMAP 手动测试脚本
    • IMAP 认证机制
    • 主动推送
  • 80_性能测试

    • 压力测试 - tio-http-serer
    • 压力测试 - tio-boot
    • 压力测试 - tio-boot-native
    • 压力测试 - netty-boot
    • 性能测试对比
    • TechEmpower FrameworkBenchmarks
    • 压力测试 - tio-boot 12 C 32G
  • 99_案例

    • 封装 IP 查询服务
    • tio-boot 案例 - 全局异常捕获与企业微信群通知
    • tio-boot 案例 - 文件上传和下载
    • tio-boot 案例 - 整合 ant design pro 增删改查
    • tio-boot 案例 - 流失响应
    • tio-boot 案例 - 增强检索
    • tio-boot 案例 - 整合 function call
    • tio-boot 案例 - 定时任务 监控 PostgreSQL、Redis 和 Elasticsearch
    • Tio-Boot 案例:使用 SQLite 整合到登录注册系统
    • tio-boot 案例 - 执行 shell 命令

dom构建- 将网页可点击元素提取与可视化

一、项目背景与目标

在自动化测试、智能 AI 代理交互等场景中,我们常常需要让机器“看懂”网页,将页面中的可点击元素提取出来并以结构化、可读的文本形式呈现,便于后续推理或自动化操作。本示例基于 Playwright 和一段自定义脚本,将任意网页的 DOM 树构建为 Java 对象,并输出所有可交互元素的文本化列表。


二、整体架构

  1. 前端脚本(index.js)

    • 深度遍历 DOM,生成包含每个节点属性、可见性、交互性、子节点引用等信息的 JSON 结构。
    • 为每个可交互元素(按钮、链接、输入框等)分配唯一的 highlightIndex,并可选标记“新元素”。
  2. Java 端解析

    • DomService:在 Playwright Page 上注入并执行上述脚本,拿到原始 JSON,分两轮构建 Java 对象:

      1. 第一轮:根据节点类型(元素/文本)创建对应的 DOMElementNode 或 DOMTextNode;
      2. 第二轮:根据 JSON 中的子节点列表建立父子关系,最终获得根 DOMElementNode。
    • DOMState:持有根节点与从 highlightIndex 到节点实例的映射(selectorMap)。

  3. 可视化输出

    • 调用根节点的 clickableElementsToString(...),以

      [index]<tag 属性拼接>节点文本/>
      

      的格式逐行输出,每行代表一个可点击元素,属性列表仅保留常用且非空字段。


三、核心类说明

1. DOMBaseNode(抽象基类)

  • 字段:

    • isVisible(boolean):节点在页面上是否可见。
    • parent:父级 DOMElementNode 引用。
  • 方法:

    • isVisible()、getParent()、setParent(...)。

2. DOMElementNode(元素节点)

  • 继承:DOMBaseNode

  • 主要字段:

    • tagName、xpath、attributes(属性映射);
    • isInteractive、isTopElement、isInViewport、shadowRoot;
    • highlightIndex(可点击元素唯一索引)、isNew(是否为新出现元素);
    • children:子节点列表。
  • 核心方法:

    • getAllTextTillNextClickableElement(int maxDepth):收集从当前节点到下一个可点击元素之间的所有纯文本;
    • clickableElementsToString(List<String> includeAttributes):遍历整个树,将所有标记了 highlightIndex 的元素按格式输出。

3. DOMTextNode(文本节点)

  • 继承:DOMBaseNode

  • 主要字段:text(节点内文字)、type="TEXT_NODE";

  • 方法:

    • getText();
    • hasParentWithHighlightIndex():判断当前文本是否属于某个已标记的可点击元素内部,以便过滤冗余。

4. DOMState

  • 持有:

    • DOMElementNode elementTree:完整的元素节点树;
    • Map<Integer, DOMElementNode> selectorMap:索引到可点击节点的映射,方便按索引快速定位。

5. DomService

  • 构造器加载并缓存 index.js;

  • getClickableElements(boolean highlightElements, int focusElement, int viewportExpansion):

    1. 将参数打包为 JS 对象,注入并执行构建脚本;
    2. 解析返回的 JSON Map → Java 节点;
    3. 建立父子关系;
    4. 返回 DOMState。

四 代码

DOMElementNode

package com.litongjava.ai.browser.dom.model;

import java.util.ArrayList;
import java.util.LinkedHashMap;
import java.util.List;
import java.util.Map;
import java.util.stream.Collectors;

import com.litongjava.tio.utils.collect.Lists;
import com.litongjava.tio.utils.hutool.StrUtil;

public class DOMElementNode extends DOMBaseNode {
  private final String tagName;
  private final String xpath;
  private final Map<String, String> attributes;
  private final List<DOMBaseNode> children = new ArrayList<>();

  private final boolean isInteractive;
  private final boolean isTopElement;
  private final boolean isInViewport;
  private final boolean shadowRoot;
  private final Integer highlightIndex;
  private final Boolean isNew;

  // (viewportInfo / pageCoordinates 按需补)
  public static final List<String> DEFAULT_INCLUDE_ATTRIBUTES = Lists.of("title", "type", "checked", "name", "role", "value",
      //
      "placeholder", "data-date-format", "alt", "aria-label", "aria-expanded", "data-state", "aria-checked");

  public DOMElementNode(String tagName, String xpath, Map<String, String> attributes, boolean isVisible, boolean
  //
  isInteractive, boolean isTopElement, boolean isInViewport, boolean shadowRoot, Integer highlightIndex, Boolean isNew) {
    super(isVisible);
    this.tagName = tagName;
    this.xpath = xpath;
    this.attributes = attributes;
    this.isInteractive = isInteractive;
    this.isTopElement = isTopElement;
    this.isInViewport = isInViewport;
    this.shadowRoot = shadowRoot;
    this.highlightIndex = highlightIndex;
    this.isNew = isNew;
  }

  public String getTagName() {
    return tagName;
  }

  public Integer getHighlightIndex() {
    return highlightIndex;
  }

  public boolean isInteractive() {
    return isInteractive;
  }

  public boolean isTopElement() {
    return isTopElement;
  }

  public boolean isInViewport() {
    return isInViewport;
  }

  public Boolean isNew() {
    return isNew;
  }

  public List<DOMBaseNode> getChildren() {
    return children;
  }

  public void addChild(DOMBaseNode child) {
    children.add(child);
    if (child instanceof DOMElementNode) {
      ((DOMElementNode) child).setParent(this);
    } else if (child instanceof DOMTextNode) {
      ((DOMTextNode) child).setParent(this);
    }
  }

  /**
   * 收集从 this 节点开始,直到下一个可点击元素前的所有文本
   */
  public String getAllTextTillNextClickableElement(int maxDepth) {
    StringBuilder sb = new StringBuilder();
    collectText(this, 0, maxDepth, sb);
    return sb.toString().trim();
  }

  private void collectText(DOMBaseNode node, int depth, int maxDepth, StringBuilder sb) {
    if (maxDepth != -1 && depth > maxDepth) {
      return;
    }
    if (node instanceof DOMElementNode) {
      DOMElementNode el = (DOMElementNode) node;
      if (el != this && el.getHighlightIndex() != null) {
        return;
      }
      for (DOMBaseNode c : el.getChildren()) {
        collectText(c, depth + 1, maxDepth, sb);
      }
    } else if (node instanceof DOMTextNode) {
      //sb.append(((DOMTextNode) node).getText()).append("\n");
      String text = ((DOMTextNode) node).getText();
      sb.append(text.trim()).append(" ");
    }
  }

  /**
   * 核心:把可点击元素按照 [index]<tag 属性拼接>文本/> 的格式输出
   */
  public String clickableElementsToString(List<String> includeAttributes) {
    if (includeAttributes == null) {
      includeAttributes = DEFAULT_INCLUDE_ATTRIBUTES;
    }

    List<String> out = new ArrayList<>();
    processNode(this, "", includeAttributes, out);
    return out.stream().collect(Collectors.joining("\n"));
  }

  private void processNode(DOMBaseNode node, String indent, List<String> includeAttributes, List<String> out) {
    if (node instanceof DOMElementNode) {
      DOMElementNode el = (DOMElementNode) node;
      if (el.getHighlightIndex() != null) {
        String text = el.getAllTextTillNextClickableElement(-1);
        String attrStr = buildAttributesHtml(el.attributes, includeAttributes, text);
        String indicator = Boolean.TRUE.equals(el.isNew()) ? "*[" + el.getHighlightIndex() + "]" : "[" + el.getHighlightIndex() + "]";
        String line = indent + indicator + "<" + el.tagName + (attrStr.isEmpty() ? "" : " " + attrStr)
            + (text.isEmpty() ? (attrStr.isEmpty() ? " " : "") + "/>" : (attrStr.isEmpty() ? " " : "") + ">" + text + "/>");
        out.add(line);
      }
      // 继续递归
      for (DOMBaseNode c : el.getChildren()) {
        processNode(c, indent + "\t", includeAttributes, out);
      }
    } else if (node instanceof DOMTextNode) {
      DOMTextNode txt = (DOMTextNode) node;
      if (txt.hasParentWithHighlightIndex())
        return;
      DOMElementNode p = txt.getParent();
      if (p != null && p.isVisible() && p.isTopElement()) {
        out.add(indent + txt.getText());
      }
    }
  }

  private String buildAttributesHtml(Map<String, String> attrs, List<String> includeAttributes, String text) {
    Map<String, String> keep = new LinkedHashMap<>();
    for (String k : includeAttributes) {
      if (attrs.containsKey(k) && StrUtil.isNotBlank(attrs.get(k))) {
        keep.put(k, cap(attrs.get(k), 15));
      }
    }
    // “去重”“剔除与文本相同的属性” 等…可按需补
    return keep.entrySet().stream().map(e -> e.getKey() + "='" + e.getValue() + "'").collect(Collectors.joining(" "));
  }

  private static String cap(String s, int max) {
    return s.length() > max ? s.substring(0, max) + "..." : s;
  }
}

DOMBaseNode

package com.litongjava.ai.browser.dom.model;

public abstract class DOMBaseNode {
  protected boolean isVisible;
  protected DOMElementNode parent;

  public DOMBaseNode(boolean isVisible) {
    this.isVisible = isVisible;
  }

  public boolean isVisible() {
    return isVisible;
  }

  public DOMElementNode getParent() {
    return parent;
  }

  public void setParent(DOMElementNode parent) {
    this.parent = parent;
  }
}

DOMTextNode

package com.litongjava.ai.browser.dom.model;

public class DOMTextNode extends DOMBaseNode {
  private final String text;
  private final String type = "TEXT_NODE";

  public DOMTextNode(String text, boolean isVisible) {
    super(isVisible);
    this.text = text;
  }

  public String getText() {
    return text;
  }

  public boolean hasParentWithHighlightIndex() {
    DOMElementNode cur = parent;
    while (cur != null) {
      if (cur.getHighlightIndex() != null)
        return true;
      cur = cur.getParent();
    }
    return false;
  }

  public boolean isParentInViewport() {
    return parent != null && parent.isInViewport();
  }

  public boolean isParentTopElement() {
    return parent != null && parent.isTopElement();
  }
}

DOMState

package com.litongjava.ai.browser.dom.model;

import java.util.Map;

public class DOMState {
  private final DOMElementNode elementTree;
  private final Map<Integer, DOMElementNode> selectorMap;

  public DOMState(DOMElementNode tree, Map<Integer, DOMElementNode> sel) {
    this.elementTree = tree;
    this.selectorMap = sel;
  }

  public DOMElementNode getElementTree() {
    return elementTree;
  }

  public Map<Integer, DOMElementNode> getSelectorMap() {
    return selectorMap;
  }
}

DomService

package com.litongjava.ai.browser.dom.service;

import java.net.URL;
import java.util.HashMap;
import java.util.List;
import java.util.Map;
import java.util.Map.Entry;
import java.util.Set;

import com.litongjava.ai.browser.dom.model.DOMBaseNode;
import com.litongjava.ai.browser.dom.model.DOMElementNode;
import com.litongjava.ai.browser.dom.model.DOMState;
import com.litongjava.ai.browser.dom.model.DOMTextNode;
import com.litongjava.tio.utils.hutool.FileUtil;
import com.litongjava.tio.utils.hutool.ResourceUtil;
import com.microsoft.playwright.Page;

import lombok.extern.slf4j.Slf4j;

@Slf4j
public class DomService {
  private final Page page;
  private final String buildScript;

  public DomService(Page page) {
    this.page = page;
    // 从 resources 加载 index.js
    String js_path = "dom/dom_tree/index.js";
    URL url = ResourceUtil.getResource(js_path);
    if (url == null) {
      throw new RuntimeException("not found index.js");
    }
    StringBuilder stringBuilder = FileUtil.readURLAsString(url);
    this.buildScript = stringBuilder.toString();
  }

  public DOMState getClickableElements(boolean highlightElements, int focusElement, int viewportExpansion) {
    // 构造 JS 参数
    Map<String, Object> args = new HashMap<>();
    args.put("doHighlightElements", highlightElements);
    args.put("focusHighlightIndex", focusElement);
    args.put("viewportExpansion", viewportExpansion);
    args.put("debugMode", log.isDebugEnabled());

    // 在页面上下文执行:注入脚本 + 调用 buildDomTree(args)
    String evalScript = "const buildDomTree = " + buildScript + ";\n" + "return buildDomTree(args);";

    @SuppressWarnings("unchecked")
    Map<String, Object> evalPage = (Map<String, Object>) page.evaluate("(args) => {\n" + evalScript + "\n" + "}", args);

    // 拿到 map 和 rootId
    @SuppressWarnings("unchecked")
    Map<String, Map<String, Object>> jsNodeMap = (Map<String, Map<String, Object>>) evalPage.get("map");
    Object object = evalPage.get("rootId");
    String rootId = object.toString();

    // 第一次遍历:构建所有节点(不设 parent/children)
    Map<String, DOMBaseNode> nodeMap = new HashMap<>();
    Map<Integer, DOMElementNode> selectorMap = new HashMap<>();

    Set<Entry<String, Map<String, Object>>> entrySet = jsNodeMap.entrySet();
    for (Entry<String, Map<String, Object>> entry : entrySet) {
      String id = entry.getKey();
      Map<String, Object> nd = entry.getValue();
      String type = (String) nd.get("type");

      if ("TEXT_NODE".equals(type)) {
        // 文本节点
        String text = (String) nd.get("text");
        boolean isVis = Boolean.TRUE.equals(nd.get("isVisible"));
        nodeMap.put(id, new DOMTextNode(text, isVis));
        continue;
      }

      // 元素节点
      String tag = (String) nd.get("tagName");
      String xpath = (String) nd.get("xpath");
      @SuppressWarnings("unchecked")
      Map<String, String> attrs = (Map<String, String>) nd.get("attributes");
      boolean isVis = Boolean.TRUE.equals(nd.get("isVisible"));
      boolean isInt = Boolean.TRUE.equals(nd.get("isInteractive"));
      boolean isTop = Boolean.TRUE.equals(nd.get("isTopElement"));
      boolean inVP = Boolean.TRUE.equals(nd.get("isInViewport"));
      boolean sr = Boolean.TRUE.equals(nd.get("shadowRoot"));
      Integer hi = nd.get("highlightIndex") != null ? ((Number) nd.get("highlightIndex")).intValue() : null;
      Boolean isNew = (Boolean) nd.get("isNew");

      DOMElementNode el = new DOMElementNode(tag, xpath, attrs, isVis, isInt, isTop, inVP, sr, hi, isNew);
      nodeMap.put(id, el);
      if (hi != null) {
        selectorMap.put(hi, el);
      }

    }

    // 第二次遍历:建立 parent–children 关系
    for (Entry<String, Map<String, Object>> entry : entrySet) {
      String id = entry.getKey();
      Map<String, Object> raw = entry.getValue();
      if (!(nodeMap.get(id) instanceof DOMElementNode)) {
        continue;
      }

      DOMElementNode el = (DOMElementNode) nodeMap.get(id);
      @SuppressWarnings("unchecked")
      List<Object> childList = (List<Object>) raw.get("children");
      if (childList == null) {
        continue;
      }
      for (Object o : childList) {
        String cid = o.toString();
        DOMBaseNode child = nodeMap.get(cid);
        if (child != null) {
          el.addChild(child);
        }

      }
    }

    // 拿到根节点
    DOMElementNode root = (DOMElementNode) nodeMap.get(rootId);
    return new DOMState(root, selectorMap);
  }
}

DomServiceTest

package com.litongjava.ai.browser.dom.service;

import org.junit.Test;

import com.litongjava.ai.browser.dom.model.DOMState;
import com.microsoft.playwright.Browser;
import com.microsoft.playwright.BrowserContext;
import com.microsoft.playwright.BrowserType;
import com.microsoft.playwright.Page;
import com.microsoft.playwright.Playwright;

public class DomServiceTest {

  @Test
  public void test() {
    String url = "https://www.baidu.com";

    try (Playwright pw = Playwright.create()) {
      Browser browser = pw.chromium().launch(new BrowserType.LaunchOptions().setHeadless(false));
      BrowserContext ctx = browser.newContext();
      Page page = ctx.newPage();
      page.navigate(url);

      DomService svc = new DomService(page);
      DOMState state = svc.getClickableElements(true, -1, 0);

      System.out.println("[Start of page]");
      String out = state.getElementTree().clickableElementsToString(null);
      System.out.println(out);
      System.out.println("[End of page]");
    }
  }
}

测试

input

images baidu-boxed.png

output

[Start of page]
				[0]<a >新闻/>
				[1]<a >hao123/>
				[2]<a >地图/>
				[3]<a >贴吧/>
				[4]<a >视频/>
				[5]<a >图片/>
				[6]<a >网盘/>
				[7]<a >文库/>
				[8]<a />
					[9]<a name='tj_briicon'>更多/>
				[10]<a />
				[11]<span >设置/>
				[12]<a name='tj_login'>登录/>
								[13]<span />
								[14]<input name='wd' placeholder='肖战连续两天请剧组喝冰饮'/>
								[15]<input type='submit' value='百度一下'/>
								[16]<a >AI搜索已支持「DeepSeek-R1」最新版 立即体验/>
									[17]<div > />
								[18]<a > 换一换/>
								[19]<li />
									[20]<a > 0 以历史的纵深感做好今天的工作/>
								[21]<li >新/>
									[22]<a > 5 亲叔叔炮轰宗馥莉:她从不与宗家往来/>
								[23]<li >热/>
									[24]<a > 1 打虎!正部级女官员刘慧被查/>
								[25]<li />
									[26]<a > 6 公司CEO搂抱HR被演唱会大屏拍到/>
								[27]<li >热/>
									[28]<a > 2 河南极端高温 蚊子都被热死了/>
								[29]<li />
									[30]<a > 7 男子在山东高速偶遇欧盟牌照小车/>
								[31]<li />
									[32]<a > 3 防中暑要避开这些误区/>
								[33]<li >热/>
									[34]<a > 8 接连爆料华语顶流大瓜 王晶被骂惨了/>
								[35]<li >新/>
									[36]<a > 4 杨议称杨少华遗产四个儿子一人一亿/>
								[37]<li >热/>
									[38]<a > 9 辣妹风坑苦了优衣库/>
			[39]<div >辅助模式/>
				[40]<div />
[End of page]
Edit this page
Last Updated:
Contributors: Tong Li
Prev
dom构建- buildDomTree.js
Next
提取网内容