Tio Boot DocsTio Boot Docs
Home
  • java-db
  • api-table
  • Enjoy
  • Tio Boot Admin
  • ai_agent
  • translator
  • knowlege_base
  • ai-search
  • 案例
Abount
  • Github
  • Gitee
Home
  • java-db
  • api-table
  • Enjoy
  • Tio Boot Admin
  • ai_agent
  • translator
  • knowlege_base
  • ai-search
  • 案例
Abount
  • Github
  • Gitee
  • 01_tio-boot 简介

    • tio-boot:新一代高性能 Java Web 开发框架
    • tio-boot 入门示例
    • Tio-Boot 配置 : 现代化的配置方案
    • tio-boot 整合 Logback
    • tio-boot 整合 hotswap-classloader 实现热加载
    • 自行编译 tio-boot
    • 最新版本
    • 开发规范
  • 02_部署

    • 使用 Maven Profile 实现分环境打包 tio-boot 项目
    • Maven 项目配置详解:依赖与 Profiles 配置
    • tio-boot 打包成 FastJar
    • 使用 GraalVM 构建 tio-boot Native 程序
    • 使用 Docker 部署 tio-boot
    • 部署到 Fly.io
    • 部署到 AWS Lambda
    • 到阿里云云函数
    • 使用 Deploy 工具部署
    • 胖包与瘦包的打包与部署
    • 使用 Jenkins 部署 Tio-Boot 项目
    • 使用 Nginx 反向代理 Tio-Boot
    • 使用 Supervisor 管理 Java 应用
  • 03_配置

    • 配置参数
    • 服务器监听器
    • 内置缓存系统 AbsCache
    • 使用 Redis 作为内部 Cache
    • 静态文件处理器
    • 基于域名的静态资源隔离
    • DecodeExceptionHandler
  • 04_原理

    • 生命周期
    • 请求处理流程
    • 重要的类
  • 05_json

    • Json
    • 接受 JSON 和响应 JSON
    • 响应实体类
  • 06_web

    • 概述
    • 文件上传
    • 接收请求参数
    • 接收日期参数
    • 接收数组参数
    • 返回字符串
    • 返回文本数据
    • 返回网页
    • 请求和响应字节
    • 文件下载
    • 返回视频文件并支持断点续传
    • http Session
    • Cookie
    • HttpRequest
    • HttpResponse
    • Resps
    • RespBodyVo
    • /zh/06_web/19.html
    • 全局异常处理器
    • 异步
    • 动态 返回 CSS 实现
    • 返回图片
    • Transfer-Encoding: chunked 实时音频播放
    • Server-Sent Events (SSE)
    • 接口访问统计
    • 接口请求和响应数据记录
    • 自定义 Handler 转发请求
    • 使用 HttpForwardHandler 转发所有请求
    • 跨域
    • 添加 Controller
    • 常用工具类
    • HTTP Basic 认证
    • WebJars
    • JProtobuf
  • 07_validate

    • 数据紧校验规范
    • 参数校验
  • 08_websocket

    • 使用 tio-boot 搭建 WebSocket 服务
    • WebSocket 聊天室项目示例
  • 09_java-db

    • java‑db
    • 操作数据库入门示例
    • SQL 模板
    • 数据源配置与使用
    • ActiveRecord
    • Model
    • 生成器与 Model
    • Db 工具类
    • 批量操作
    • 数据库事务处理
    • Cache 缓存
    • Dialect 多数据库支持
    • 表关联操作
    • 复合主键
    • Oracle 支持
    • Enjoy SQL 模板
    • Java-DB 整合 Enjoy 模板最佳实践
    • 多数据源支持
    • 独立使用 ActiveRecord
    • 调用存储过程
    • java-db 整合 Guava 的 Striped 锁优化
    • 生成 SQL
    • 通过实体类操作数据库
    • java-db 读写分离
    • Spring Boot 整合 Java-DB
    • like 查询
    • 常用操作示例
    • Druid 监控集成指南
    • SQL 统计
  • 10_api-table

    • ApiTable 概述
    • 使用 ApiTable 连接 SQLite
    • 使用 ApiTable 连接 Mysql
    • 使用 ApiTable 连接 Postgres
    • 使用 ApiTable 连接 TDEngine
    • 使用 api-table 连接 oracle
    • 使用 api-table 连接 mysql and tdengine 多数据源
    • EasyExcel 导出
    • EasyExcel 导入
    • TQL(Table SQL)前端输入规范
    • ApiTable 实现增删改查
    • 数组类型
    • 单独使用 ApiTable
  • 11_aop

    • JFinal-aop
    • Aop 工具类
    • 配置
    • 配置
    • 独立使用 JFinal Aop
    • @AImport
    • 原理解析
  • 12_cache

    • Caffine
    • Jedis-redis
    • hutool RedisDS
    • Redisson
    • Caffeine and redis
    • CacheUtils 工具类
    • 使用 CacheUtils 整合 caffeine 和 redis 实现的两级缓存
    • 使用 java-db 整合 ehcache
    • 使用 java-db 整合 redis
    • Java DB Redis 相关 Api
    • redis 使用示例
  • 13_认证和权限

    • hutool-JWT
    • FixedTokenInterceptor
    • 使用内置 TokenManager 实现登录
    • 用户系统
    • 重置密码
    • 匿名登录
    • Google 登录
    • 权限校验注解
    • Sa-Token
    • sa-token 登录注册
    • StpUtil.isLogin() 源码解析
    • 短信登录
    • 移动端微信登录实现指南
    • 移动端重置密码
  • 14_i18n

    • i18n
  • 15_enjoy

    • tio-boot 整合 Enjoy 模版引擎文档
    • 引擎配置
    • 表达式
    • 指令
    • 注释
    • 原样输出
    • Shared Method 扩展
    • Shared Object 扩展
    • Extension Method 扩展
    • Spring boot 整合
    • 独立使用 Enjoy
    • tio-boot enjoy 自定义指令 localeDate
    • PromptEngine
    • Enjoy 入门示例-擎渲染大模型请求体
    • Enjoy 使用示例
  • 16_定时任务

    • Quartz 定时任务集成指南
    • 分布式定时任务 xxl-jb
    • cron4j 使用指南
  • 17_tests

    • TioBootTest 类
  • 18_tio

    • TioBootServer
    • tio-core
    • 内置 TCP 处理器
    • 独立启动 UDPServer
    • 使用内置 UDPServer
    • t-io 消息处理流程
    • tio-运行原理详解
    • TioConfig
    • ChannelContext
    • Tio 工具类
    • 业务数据绑定
    • 业务数据解绑
    • 发送数据
    • 关闭连接
    • Packet
    • 监控: 心跳
    • 监控: 客户端的流量数据
    • 监控: 单条 TCP 连接的流量数据
    • 监控: 端口的流量数据
    • 单条通道统计: ChannelStat
    • 所有通道统计: GroupStat
    • 资源共享
    • 成员排序
    • ssl
    • DecodeRunnable
    • 使用 AsynchronousSocketChannel 响应数据
    • 拉黑 IP
    • 深入解析 Tio 源码:构建高性能 Java 网络应用
  • 19_aio

    • ByteBuffer
    • AIO HTTP 服务器
    • 自定义和线程池和池化 ByteBuffer
    • AioHttpServer 应用示例 IP 属地查询
    • 手写 AIO Http 服务器
  • 20_netty

    • Netty TCP Server
    • Netty Web Socket Server
    • 使用 protoc 生成 Java 包文件
    • Netty WebSocket Server 二进制数据传输
    • Netty 组件详解
  • 21_netty-boot

    • Netty-Boot
    • 原理解析
    • 整合 Hot Reload
    • 整合 数据库
    • 整合 Redis
    • 整合 Elasticsearch
    • 整合 Dubbo
    • Listener
    • 文件上传
    • 拦截器
    • Spring Boot 整合 Netty-Boot
    • SSL 配置指南
    • ChannelInitializer
    • Reserve
  • 22_MQ

    • Mica-mqtt
    • EMQX
    • Disruptor
  • 23_tio-utils

    • tio-utils
    • HttpUtils
    • Notification
    • 邮箱
    • JSON
    • 读取文件
    • Base64
    • 上传和下载
    • Http
    • Telegram
    • RsaUtils
    • EnvUtils 使用文档
    • 系统监控
    • 毫秒并发 ID (MCID) 生成方案
  • 24_tio-http-server

    • 使用 Tio-Http-Server 搭建简单的 HTTP 服务
    • tio-boot 添加 HttpRequestHandler
    • 在 Android 上使用 tio-boot 运行 HTTP 服务
    • tio-http-server-native
    • handler 常用操作
  • 25_tio-websocket

    • WebSocket 服务器
    • WebSocket Client
  • 26_tio-im

    • 通讯协议文档
    • ChatPacket.proto 文档
    • java protobuf
    • 数据表设计
    • 创建工程
    • 登录
    • 历史消息
    • 发消息
  • 27_mybatis

    • Tio-Boot 整合 MyBatis
    • 使用配置类方式整合 MyBatis
    • 整合数据源
    • 使用 mybatis-plus 整合 tdengine
    • 整合 mybatis-plus
  • 28_mongodb

    • tio-boot 使用 mongo-java-driver 操作 mongodb
  • 29_elastic-search

    • Elasticsearch
    • JavaDB 整合 ElasticSearch
    • Elastic 工具类使用指南
    • Elastic-search 注意事项
    • ES 课程示例文档
  • 30_magic-script

    • tio-boot 整合 magic-script
  • 31_groovy

    • tio-boot 整合 Groovy
  • 32_firebase

    • 整合 google firebase
    • Firebase Storage
    • Firebase Authentication
    • 使用 Firebase Admin SDK 进行匿名用户管理与自定义状态标记
    • 导出用户
    • 注册回调
    • 登录注册
  • 33_文件存储

    • 文件上传数据表
    • 本地存储
    • 使用 AWS S3 存储文件并整合到 Tio-Boot 项目中
    • 存储文件到 腾讯 COS
  • 34_spider

    • jsoup
    • 爬取 z-lib.io 数据
    • 整合 WebMagic
    • WebMagic 示例:爬取学校课程数据
    • Playwright
    • Flexmark (Markdown 处理器)
    • tio-boot 整合 Playwright
    • 缓存网页数据
  • 36_integration_thirty_party

    • tio-boot 整合 okhttp
    • 整合 GrpahQL
    • 集成 Mailjet
    • 整合 ip2region
    • 整合 GeoLite 离线库
    • 整合 Lark 机器人指南
    • 集成 Lark Mail 实现邮件发送
    • Thymeleaf
    • Swagger
    • Clerk 验证
  • 37_dubbo

    • 概述
    • dubbo 2.6.0
    • dubbo 2.6.0 调用过程
    • dubbo 3.2.0
  • 38_spring

    • Spring Boot Web 整合 Tio Boot
    • spring-boot-starter-webflux 整合 tio-boot
    • Tio Boot 整合 Spring Boot Starter
    • Tio Boot 整合 Spring Boot Starter Data Redis 指南
  • 39_spring-cloud

    • tio-boot spring-cloud
  • 40_mysql

    • 使用 Docker 运行 MySQL
    • /zh/42_mysql/02.html
  • 41_postgresql

    • PostgreSQL 安装
    • PostgreSQL 主键自增
    • PostgreSQL 日期类型
    • Postgresql 金融类型
    • PostgreSQL 数组类型
    • PostgreSQL 全文检索
    • PostgreSQL 查询优化
    • 获取字段类型
    • PostgreSQL 向量
    • PostgreSQL 优化向量查询
    • PostgreSQL 其他
  • 43_oceanbase

    • 快速体验 OceanBase 社区版
    • 快速上手 OceanBase 数据库单机部署与管理
    • 诊断集群性能
    • 优化 SQL 性能指南
    • /zh/43_oceanbase/05.html
  • 50_media

    • JAVE 提取视频中的声音
    • Jave 提取视频中的图片
    • /zh/50_media/03.html
  • 51_asr

    • Whisper-JNI
  • 54_native-media

    • java-native-media
    • JNI 入门示例
    • mp3 拆分
    • mp4 转 mp3
    • 使用 libmp3lame 实现高质量 MP3 编码
    • Linux 编译
    • macOS 编译
    • 从 JAR 包中加载本地库文件
    • 支持的音频和视频格式
    • 任意格式转为 mp3
    • 通用格式转换
    • 通用格式拆分
    • 视频合并
    • VideoToHLS
    • split_video_to_hls 支持其他语言
    • 持久化 HLS 会话
  • 55_telegram4j

    • 数据库设计
    • /zh/55_telegram4j/02.html
    • 基于 MTProto 协议开发 Telegram 翻译机器人
    • 过滤旧消息
    • 保存机器人消息
    • 定时推送
    • 增加命令菜单
    • 使用 telegram-Client
    • 使用自定义 StoreLayout
    • 延迟测试
    • Reactor 错误处理
    • Telegram4J 常见错误处理指南
  • 56_telegram-bots

    • TelegramBots 入门指南
    • 使用工具库 telegram-bot-base 开发翻译机器人
  • 60_LLM

    • 简介
    • AI 问答
    • /zh/60_LLM/03.html
    • /zh/60_LLM/04.html
    • 增强检索(RAG)
    • 结构化数据检索
    • 搜索+AI
    • 集成第三方 API
    • 后置处理
    • 推荐问题生成
    • 连接代码执行器
    • 避免 GPT 混乱
    • /zh/60_LLM/13.html
  • 61_ai_agent

    • 数据库设计
    • 示例问题管理
    • 会话管理
    • 历史记录
    • 对接 Perplexity API
    • 意图识别与生成提示词
    • 智能问答模块设计与实现
    • 文件上传与解析文档
    • 翻译
    • 名人搜索功能实现
    • Ai studio gemini youbue 问答使用说明
    • 自建 YouTube 字幕问答系统
    • 自建 获取 youtube 字幕服务
    • 通用搜索
    • /zh/61_ai_agent/15.html
    • 16
    • 17
    • 18
    • 在 tio-boot 应用中整合 ai-agent
    • 16
  • 62_translator

    • 简介
  • 63_knowlege_base

    • 数据库设计
    • 用户登录实现
    • 模型管理
    • 知识库管理
    • 文档拆分
    • 片段向量
    • 命中测试
    • 文档管理
    • 片段管理
    • 问题管理
    • 应用管理
    • 向量检索
    • 推理问答
    • 问答模块
    • 统计分析
    • 用户管理
    • api 管理
    • 存储文件到 S3
    • 文档解析优化
    • 片段汇总
    • 段落分块与检索
    • 多文档解析
    • 对话日志
    • 检索性能优化
    • Milvus
    • 文档解析方案和费用对比
    • 离线运行向量模型
  • 64_ai-search

    • ai-search 项目简介
    • ai-search 数据库文档
    • ai-search SearxNG 搜索引擎
    • ai-search Jina Reader API
    • ai-search Jina Search API
    • ai-search 搜索、重排与读取内容
    • ai-search PDF 文件处理
    • ai-search 推理问答
    • Google Custom Search JSON API
    • ai-search 意图识别
    • ai-search 问题重写
    • ai-search 系统 API 接口 WebSocket 版本
    • ai-search 搜索代码实现 WebSocket 版本
    • ai-search 生成建议问
    • ai-search 生成问题标题
    • ai-search 历史记录
    • Discover API
    • 翻译
    • Tavily Search API 文档
    • 对接 Tavily Search
    • 火山引擎 DeepSeek
    • 对接 火山引擎 DeepSeek
    • ai-search 搜索代码实现 SSE 版本
    • jar 包部署
    • Docker 部署
    • 爬取一个静态网站的所有数据
    • 网页数据预处理
    • 网页数据检索与问答流程整合
  • 65_java-linux

    • Java 执行 python 代码
    • 通过大模型执行 Python 代码
    • MCP 协议
    • Cline 提示词
    • Cline 提示词-中文版本
  • 66_manim

    • 简介
    • Manim 开发环境搭建
    • 生成场景提示词
    • 生成代码
    • 完整脚本示例
    • 语音合成系统
    • Fish.audio TTS 接口说明文档与 Java 客户端封装
    • 整合 fishaudio 到 java-uni-ai-server 项目
    • 执行 Python (Manim) 代码
    • 使用 SSE 流式传输生成进度的实现文档
    • 整合全流程完整文档
    • HLS 动态推流技术文档
    • manim 分场景生成代码
    • 分场景运行代码及流式播放支持
    • 分场景业务端完整实现流程
    • Maiim布局管理器
    • 仅仅生成场景代码
    • 使用 modal 运行 manim 代码
    • Python 使用 Modal GPU 加速渲染
    • Modal 平台 GPU 环境下运行 Manim
    • Modal Manim OpenGL 安装与使用
    • 优化 GPU 加速
    • 生成视频封面流程
    • Java 调用 manim 命令 执行代码 生成封面
    • Manim 图像生成服务客户端文档
    • manim render help
    • 显示 中文公式
    • manimgl
    • EGL
    • /zh/66_manim/30.html
    • /zh/66_manim/31.html
    • 成本核算
    • /zh/66_manim/33.html
  • 70_tio-boot-admin

    • 入门指南
    • 初始化数据
    • token 存储
    • 与前端集成
    • 文件上传
    • 网络请求
    • 图片管理
    • /zh/70_tio-boot-admin/08.html
    • Word 管理
    • PDF 管理
    • 文章管理
    • 富文本编辑器
  • 71_tio-boot

    • /zh/71_tio-boot/01.html
    • Swagger 整合到 Tio-Boot 中的指南
    • HTTP/1.1 Pipelining 性能测试报告
  • 80_性能测试

    • 压力测试 - tio-http-serer
    • 压力测试 - tio-boot
    • 压力测试 - tio-boot-native
    • 压力测试 - netty-boot
    • 性能测试对比
    • TechEmpower FrameworkBenchmarks
    • 压力测试 - tio-boot 12 C 32G
  • 99_案例

    • 封装 IP 查询服务
    • tio-boot 案例 - 全局异常捕获与企业微信群通知
    • tio-boot 案例 - 文件上传和下载
    • tio-boot 案例 - 整合 ant design pro 增删改查
    • tio-boot 案例 - 流失响应
    • tio-boot 案例 - 增强检索
    • tio-boot 案例 - 整合 function call
    • tio-boot 案例 - 定时任务 监控 PostgreSQL、Redis 和 Elasticsearch
    • Tio-Boot 案例:使用 SQLite 整合到登录注册系统
    • tio-boot 案例 - 执行 shell 命令

基于 HTTP 协议开发 Telegram 翻译机器人

  • 1. 简介
  • 2. 协议支持
  • 3. 配置 Telegram 机器人
    • 3.1 创建 Telegram 机器人
    • 3.2 设置 Webhook 地址
  • 4. 提示词配置
    • 4.1 提示词说明
  • 5. 开发实现
    • 5.1 TranslateAdminAppConfig
    • 5.2 TranslatorTextVo 类
    • 5.3 TranslatorService
    • 5.4 测试类
  • 6. Tio Boot 整合 Telegram Bot
    • 6.1 配置 Telegram Bot Token
    • 6.2 TelegramBotConfig 类
    • 6.3 TelegramWebhookController 类
  • 7. 测试翻译功能
    • 7.1 测试步骤
    • 7.2 示例
  • 8. 总结
  • 9. 开源地址

本文档旨在指导开发者如何使用 HTTP 协议开发一个具有翻译功能的 Telegram 机器人。文中详细描述了机器人的创建、Webhook 配置、翻译提示词编写、翻译服务的实现以及 Tio Boot 与 Telegram Bot 的整合,同时附有完整的 Java 代码示例,便于开发者参考与实践。


1. 简介

Telegram 机器人是一种运行在 Telegram 平台上、能够与用户进行即时交互的自动化应用程序。通过借助 HTTP 协议与 Webhook 技术,机器人能及时接收用户消息,并做出响应。本指南主要介绍如何搭建一个具备自动语言检测和翻译功能的 Telegram 机器人,涵盖了以下关键点:

  • HTTP 协议支持:主要通过 Webhook 与服务器通信;
  • 提示词配置:为翻译模型提供明确的翻译指令;
  • 翻译服务实现:包括文本拆分、缓存管理、翻译请求构造等;
  • Tio Boot 整合:实现 Telegram Bot 的注册与高效管理。

2. 协议支持

Telegram 机器人开发支持两种主要协议:

  1. HTTP 协议
    通过 Webhook 方式接收和发送消息,此方案适用于大多数业务场景,配置简单、部署灵活。

  2. MTProto 协议
    Telegram 自有的专用通信协议,适用于对性能和安全性要求较高的场景。

本项目主要使用 HTTP 协议 进行开发,利用 Webhook 接收客户端请求,再将翻译结果返回给用户。


3. 配置 Telegram 机器人

在正式开发之前,需要完成以下两个步骤的配置:

3.1 创建 Telegram 机器人

首先,通过 Telegram 内的 BotFather 创建一个新的机器人,并获取相应的 API Token。该 Token 是后续调用 Telegram 接口的凭证。

3.2 设置 Webhook 地址

配置机器人的 Webhook 地址,使 Telegram 能够将用户消息推送到您的服务器。请确保服务器支持 HTTPS 访问,并且 Webhook 地址可被外部访问。详细配置步骤参见如下文档链接:

设置 Webhook


4. 提示词配置

为了实现高质量的翻译功能,我们需要定义一个提示词文件 src/main/resources/prompts/translator_prompt.txt。该文件用于指导翻译模型如何执行翻译操作。具体内容如下:

You are a helpful translator.
- Please translate the following #(src_lang) into #(dst_lang).
- Preserve the format of the source content during translation.
- Do not provide any explanations or text apart from the translation.

source text:
#(source_text)

4.1 提示词说明

  • src_lang:表示源语言(例如 "Chinese")。
  • dst_lang:表示目标语言(例如 "English")。
  • source_text:需要翻译的文本内容。

这段提示词指示翻译模型仅返回纯粹的翻译结果,不添加额外的解释或说明,从而保证最终输出的内容格式与源文保持一致。


5. 开发实现

接下来介绍项目中关键的 Java 类和方法,详细说明各个模块的作用及工作流程。

5.1 TranslateAdminAppConfig

该类用于初始化 Tio Boot Admin 后台的数据库配置,以便系统能正确管理和存储翻译记录。

package com.litongjava.gpt.translator.config;

import com.litongjava.annotation.AConfiguration;
import com.litongjava.annotation.Initialization;
import com.litongjava.tio.boot.admin.config.TioAdminDbConfiguration;

@AConfiguration
public class TranslateAdminAppConfig {

  @Initialization
  public void config() {
    new TioAdminDbConfiguration().config();
  }
}

说明:
通过 @AConfiguration 与 @Initialization 注解实现自动配置,在应用启动时调用 config() 方法,从而完成后台数据库管理模块的初始化设置。

5.2 TranslatorTextVo 类

用于封装翻译请求的关键信息,包括源文本、源语言和目标语言。

package com.litongjava.gpt.translator.vo;

import lombok.AllArgsConstructor;
import lombok.Data;
import lombok.NoArgsConstructor;

@Data
@NoArgsConstructor
@AllArgsConstructor
public class TranslatorTextVo {
  // 例如:"今天的任务你完成了吗?", Chinese, English
  private String srcText, srcLang, destLang;
}

说明:
此类利用 Lombok 自动生成 getter、setter、无参及全参构造函数,确保代码简洁,同时使数据传输更加便捷。

5.3 TranslatorService

这是整个项目最核心的类,负责以下工作:

  • 翻译请求构建与处理
    利用 JFinal 模板引擎加载提示词文件,并填充源语言、目标语言及要翻译的文本,构造出发送给翻译模型的完整提示信息。
  • 缓存机制
    通过 MD5 值检查是否存在翻译缓存,避免重复调用翻译模型,从而提高效率。
  • 文本拆分
    若输入文本超过最大令牌数限制,则会根据 Markdown 结构或通过递归二分法对文本进行拆分,保证每次请求的文本长度在合理范围内。
  • 记录翻译信息
    翻译过程的详细信息(如耗时、使用的令牌数量等)会被保存到数据库中,便于后续统计和分析。

以下是完整的代码示例:

package com.litongjava.gpt.translator.services;

import java.util.ArrayList;
import java.util.HashMap;
import java.util.List;
import java.util.Map;

import com.jfinal.template.Template;
import com.litongjava.db.activerecord.Db;
import com.litongjava.db.activerecord.Row;
import com.litongjava.gemini.GeminiClient;
import com.litongjava.gemini.GoogleGeminiModels;
import com.litongjava.gpt.translator.constant.TableNames;
import com.litongjava.gpt.translator.vo.TranslatorTextVo;
import com.litongjava.template.PromptEngine;
import com.litongjava.tio.utils.crypto.Md5Utils;
import com.litongjava.tio.utils.snowflake.SnowflakeIdUtils;
import com.litongjava.utils.TokenUtils;

public class TranslatorService {

  // Define the maximum number of tokens per request
  private static final int MAX_TOKENS_PER_REQUEST = 1048576 / 3;

  /**
   * Translate method that handles splitting the text if it exceeds the token limit.
   */
  public String translate(String chatId, TranslatorTextVo translatorTextVo) {
    String srcText = translatorTextVo.getSrcText();
    String md5 = Md5Utils.getMD5(srcText);
    Row record = Db.findColumnsById(TableNames.max_kb_sentence_tanslate_cache, "dst_text", "md5", md5);
    String dstText = null;
    if (record != null) {
      dstText = record.getStr("dst_text");
      if (dstText != null) {
        return dstText;
      }
    }

    // Split the srcText into chunks if necessary
    int countTokens = TokenUtils.countTokens(srcText);
    StringBuilder translatedBuilder = new StringBuilder();
    long totalStart = System.currentTimeMillis();
    if (countTokens > MAX_TOKENS_PER_REQUEST) {
      List<String> textChunks = splitTextIntoChunks(srcText, countTokens, MAX_TOKENS_PER_REQUEST);

      for (String chunk : textChunks) {
        TranslatorTextVo chunkVo = new TranslatorTextVo();
        chunkVo.setSrcLang(translatorTextVo.getSrcLang());
        chunkVo.setDestLang(translatorTextVo.getDestLang());
        chunkVo.setSrcText(chunk);

        long start = System.currentTimeMillis();
        String translatedChunk = this.translate(chunkVo);
        translatedBuilder.append(translatedChunk);
        long end = System.currentTimeMillis();

        // save each chunk's translation to the cache
        saveTranslation(chatId, translatorTextVo, chunk, translatedChunk, end - start);
      }
    } else {
      TranslatorTextVo chunkVo = new TranslatorTextVo();
      chunkVo.setSrcLang(translatorTextVo.getSrcLang());
      chunkVo.setDestLang(translatorTextVo.getDestLang());
      chunkVo.setSrcText(srcText);

      String translatedChunk = this.translate(chunkVo);

      translatedBuilder.append(translatedChunk);

    }

    long totalEnd = System.currentTimeMillis();
    String finalTranslatedText = translatedBuilder.toString().trim();

    // Optionally, save the combined translation to the cache
    saveCombinedTranslation(chatId, translatorTextVo, srcText, finalTranslatedText, totalEnd - totalStart);

    return finalTranslatedText;
  }

  /**
   * Helper method to split text into chunks based on the maximum token limit.
   */
  /**
   * Splits text into chunks based on the maximum token limit using a recursive binary splitting approach.
   * This method prioritizes splitting by Markdown structure (e.g., paragraphs) to preserve formatting.
   */
  public List<String> splitTextIntoChunks(String text, int tokenCount, int maxTokens) {
    List<String> chunks = new ArrayList<>();
    splitRecursive(text, tokenCount, maxTokens, chunks);
    return chunks;
  }

  private void splitRecursive(String text, int tokenCount, int maxTokens, List<String> chunks) {
    if (tokenCount <= maxTokens) {
      chunks.add(text.trim());
      return;
    }

    // Attempt to split by Markdown paragraphs
    String[] paragraphs = text.split("\n{2,}");
    if (paragraphs.length > 1) {
      for (String para : paragraphs) {
        splitRecursive(para, tokenCount, maxTokens, chunks);
      }
      return;
    }

    // Attempt to split by Markdown headings
    String[] headings = text.split("(?m)^#{1,6} ");
    if (headings.length > 1) {
      for (String section : headings) {
        // Add the heading back since split removes the delimiter
        String trimmedSection = section.trim();
        if (!trimmedSection.startsWith("#")) {
          trimmedSection = "#" + trimmedSection;
        }
        splitRecursive(trimmedSection, tokenCount, maxTokens, chunks);
      }
      return;
    }

    // If unable to split by structure, perform binary split
    int mid = text.length() / 2;
    // Ensure we split at a whitespace to avoid breaking words
    while (mid < text.length() && !Character.isWhitespace(text.charAt(mid))) {
      mid++;
    }
    if (mid == text.length()) {
      // No whitespace found; force split
      mid = text.length() / 2;
    }

    String firstHalf = text.substring(0, mid);
    String secondHalf = text.substring(mid);

    splitRecursive(firstHalf, tokenCount, maxTokens, chunks);
    splitRecursive(secondHalf, tokenCount, maxTokens, chunks);
  }

  /**
   * Save each chunk's translation to the cache.
   */
  private void saveTranslation(String chatId, TranslatorTextVo originalVo, String srcChunk, String dstChunk, long elapsed) {
    String md5 = Md5Utils.getMD5(srcChunk);
    long id = SnowflakeIdUtils.id();
    Row saveRecord = Row.by("id", id).set("md5", md5).set("from", "telegram").set("user_id", chatId)
        //
        .set("src_lang", originalVo.getSrcLang()).set("src_text", srcChunk)
        //
        .set("dst_lang", originalVo.getDestLang()).set("dst_text", dstChunk).set("elapsed", elapsed);
    ;
    //
    Db.save(TableNames.max_kb_sentence_tanslate_cache, saveRecord);
  }

  /**
   * Optionally save the combined translation to the cache.
   */
  private void saveCombinedTranslation(String chatId, TranslatorTextVo originalVo, String srcText, String dstText, long elapsed) {
    String md5 = Md5Utils.getMD5(srcText);
    long id = SnowflakeIdUtils.id();
    Row saveRecord = Row.by("id", id).set("md5", md5).set("from", "telegram").set("user_id", chatId)
        //
        .set("src_lang", originalVo.getSrcLang()).set("src_text", srcText)
        //
        .set("dst_lang", originalVo.getDestLang()).set("dst_text", dstText).set("elapsed", elapsed);
    Db.save(TableNames.max_kb_sentence_tanslate_cache, saveRecord);
  }

  /**
   * Original translate method that translates a single chunk.
   */
  public String translate(TranslatorTextVo translatorTextVo) {
    String srcLang = translatorTextVo.getSrcLang();
    String destLang = translatorTextVo.getDestLang();
    String srcText = translatorTextVo.getSrcText();

    Template template = PromptEngine.getTemplate("translator_prompt.txt");
    Map<String, String> values = new HashMap<>();

    values.put("src_lang", srcLang);
    values.put("dst_lang", destLang);
    values.put("source_text", srcText);

    String prompt = template.renderToString(values);
    String response = GeminiClient.chatWithModel(GoogleGeminiModels.GEMINI_2_0_FLASH_EXP, "user", prompt);
    return response;
  }
}

说明:

  1. 缓存机制:方法首先计算输入文本的 MD5 值,检查数据库缓存,若已有翻译记录则直接返回结果;
  2. 文本拆分:当文本超出模型令牌限制时,通过递归方法按 Markdown 段落或标题进行拆分,确保每个子块在合理范围内;
  3. 提示词渲染:通过 JFinal 模板引擎加载 translator_prompt.txt 并填充相关变量,生成完整的提示内容发送至翻译模型;
  4. 翻译记录保存:分别保存各块及整体翻译记录,便于后续数据统计和重复请求的快速响应。

5.4 测试类

以下测试类用于验证 TranslatorService 的正确性,通过单元测试来确保翻译功能的有效性。

package com.litongjava.gpt.translator.services;

import org.junit.Test;

import com.litongjava.gpt.translator.config.TranslateAdminAppConfig;
import com.litongjava.gpt.translator.vo.TranslatorTextVo;
import com.litongjava.jfinal.aop.Aop;
import com.litongjava.tio.boot.testing.TioBootTest;
import com.litongjava.tio.utils.environment.EnvUtils;

public class TranslatorServiceTest {

  @Test
  public void translate() {
    EnvUtils.load();
    TranslatorTextVo translatorTextVo = new TranslatorTextVo();
    translatorTextVo.setDestLang("English").setSrcLang("Chinese").setSrcText("今天天气怎么样");
    String translate = Aop.get(TranslatorService.class).translate(translatorTextVo);
    System.out.println(translate); //How is the weather today?
  }

  @Test
  public void translateWithTelegram() {
    TioBootTest.runWith(TranslateAdminAppConfig.class);
    TranslatorTextVo translatorTextVo = new TranslatorTextVo();
    translatorTextVo.setDestLang("English").setSrcLang("Chinese").setSrcText("今天天气怎么样,亲");
    String translate = Aop.get(TranslatorService.class).translate("001", translatorTextVo);
    System.out.println(translate); //How is the weather today?
  }
}

说明:
测试类中包含两种调用方式:

  • 第一种直接调用 translate 方法,不涉及 Telegram 上下文;
  • 第二种通过传入模拟的 chatId 测试结合 Telegram 环境的翻译请求。

6. Tio Boot 整合 Telegram Bot

本节详细讲解如何将翻译服务与 Telegram Bot 进行整合,借助 Tio Boot 实现消息接收与响应。

6.1 配置 Telegram Bot Token

在 app.properties 文件中加入如下配置:

telegram.bot.token=

说明:请将上述配置项的值替换为您在 BotFather 获取到的 Telegram Bot API Token。

6.2 TelegramBotConfig 类

该类负责初始化 Telegram Bot,加载 Token,并注册至 Telegram 管理类中,同时配置销毁钩子函数以保证资源释放。

package com.litongjava.gpt.translator.config;
import com.litongjava.annotation.AConfiguration;
import com.litongjava.annotation.Initialization;
import com.litongjava.hook.HookCan;
import com.litongjava.tio.utils.environment.EnvUtils;
import com.litongjava.tio.utils.telegram.Telegram;
import com.litongjava.tio.utils.telegram.TelegramBot;

@AConfiguration
public class TelegramBotConfig {

  @Initialization
  public void config() {
    String botToken = EnvUtils.getStr("telegram.bot.token");
    // 创建一个 Telegram bot 实例
    TelegramBot bot = new TelegramBot(botToken);
    // 将 bot 添加到 Telegram 管理类中
    Telegram.addBot(bot);

    // 添加销毁方法,确保在应用关闭时清理资源
    HookCan.me().addDestroyMethod(() -> {
      Telegram.clearBot();
    });
  }
}

说明:

  1. 从环境变量中获取机器人 Token,并据此创建 TelegramBot 实例;
  2. 注册到 Telegram 管理类中,方便后续消息发送;
  3. 配置销毁方法,避免应用关闭时残留资源。

6.3 TelegramWebhookController 类

TelegramWebhookController 用于处理 Telegram 推送来的 Webhook 请求,解析消息内容,调用翻译服务后将结果返回给用户。

package com.litongjava.gpt.translator.controller;

import com.alibaba.fastjson2.JSONObject;
import com.litongjava.annotation.RequestPath;
import com.litongjava.gpt.translator.services.TranslatorService;
import com.litongjava.gpt.translator.vo.TranslatorTextVo;
import com.litongjava.jfinal.aop.Aop;
import com.litongjava.tio.boot.http.TioRequestContext;
import com.litongjava.tio.http.common.HttpRequest;
import com.litongjava.tio.http.common.HttpResponse;
import com.litongjava.tio.utils.json.FastJson2Utils;
import com.litongjava.tio.utils.telegram.Telegram;

import lombok.extern.slf4j.Slf4j;

@Slf4j
@RequestPath("/telegram")
public class TelegramWebhookController {

  @RequestPath("/webhook")
  public HttpResponse handleTelegramWebhook(HttpRequest request) {
    String bodyString = request.getBodyString();

    JSONObject jsonObject = FastJson2Utils.parseObject(bodyString);
    JSONObject message = jsonObject.getJSONObject("message");

    JSONObject chat = message.getJSONObject("chat");
    String chatId = chat.getString("id");

    String text = message.getString("text");
    log.info("Received text: {}", text);

    // 根据文本内容设置源语言和目标语言
    String srcLang;
    String destLang;

    if (containsChinese(text)) {
      srcLang = "Chinese";
      destLang = "English";
    } else {
      srcLang = "English";
      destLang = "Chinese";
    }

    // 创建翻译请求对象
    TranslatorTextVo translatorTextVo = new TranslatorTextVo();
    translatorTextVo.setSrcText(text);
    translatorTextVo.setSrcLang(srcLang);
    translatorTextVo.setDestLang(destLang);
    String responseText;
    try {
      // 调用翻译服务
      responseText=Aop.get(TranslatorService.class).translate(chatId,translatorTextVo);
    } catch (Exception e) {
      log.error("Exception", e);
      responseText = "Exception: " + e.getMessage();
    }

    // 发送翻译结果回 Telegram
    Telegram.use().sendMessage(chatId.toString(), responseText);
    return TioRequestContext.getResponse();
  }

  /**
   * 判断文本中是否包含中文字符
   *
   * @param text 输入的文本
   * @return 如果包含中文字符则返回 true,否则返回 false
   */
  private boolean containsChinese(String text) {
    if (text == null || text.isEmpty()) {
      return false;
    }
    // 使用正则表达式检查是否包含中文字符
    return text.matches(".*[\\u4e00-\\u9fa5]+.*");
  }
}

说明:

  1. 控制器通过 /telegram/webhook 路径接收来自 Telegram 的 Webhook 消息;
  2. 解析 JSON 数据,提取聊天 ID 和文本内容;
  3. 利用正则表达式判断文本是否包含中文,自动设置源语言和目标语言;
  4. 调用 TranslatorService 获取翻译结果,并使用 Telegram API 发送回复。

7. 测试翻译功能

完成开发及配置后,即可部署服务器并设置正确的 Webhook 地址,通过 Telegram 与机器人进行交互测试翻译功能。

7.1 测试步骤

  1. 启动服务器:确保服务器正常运行,并且 Webhook 地址已正确配置;
  2. 与机器人对话:在 Telegram 搜索您的机器人并发送需要翻译的文本消息;
  3. 查看翻译结果:机器人自动检测文本语言,并返回翻译后的内容给用户。

7.2 示例

  • 用户发送:你好,世界!
    机器人回复:Hello, World!

  • 用户发送:Good morning!
    机器人回复:早上好!


8. 总结

本文档详细介绍了如何使用 HTTP 协议开发一个具备翻译功能的 Telegram 机器人。通过以下几个步骤,您可以快速上手该项目:

  • 创建机器人 & 配置 Webhook:使用 BotFather 创建机器人并正确设置 Webhook 地址;
  • 编写提示词 & 翻译服务:定义翻译提示词,通过 Java 实现翻译服务,包括文本拆分、缓存管理与调用翻译模型;
  • 整合 Tio Boot 与 Telegram Bot:利用 Tio Boot 构建整合方案,实现消息的自动接收与回复。

项目提供了详细的代码示例与测试用例,开发者可根据自身需求进行扩展与定制。如果在开发过程中遇到问题,请参考相关文档或社区支持,持续完善您的翻译机器人。


9. 开源地址

项目的完整代码托管在 GitHub 上,欢迎访问、参考和体验:
https://github.com/litongjava/max-translator-bot
体验翻机器人:@maxtranslatorbot

Edit this page
Last Updated:
Contributors: Tong Li
Prev
数据库设计
Next
基于 MTProto 协议开发 Telegram 翻译机器人