Tio Boot DocsTio Boot Docs
Home
  • java-db
  • api-table
  • Enjoy
  • Tio Boot Admin
  • ai_agent
  • translator
  • knowlege_base
  • ai-search
  • 案例
Abount
  • Github
  • Gitee
Home
  • java-db
  • api-table
  • Enjoy
  • Tio Boot Admin
  • ai_agent
  • translator
  • knowlege_base
  • ai-search
  • 案例
Abount
  • Github
  • Gitee
  • 01_tio-boot 简介

    • tio-boot:新一代高性能 Java Web 开发框架
    • tio-boot 入门示例
    • Tio-Boot 配置 : 现代化的配置方案
    • tio-boot 整合 Logback
    • tio-boot 整合 hotswap-classloader 实现热加载
    • 自行编译 tio-boot
    • 最新版本
    • 开发规范
  • 02_部署

    • 使用 Maven Profile 实现分环境打包 tio-boot 项目
    • Maven 项目配置详解:依赖与 Profiles 配置
    • tio-boot 打包成 FastJar
    • 使用 GraalVM 构建 tio-boot Native 程序
    • 使用 Docker 部署 tio-boot
    • 部署到 Fly.io
    • 部署到 AWS Lambda
    • 到阿里云云函数
    • 使用 Deploy 工具部署
    • 胖包与瘦包的打包与部署
    • 使用 Jenkins 部署 Tio-Boot 项目
    • 使用 Nginx 反向代理 Tio-Boot
    • 使用 Supervisor 管理 Java 应用
  • 03_配置

    • 配置参数
    • 服务器监听器
    • 内置缓存系统 AbsCache
    • 使用 Redis 作为内部 Cache
    • 静态文件处理器
    • 基于域名的静态资源隔离
    • DecodeExceptionHandler
  • 04_原理

    • 生命周期
    • 请求处理流程
    • 重要的类
  • 05_json

    • Json
    • 接受 JSON 和响应 JSON
    • 响应实体类
  • 06_web

    • 概述
    • 文件上传
    • 接收请求参数
    • 接收日期参数
    • 接收数组参数
    • 返回字符串
    • 返回文本数据
    • 返回网页
    • 请求和响应字节
    • 文件下载
    • 返回视频文件并支持断点续传
    • http Session
    • Cookie
    • HttpRequest
    • HttpResponse
    • Resps
    • RespBodyVo
    • /zh/06_web/19.html
    • 全局异常处理器
    • 异步
    • 动态 返回 CSS 实现
    • 返回图片
    • Transfer-Encoding: chunked 实时音频播放
    • Server-Sent Events (SSE)
    • 接口访问统计
    • 接口请求和响应数据记录
    • 自定义 Handler 转发请求
    • 使用 HttpForwardHandler 转发所有请求
    • 跨域
    • 添加 Controller
    • 常用工具类
    • HTTP Basic 认证
    • WebJars
    • JProtobuf
  • 07_validate

    • 数据紧校验规范
    • 参数校验
  • 08_websocket

    • 使用 tio-boot 搭建 WebSocket 服务
    • WebSocket 聊天室项目示例
  • 09_java-db

    • java‑db
    • 操作数据库入门示例
    • SQL 模板
    • 数据源配置与使用
    • ActiveRecord
    • Model
    • 生成器与 Model
    • Db 工具类
    • 批量操作
    • 数据库事务处理
    • Cache 缓存
    • Dialect 多数据库支持
    • 表关联操作
    • 复合主键
    • Oracle 支持
    • Enjoy SQL 模板
    • Java-DB 整合 Enjoy 模板最佳实践
    • 多数据源支持
    • 独立使用 ActiveRecord
    • 调用存储过程
    • java-db 整合 Guava 的 Striped 锁优化
    • 生成 SQL
    • 通过实体类操作数据库
    • java-db 读写分离
    • Spring Boot 整合 Java-DB
    • like 查询
    • 常用操作示例
    • Druid 监控集成指南
    • SQL 统计
  • 10_api-table

    • ApiTable 概述
    • 使用 ApiTable 连接 SQLite
    • 使用 ApiTable 连接 Mysql
    • 使用 ApiTable 连接 Postgres
    • 使用 ApiTable 连接 TDEngine
    • 使用 api-table 连接 oracle
    • 使用 api-table 连接 mysql and tdengine 多数据源
    • EasyExcel 导出
    • EasyExcel 导入
    • TQL(Table SQL)前端输入规范
    • ApiTable 实现增删改查
    • 数组类型
    • 单独使用 ApiTable
  • 11_aop

    • JFinal-aop
    • Aop 工具类
    • 配置
    • 配置
    • 独立使用 JFinal Aop
    • @AImport
    • 原理解析
  • 12_cache

    • Caffine
    • Jedis-redis
    • hutool RedisDS
    • Redisson
    • Caffeine and redis
    • CacheUtils 工具类
    • 使用 CacheUtils 整合 caffeine 和 redis 实现的两级缓存
    • 使用 java-db 整合 ehcache
    • 使用 java-db 整合 redis
    • Java DB Redis 相关 Api
    • redis 使用示例
  • 13_认证和权限

    • hutool-JWT
    • FixedTokenInterceptor
    • 使用内置 TokenManager 实现登录
    • 用户系统
    • 重置密码
    • 匿名登录
    • Google 登录
    • 权限校验注解
    • Sa-Token
    • sa-token 登录注册
    • StpUtil.isLogin() 源码解析
    • 短信登录
    • 移动端微信登录实现指南
    • 移动端重置密码
  • 14_i18n

    • i18n
  • 15_enjoy

    • tio-boot 整合 Enjoy 模版引擎文档
    • 引擎配置
    • 表达式
    • 指令
    • 注释
    • 原样输出
    • Shared Method 扩展
    • Shared Object 扩展
    • Extension Method 扩展
    • Spring boot 整合
    • 独立使用 Enjoy
    • tio-boot enjoy 自定义指令 localeDate
    • PromptEngine
    • Enjoy 入门示例-擎渲染大模型请求体
    • Enjoy 使用示例
  • 16_定时任务

    • Quartz 定时任务集成指南
    • 分布式定时任务 xxl-jb
    • cron4j 使用指南
  • 17_tests

    • TioBootTest 类
  • 18_tio

    • TioBootServer
    • tio-core
    • 内置 TCP 处理器
    • 独立启动 UDPServer
    • 使用内置 UDPServer
    • t-io 消息处理流程
    • tio-运行原理详解
    • TioConfig
    • ChannelContext
    • Tio 工具类
    • 业务数据绑定
    • 业务数据解绑
    • 发送数据
    • 关闭连接
    • Packet
    • 监控: 心跳
    • 监控: 客户端的流量数据
    • 监控: 单条 TCP 连接的流量数据
    • 监控: 端口的流量数据
    • 单条通道统计: ChannelStat
    • 所有通道统计: GroupStat
    • 资源共享
    • 成员排序
    • ssl
    • DecodeRunnable
    • 使用 AsynchronousSocketChannel 响应数据
    • 拉黑 IP
    • 深入解析 Tio 源码:构建高性能 Java 网络应用
  • 19_aio

    • ByteBuffer
    • AIO HTTP 服务器
    • 自定义和线程池和池化 ByteBuffer
    • AioHttpServer 应用示例 IP 属地查询
    • 手写 AIO Http 服务器
  • 20_netty

    • Netty TCP Server
    • Netty Web Socket Server
    • 使用 protoc 生成 Java 包文件
    • Netty WebSocket Server 二进制数据传输
    • Netty 组件详解
  • 21_netty-boot

    • Netty-Boot
    • 原理解析
    • 整合 Hot Reload
    • 整合 数据库
    • 整合 Redis
    • 整合 Elasticsearch
    • 整合 Dubbo
    • Listener
    • 文件上传
    • 拦截器
    • Spring Boot 整合 Netty-Boot
    • SSL 配置指南
    • ChannelInitializer
    • Reserve
  • 22_MQ

    • Mica-mqtt
    • EMQX
    • Disruptor
  • 23_tio-utils

    • tio-utils
    • HttpUtils
    • Notification
    • 邮箱
    • JSON
    • 读取文件
    • Base64
    • 上传和下载
    • Http
    • Telegram
    • RsaUtils
    • EnvUtils 使用文档
    • 系统监控
    • 毫秒并发 ID (MCID) 生成方案
  • 24_tio-http-server

    • 使用 Tio-Http-Server 搭建简单的 HTTP 服务
    • tio-boot 添加 HttpRequestHandler
    • 在 Android 上使用 tio-boot 运行 HTTP 服务
    • tio-http-server-native
    • handler 常用操作
  • 25_tio-websocket

    • WebSocket 服务器
    • WebSocket Client
  • 26_tio-im

    • 通讯协议文档
    • ChatPacket.proto 文档
    • java protobuf
    • 数据表设计
    • 创建工程
    • 登录
    • 历史消息
    • 发消息
  • 27_mybatis

    • Tio-Boot 整合 MyBatis
    • 使用配置类方式整合 MyBatis
    • 整合数据源
    • 使用 mybatis-plus 整合 tdengine
    • 整合 mybatis-plus
  • 28_mongodb

    • tio-boot 使用 mongo-java-driver 操作 mongodb
  • 29_elastic-search

    • Elasticsearch
    • JavaDB 整合 ElasticSearch
    • Elastic 工具类使用指南
    • Elastic-search 注意事项
    • ES 课程示例文档
  • 30_magic-script

    • tio-boot 整合 magic-script
  • 31_groovy

    • tio-boot 整合 Groovy
  • 32_firebase

    • 整合 google firebase
    • Firebase Storage
    • Firebase Authentication
    • 使用 Firebase Admin SDK 进行匿名用户管理与自定义状态标记
    • 导出用户
    • 注册回调
    • 登录注册
  • 33_文件存储

    • 文件上传数据表
    • 本地存储
    • 使用 AWS S3 存储文件并整合到 Tio-Boot 项目中
    • 存储文件到 腾讯 COS
  • 34_spider

    • jsoup
    • 爬取 z-lib.io 数据
    • 整合 WebMagic
    • WebMagic 示例:爬取学校课程数据
    • Playwright
    • Flexmark (Markdown 处理器)
    • tio-boot 整合 Playwright
    • 缓存网页数据
  • 36_integration_thirty_party

    • tio-boot 整合 okhttp
    • 整合 GrpahQL
    • 集成 Mailjet
    • 整合 ip2region
    • 整合 GeoLite 离线库
    • 整合 Lark 机器人指南
    • 集成 Lark Mail 实现邮件发送
    • Thymeleaf
    • Swagger
    • Clerk 验证
  • 37_dubbo

    • 概述
    • dubbo 2.6.0
    • dubbo 2.6.0 调用过程
    • dubbo 3.2.0
  • 38_spring

    • Spring Boot Web 整合 Tio Boot
    • spring-boot-starter-webflux 整合 tio-boot
    • Tio Boot 整合 Spring Boot Starter
    • Tio Boot 整合 Spring Boot Starter Data Redis 指南
  • 39_spring-cloud

    • tio-boot spring-cloud
  • 40_mysql

    • 使用 Docker 运行 MySQL
    • /zh/42_mysql/02.html
  • 41_postgresql

    • PostgreSQL 安装
    • PostgreSQL 主键自增
    • PostgreSQL 日期类型
    • Postgresql 金融类型
    • PostgreSQL 数组类型
    • PostgreSQL 全文检索
    • PostgreSQL 查询优化
    • 获取字段类型
    • PostgreSQL 向量
    • PostgreSQL 优化向量查询
    • PostgreSQL 其他
  • 43_oceanbase

    • 快速体验 OceanBase 社区版
    • 快速上手 OceanBase 数据库单机部署与管理
    • 诊断集群性能
    • 优化 SQL 性能指南
    • /zh/43_oceanbase/05.html
  • 50_media

    • JAVE 提取视频中的声音
    • Jave 提取视频中的图片
    • /zh/50_media/03.html
  • 51_asr

    • Whisper-JNI
  • 54_native-media

    • java-native-media
    • JNI 入门示例
    • mp3 拆分
    • mp4 转 mp3
    • 使用 libmp3lame 实现高质量 MP3 编码
    • Linux 编译
    • macOS 编译
    • 从 JAR 包中加载本地库文件
    • 支持的音频和视频格式
    • 任意格式转为 mp3
    • 通用格式转换
    • 通用格式拆分
    • 视频合并
    • VideoToHLS
    • split_video_to_hls 支持其他语言
    • 持久化 HLS 会话
  • 55_telegram4j

    • 数据库设计
    • /zh/55_telegram4j/02.html
    • 基于 MTProto 协议开发 Telegram 翻译机器人
    • 过滤旧消息
    • 保存机器人消息
    • 定时推送
    • 增加命令菜单
    • 使用 telegram-Client
    • 使用自定义 StoreLayout
    • 延迟测试
    • Reactor 错误处理
    • Telegram4J 常见错误处理指南
  • 56_telegram-bots

    • TelegramBots 入门指南
    • 使用工具库 telegram-bot-base 开发翻译机器人
  • 60_LLM

    • 简介
    • AI 问答
    • /zh/60_LLM/03.html
    • /zh/60_LLM/04.html
    • 增强检索(RAG)
    • 结构化数据检索
    • 搜索+AI
    • 集成第三方 API
    • 后置处理
    • 推荐问题生成
    • 连接代码执行器
    • 避免 GPT 混乱
    • /zh/60_LLM/13.html
  • 61_ai_agent

    • 数据库设计
    • 示例问题管理
    • 会话管理
    • 历史记录
    • 对接 Perplexity API
    • 意图识别与生成提示词
    • 智能问答模块设计与实现
    • 文件上传与解析文档
    • 翻译
    • 名人搜索功能实现
    • Ai studio gemini youbue 问答使用说明
    • 自建 YouTube 字幕问答系统
    • 自建 获取 youtube 字幕服务
    • 通用搜索
    • /zh/61_ai_agent/15.html
    • 16
    • 17
    • 18
    • 在 tio-boot 应用中整合 ai-agent
    • 16
  • 62_translator

    • 简介
  • 63_knowlege_base

    • 数据库设计
    • 用户登录实现
    • 模型管理
    • 知识库管理
    • 文档拆分
    • 片段向量
    • 命中测试
    • 文档管理
    • 片段管理
    • 问题管理
    • 应用管理
    • 向量检索
    • 推理问答
    • 问答模块
    • 统计分析
    • 用户管理
    • api 管理
    • 存储文件到 S3
    • 文档解析优化
    • 片段汇总
    • 段落分块与检索
    • 多文档解析
    • 对话日志
    • 检索性能优化
    • Milvus
    • 文档解析方案和费用对比
    • 离线运行向量模型
  • 64_ai-search

    • ai-search 项目简介
    • ai-search 数据库文档
    • ai-search SearxNG 搜索引擎
    • ai-search Jina Reader API
    • ai-search Jina Search API
    • ai-search 搜索、重排与读取内容
    • ai-search PDF 文件处理
    • ai-search 推理问答
    • Google Custom Search JSON API
    • ai-search 意图识别
    • ai-search 问题重写
    • ai-search 系统 API 接口 WebSocket 版本
    • ai-search 搜索代码实现 WebSocket 版本
    • ai-search 生成建议问
    • ai-search 生成问题标题
    • ai-search 历史记录
    • Discover API
    • 翻译
    • Tavily Search API 文档
    • 对接 Tavily Search
    • 火山引擎 DeepSeek
    • 对接 火山引擎 DeepSeek
    • ai-search 搜索代码实现 SSE 版本
    • jar 包部署
    • Docker 部署
    • 爬取一个静态网站的所有数据
    • 网页数据预处理
    • 网页数据检索与问答流程整合
  • 65_java-linux

    • Java 执行 python 代码
    • 通过大模型执行 Python 代码
    • MCP 协议
    • Cline 提示词
    • Cline 提示词-中文版本
  • 66_manim

    • 简介
    • Manim 开发环境搭建
    • 生成场景提示词
    • 生成代码
    • 完整脚本示例
    • 语音合成系统
    • Fish.audio TTS 接口说明文档与 Java 客户端封装
    • 整合 fishaudio 到 java-uni-ai-server 项目
    • 执行 Python (Manim) 代码
    • 使用 SSE 流式传输生成进度的实现文档
    • 整合全流程完整文档
    • HLS 动态推流技术文档
    • manim 分场景生成代码
    • 分场景运行代码及流式播放支持
    • 分场景业务端完整实现流程
    • Maiim布局管理器
    • 仅仅生成场景代码
    • 使用 modal 运行 manim 代码
    • Python 使用 Modal GPU 加速渲染
    • Modal 平台 GPU 环境下运行 Manim
    • Modal Manim OpenGL 安装与使用
    • 优化 GPU 加速
    • 生成视频封面流程
    • Java 调用 manim 命令 执行代码 生成封面
    • Manim 图像生成服务客户端文档
    • manim render help
    • 显示 中文公式
    • manimgl
    • EGL
    • /zh/66_manim/30.html
    • /zh/66_manim/31.html
    • 成本核算
    • /zh/66_manim/33.html
  • 70_tio-boot-admin

    • 入门指南
    • 初始化数据
    • token 存储
    • 与前端集成
    • 文件上传
    • 网络请求
    • 图片管理
    • /zh/70_tio-boot-admin/08.html
    • Word 管理
    • PDF 管理
    • 文章管理
    • 富文本编辑器
  • 71_tio-boot

    • /zh/71_tio-boot/01.html
    • Swagger 整合到 Tio-Boot 中的指南
    • HTTP/1.1 Pipelining 性能测试报告
  • 80_性能测试

    • 压力测试 - tio-http-serer
    • 压力测试 - tio-boot
    • 压力测试 - tio-boot-native
    • 压力测试 - netty-boot
    • 性能测试对比
    • TechEmpower FrameworkBenchmarks
    • 压力测试 - tio-boot 12 C 32G
  • 99_案例

    • 封装 IP 查询服务
    • tio-boot 案例 - 全局异常捕获与企业微信群通知
    • tio-boot 案例 - 文件上传和下载
    • tio-boot 案例 - 整合 ant design pro 增删改查
    • tio-boot 案例 - 流失响应
    • tio-boot 案例 - 增强检索
    • tio-boot 案例 - 整合 function call
    • tio-boot 案例 - 定时任务 监控 PostgreSQL、Redis 和 Elasticsearch
    • Tio-Boot 案例:使用 SQLite 整合到登录注册系统
    • tio-boot 案例 - 执行 shell 命令

视频合并

本方案的主要思路是调用 FFmpeg 的开发库,在 C 层实现“流复制(stream copy)”模式下的多个视频和音频文件的合并操作,并通过 JNI 供 Java 层调用。视频和音频合并过程中针对不同输入文件时长不一致的问题,采用了统一全局时间轴(global offset)的策略,确保合并后各个媒体流在播放时不会出现音视频不同步或音频播放速度异常的问题。

一、Java 接口定义

在 Java 层通过 JNI 声明 native 方法 merge,该方法接收多个输入文件路径和输出文件路径,调用底层 C 函数实现视频合并。代码如下:

/**
 * Merges multiple video/audio files into a single output file using stream copy.
 * This method calls a native C function that utilizes the FFmpeg command-line tool.
 * The input files should ideally have compatible stream parameters (codec, resolution, etc.)
 * for stream copy to work reliably and efficiently.
 *
 * @param inputPaths An array of absolute paths to the input media files.
 * @param outputPath The absolute path for the merged output media file.
 * @return true if the merging process initiated by FFmpeg completes successfully (exit code 0), false otherwise.
 * @throws NullPointerException if inputPaths or outputPath is null, or if inputPaths contains null elements.
 * @throws IllegalArgumentException if inputPaths contains fewer than 2 files.
 */
public static native boolean merge(String[] inputPaths, String outputPath);

二、Java 测试代码

下面的测试代码演示了如何读取指定目录下的所有 .mp4 文件,并调用 NativeMedia.merge 方法合并到指定输出文件。测试代码利用了 Java 的文件操作和 JSON 格式输出工具来展示文件集合。

package com.litongjava.linux.service;

import java.io.File;
import java.util.ArrayList;
import java.util.List;

import org.junit.Test;

import com.litongjava.media.NativeMedia;
import com.litongjava.tio.utils.json.JsonUtils;

import lombok.extern.slf4j.Slf4j;

@Slf4j
public class VideoMergeTest {

  @Test
  public void testSession() {

    String folderPath = "C:\\Users\\Administrator\\Downloads";
    File folderFile = new File(folderPath);
    File[] listFiles = folderFile.listFiles();

    // 使用 ArrayList 来存储符合条件的文件路径
    List<String> videoPaths = new ArrayList<>();
    if (listFiles != null) {
      for (File file : listFiles) {
        if (file != null && file.getName().endsWith(".mp4")) {
          videoPaths.add(file.getAbsolutePath());
        }
      }
    }

    // 输出 JSON 格式的结果,这里不会出现 null 元素
    System.out.println(JsonUtils.toJson(videoPaths));

    // 如果 NativeMedia.merge 方法需要数组,可以通过 toArray 方法转换
    NativeMedia.merge(videoPaths.toArray(new String[0]), "main.mp4");
  }
}

说明

  • 输入文件要求
    代码中通过遍历指定目录,获取所有扩展名为 .mp4 的文件并存储在 List 中,最终转换为字符串数组传递给 JNI 方法。
  • 异常处理
    文档注释中规定了当输入数组为空、含有 null 值或文件数不足时,会抛出相应的异常。因此在实际使用中,请保证输入文件数组不为空且至少包含两个有效文件。

三、C 端 JNI 实现

下面是 JNI 的 C 实现代码,文件名假设为 jni_merge.c。该代码完整实现了如下功能:

  1. 支持中文文件名

    • 在 Windows 平台下利用 WideCharToMultiByte 进行编码转换。
    • 在非 Windows 平台直接调用 GetStringUTFChars。
  2. 输出流上下文创建及模板构建

    • 以第一个输入文件为模板,将视频和音频流复制到输出上下文,采用 “copy” 模式(直接拷贝数据,不重新编码)。
  3. 全局时间轴统一处理

    • 对每个输入文件计算音视频的最大时长(转换到统一的 AV_TIME_BASE 单位)。
    • 采用全局时间偏移量 global_offset,在对每个包进行时间戳转换时保证时间连续性,解决多个文件间因转场引起的音视频不同步问题。
  4. 逐包读取和写入输出文件

    • 通过 av_read_frame 逐包读取各输入文件,并根据流类型进行时间戳和包数据调整后写入输出文件。

完整代码如下:

#include "com_litongjava_media_NativeMedia.h"
#include <jni.h>
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <stdint.h>
#include <libavformat/avformat.h>
#include <libavcodec/avcodec.h>
#include <libavutil/timestamp.h>
#include <libavutil/error.h>

#ifdef _WIN32

#include <windows.h>
#include <stringapiset.h>

/**
 * 将 Java 的 jstring 转换为 UTF-8 编码的 C 字符串(支持中文路径)
 */
char *jstringToChar(JNIEnv *env, jstring jStr) {
  const jchar *raw = (*env)->GetStringChars(env, jStr, NULL);
  jsize len = (*env)->GetStringLength(env, jStr);
  int size_needed = WideCharToMultiByte(CP_UTF8, 0, (LPCWCH) raw, len, NULL, 0, NULL, NULL);
  char *strTo = (char *) malloc(size_needed + 1);
  WideCharToMultiByte(CP_UTF8, 0, (LPCWCH) raw, len, strTo, size_needed, NULL, NULL);
  strTo[size_needed] = '\0';
  (*env)->ReleaseStringChars(env, jStr, raw);
  return strTo;
}

#else
/**
 * 非 Windows 平台直接返回 UTF-8 编码的字符串
 */
char* jstringToChar(JNIEnv* env, jstring jStr) {
    const char* chars = (*env)->GetStringUTFChars(env, jStr, NULL);
    char* copy = strdup(chars);
    (*env)->ReleaseStringUTFChars(env, jStr, chars);
    return copy;
}
#endif

/*
 * 说明:
 * 1. 根据输出文件名创建输出格式上下文,并以第一个输入文件为模板建立输出流(仅复制视频和音频流参数)。
 * 2. 为每个输入文件计算其总体时长(按 AV_TIME_BASE 统一计算,取视频和音频最大值),并使用统一的 global_offset 作为所有流包的时间补偿。
 * 3. 每个包在转换时间戳时先使用 av_rescale_q 将其 pts/dts 从输入流的 time_base 转换到输出流 time_base,再加上统一偏移量。
 *
 * 这样处理后,各输入文件无论音视频各自时长是否一致,都按同一全局时间轴排列,解决了音频播放速度快于视频的问题。
 */
JNIEXPORT jboolean JNICALL Java_com_litongjava_media_NativeMedia_merge
  (JNIEnv *env, jclass clazz, jobjectArray jInputPaths, jstring jOutputPath) {
  int ret = 0;
  int nb_inputs = (*env)->GetArrayLength(env, jInputPaths);
  if (nb_inputs < 1) {
    return JNI_FALSE;
  }
  // 输出文件名(支持中文)
  char *output_filename = jstringToChar(env, jOutputPath);

  // 创建输出格式上下文
  AVFormatContext *ofmt_ctx = NULL;
  ret = avformat_alloc_output_context2(&ofmt_ctx, NULL, NULL, output_filename);
  if (ret < 0 || !ofmt_ctx) {
    free(output_filename);
    return JNI_FALSE;
  }
  AVOutputFormat *ofmt = ofmt_ctx->oformat;

  // 采用第一个输入文件作为模板构造输出流
  char *first_input = jstringToChar(env, (*env)->GetObjectArrayElement(env, jInputPaths, 0));
  AVFormatContext *ifmt_ctx1 = NULL;
  if ((ret = avformat_open_input(&ifmt_ctx1, first_input, NULL, NULL)) < 0) {
    free(first_input);
    free(output_filename);
    return JNI_FALSE;
  }
  if ((ret = avformat_find_stream_info(ifmt_ctx1, NULL)) < 0) {
    avformat_close_input(&ifmt_ctx1);
    free(first_input);
    free(output_filename);
    return JNI_FALSE;
  }
  free(first_input);

  // 建立输出流(仅复制视频、音频流)
  int video_out_index = -1, audio_out_index = -1;
  for (unsigned int i = 0; i < ifmt_ctx1->nb_streams; i++) {
    AVStream *in_stream = ifmt_ctx1->streams[i];
    if (in_stream->codecpar->codec_type == AVMEDIA_TYPE_VIDEO ||
        in_stream->codecpar->codec_type == AVMEDIA_TYPE_AUDIO) {

      AVStream *out_stream = avformat_new_stream(ofmt_ctx, NULL);
      if (!out_stream) {
        avformat_close_input(&ifmt_ctx1);
        free(output_filename);
        return JNI_FALSE;
      }
      ret = avcodec_parameters_copy(out_stream->codecpar, in_stream->codecpar);
      if (ret < 0) {
        avformat_close_input(&ifmt_ctx1);
        free(output_filename);
        return JNI_FALSE;
      }
      out_stream->codecpar->codec_tag = 0;
      if (in_stream->codecpar->codec_type == AVMEDIA_TYPE_VIDEO)
        video_out_index = out_stream->index;
      else if (in_stream->codecpar->codec_type == AVMEDIA_TYPE_AUDIO)
        audio_out_index = out_stream->index;
    }
  }
  avformat_close_input(&ifmt_ctx1);

  // 打开输出文件
  if (!(ofmt->flags & AVFMT_NOFILE)) {
    if ((ret = avio_open(&ofmt_ctx->pb, output_filename, AVIO_FLAG_WRITE)) < 0) {
      avformat_free_context(ofmt_ctx);
      free(output_filename);
      return JNI_FALSE;
    }
  }

  // 写入输出文件头
  ret = avformat_write_header(ofmt_ctx, NULL);
  if (ret < 0) {
    if (!(ofmt->flags & AVFMT_NOFILE))
      avio_close(ofmt_ctx->pb);
    avformat_free_context(ofmt_ctx);
    free(output_filename);
    return JNI_FALSE;
  }

  // 定义统一全局时间偏移量(单位:AV_TIME_BASE,AV_TIME_BASE_Q= {1,AV_TIME_BASE})
  int64_t global_offset = 0;

  // 遍历每个输入文件
  for (int i = 0; i < nb_inputs; i++) {
    char *input_filename = jstringToChar(env, (*env)->GetObjectArrayElement(env, jInputPaths, i));
    AVFormatContext *ifmt_ctx = NULL;
    if ((ret = avformat_open_input(&ifmt_ctx, input_filename, NULL, NULL)) < 0) {
      free(input_filename);
      continue;  // 无法打开的文件跳过
    }
    if ((ret = avformat_find_stream_info(ifmt_ctx, NULL)) < 0) {
      avformat_close_input(&ifmt_ctx);
      free(input_filename);
      continue;
    }

    // 计算该输入文件中音视频的最大时长(统一转换到 AV_TIME_BASE 单位)
    int64_t file_duration = 0;
    for (unsigned int j = 0; j < ifmt_ctx->nb_streams; j++) {
      AVStream *in_stream = ifmt_ctx->streams[j];
      if (in_stream->codecpar->codec_type == AVMEDIA_TYPE_VIDEO ||
          in_stream->codecpar->codec_type == AVMEDIA_TYPE_AUDIO) {
        if (in_stream->duration > 0) {
          int64_t dur = av_rescale_q(in_stream->duration, in_stream->time_base, AV_TIME_BASE_Q);
          if (dur > file_duration)
            file_duration = dur;
        }
      }
    }

    // 逐包读取处理
    AVPacket pkt;
    while (av_read_frame(ifmt_ctx, &pkt) >= 0) {
      AVStream *in_stream = ifmt_ctx->streams[pkt.stream_index];
      int out_index = -1;
      if (in_stream->codecpar->codec_type == AVMEDIA_TYPE_VIDEO && video_out_index >= 0) {
        out_index = video_out_index;
      } else if (in_stream->codecpar->codec_type == AVMEDIA_TYPE_AUDIO && audio_out_index >= 0) {
        out_index = audio_out_index;
      } else {
        av_packet_unref(&pkt);
        continue;
      }

      AVStream *out_stream = ofmt_ctx->streams[out_index];
      // 将统一偏移量转换到输出流的 time_base 单位
      int64_t offset = av_rescale_q(global_offset, AV_TIME_BASE_Q, out_stream->time_base);

      // 将 pts、dts 和 duration 从输入流 time_base 转换到输出流 time_base 后加上偏移量
      pkt.pts = av_rescale_q(pkt.pts, in_stream->time_base, out_stream->time_base) + offset;
      pkt.dts = av_rescale_q(pkt.dts, in_stream->time_base, out_stream->time_base) + offset;
      if (pkt.duration > 0)
        pkt.duration = av_rescale_q(pkt.duration, in_stream->time_base, out_stream->time_base);
      pkt.pos = -1;
      pkt.stream_index = out_index;

      ret = av_interleaved_write_frame(ofmt_ctx, &pkt);
      if (ret < 0) {
        av_packet_unref(&pkt);
        break;
      }
      av_packet_unref(&pkt);
    }

    avformat_close_input(&ifmt_ctx);
    free(input_filename);

    // 当前输入文件处理完后,将全局偏移量更新为之前的 global_offset + 本文件最大时长(确保所有流时间统一)
    global_offset += file_duration;
  }

  // 写入 trailer,并关闭上下文
  av_write_trailer(ofmt_ctx);
  if (!(ofmt->flags & AVFMT_NOFILE))
    avio_close(ofmt_ctx->pb);
  avformat_free_context(ofmt_ctx);
  free(output_filename);
  return JNI_TRUE;
}

关键点解释

  1. 中文路径支持
    针对不同平台采用不同的方式将 Java 的 jstring 转换成 UTF-8 编码的 C 字符串,以确保中文路径能够正确处理。

    • Windows 平台使用 WideCharToMultiByte。
    • 非 Windows 平台直接使用 GetStringUTFChars。
  2. 输出格式上下文创建与模板构建

    • 调用 avformat_alloc_output_context2 创建输出格式上下文。
    • 以第一个输入文件为模板调用 avformat_open_input 和 avformat_find_stream_info,获取第一个输入文件的视频和音频流参数。
    • 使用 avcodec_parameters_copy 将视频和音频流参数复制到输出流中,使输出文件能够直接采用“流复制”模式。
  3. 全局时间偏移量的处理

    • 为了解决由于转场及各文件内音视频时长不一致而引起的音视频同步问题,在写入每个包之前均将其时间戳进行转换,并加上全局偏移量。
    • 每个输入文件处理完毕后,将该文件最大时长(视频流与音频流中较大者)累加到全局偏移量 global_offset,确保后续包在全局时间轴上连续排列。
  4. 逐包读取与写入

    • 采用 av_read_frame 循环读取每个输入文件中的所有包,根据包的类型选择对应的输出流。
    • 对每个包:
      • 使用 av_rescale_q 将输入的 pts、dts、duration 从输入流的 time_base 转换到输出流的 time_base。
      • 加上转换后的全局时间偏移量,保证包在全局统一时间轴上连续排列。
      • 使用 av_interleaved_write_frame 写入输出文件,确保多路流的交错顺序正确。
  5. 错误处理与资源释放

    • 各处有错误检查,并在错误出现时及时释放相关上下文和动态内存。
    • 最后写入 trailer 后关闭输出文件与释放输出上下文。

四、小结

本文档详细介绍了通过 JNI 调用 FFmpeg 库实现视频和音频合并的完整过程。

  • Java 层提供简单的接口,负责传递文件路径参数。
  • C 层则利用 FFmpeg 的 API 逐步建立输出上下文、设置流参数、处理时间戳转换,并通过全局时间偏移量确保音视频同步,最终将所有包写入合并后的文件中。
  • 该方案支持中文文件路径,并保证在转场动画和时长不一致的场景下音视频同步正确。

请根据实际需求进行扩展和完善,例如加入更详细的日志输出、错误码打印及异常处理等。希望这份文档对你的开发有所帮助!

Edit this page
Last Updated:
Contributors: Tong Li
Prev
通用格式拆分
Next
VideoToHLS