Tio Boot DocsTio Boot Docs
Home
  • java-db
  • api-table
  • Enjoy
  • Tio Boot Admin
  • ai_agent
  • translator
  • knowlege_base
  • ai-search
  • 案例
Abount
  • Github
  • Gitee
Home
  • java-db
  • api-table
  • Enjoy
  • Tio Boot Admin
  • ai_agent
  • translator
  • knowlege_base
  • ai-search
  • 案例
Abount
  • Github
  • Gitee
  • 01_tio-boot 简介

    • tio-boot:新一代高性能 Java Web 开发框架
    • tio-boot 入门示例
    • Tio-Boot 配置 : 现代化的配置方案
    • tio-boot 整合 Logback
    • tio-boot 整合 hotswap-classloader 实现热加载
    • 自行编译 tio-boot
    • 最新版本
    • 开发规范
  • 02_部署

    • 使用 Maven Profile 实现分环境打包 tio-boot 项目
    • Maven 项目配置详解:依赖与 Profiles 配置
    • tio-boot 打包成 FastJar
    • 使用 GraalVM 构建 tio-boot Native 程序
    • 使用 Docker 部署 tio-boot
    • 部署到 Fly.io
    • 部署到 AWS Lambda
    • 到阿里云云函数
    • 使用 Deploy 工具部署
    • 胖包与瘦包的打包与部署
    • 使用 Jenkins 部署 Tio-Boot 项目
    • 使用 Nginx 反向代理 Tio-Boot
    • 使用 Supervisor 管理 Java 应用
  • 03_配置

    • 配置参数
    • 服务器监听器
    • 内置缓存系统 AbsCache
    • 使用 Redis 作为内部 Cache
    • 静态文件处理器
    • 基于域名的静态资源隔离
    • DecodeExceptionHandler
  • 04_原理

    • 生命周期
    • 请求处理流程
    • 重要的类
  • 05_json

    • Json
    • 接受 JSON 和响应 JSON
    • 响应实体类
  • 06_web

    • 概述
    • 文件上传
    • 接收请求参数
    • 接收日期参数
    • 接收数组参数
    • 返回字符串
    • 返回文本数据
    • 返回网页
    • 请求和响应字节
    • 文件下载
    • 返回视频文件并支持断点续传
    • http Session
    • Cookie
    • HttpRequest
    • HttpResponse
    • Resps
    • RespBodyVo
    • /zh/06_web/19.html
    • 全局异常处理器
    • 异步
    • 动态 返回 CSS 实现
    • 返回图片
    • Transfer-Encoding: chunked 实时音频播放
    • Server-Sent Events (SSE)
    • 接口访问统计
    • 接口请求和响应数据记录
    • 自定义 Handler 转发请求
    • 使用 HttpForwardHandler 转发所有请求
    • 跨域
    • 添加 Controller
    • 常用工具类
    • HTTP Basic 认证
    • WebJars
    • JProtobuf
  • 07_validate

    • 数据紧校验规范
    • 参数校验
  • 08_websocket

    • 使用 tio-boot 搭建 WebSocket 服务
    • WebSocket 聊天室项目示例
  • 09_java-db

    • java‑db
    • 操作数据库入门示例
    • SQL 模板
    • 数据源配置与使用
    • ActiveRecord
    • Model
    • 生成器与 Model
    • Db 工具类
    • 批量操作
    • 数据库事务处理
    • Cache 缓存
    • Dialect 多数据库支持
    • 表关联操作
    • 复合主键
    • Oracle 支持
    • Enjoy SQL 模板
    • Java-DB 整合 Enjoy 模板最佳实践
    • 多数据源支持
    • 独立使用 ActiveRecord
    • 调用存储过程
    • java-db 整合 Guava 的 Striped 锁优化
    • 生成 SQL
    • 通过实体类操作数据库
    • java-db 读写分离
    • Spring Boot 整合 Java-DB
    • like 查询
    • 常用操作示例
    • Druid 监控集成指南
    • SQL 统计
  • 10_api-table

    • ApiTable 概述
    • 使用 ApiTable 连接 SQLite
    • 使用 ApiTable 连接 Mysql
    • 使用 ApiTable 连接 Postgres
    • 使用 ApiTable 连接 TDEngine
    • 使用 api-table 连接 oracle
    • 使用 api-table 连接 mysql and tdengine 多数据源
    • EasyExcel 导出
    • EasyExcel 导入
    • TQL(Table SQL)前端输入规范
    • ApiTable 实现增删改查
    • 数组类型
    • 单独使用 ApiTable
  • 11_aop

    • JFinal-aop
    • Aop 工具类
    • 配置
    • 配置
    • 独立使用 JFinal Aop
    • @AImport
    • 原理解析
  • 12_cache

    • Caffine
    • Jedis-redis
    • hutool RedisDS
    • Redisson
    • Caffeine and redis
    • CacheUtils 工具类
    • 使用 CacheUtils 整合 caffeine 和 redis 实现的两级缓存
    • 使用 java-db 整合 ehcache
    • 使用 java-db 整合 redis
    • Java DB Redis 相关 Api
    • redis 使用示例
  • 13_认证和权限

    • hutool-JWT
    • FixedTokenInterceptor
    • 使用内置 TokenManager 实现登录
    • 用户系统
    • 重置密码
    • 匿名登录
    • Google 登录
    • 权限校验注解
    • Sa-Token
    • sa-token 登录注册
    • StpUtil.isLogin() 源码解析
    • 短信登录
    • 移动端微信登录实现指南
    • 移动端重置密码
  • 14_i18n

    • i18n
  • 15_enjoy

    • tio-boot 整合 Enjoy 模版引擎文档
    • 引擎配置
    • 表达式
    • 指令
    • 注释
    • 原样输出
    • Shared Method 扩展
    • Shared Object 扩展
    • Extension Method 扩展
    • Spring boot 整合
    • 独立使用 Enjoy
    • tio-boot enjoy 自定义指令 localeDate
    • PromptEngine
    • Enjoy 入门示例-擎渲染大模型请求体
    • Enjoy 使用示例
  • 16_定时任务

    • Quartz 定时任务集成指南
    • 分布式定时任务 xxl-jb
    • cron4j 使用指南
  • 17_tests

    • TioBootTest 类
  • 18_tio

    • TioBootServer
    • tio-core
    • 内置 TCP 处理器
    • 独立启动 UDPServer
    • 使用内置 UDPServer
    • t-io 消息处理流程
    • tio-运行原理详解
    • TioConfig
    • ChannelContext
    • Tio 工具类
    • 业务数据绑定
    • 业务数据解绑
    • 发送数据
    • 关闭连接
    • Packet
    • 监控: 心跳
    • 监控: 客户端的流量数据
    • 监控: 单条 TCP 连接的流量数据
    • 监控: 端口的流量数据
    • 单条通道统计: ChannelStat
    • 所有通道统计: GroupStat
    • 资源共享
    • 成员排序
    • SSL
    • DecodeRunnable
    • 使用 AsynchronousSocketChannel 响应数据
    • 拉黑 IP
    • 深入解析 Tio 源码:构建高性能 Java 网络应用
  • 19_aio

    • ByteBuffer
    • AIO HTTP 服务器
    • 自定义和线程池和池化 ByteBuffer
    • AioHttpServer 应用示例 IP 属地查询
    • 手写 AIO Http 服务器
  • 20_netty

    • Netty TCP Server
    • Netty Web Socket Server
    • 使用 protoc 生成 Java 包文件
    • Netty WebSocket Server 二进制数据传输
    • Netty 组件详解
  • 21_netty-boot

    • Netty-Boot
    • 原理解析
    • 整合 Hot Reload
    • 整合 数据库
    • 整合 Redis
    • 整合 Elasticsearch
    • 整合 Dubbo
    • Listener
    • 文件上传
    • 拦截器
    • Spring Boot 整合 Netty-Boot
    • SSL 配置指南
    • ChannelInitializer
    • Reserve
  • 22_MQ

    • Mica-mqtt
    • EMQX
    • Disruptor
  • 23_tio-utils

    • tio-utils
    • HttpUtils
    • Notification
    • 邮箱
    • JSON
    • 读取文件
    • Base64
    • 上传和下载
    • Http
    • Telegram
    • RsaUtils
    • EnvUtils 使用文档
    • 系统监控
    • 毫秒并发 ID (MCID) 生成方案
  • 24_tio-http-server

    • 使用 Tio-Http-Server 搭建简单的 HTTP 服务
    • tio-boot 添加 HttpRequestHandler
    • 在 Android 上使用 tio-boot 运行 HTTP 服务
    • tio-http-server-native
    • handler 常用操作
  • 25_tio-websocket

    • WebSocket 服务器
    • WebSocket Client
  • 26_tio-im

    • 通讯协议文档
    • ChatPacket.proto 文档
    • java protobuf
    • 数据表设计
    • 创建工程
    • 登录
    • 历史消息
    • 发消息
  • 27_mybatis

    • Tio-Boot 整合 MyBatis
    • 使用配置类方式整合 MyBatis
    • 整合数据源
    • 使用 mybatis-plus 整合 tdengine
    • 整合 mybatis-plus
  • 28_mongodb

    • tio-boot 使用 mongo-java-driver 操作 mongodb
  • 29_elastic-search

    • Elasticsearch
    • JavaDB 整合 ElasticSearch
    • Elastic 工具类使用指南
    • Elastic-search 注意事项
    • ES 课程示例文档
  • 30_magic-script

    • tio-boot 整合 magic-script
  • 31_groovy

    • tio-boot 整合 Groovy
  • 32_firebase

    • 整合 google firebase
    • Firebase Storage
    • Firebase Authentication
    • 使用 Firebase Admin SDK 进行匿名用户管理与自定义状态标记
    • 导出用户
    • 注册回调
    • 登录注册
  • 33_文件存储

    • 文件上传数据表
    • 本地存储
    • 使用 AWS S3 存储文件并整合到 Tio-Boot 项目中
    • 存储文件到 腾讯 COS
  • 34_spider

    • jsoup
    • 爬取 z-lib.io 数据
    • 整合 WebMagic
    • WebMagic 示例:爬取学校课程数据
    • Playwright
    • Flexmark (Markdown 处理器)
    • tio-boot 整合 Playwright
    • 缓存网页数据
  • 36_integration_thirty_party

    • tio-boot 整合 okhttp
    • 整合 GrpahQL
    • 集成 Mailjet
    • 整合 ip2region
    • 整合 GeoLite 离线库
    • 整合 Lark 机器人指南
    • 集成 Lark Mail 实现邮件发送
    • Thymeleaf
    • Swagger
    • Clerk 验证
  • 37_dubbo

    • 概述
    • dubbo 2.6.0
    • dubbo 2.6.0 调用过程
    • dubbo 3.2.0
  • 38_spring

    • Spring Boot Web 整合 Tio Boot
    • spring-boot-starter-webflux 整合 tio-boot
    • Tio Boot 整合 Spring Boot Starter
    • Tio Boot 整合 Spring Boot Starter Data Redis 指南
  • 39_spring-cloud

    • tio-boot spring-cloud
  • 40_mysql

    • 使用 Docker 运行 MySQL
    • /zh/42_mysql/02.html
  • 41_postgresql

    • PostgreSQL 安装
    • PostgreSQL 主键自增
    • PostgreSQL 日期类型
    • Postgresql 金融类型
    • PostgreSQL 数组类型
    • PostgreSQL 全文检索
    • PostgreSQL 查询优化
    • 获取字段类型
    • PostgreSQL 向量
    • PostgreSQL 优化向量查询
    • PostgreSQL 其他
  • 43_oceanbase

    • 快速体验 OceanBase 社区版
    • 快速上手 OceanBase 数据库单机部署与管理
    • 诊断集群性能
    • 优化 SQL 性能指南
    • /zh/43_oceanbase/05.html
  • 50_media

    • JAVE 提取视频中的声音
    • Jave 提取视频中的图片
    • /zh/50_media/03.html
  • 51_asr

    • Whisper-JNI
  • 54_native-media

    • java-native-media
    • JNI 入门示例
    • mp3 拆分
    • mp4 转 mp3
    • 使用 libmp3lame 实现高质量 MP3 编码
    • Linux 编译
    • macOS 编译
    • 从 JAR 包中加载本地库文件
    • 支持的音频和视频格式
    • 任意格式转为 mp3
    • 通用格式转换
    • 通用格式拆分
    • 视频合并
    • VideoToHLS
    • split_video_to_hls 支持其他语言
    • 持久化 HLS 会话
  • 55_telegram4j

    • 数据库设计
    • /zh/55_telegram4j/02.html
    • 基于 MTProto 协议开发 Telegram 翻译机器人
    • 过滤旧消息
    • 保存机器人消息
    • 定时推送
    • 增加命令菜单
    • 使用 telegram-Client
    • 使用自定义 StoreLayout
    • 延迟测试
    • Reactor 错误处理
    • Telegram4J 常见错误处理指南
  • 56_telegram-bots

    • TelegramBots 入门指南
    • 使用工具库 telegram-bot-base 开发翻译机器人
  • 60_LLM

    • 简介
    • AI 问答
    • /zh/60_LLM/03.html
    • /zh/60_LLM/04.html
    • 增强检索(RAG)
    • 结构化数据检索
    • 搜索+AI
    • 集成第三方 API
    • 后置处理
    • 推荐问题生成
    • 连接代码执行器
    • 避免 GPT 混乱
    • /zh/60_LLM/13.html
  • 61_ai_agent

    • 数据库设计
    • 示例问题管理
    • 会话管理
    • 历史记录
    • 对接 Perplexity API
    • 意图识别与生成提示词
    • 智能问答模块设计与实现
    • 文件上传与解析文档
    • 翻译
    • 名人搜索功能实现
    • Ai studio gemini youbue 问答使用说明
    • 自建 YouTube 字幕问答系统
    • 自建 获取 youtube 字幕服务
    • 通用搜索
    • /zh/61_ai_agent/15.html
    • 16
    • 17
    • 18
    • 在 tio-boot 应用中整合 ai-agent
    • 16
  • 62_translator

    • 简介
  • 63_knowlege_base

    • 数据库设计
    • 用户登录实现
    • 模型管理
    • 知识库管理
    • 文档拆分
    • 片段向量
    • 命中测试
    • 文档管理
    • 片段管理
    • 问题管理
    • 应用管理
    • 向量检索
    • 推理问答
    • 问答模块
    • 统计分析
    • 用户管理
    • api 管理
    • 存储文件到 S3
    • 文档解析优化
    • 片段汇总
    • 段落分块与检索
    • 多文档解析
    • 对话日志
    • 检索性能优化
    • Milvus
    • 文档解析方案和费用对比
    • 离线运行向量模型
  • 64_ai-search

    • ai-search 项目简介
    • ai-search 数据库文档
    • ai-search SearxNG 搜索引擎
    • ai-search Jina Reader API
    • ai-search Jina Search API
    • ai-search 搜索、重排与读取内容
    • ai-search PDF 文件处理
    • ai-search 推理问答
    • Google Custom Search JSON API
    • ai-search 意图识别
    • ai-search 问题重写
    • ai-search 系统 API 接口 WebSocket 版本
    • ai-search 搜索代码实现 WebSocket 版本
    • ai-search 生成建议问
    • ai-search 生成问题标题
    • ai-search 历史记录
    • Discover API
    • 翻译
    • Tavily Search API 文档
    • 对接 Tavily Search
    • 火山引擎 DeepSeek
    • 对接 火山引擎 DeepSeek
    • ai-search 搜索代码实现 SSE 版本
    • jar 包部署
    • Docker 部署
    • 爬取一个静态网站的所有数据
    • 网页数据预处理
    • 网页数据检索与问答流程整合
  • 65_java-linux

    • Java 执行 python 代码
    • 通过大模型执行 Python 代码
    • MCP 协议
    • Cline 提示词
    • Cline 提示词-中文版本
  • 66_manim

    • Teach me anything - 基于大语言的知识点讲解视频生成系统
    • Manim 开发环境搭建
    • 生成场景提示词
    • 生成代码
    • 完整脚本示例
    • 语音合成系统
    • Fish.audio TTS 接口说明文档与 Java 客户端封装
    • 整合 fishaudio 到 java-uni-ai-server 项目
    • 执行 Python (Manim) 代码
    • 使用 SSE 流式传输生成进度的实现文档
    • 整合全流程完整文档
    • HLS 动态推流技术文档
    • manim 分场景生成代码
    • 分场景运行代码及流式播放支持
    • 分场景业务端完整实现流程
    • Maiim布局管理器
    • 仅仅生成场景代码
    • 使用 modal 运行 manim 代码
    • Python 使用 Modal GPU 加速渲染
    • Modal 平台 GPU 环境下运行 Manim
    • Modal Manim OpenGL 安装与使用
    • 优化 GPU 加速
    • 生成视频封面流程
    • Java 调用 manim 命令 执行代码 生成封面
    • Manim 图像生成服务客户端文档
    • manim render help
    • 显示 中文公式
    • manimgl
    • EGL
    • /zh/66_manim/30.html
    • /zh/66_manim/31.html
    • /zh/66_manim/32.html
    • /zh/66_manim/33.html
  • 68_java-llm-proxy

    • 使用tio-boot搭建openai 代理服务
  • 70_tio-boot-admin

    • 入门指南
    • 初始化数据
    • token 存储
    • 与前端集成
    • 文件上传
    • 网络请求
    • 图片管理
    • /zh/70_tio-boot-admin/08.html
    • Word 管理
    • PDF 管理
    • 文章管理
    • 富文本编辑器
  • 71_tio-boot

    • /zh/71_tio-boot/01.html
    • Swagger 整合到 Tio-Boot 中的指南
    • HTTP/1.1 Pipelining 性能测试报告
  • 80_性能测试

    • 压力测试 - tio-http-serer
    • 压力测试 - tio-boot
    • 压力测试 - tio-boot-native
    • 压力测试 - netty-boot
    • 性能测试对比
    • TechEmpower FrameworkBenchmarks
    • 压力测试 - tio-boot 12 C 32G
  • 99_案例

    • 封装 IP 查询服务
    • tio-boot 案例 - 全局异常捕获与企业微信群通知
    • tio-boot 案例 - 文件上传和下载
    • tio-boot 案例 - 整合 ant design pro 增删改查
    • tio-boot 案例 - 流失响应
    • tio-boot 案例 - 增强检索
    • tio-boot 案例 - 整合 function call
    • tio-boot 案例 - 定时任务 监控 PostgreSQL、Redis 和 Elasticsearch
    • Tio-Boot 案例:使用 SQLite 整合到登录注册系统
    • tio-boot 案例 - 执行 shell 命令

布局管理器和整体流程

一、自定义布局管理器(LayoutManager)介绍

项目中提供了一个通用的、基于 Manim 的布局管理器,以解决多元素同时放置时避免重叠、自动缩放和对齐的问题。该布局管理器由以下核心类构成:

  1. LayoutRegion

    • 描述一个矩形区域,包含 x_min、x_max、y_min、y_max 四个属性。

    • 提供 width、height 属性,返回区域宽高;get_center() 方法返回该区域中心坐标。

    • 核心方法 place(mobject, aligned_edge, buff):将某个 Mobject(包含整个 VGroup)缩放并移动到该区域内,使其以 aligned_edge(如 UL、UR、LEFT 等)所指示的边或点对齐,并在各边留出 buff 间距。实现思路:

      1. 先计算给定 Mobject 的包围盒宽高;
      2. 根据区域可用宽高(减去两倍 buff)计算统一缩放因子,使 Mobject 能完整放入;
      3. 将 Mobject 缩放,并将其对齐到指定边:aligned_edge 表示要把 Mobject 的哪一边对齐到区域对应边或角落;
      4. 最终返回移动/缩放后的 Mobject,保证不超出区域。
  2. LayoutAtom

    • 代表布局定义中的“最小单元”,在内层配合 Layout 使用,无需额外逻辑,仅用于占比计算。
    • 其 _resolve_size(region) 方法直接返回传入的 Region,不做拆分。
  3. LayoutDirection

    • 枚举:HORIZONTAL(水平切分)或 VERTICAL(垂直切分),用于指导 Layout 如何在父区域里分配子区域。
  4. Layout

    • 接收一个 LayoutDirection 以及一个映射 Map<String, (proportion, LayoutAtom|Layout)>,将一个父级 Region 水平或垂直切分成若干子区域:

      • 首先计算权重比例总和 proportion_sum。
      • 将各自权重归一化,累加得到每个子区域在父区域上的起止比例位置;
      • 每个子区域再被封装成新的 LayoutRegion 并传给子元素(如果子元素本身是嵌套的 Layout,则递归调用 _resolve_size;否则传给 LayoutAtom)。
    • 最终 resolve(scene: Scene) 会从场景中获取 camera.frame_width、camera.frame_height,创建初始 LayoutRegion,并返回一个二级嵌套的 Map,对应每个区域的具体 Region 实例。

  5. LayoutManager

    • 负责将真正的 Mobject 或 VGroup 放入上面由 Layout 计算出的子区域。

    • 构造时指定 scene、direction(埋点不常用)、buff(内边距)、background(背景色,影响默认文字/公式颜色和调色板)、palette(可选调色板)。

    • 核心方法:

      1. register(mobject, important, color, opacity, adjust_camera):将单个 Mobject 或 VGroup 注册到内部容器 self.container,并根据类型(Text、MathTex、其他 VMobject)自动分配颜色;若是 VGroup,则对子元素统一设置颜色与透明度。
      2. update_color_and_weight(mobject, important, color_override, opacity):为新增的 Mobject 根据“是否重要”“是否指定颜色”等,计算最终颜色并应用;若是 Text 且 important=True,还会加粗。
      3. update_color(sub, group_color_override):为 VGroup 内的子元素单独调整颜色,支持继承父级颜色或按调色板循环分配。
      4. set_background(background_color_name):更改背景色后,会遍历所有已注册的 Mobject,重新执行颜色分配逻辑(对于之前指定过“自定义颜色”的对象,尝试保留该颜色;对纯按调色板生成的颜色,则重新从新背景下的配色板中选取)。
      5. gentle_camera_adjustment():在容器内所有已注册的 Mobject(self.container)完成 arrange(direction, buff) 排列后,计算整体宽高并与当前摄像机 Frame 对比,必要时按最大缩放比例对摄像机 frame 进行 scale(scale_factor),保证所有内容都能完整显示;最后将容器移动到画面顶边。
      6. arrange_objects(objects, direction, buff):辅助方法,将传入的 Mobject 列表包装成临时 VGroup 并做一次 arrange 排列,返回该临时组。
    • 使用示例:

      1. 在场景 construct() 中先调用:

        layout = Layout(LayoutDirection.VERTICAL, {
            "title": (1.0, LayoutAtom()),
            "body": (7.0, Layout(LayoutDirection.HORIZONTAL, {
                "text": (4.0, LayoutAtom()),
                "figure": (3.0, LayoutAtom())
            }))
        }).resolve(self)
        
      2. 生成各个子区域的 LayoutRegion:

        • layout["title"] 获取第一个垂直区域的 Region
        • layout["body"]["text"] 获取第二个垂直区域(body)里的左半个水平区域
        • layout["body"]["figure"] 获取第二个垂直区域(body)里的右半个水平区域
      3. 对各个 Mobject 或 VGroup 做:

        layout["title"].place(title_mobject, aligned_edge=UL, buff=MED_SMALL_BUFF)
        layout["body"]["text"].place(text_group, aligned_edge=UL, buff=SMALL_BUFF)
        layout["body"]["figure"].place(figure_group, aligned_edge=ORIGIN, buff=MED_SMALL_BUFF)
        
      4. 如果要动态调整子元素字体、颜色、粗细,只需在 register() 时传递相应参数即可。

总结:通过上述类的协同,用户只需在场景代码里一句 Layout(...).resolve(self),就能得到各区的具体 Region;再用 place(...) 统一缩放、对齐,彻底避免了多元素“超出画面”或“手工调整位置”带来的繁琐与不一致。


二、代码生成、执行、视频渲染与流式输出流程

本节仅介绍:如何在 Java 端或 Linux 端,基于上一步 AI 生成的 Python 脚本,完成 Manim 代码运行、渲染出视频分片(HLS)并实时通过 SSE/JSON 流式输送给前端的关键环节。下面分为三部分阐述。

1. Python 脚本的生成(Code Generation)

  1. 输入:在 Java 后端,已经通过聊天模型(Gemini/其他)生成了 Manim 场景的 Python 代码文本(完整的 CombinedScene 类或子场景代码),并存储在临时字符串变量 code 中。

  2. 保存脚本:

    • 将 code 写入磁盘文件,路径示例 scripts/{topic}_{雪花ID}.py。
    • 保持脚本编码 UTF-8,以便 Manim 在 Linux 端能够正确解析中文、UTF-8 注释等。
  3. 注意事项:生成的脚本必须遵循 ManimCE v0.19.0 的 API 要求(用户已在 Prompt 中限制),且文件里不包含多余注释,以减少渲染时的解析开销。

在 Python 端,用户并未显式展示 AI 生成脚本部分的代码——它位于 Java 后端的 CodeGenerateService 中,核心是调用 PredictService.generate() 得到纯文本后,使用工具函数 CodeUtils.parsePythonCode() 抽取代码,再写入本地文件。该过程已经在上一部分项目概述中说明,此处不再赘述。

2. 脚本执行与 HLS 分片(Manim 渲染)

所有 Python 脚本的实际渲染都在独立的 Linux 服务器上,通过以下步骤完成:

2.1 启动 HLS 会话

  • Java 端调用 LinuxService.startMainmSession(),内部等价于对 LinuxClient.startMainmSession(apiBase, api_key) 发起 HTTP 请求。

  • Linux 服务端的 ManimHanlder.start():

    1. 生成唯一 sessionId = SnowflakeIdUtils.id(),在服务器子目录 ./data/session/{sessionId} 下创建目录并初始化 main.m3u8 文件;
    2. 定义分片模板路径 ./data/session/{sessionId}/segment_video_%03d.ts,以及 startNumber=0, segmentDuration=2s;
    3. 调用 NativeMedia.initPersistentHls(m3u8Path, tsPattern, startNumber, segmentDuration),开启 HLS 節流合成会话(返回值 sessionIdPrt 代表 C 库内部句柄);
    4. 将结果封装成 ProcessResult{ sessionId, sessionIdPrt, output = m3u8Path } JSON 返回给 Java;

Java 端接收到 sessionIdPrt 与 m3u8Path 后,即可将它保存到数据库及内存,作为后续代码渲染时的上下文。

2.2 渲染某个场景脚本(单次请求)

  1. Java 端通过 LinuxService.runManimCode(code, sessionIdPrt, m3u8Path, channelContext) 发起 HTTP POST 请求到 Linux 端的 /manim/index 接口,请求体为完整的 Python 脚本字符串 code,并在 URL 或请求头中附带 session_prt、m3u8_path、stream=true(如果希望 SSE 实时流式返回日志)。

  2. Linux 端的 ManimHanlder.index(HttpRequest):

    • 若 stream=true,则先对 HTTP 响应启用 Server-Sent Events,保持连接不关闭;

    • 将请求体里的 Python 脚本写入本地临时文件:

      folder = "scripts/{taskId}"    # 例如 scripts/163489243...  
      scriptPath = folder + "/script.py"
      FileUtil.writeString(code, scriptPath, "UTF-8")
      
    • 调用 ManimCodeExecuteService.executeCode(scriptPath, taskFolder) 执行渲染:

      1. 在 scriptPath 同级路径下构造 manim_utils.py 等辅助文件,并拷贝到同一目录;

      2. 在 cache/{taskId} 下创建缓存目录 taskFolder,该目录用于存放 Manim 渲染生成的资源与分片;

      3. 调用 ProcessBuilder("manim", "-ql", "--fps", "10", "--progress_bar", "none", "--verbosity", "WARNING", "--media_dir", taskFolder, "--output_file", "CombinedScene", scriptPath, "CombinedScene"),在脚本所在目录启动 Manim 渲染进程:

        • -ql:快速质量
        • --media_dir:将产出文件写入缓存目录,以便后续 HLS 合并
        • --output_file CombinedScene:指定输出文件名(不附后缀,后续合并时会自动处理)
      4. 将渲染进程的 stdout/stderr 重定向到脚本目录下的 stdout.log 和 stderr.log,方便后续排错。

      5. 等待渲染完成,最长 120 秒,若超时则强制销毁进程并返回状态码 exitCode = -1。

      6. 渲染完成后,在缓存目录 cache/{taskId} 中搜索 videos/{分辨率}/{CombinedScene.mp4},若存在则:

        • 如果 sessionPrt != null(HLS 会话存在),则调用 NativeMedia.appendVideoSegmentToHls(sessionPrt, filePath),将此分片追加到当前 HLS 播放列表;
        • 将 HLS 分片相对路径 "/" + filePath(例如 /cache/12345/videos/480p30/CombinedScene.mp4)设置到 ProcessResult.output。
      7. 若没有找到任何分辨率视频文件,则认为渲染失败,在 ProcessResult.stdErr 填入错误原因。

      8. 返回 ProcessResult{ exitCode, stdOut, stdErr, output } 给 ManimHanlder.index;

  3. ManimHanlder.index 将 ProcessResult 序列化为 JSON 并通过 SSE 实时推送给 Java;若 stream=true,连接保持打开状态,Java 可在收到分片路径后立即更新并通知前端;请求返回后该 SSE 通道仍可保持,直到 Java 主动关闭。

2.3 多场景循环与错误修复

  • Java 端在收到上一次 ProcessResult 后,检查 output 是否为空:

    • 若不为空,表示本场景分片生成成功,将 output(HLS 路径)加入 m3u8List,通过 SSE 通知前端“已生成第 N 场景分片”;
    • 若为空,表示渲染出错,Java 端将当前 code(错误脚本)、stdOut、stdErr 信息封装为 FixCodeVo,调用 FixVideoCodeService.fixCode(...) 获取修复后的代码,并重新请求渲染。
  • 这种“渲染—检查—修复—重试”循环在每个场景中允许出现多个尝试,最多达到预设次数(如 5 次失败后跳过此场景)。

  • 当 AI 返回的下一场景 prompt 文本为“done”或已达最大场景数时,跳出循环,转入合并阶段。

3. HLS 分片合并与最终 MP4

当所有场景的 HLS 分片都成功提交至 Linux 端 HLS 会话后,Java 端调用 LinuxService.finish(sessionIdPrt, m3u8Path, videos),其中 videos 为逗号分隔的所有分片 m3u8 路径。例如:

videos=" /cache/123/videos/480p30/CombinedScene.mp4,/cache/123/videos/720p30/CombinedScene.mp4 "

(注意:实际传入格式由 ExplanationVideoService 拼接 m3u8List 时确定)

Linux 端 ManimHanlder.finish(HttpRequest):

  1. 首先检查 m3u8Path 指向的 HLS 播放列表文件是否存在;

    • 若存在,调用 NativeMedia.finishPersistentHls(session_prt, m3u8Path),结束 HLS 会话并确保最后一个分片写入;
    • 若不存在,只需调用 NativeMedia.freeHlsSession(session_prt) 释放 C 库内部资源;
  2. 解析 videos.split(","),得到每个分片对应的本地 MP4 路径(+ ".mp4" 后缀);

  3. 调用 NativeMedia.merge(mp4FileList, outputPath),将所有片段按顺序拼接到 outputPath(如 ./data/session/{sessionId}/main.mp4);

  4. 如果合并成功,则调用 NativeMedia.getVideoLength(outputPath) 返回合并后的视频总时长(单位秒),写入 ProcessResult.video_length;

  5. 返回 JSON 给 Java。

Java 接到结果后,将视频时长四舍五入存入数据库,拼接最终可访问 URL(例如 http://your-video-server/data/session/{sessionId}/main.mp4),通过 SSE 推送给前端“main”事件,表示视频已可在线观看或下载。

4. 前端实时流式输出

在以上各环节,Java 端均通过 Tio SSE 通道向前端推送关键进度:

  1. task:首次启动 HLS 会话后,向前端返回 {"id": "{任务ID}"},前端可根据 ID 构造视频播放或轮询地址。
  2. progress:每次执行关键步骤(如 “start generate python code”、“finish first scene code”、“start run N sence code”等)时,Java 端都会发送带 {"info": "某某步骤完成"} 的 progress 事件,使前端实时显示日志或进度条。
  3. answer:AI 回答生成后,将具体回答文本通过 SSE 返回。
  4. error:若渲染或修复出错,将错误信息推送给前端。
  5. metadata:在最终合并前,将 {"id": "{任务ID}"} 再次发送,前端可在收到后展示视频预览位置或更新播放按钮状态。
  6. main:合并完成后,发送 {"url": "{最终MP4链接}"},前端即可启动视频播放器或提示用户下载。
  7. 最终 close:在流程最后关闭 SSE 通道,通知前端可以结束轮询。

这种通过 SSE 推送进度的方式,使前端无需频繁轮询服务端,即可实时获取 AI 回答、Manim 渲染日志、最终视频 URL 等关键节点状态,从而大幅提升用户体验。


流程示意图

用户发起请求 → Java 后端校验 → 检查缓存 
    ├── 命中缓存 → 直接返回 metadata + 视频 URL
    └── 未命中缓存 → AI 回答生成 → 保存 answer
           ↓
       Python 代码生成 → 保存脚本文件
           ↓
       Linux HLS 会话开启
           ↓
       循环渲染场景(Manim 渲染 + 错误修复)
           ↓
       所有场景渲染完成 → 合并 HLS 分片 → 生成 MP4
           ↓
       返回视频时长 + MP4 链接 → 异步生成封面图 → SSE 推送完成

小结

  1. 布局管理器(LayoutManager)

    • 通过 LayoutRegion、LayoutAtom、Layout、LayoutManager 四个核心类,实现了将多个 Mobject 分区自动缩放、对齐的能力,消除了手工使用 next_to、move_to 带来的繁琐和不一致。
    • 用户只需在场景中调用 Layout(...).resolve(self),并对各区域进行一次性 place(),即可完成复杂的左右/上下分栏、嵌套布局。
  2. 代码生成到视频渲染的流水线

    • AI 代码生成:Java 端调用 PredictService,通过 LLM(如 Gemini)生成符合 ManimCE v0.19.0 规范的脚本,将纯 Python 代码解析并保持到本地磁盘。
    • 渲染执行:Linux 端收到脚本后的 manim CLI 命令,在本地进行分片渲染,绑定 HLS 会话将每次场景渲染的 MP4 分片追加至 m3u8;若代码有误,则通过 FixVideoCodeService 重新向 AI 请求修复代码并重试。
    • 分片合并:所有场景分片完成后,调用 NativeMedia C 库将 HLS 各分片合并为单个 MP4,并计算总时长。
    • 实时输出:Java 端通过 SSE 不断向前端推送进度(AI 回答、渲染步骤、错误信息、最终 URL),使前端无需轮询即可刷新状态。

通过上述设计,系统实现了从“用户输入文字”到“最终 Manim 可视化视频”无人值守的全自动闭环,兼顾了布局自动化、AI 代码生成脱敏、渲染可靠重试以及对外实时进度反馈。

Edit this page
Last Updated:
Contributors: Tong Li