科普教学课程 AI 制作平台

一、项目背景与目标

为推进“ONCE 海洋负排放”科学传播,强化《宜居地球》科普课程的数字化教学手段,并建设“地球交易所”可持续教育平台,我们计划开发地球科学 AI 生成视频课堂平台,面向中小学生群体普及基础地球与海洋科学知识。

本项目参考 VideoTutor 等前沿生成式 AI 教育平台,结合我们自身在海洋负排放、碳汇知识、生态科普方面的研究成果,打造国内首个面向青少年的地球科学 AI 视频生成平台,构建 AI 自动生成 + 老师自定义 + 多学科融合的教育新范式。

二、项目定位

三、建设分阶段目标

一期:原型试验阶段(试运行)

二期:系统化建设阶段(正式立项)

三期:高阶拓展阶段(升级开发)

四、技术实现路径

4.1 非技术背景可理解版本

本平台采用五步 AI 视频自动生成技术流程:

  1. 内容生成:输入主题(如“碳循环”),平台自动拆解为几个教学板块并撰写课程讲解脚本,可人工微调内容。

  2. 动画生成:根据每个知识点匹配 SVG 插图、照片或生成动画(如海藻生长过程、碳排放路径等)。

  3. 配音与字幕:AI 将内容脚本转化为标准播音级语音,并生成同步字幕。

  4. 视频预览版生成:自动合成预览视频(低清、快速回传)。

  5. 高清视频输出(可选):生成可发布的 2K/4K 版本,用于公开播放、展示或课堂教学。

4.2 系统架构

4.2.1 四个核心阶段

1️⃣ 内容规划阶段

2️⃣ 风格设计阶段

3️⃣ 制作配置阶段

4️⃣ 成品输出阶段

🔄 关键特性

4.2.2 生成原理解释
满意
需修改
输入主题/想法
AI内容分析
视频大纲生成
小节概要拆解
参考知识片段选取
AI内容优化
视频风格定义
参与角色设计
对白/旁白脚本
演绎类型选择
素材库匹配
图片缓动动画
SVG生长动画
视频元素
Maxim科技动画
数字人形象
AI素材整合
制作模板配置
剪辑模板选择
预览预设配置
制品预设定义
AI自动剪辑
预览版生成
低清/快速
预览审核
高清成品生成
2K/4K版本
人工微调
最终视频输出
AI语音合成
标准播音级配音
同步字幕生成
4.2.3 系统架构图
外部服务集成
基础设施层
数据存储层
AI引擎层
核心业务服务层
用户接入层
容器化平台
消息队列
监控运维
云服务
关系型数据库
NoSQL数据库
文件存储
向量数据库
自然语言处理
计算机视觉
语音处理
推荐算法
内容规划服务
风格设计服务
媒体处理服务
模板管理服务
第三方API
知识库/素材库
支付服务
微信/支付宝
通知服务
邮件/短信
认证服务
OAuth2.0
GPU集群
模型训练/推理
计算资源
弹性伸缩
监控系统
Prometheus
日志系统
ELK Stack
性能监控
Grafana
消息队列
RabbitMQ/Kafka
工作流引擎
Airflow
Kubernetes集群
Docker容器
向量数据库
Qdrant/Milvus
对象存储
RustFS/MinIO/阿里云OSS
CDN分发网络
MongoDB
知识片段
Redis
缓存/会话
PostgreSQL
BM2.5
Agentic-RAG
LightAgent
语音识别
Whisper/pyannote
文本转语音
Index1.5/SparkTTS
语音处理引擎
VAD/Segmentation
计算机视觉引擎
图像生成
FLUX.1-Kontext-dev/ControlNet
视频生成
Wan2.1/FusionX
NLP引擎
大语言模型
GPT/Claude
知识图谱
模板管理服务
预设配置服务
渲染管理服务
视频生成服务
动画生成服务
语音合成服务
字幕同步服务
视频编辑服务
风格定义服务
角色设计服务
脚本编写服务
动画类型服务
素材匹配服务
内容解析服务
大纲生成服务
知识提取服务
内容优化服务
Web界面/移动App
RESTful API
第三方SDK集成
API网关
认证/限流/路由
4.2.4 系统模块拆解
⚙️ 智能工作流引擎
📦 制品管理库
📝 智能模板库
👤 AI数字人
🎨 AI素材库
🧠 专业知识库
知识注入
素材供给
角色输出
模板应用
制品输出
使用反馈
效果数据
观看数据
内容规划
📋 主题分析
🎯 目标设定
📝 大纲生成
智能制作
🤖 自动合成
🎬 动态渲染
🔄 实时预览
质量控制
✅ 自动检测
🔍 质量评估
🛠️ 优化建议
制品分类
📚 学科分类
🎯 难度等级
⏱️ 时长分组
👥 受众群体
制品专辑
📑 系列课程
🔗 关联推荐
📈 学习路径
🏆 精品合集
观看分享
▶️ 在线播放
📱 多端同步
🔗 社交分享
📊 数据统计
剪辑模板
🎬 分镜脚本
⏱️ 时间轴
🎵 音效配置
🎨 转场效果
预览配置
👁️ 快速预览
📱 多端适配
⚡ 实时渲染
🔄 版本控制
制品配置
📺 输出规格
🎯 发布平台
📊 质量设置
💾 存储策略
训练素材
📸 人物图片
🎥 视频录像
🎤 语音样本
数字人训练
🧠 面部建模
🗣️ 语音克隆
💃 动作捕捉
😊 表情生成
人设配置
👔 角色设定
🎭 性格特征
🗣️ 说话风格
🎵 声音特色
视频输出
💋 精准对口型
👥 多人对话
🎬 场景互动
📱 实时渲染
原始素材
🖼️ 图片素材
🎬 视频片段
🎯 SVG图形
🎭 ManimClaude动画
智能编辑改造
✂️ 自动剪辑
🎨 风格转换
📐 尺寸适配
🔧 格式转换
AI智能创作
🎪 Flux.1.Dev生成
🎬 FusionX视频
📱 自动布局
🎵 SoundMix配乐匹配
元数据标注
🏷️ 智能标签
📋 使用场景
⏱️ 时长信息
🎯 适用主题
原始数据
📚 学术论文
📖 教科书
🌐 权威网站
LLM知识提取
🤖 QWen/Zhipu
📝 自然语言处理
🔍 实体识别
知识成果
💡 结构化知识
🧩 常识推理
📊 知识图谱
👤 用户输入
💭 创意想法
📝 主题需求
📱 用户获取
🎬 完整视频
📊 学习报告
4.2.5 系统整理架构
生产计划
素材管理
课程管理
最佳素材挑选
AI 课程规划
AI 内容生成
隐空间语义匹配
AI 内容生成
🔍资产要素搜索
首尾帧动画/专场动画
运镜
关键动画/代码推演
组合布局
N, 修改配置
Y, 后台渲染
批量后台渲染
📖 故事板模板
📺 预览配置
📦 成品配置
📝 生成配置
👤 数字人形象
👥 角色设定
🎭 性格特征
🗣️ 说话风格
🎵 声音模型
🎤 语音素材
🎙️ 播音级语音合成
🔊 AI音效
🎵 AI背景音乐
📸 图片素材
FLUX.1-Kontext-dev
ControlNet
🎬 视频素材
Wan2.1
FusionX
🎯 SVG图形
生长动画
🎭 Manim科技动画
元素定制
🔊 字幕动画风格
字体管理
演绎动效
单人说话视频
多人对话视频
对话视频+音效
动画视频+音效
想法/主题/概述
📝 目录大纲
📖 章节概要
📚 参考知识片段
📜 分镜脚本
🔍 生产要素
AI内容分析
自动剪辑计划
批量生产
试生产
预览版
是否满意
成品版

五、预期成果与影响