高级AIGC视频生成算法工程师
2-4万元/月
更新 2025-10-29 10:44:32
浏览 871
职位详情
算法工程师
3-5年
语音算法 · 图像算法 · 分布式训练 · 大模型算法 · 多模态算法 · 大数据处理框架(Spark/Hadoop/Hive) · 算法工程化经验 · Python
岗位职责:
1.跟踪Sora、DiT等先进视频生成技术发展,建立模型评估标准,主导开源与闭源模型的测试选型及业务场景适配
2.搭建视频生成技术中台,完成文本转视频、图像转视频、视频风格迁移、视频插帧等功能的模块化整合与API服务输出
3.针对商业短视频应用场景研发定制化生成模型,围绕意图还原精度、平台流行内容匹配、时序连贯性与画面一致性等需求优化模型性能
4.构建多模态Prompt工程框架,提升文本-图像-视频之间的语义一致性,增强生成内容与商业目标的契合度
任职要求:
1.熟练掌握PyTorch/TensorFlow框架,具备混合精度训练、分布式训练等工程实践能力
2.深入理解Diffusion模型、Transformer、DiT等生成式架构原理,能够根据需求调整模型结构
3.掌握PromptEngineering、LoRA微调等大模型适配方法,具有ControlNet类控制模块开发经验
4.具备处理多模态数据的能力,熟悉CLIP、BLIP等跨模态对齐模型的实际应用
5.了解视频编解码技术(H.264/HEVC),熟练使用FFmpeg/OpenCV等工具链进行视频处理
6.熟悉商业视频制作流程,具备镜头语言、转场特效等影视制作规范认知者优先
负责:
1.跟进外部优质视频生成模型与算法进展,结合需求将其集成至kuaizi产品体系
2.自主研发kuaizi视频生成模型
1.跟踪Sora、DiT等先进视频生成技术发展,建立模型评估标准,主导开源与闭源模型的测试选型及业务场景适配
2.搭建视频生成技术中台,完成文本转视频、图像转视频、视频风格迁移、视频插帧等功能的模块化整合与API服务输出
3.针对商业短视频应用场景研发定制化生成模型,围绕意图还原精度、平台流行内容匹配、时序连贯性与画面一致性等需求优化模型性能
4.构建多模态Prompt工程框架,提升文本-图像-视频之间的语义一致性,增强生成内容与商业目标的契合度
任职要求:
1.熟练掌握PyTorch/TensorFlow框架,具备混合精度训练、分布式训练等工程实践能力
2.深入理解Diffusion模型、Transformer、DiT等生成式架构原理,能够根据需求调整模型结构
3.掌握PromptEngineering、LoRA微调等大模型适配方法,具有ControlNet类控制模块开发经验
4.具备处理多模态数据的能力,熟悉CLIP、BLIP等跨模态对齐模型的实际应用
5.了解视频编解码技术(H.264/HEVC),熟练使用FFmpeg/OpenCV等工具链进行视频处理
6.熟悉商业视频制作流程,具备镜头语言、转场特效等影视制作规范认知者优先
负责:
1.跟进外部优质视频生成模型与算法进展,结合需求将其集成至kuaizi产品体系
2.自主研发kuaizi视频生成模型
相似职位