语音识别工程师(FunASR二次开发)
1.5-3万元/月
更新 2025-12-29 13:09:34
浏览 839
职位详情
语音算法
1-3年
C/C++ · 语音识别工作经验 · 计算机相关专业 · Python
【岗位职责】
1、基于FunASR框架开展二次开发与系统维护,搭建自动语音标注及识别系统;
2、设计语音数据自动化处理流程,涵盖音频切分、语音转写、标点还原、时间戳对齐、置信度生成等功能模块;
3、对接人工标注平台,实现语音识别结果的自动生成、人工校验与回写同步机制;
4、根据实际业务需求,对FunASR模型进行优化与微调,提升识别准确率与实时响应性能;
5、参与语音数据清洗、质量检测、标注一致性评估工具的开发与迭代;
6、构建并维护语音识别服务接口(RESTful/gRPC/WebSocket),完成容器化部署(Docker/K8S);
7、撰写相关技术文档、操作指南和接口说明,并为团队提供必要的技术支持。
【任职要求】
1、本科及以上学历,计算机、人工智能、电子信息、自动化、语言处理或相关专业背景;
2、精通Python、C++编程语言,具备扎实的编码与调试能力;
3、掌握PyTorch深度学习框架,熟悉模型加载、训练与推理的基本流程;
4、了解主流语音识别技术,如ASR(自动语音识别)、VAD(语音活动检测)、说话人识别/分离、标点恢复、时间戳对齐等;
5、具有语音数据处理与标注实践经验,熟悉语音标注流程、质量评估标准及相关数据格式(wav.scp、jsonl等);
6、具备服务端开发经历,熟悉Flask/FastAPI/Django中至少一种后端框架;
7、了解Docker及Linux环境下的部署与基础性能调优;
8、能够阅读英文技术文档,理解开源项目结构,具备独立分析与解决问题的能力。
1、基于FunASR框架开展二次开发与系统维护,搭建自动语音标注及识别系统;
2、设计语音数据自动化处理流程,涵盖音频切分、语音转写、标点还原、时间戳对齐、置信度生成等功能模块;
3、对接人工标注平台,实现语音识别结果的自动生成、人工校验与回写同步机制;
4、根据实际业务需求,对FunASR模型进行优化与微调,提升识别准确率与实时响应性能;
5、参与语音数据清洗、质量检测、标注一致性评估工具的开发与迭代;
6、构建并维护语音识别服务接口(RESTful/gRPC/WebSocket),完成容器化部署(Docker/K8S);
7、撰写相关技术文档、操作指南和接口说明,并为团队提供必要的技术支持。
【任职要求】
1、本科及以上学历,计算机、人工智能、电子信息、自动化、语言处理或相关专业背景;
2、精通Python、C++编程语言,具备扎实的编码与调试能力;
3、掌握PyTorch深度学习框架,熟悉模型加载、训练与推理的基本流程;
4、了解主流语音识别技术,如ASR(自动语音识别)、VAD(语音活动检测)、说话人识别/分离、标点恢复、时间戳对齐等;
5、具有语音数据处理与标注实践经验,熟悉语音标注流程、质量评估标准及相关数据格式(wav.scp、jsonl等);
6、具备服务端开发经历,熟悉Flask/FastAPI/Django中至少一种后端框架;
7、了解Docker及Linux环境下的部署与基础性能调优;
8、能够阅读英文技术文档,理解开源项目结构,具备独立分析与解决问题的能力。
相似职位
很抱歉,暂无相似职位!