返回 职位详情 登录/注册
语音识别工程师(FunASR二次开发)
1.5-3万元/月
定位 广州黄埔区深圳君南信息系统有限公司B3-01栋2楼
更新 2025-12-29 13:09:34 浏览 839
职位详情
语音算法 1-3年 C/C++ · 语音识别工作经验 · 计算机相关专业 · Python
【岗位职责】
1、基于FunASR框架开展二次开发与系统维护,搭建自动语音标注及识别系统;
2、设计语音数据自动化处理流程,涵盖音频切分、语音转写、标点还原、时间戳对齐、置信度生成等功能模块;
3、对接人工标注平台,实现语音识别结果的自动生成、人工校验与回写同步机制;
4、根据实际业务需求,对FunASR模型进行优化与微调,提升识别准确率与实时响应性能;
5、参与语音数据清洗、质量检测、标注一致性评估工具的开发与迭代;
6、构建并维护语音识别服务接口(RESTful/gRPC/WebSocket),完成容器化部署(Docker/K8S);
7、撰写相关技术文档、操作指南和接口说明,并为团队提供必要的技术支持。

【任职要求】
1、本科及以上学历,计算机、人工智能、电子信息、自动化、语言处理或相关专业背景;
2、精通Python、C++编程语言,具备扎实的编码与调试能力;
3、掌握PyTorch深度学习框架,熟悉模型加载、训练与推理的基本流程;
4、了解主流语音识别技术,如ASR(自动语音识别)、VAD(语音活动检测)、说话人识别/分离、标点恢复、时间戳对齐等;
5、具有语音数据处理与标注实践经验,熟悉语音标注流程、质量评估标准及相关数据格式(wav.scp、jsonl等);
6、具备服务端开发经历,熟悉Flask/FastAPI/Django中至少一种后端框架;
7、了解Docker及Linux环境下的部署与基础性能调优;
8、能够阅读英文技术文档,理解开源项目结构,具备独立分析与解决问题的能力。
公司信息
深圳君南信息系统有限公司
明细
深圳市南山区粤海街道高新区社区科技南八路2号豪威科技大厦1413
南沙人才网温馨提示
求职过程请勿缴纳费用,谨防诈骗!若信息不实请举报。
相似职位
很抱歉,暂无相似职位!