AI 虚拟人后端开发工程师( Python )
岗位定位
负责公司 AI 虚拟人( Virtual Human / Digital Human )产品的后端研发与服务化落地,核心包括对话引擎、角色配置、音视频生成调用、知识库接入、用户会话管理以及对外 API 能力的设计与实现。你将和前端/3D/产品/算法团队紧密协作,把“能说会听、有记忆、有形象的 AI 人”做成真正可上线、可运营、可监控的系统。
一、岗位职责
1. 后端服务开发
使用 Python ( FastAPI / Django / Flask 其一)设计并实现 AI 虚拟人相关的后端服务与 RESTful API 、WebSocket 接口。
封装大模型/语音/图像/视频等第三方或自研 AI 能力,提供统一的 Service 层或 Adapter 层,保证可扩展与可替换。
2. 对话与会话管理
设计会话、用户画像、上下文记忆的数据结构,支持多轮对话、角色设定、场景化回复。
支持多角色/多实例虚拟人并行运行(如导览员、客服、讲解员、商务助理等),并做好权限与隔离。
3. AI 能力编排
将语音识别( ASR )、文本生成( LLM )、文本转语音( TTS )、表情/动作驱动、视频合成等能力进行流程化编排( Orchestration ),确保时序、超时、重试、回调等机制完善。
对接第三方 AI 服务( OpenAI 、Azure 、国内大模型、语音服务等),并做好鉴权、限流与日志。
4. 数据与存储设计
设计并实现与虚拟人相关的数据表(用户、会话、脚本、素材、场景配置、调用记录、计费信息等)。
与向量库/知识库(如 FAISS 、Milvus 、Weaviate 、Elasticsearch )交互,支持“角色+知识”的回答模式。
5. 性能与稳定性
编写高质量、可测试的代码,完善单元测试与接口测试。
优化接口响应时延,处理异步任务( Celery / RQ / 自建队列),保证高并发场景下的稳定性。
接入日志、监控、告警(如 Prometheus + Grafana / ELK ),对线上问题进行快速定位。
6. 协作与文档
与前端/3D/Unity/角色编辑工具的同事协作,定义清晰的接口协议( OpenAPI/Swagger )。
输出技术设计文档、接口文档、部署文档,支持持续交付与版本化管理。
二、任职要求
1. 语言基础
精通 Python ,熟悉异步编程( asyncio / FastAPI ),了解常见 Web 框架( FastAPI 优先,Django/Flask 也可)。
代码风格规范,能写出结构清晰、易维护的业务代码。
2. 后端通用能力
熟悉 RESTful API 设计,了解 WebSocket / SSE 等实时通信方式。
熟悉 MySQL / PostgreSQL 至少一种关系型数据库,能够做表结构设计与性能优化。
熟悉 Redis 在缓存、分布式锁、消息队列等场景下的使用。
熟悉 Linux 基本操作,有 Docker 容器化经验者优先。
3. AI/音视频相关经验(满足其一或多项即可)
有对接过大语言模型( OpenAI 、Claude 、国内模型)的经验,了解 prompt 设计和上下文控制。
有过 TTS 、ASR 、语音克隆、视频驱动( Talking Head 、Avatar )等服务的接入经验。
了解向量检索、知识库问答( RAG )基本原理,能在后端完成基本封装。
4. 工程化与安全
有 CI/CD 实践经验,熟悉 Git 工作流。
理解鉴权、签名、Token 过期、用户隔离、多租户等 SaaS 常见问题。
有生产环境运维经验 / 调优经验者优先。
5. 软性要求
对 AI 虚拟人、AIGC 、交互式内容产品有兴趣,愿意快速试错。
沟通顺畅,能理解产品需求并转化为技术实现。
有成长性,能把“能跑的 Demo”做成“可运营的产品”。
三、加分项
有做过 虚拟主播 / 数字分身 / 数字人客服 / 智能导览员 等相关项目的真实线上经验;
有参与过多模型编排框架( LangChain 、LlamaIndex 、Haystack 等)并做过二次封装;
有前后端一体的快速原型能力,能自己搞定简单的管理后台;
有多语言场景(中/英/日/西)文本预处理经验者很适合我们;
有实时音视频( WebRTC 、RTMP 、SRT )经验者优先。
[联系方式]
请将简历投至
[email protected]