大模型应用研发工程师(需长期外派)
1.5-3万元/月
更新 2025-12-28 14:21:55
浏览 377
职位详情
大模型算法
经验不限
计算机相关专业
岗位职责
1.大模型应用功能的二次开发与参数优化:依托LangChain/LlamaIndex/Dify/Haystack/RAGFlow/Flowise等开源平台进行定制化开发及深度参数调整,实现专用文档解析模块、向量索引机制、Agent工具集成、Prompt架构设计、结果重排序模型、权限控制逻辑等功能扩展。
2.大模型推理引擎的部署与性能调优:结合pytorch、vllm、sglang等开源框架,根据客户硬件资源配置优化推理参数,实现高效稳定的推理服务性能。
3.私有化场景下的端到端部署与交付:基于K8S完成大模型应用系统的定制化构建,并完成在客户现场的全流程部署与上线支持。
4.系统持续维护与技术支持:承担系统上线后的版本迭代、问题排查与应急响应任务,输出运维文档、故障处理流程及培训资料。
任职要求
1.计算机类相关专业本科及以上学历,具备2年以上AI工程实施或私有化项目交付经验。
2.熟练掌握以下至少两类开源框架,并拥有实际部署和二次开发经历:LangChain/LlamaIndex/Dify/Haystack/RAGFlow/FastGPT/Flowise
3.至少了解一种主流大模型推理方案(如hf原生/vllm/sglang),掌握其底层推理并行技术原理。
4.精通Python与PyTorch,具备扎实的工程实现能力;能够使用C++/CUDA或Golang开发高性能计算组件或辅助服务模块。
5.掌握向量数据库(Milvus、Weaviate、PGVector、OpenSearch-k-NN)的高可用架构部署、性能优化及数据迁移策略;
6.具备强烈的技术探索意愿,良好的表达能力和协作意识,能积极应对变化并快速融入新环境;拥有较强的逻辑分析、沟通协调、抗压调节与情绪管理能力。
【base城市:北京or长春】
1.大模型应用功能的二次开发与参数优化:依托LangChain/LlamaIndex/Dify/Haystack/RAGFlow/Flowise等开源平台进行定制化开发及深度参数调整,实现专用文档解析模块、向量索引机制、Agent工具集成、Prompt架构设计、结果重排序模型、权限控制逻辑等功能扩展。
2.大模型推理引擎的部署与性能调优:结合pytorch、vllm、sglang等开源框架,根据客户硬件资源配置优化推理参数,实现高效稳定的推理服务性能。
3.私有化场景下的端到端部署与交付:基于K8S完成大模型应用系统的定制化构建,并完成在客户现场的全流程部署与上线支持。
4.系统持续维护与技术支持:承担系统上线后的版本迭代、问题排查与应急响应任务,输出运维文档、故障处理流程及培训资料。
任职要求
1.计算机类相关专业本科及以上学历,具备2年以上AI工程实施或私有化项目交付经验。
2.熟练掌握以下至少两类开源框架,并拥有实际部署和二次开发经历:LangChain/LlamaIndex/Dify/Haystack/RAGFlow/FastGPT/Flowise
3.至少了解一种主流大模型推理方案(如hf原生/vllm/sglang),掌握其底层推理并行技术原理。
4.精通Python与PyTorch,具备扎实的工程实现能力;能够使用C++/CUDA或Golang开发高性能计算组件或辅助服务模块。
5.掌握向量数据库(Milvus、Weaviate、PGVector、OpenSearch-k-NN)的高可用架构部署、性能优化及数据迁移策略;
6.具备强烈的技术探索意愿,良好的表达能力和协作意识,能积极应对变化并快速融入新环境;拥有较强的逻辑分析、沟通协调、抗压调节与情绪管理能力。
【base城市:北京or长春】
相似职位
很抱歉,暂无相似职位!