返回 职位详情 登录/注册
大模型算法岗位
1.5-3万元/月
定位 北京海淀区硅谷亮城2A座201室
更新 2026-01-15 14:41:09 浏览 826
职位详情
算法工程师 3-5年 语音算法 · 团队管理经验 · 分布式训练 · 深度学习 · 大模型算法 · 自然语言处理算法 · 多模态算法 · 算法工程化经验 · 其他 · 优秀开源项目经历 · SQL · 发表算法相关优秀论文 · 强化学习 · 参加算法相关竞赛/获奖 · 模型加速
岗位职责
1.主导或参与车载垂直领域大模型的架构设计与开发工作:聚焦车控、导航、娱乐、问答等车载应用场景,开展预训练语言模型的结构设计、持续预训练及对齐优化(SFT/RLHF),增强模型在车载环境中的对话理解、任务完成与个性化服务能力

2.攻克大规模模型训练关键技术难题:深入实践分布式并行训练方法(数据并行、张量并行、流水线并行),优化主流训练框架(如DeepSpeed、Megatron-LM),应对千亿参数级别模型在训练过程中的性能瓶颈、显存消耗与系统稳定性问题

3.设计高效推理与落地部署方案:研究面向车规级硬件平台的轻量化推理技术,涵盖模型量化、知识蒸馏、结构剪枝以及动态批处理、KVCache压缩等手段,实现计算效率与终端资源占用的最优匹配

4.推动前沿技术落地应用:紧密跟踪学术界与产业界最新进展(如MoE架构、多模态融合、智能Agent等方向),结合实际车载业务需求进行快速实验验证与工程化转化,持续提升模型综合能力边界

5.完善AI底层能力建设:参与搭建覆盖数据预处理、预训练、微调到评估上线的全链路大模型研发体系,支撑高效迭代与规模化应用

任职要求
1.计算机科学、人工智能、数学等相关专业本科及以上学历,具备3年以上自然语言处理或深度学习相关项目研发经验

2.深入掌握Transformer核心机制,了解主流大模型(如LLaMA系列、GPT系列)的技术演进路径与内部原理

3.熟练使用PyTorch或TensorFlow框架,具有扎实的Python/C++编程能力,熟悉Linux下开发流程与工具链

4.拥有在大规模GPU集群上训练模型的实际经验,至少熟练掌握一种主流分布式训练框架(如Megatron-DeepSpeed、ColossalAI、FairScale等)

5.熟悉大模型预训练全流程核心技术环节,包括海量文本数据清洗、词表构建、预训练任务设计与实施等
公司信息
奇瑞汽车股份有限公司
明细
安徽省芜湖市经济技术开发区长春路8号
城口人才网温馨提示
求职过程请勿缴纳费用,谨防诈骗!若信息不实请举报。
相似职位
很抱歉,暂无相似职位!