大模型算法岗位
1.5-3万元/月
更新 2026-01-15 14:41:09
浏览 826
职位详情
算法工程师
3-5年
语音算法 · 团队管理经验 · 分布式训练 · 深度学习 · 大模型算法 · 自然语言处理算法 · 多模态算法 · 算法工程化经验 · 其他 · 优秀开源项目经历 · SQL · 发表算法相关优秀论文 · 强化学习 · 参加算法相关竞赛/获奖 · 模型加速
岗位职责
1.主导或参与车载垂直领域大模型的架构设计与开发工作:聚焦车控、导航、娱乐、问答等车载应用场景,开展预训练语言模型的结构设计、持续预训练及对齐优化(SFT/RLHF),增强模型在车载环境中的对话理解、任务完成与个性化服务能力
2.攻克大规模模型训练关键技术难题:深入实践分布式并行训练方法(数据并行、张量并行、流水线并行),优化主流训练框架(如DeepSpeed、Megatron-LM),应对千亿参数级别模型在训练过程中的性能瓶颈、显存消耗与系统稳定性问题
3.设计高效推理与落地部署方案:研究面向车规级硬件平台的轻量化推理技术,涵盖模型量化、知识蒸馏、结构剪枝以及动态批处理、KVCache压缩等手段,实现计算效率与终端资源占用的最优匹配
4.推动前沿技术落地应用:紧密跟踪学术界与产业界最新进展(如MoE架构、多模态融合、智能Agent等方向),结合实际车载业务需求进行快速实验验证与工程化转化,持续提升模型综合能力边界
5.完善AI底层能力建设:参与搭建覆盖数据预处理、预训练、微调到评估上线的全链路大模型研发体系,支撑高效迭代与规模化应用
任职要求
1.计算机科学、人工智能、数学等相关专业本科及以上学历,具备3年以上自然语言处理或深度学习相关项目研发经验
2.深入掌握Transformer核心机制,了解主流大模型(如LLaMA系列、GPT系列)的技术演进路径与内部原理
3.熟练使用PyTorch或TensorFlow框架,具有扎实的Python/C++编程能力,熟悉Linux下开发流程与工具链
4.拥有在大规模GPU集群上训练模型的实际经验,至少熟练掌握一种主流分布式训练框架(如Megatron-DeepSpeed、ColossalAI、FairScale等)
5.熟悉大模型预训练全流程核心技术环节,包括海量文本数据清洗、词表构建、预训练任务设计与实施等
1.主导或参与车载垂直领域大模型的架构设计与开发工作:聚焦车控、导航、娱乐、问答等车载应用场景,开展预训练语言模型的结构设计、持续预训练及对齐优化(SFT/RLHF),增强模型在车载环境中的对话理解、任务完成与个性化服务能力
2.攻克大规模模型训练关键技术难题:深入实践分布式并行训练方法(数据并行、张量并行、流水线并行),优化主流训练框架(如DeepSpeed、Megatron-LM),应对千亿参数级别模型在训练过程中的性能瓶颈、显存消耗与系统稳定性问题
3.设计高效推理与落地部署方案:研究面向车规级硬件平台的轻量化推理技术,涵盖模型量化、知识蒸馏、结构剪枝以及动态批处理、KVCache压缩等手段,实现计算效率与终端资源占用的最优匹配
4.推动前沿技术落地应用:紧密跟踪学术界与产业界最新进展(如MoE架构、多模态融合、智能Agent等方向),结合实际车载业务需求进行快速实验验证与工程化转化,持续提升模型综合能力边界
5.完善AI底层能力建设:参与搭建覆盖数据预处理、预训练、微调到评估上线的全链路大模型研发体系,支撑高效迭代与规模化应用
任职要求
1.计算机科学、人工智能、数学等相关专业本科及以上学历,具备3年以上自然语言处理或深度学习相关项目研发经验
2.深入掌握Transformer核心机制,了解主流大模型(如LLaMA系列、GPT系列)的技术演进路径与内部原理
3.熟练使用PyTorch或TensorFlow框架,具有扎实的Python/C++编程能力,熟悉Linux下开发流程与工具链
4.拥有在大规模GPU集群上训练模型的实际经验,至少熟练掌握一种主流分布式训练框架(如Megatron-DeepSpeed、ColossalAI、FairScale等)
5.熟悉大模型预训练全流程核心技术环节,包括海量文本数据清洗、词表构建、预训练任务设计与实施等
相似职位
很抱歉,暂无相似职位!