大模型开发
1.1-2.2万元/月
更新 2025-12-19 14:12:23
浏览 130
职位详情
大模型算法
3-5年
深度学习 · 大模型研发
面向人工智能、科学计算与大数据处理融合的智能体系架构,开展大规模预训练模型相关研究工作。
涵盖数据清洗、算法设计、训练推理、模型压缩等关键技术方向。
岗位职责:
1.与团队成员协作推进项目,完成各类模块或功能的设计与实现,并进行系统性能优化;
解决大规模预训练模型研发中的核心算法难题,如模型评估、缓解模型幻觉等问题。
2.持续探索创新方法,提升研发效率,增强团队协同开发能力。
任职要求:
1.硕士及以上学历,计算机科学与技术专业优先,计算机、人工智能、大数据知识工程、电子信息、通信等相关领域亦可;
2.具备良好的编程习惯与文档编写能力,有团队协作开发及代码评审经验,对代码质量有严格标准;
熟悉通用开发规范,掌握git等工具,具备代码库搭建与维护能力;
3.掌握深度学习基础理论,至少熟练使用一种主流深度学习框架,如PyTorch、TensorFlow、Paddle、MindSpore等,
具备模型开发、部署及微调实践经验;
4.对Transformer结构和深度学习有深入理解与实际应用经验,能基于论文复现算法;
有大规模预训练模型训练与研发经历者优先,ACL、EMNLP、COLING、NAACL等高水平会议论文发表者优先。
涵盖数据清洗、算法设计、训练推理、模型压缩等关键技术方向。
岗位职责:
1.与团队成员协作推进项目,完成各类模块或功能的设计与实现,并进行系统性能优化;
解决大规模预训练模型研发中的核心算法难题,如模型评估、缓解模型幻觉等问题。
2.持续探索创新方法,提升研发效率,增强团队协同开发能力。
任职要求:
1.硕士及以上学历,计算机科学与技术专业优先,计算机、人工智能、大数据知识工程、电子信息、通信等相关领域亦可;
2.具备良好的编程习惯与文档编写能力,有团队协作开发及代码评审经验,对代码质量有严格标准;
熟悉通用开发规范,掌握git等工具,具备代码库搭建与维护能力;
3.掌握深度学习基础理论,至少熟练使用一种主流深度学习框架,如PyTorch、TensorFlow、Paddle、MindSpore等,
具备模型开发、部署及微调实践经验;
4.对Transformer结构和深度学习有深入理解与实际应用经验,能基于论文复现算法;
有大规模预训练模型训练与研发经历者优先,ACL、EMNLP、COLING、NAACL等高水平会议论文发表者优先。
相似职位
很抱歉,暂无相似职位!