阿里云智能-容器/云原生/管控技术专家-
4-7万元/月
更新 2025-12-29 14:32:46
浏览 88
职位详情
Golang
5-10年
Golang · Docker · MySQL · Golang服务端开发经验 · 计算机相关专业 · Python · Kubernetes
岗位:阿里云智能-容器&Kubernetes技术专家-杭州/北京
职位描述
1.负责阿里云容器服务产品平台化及底层核心服务能力建设,负责阿里云容器产品的架构设计、开发与运维工作,同时支撑多个垂直领域的企业业务运行;
2.负责容器服务产品ACK、ACS的建设,能结合容器平台之上复杂多样的业务类型,提出产品能力的优化建议,提升容器服务产品的稳定性与高效性;
3.负责容器领域前沿技术的探索,对云原生AI和大数据等场景的支持。
职位要求
1.对容器和基础设施相关领域5年以上相关开发经验(如Kubernetes、Serverless平台、容器网络与存储、运维平台等云原生基础设施其中某一方向有丰富积累和突出成果);
2.精通Kubernetes,GitOps,CICD,Docker,Containerd,RunC等容器技术、相关开源项目贡献者优先;
3.熟练掌握Golang语言开发,具备Rust,Python,Shell等其他一种或多种语言开发经验;
4.对Linux系统有较深入的理解,对cgroup/namespace隔离技术了解优先,对虚拟化技术有过接触了解优先,有容器技术生产环境运维经验者优先;
5.具备较强的ownership,以结果为导向,强项业务领域内善于决策;良好的表达、组织、沟通和协作能力,对技术有激情,喜欢钻研,良好的学习能力。
岗位:阿里云智能-云管平台技术专家-北京/杭州
职位描述
1、技术方案设计
•收集、识别、分析客户的需求,围绕云管平台的定位和涉及的云产品的特性确定相应技术方案的目标、范围和交付成果;
•基于需求分析,进行技术可行性分析和方案评审,结合当前的技术架构进行合适的技术选型、功能设计、技术架构、数据架构和开发流程等;
2、技术实现
•基于技术方案的拆解,按照任务目标和产出规范,完成任务/子任务的设计、编码开发和系统功能实现;
•负责核心功能的架构与代码模板的编写,开发与维护云管平台核心业务模块,优化程序性能等;
•对编码进行阶段性的讨论和CodeReview,并通过调试优化,推动代码成功部署;
•对开发中和部署后的程序进行必要的维护和迭代,包括值班oncall、bug排查、问题诊断、产品体验改善、性能和成本优化等;
•编写技术文档,如操作手册、故障排除指南、API文档等,以支持日常答疑运维工作;
3、安全、稳定、效率和性能优化
•运用产品优化技术和方法,实现安全保障和优化系统性能,提高阿里云产品管控安全性,同时帮助客户提效,给客户更好的体验;
4、技术预研
•跟踪和了解国内外云管平台技术发展和趋势,结合业务实际需要提供有效的技术支持和架构建议;
5、技术规划
•理解业务重点,基于业务需求作出高可用、高可靠、高拓展性的技术架构规划和落地。
职位要求
•5年以上IT、互联网、云计算开发、运维相关工作经验;
•精通Python语言,有通过Python语言开发过Web平台,熟悉1-2个其他语言;
•熟练掌握Mysql原理和使用,熟练掌握缓存的使用;
•熟悉Linux操作系统常见命令,能写简单的Shell脚本;
•了解常见Web攻击方式,熟悉基本的计算机网络原理;
•具备良好的代码质量意识,熟悉单元测试和自动化接口测试;
•对自己负责的研发模块具备快速上线、响应、应急处理能力;
•能够独立的进行模块、子系统或子领域的复杂度治理工作和跨1-2个技术栈的方案设计工作;
•在架构设计中能够梳理明确模块的增删改,并据此分解开发工作项和相互依赖,考虑技术投入产出比(ROI)、性能优化。
加分项:
•熟悉阿里云云产品,有云管平台开发经验和阿里云OpenAPI使用经验;
•拥有自己内容充实的技术类文章/博客。
岗位:阿里云智能-云原生AI技术专家-北京/杭州
职位描述
1、负责阿里云容器服务云原生AI/大数据产品与解决方案的设计、架构、研发迭代,提升容器化AI/大数据场景的效率、性能和易用性;
2、参与ACK云原生AI套件产品的架构设计与迭代,持续有效支撑AIGC/LLM等新负载演进;
3、参与异构资源调度,大规模GPU集群智能化运维,资源弹性、稳定性和资源利用率优化等容器智算方向研发运维工作;
4、带领对业内云原生AI/大数据系统,开源MLOps/MLSys等前沿技术领域的进展跟进与调研、落地.
职位要求
1、5年以上IT、互联网、云计算开发相关工作经验,计算机基础知识与编程基本功扎实,熟悉Go/Python/C++至少一种;
2、2年及以上分布式系统、资源调度、容器、Kubernetes相关领域产品和技术开发经验,参与过大规模分布式系统的开发和维护;
3、了解GPU容器、云原生AI、MLOps、容器网络/存储/运行时等领域技术;
4、良好的沟通能力和团队协作精神,严谨的工作态度与高质量意识;/5、善于学习新的知识,动手能力强,有进取心.
加分项:
1、具有典型的AI、大数据、HPC系统架构、开发或运维经验,了解与容器结合的方法;
2、熟悉计算机体系结构,Linux内核和异构设备管理,了解GPU架构、Cuda编程;
3、熟悉Kubernetes/Yarn/Slurm等调度系统,有二次开发经验;
4、一种及以上分布式计算框架的开发经验(Tensorflow/Pytorch/Jax/Deepspeed/Triton/Spark/Flink/Ray等),对AI算法性能优化有认识/经验者优先;
5、有云原生、AI、大数据相关开源项目维护、定开或大规模生产使用经验。
职位描述
1.负责阿里云容器服务产品平台化及底层核心服务能力建设,负责阿里云容器产品的架构设计、开发与运维工作,同时支撑多个垂直领域的企业业务运行;
2.负责容器服务产品ACK、ACS的建设,能结合容器平台之上复杂多样的业务类型,提出产品能力的优化建议,提升容器服务产品的稳定性与高效性;
3.负责容器领域前沿技术的探索,对云原生AI和大数据等场景的支持。
职位要求
1.对容器和基础设施相关领域5年以上相关开发经验(如Kubernetes、Serverless平台、容器网络与存储、运维平台等云原生基础设施其中某一方向有丰富积累和突出成果);
2.精通Kubernetes,GitOps,CICD,Docker,Containerd,RunC等容器技术、相关开源项目贡献者优先;
3.熟练掌握Golang语言开发,具备Rust,Python,Shell等其他一种或多种语言开发经验;
4.对Linux系统有较深入的理解,对cgroup/namespace隔离技术了解优先,对虚拟化技术有过接触了解优先,有容器技术生产环境运维经验者优先;
5.具备较强的ownership,以结果为导向,强项业务领域内善于决策;良好的表达、组织、沟通和协作能力,对技术有激情,喜欢钻研,良好的学习能力。
岗位:阿里云智能-云管平台技术专家-北京/杭州
职位描述
1、技术方案设计
•收集、识别、分析客户的需求,围绕云管平台的定位和涉及的云产品的特性确定相应技术方案的目标、范围和交付成果;
•基于需求分析,进行技术可行性分析和方案评审,结合当前的技术架构进行合适的技术选型、功能设计、技术架构、数据架构和开发流程等;
2、技术实现
•基于技术方案的拆解,按照任务目标和产出规范,完成任务/子任务的设计、编码开发和系统功能实现;
•负责核心功能的架构与代码模板的编写,开发与维护云管平台核心业务模块,优化程序性能等;
•对编码进行阶段性的讨论和CodeReview,并通过调试优化,推动代码成功部署;
•对开发中和部署后的程序进行必要的维护和迭代,包括值班oncall、bug排查、问题诊断、产品体验改善、性能和成本优化等;
•编写技术文档,如操作手册、故障排除指南、API文档等,以支持日常答疑运维工作;
3、安全、稳定、效率和性能优化
•运用产品优化技术和方法,实现安全保障和优化系统性能,提高阿里云产品管控安全性,同时帮助客户提效,给客户更好的体验;
4、技术预研
•跟踪和了解国内外云管平台技术发展和趋势,结合业务实际需要提供有效的技术支持和架构建议;
5、技术规划
•理解业务重点,基于业务需求作出高可用、高可靠、高拓展性的技术架构规划和落地。
职位要求
•5年以上IT、互联网、云计算开发、运维相关工作经验;
•精通Python语言,有通过Python语言开发过Web平台,熟悉1-2个其他语言;
•熟练掌握Mysql原理和使用,熟练掌握缓存的使用;
•熟悉Linux操作系统常见命令,能写简单的Shell脚本;
•了解常见Web攻击方式,熟悉基本的计算机网络原理;
•具备良好的代码质量意识,熟悉单元测试和自动化接口测试;
•对自己负责的研发模块具备快速上线、响应、应急处理能力;
•能够独立的进行模块、子系统或子领域的复杂度治理工作和跨1-2个技术栈的方案设计工作;
•在架构设计中能够梳理明确模块的增删改,并据此分解开发工作项和相互依赖,考虑技术投入产出比(ROI)、性能优化。
加分项:
•熟悉阿里云云产品,有云管平台开发经验和阿里云OpenAPI使用经验;
•拥有自己内容充实的技术类文章/博客。
岗位:阿里云智能-云原生AI技术专家-北京/杭州
职位描述
1、负责阿里云容器服务云原生AI/大数据产品与解决方案的设计、架构、研发迭代,提升容器化AI/大数据场景的效率、性能和易用性;
2、参与ACK云原生AI套件产品的架构设计与迭代,持续有效支撑AIGC/LLM等新负载演进;
3、参与异构资源调度,大规模GPU集群智能化运维,资源弹性、稳定性和资源利用率优化等容器智算方向研发运维工作;
4、带领对业内云原生AI/大数据系统,开源MLOps/MLSys等前沿技术领域的进展跟进与调研、落地.
职位要求
1、5年以上IT、互联网、云计算开发相关工作经验,计算机基础知识与编程基本功扎实,熟悉Go/Python/C++至少一种;
2、2年及以上分布式系统、资源调度、容器、Kubernetes相关领域产品和技术开发经验,参与过大规模分布式系统的开发和维护;
3、了解GPU容器、云原生AI、MLOps、容器网络/存储/运行时等领域技术;
4、良好的沟通能力和团队协作精神,严谨的工作态度与高质量意识;/5、善于学习新的知识,动手能力强,有进取心.
加分项:
1、具有典型的AI、大数据、HPC系统架构、开发或运维经验,了解与容器结合的方法;
2、熟悉计算机体系结构,Linux内核和异构设备管理,了解GPU架构、Cuda编程;
3、熟悉Kubernetes/Yarn/Slurm等调度系统,有二次开发经验;
4、一种及以上分布式计算框架的开发经验(Tensorflow/Pytorch/Jax/Deepspeed/Triton/Spark/Flink/Ray等),对AI算法性能优化有认识/经验者优先;
5、有云原生、AI、大数据相关开源项目维护、定开或大规模生产使用经验。
相似职位
很抱歉,暂无相似职位!