技术运维工程师-熟悉k8s-2年以上
7000-11000元/月
更新 2025-12-17 14:31:39
浏览 530
职位详情
运维工程师
1-3年
通信相关专业 · 计算机相关专业 · Kubernetes
能力要求
计算机、信息管理或相关专业统招大学专科及以上学历;具有两年及以上系统运维经验;熟练掌握阿里云、腾讯云等主流云服务平台的管理操作;具备扎实的Linux系统管理及Shell/Python脚本编写能力;熟悉主流监控与日志分析系统;了解网络与安全基础知识。具有网络安全等级保护(等保)项目实战经验或安全相关认证(如CISP)者优先。具有良好的服务意识、责任心及沟通能力。
工作内容
1)核心系统全链路监控与保障服务
负责对公司数据系统、业务平台及关键应用进行7x24小时全链路监控。通过配置和维护监控工具(如Zabbix、Prometheus、Grafana等),实时追踪服务器性能、数据库状态、应用服务健康度及业务关键指标。定期分析监控数据,产出运行健康报告与容量预测报告,提前发现潜在风险,保障系统高可用性。
2)云平台管理与安全运维服务
负责阿里云、腾讯云等主流云平台资源的日常运维管理。具体包括:云服务器(ECS/CVM)、网络(VPC、负载均衡)、数据库(RDS)等核心服务的配置、扩容与优化。重点负责云平台安全策略的配置与管理,如安全组(SecurityGroup)规则、网络访问控制列表(ACL)、Web应用防火墙(WAF)策略的制定、实施与审计,确保云端架构符合安全基线要求。
3)容器化平台与自动化部署支持服务
熟悉Docker容器化技术及Kubernetes(K8s)容器编排平台,能够进行日常维护与故障排查。协助开发团队管理容器镜像仓库,维护K8s集群的节点、命名空间、工作负载(Deployment/StatefulSet)及服务配置。参与基于容器技术的CI/CD流水线的维护与优化,实现服务的自动化构建、测试与发布,提升交付效率。
4)安全策略实施与等保合规专项服务
协助制定、评审并实施信息系统安全策略、基线配置与访问控制规则。主导或深度参与网络安全等级保护(第二级/第三级)的合规建设专项工作,具体包括:对照等保2.0标准进行差距分析、协助制定整改方案、落实安全加固措施(如漏洞修复、日志审计、策略优化),并负责整理、撰写测评所需的各类管理制度、技术记录及证明材料,确保系统通过测评并满足持续合规要求。
5)系统级故障与安全事件应急响应服务
建立并维护系统故障及安全事件应急预案。对发生的系统中断、性能劣化、网络攻击或数据安全事件进行快速响应、初步判断与止损处理。协调相关资源进行故障排查与恢复,执行应急预案中的操作步骤。事后主导或参与根因分析,编写事件报告,并推动整改措施落地,以提升系统韧性。
6)技术架构与运维知识库文档服务
负责绘制、更新和维护系统架构图、网络拓扑图、部署关系图等技术图纸。编写、修订运维手册、系统安装配置手册、应急预案手册及标准化操作流程(SOP)。将运维过程中遇到的典型问题、解决方案归纳沉淀至统一知识库,形成经验共享,助力团队能力提升。
7)综合技术支撑与临时专项任务
配合其他团队完成办公环境网络、桌面系统等的基础技术支撑。响应并完成甲方安排的各项临时性技术任务,如新技术调研报告撰写、配合审计提供技术资料、重要活动期间的技术保障支持等,确保部门整体技术工作顺利开展。
8)领导交办的其它事务。
计算机、信息管理或相关专业统招大学专科及以上学历;具有两年及以上系统运维经验;熟练掌握阿里云、腾讯云等主流云服务平台的管理操作;具备扎实的Linux系统管理及Shell/Python脚本编写能力;熟悉主流监控与日志分析系统;了解网络与安全基础知识。具有网络安全等级保护(等保)项目实战经验或安全相关认证(如CISP)者优先。具有良好的服务意识、责任心及沟通能力。
工作内容
1)核心系统全链路监控与保障服务
负责对公司数据系统、业务平台及关键应用进行7x24小时全链路监控。通过配置和维护监控工具(如Zabbix、Prometheus、Grafana等),实时追踪服务器性能、数据库状态、应用服务健康度及业务关键指标。定期分析监控数据,产出运行健康报告与容量预测报告,提前发现潜在风险,保障系统高可用性。
2)云平台管理与安全运维服务
负责阿里云、腾讯云等主流云平台资源的日常运维管理。具体包括:云服务器(ECS/CVM)、网络(VPC、负载均衡)、数据库(RDS)等核心服务的配置、扩容与优化。重点负责云平台安全策略的配置与管理,如安全组(SecurityGroup)规则、网络访问控制列表(ACL)、Web应用防火墙(WAF)策略的制定、实施与审计,确保云端架构符合安全基线要求。
3)容器化平台与自动化部署支持服务
熟悉Docker容器化技术及Kubernetes(K8s)容器编排平台,能够进行日常维护与故障排查。协助开发团队管理容器镜像仓库,维护K8s集群的节点、命名空间、工作负载(Deployment/StatefulSet)及服务配置。参与基于容器技术的CI/CD流水线的维护与优化,实现服务的自动化构建、测试与发布,提升交付效率。
4)安全策略实施与等保合规专项服务
协助制定、评审并实施信息系统安全策略、基线配置与访问控制规则。主导或深度参与网络安全等级保护(第二级/第三级)的合规建设专项工作,具体包括:对照等保2.0标准进行差距分析、协助制定整改方案、落实安全加固措施(如漏洞修复、日志审计、策略优化),并负责整理、撰写测评所需的各类管理制度、技术记录及证明材料,确保系统通过测评并满足持续合规要求。
5)系统级故障与安全事件应急响应服务
建立并维护系统故障及安全事件应急预案。对发生的系统中断、性能劣化、网络攻击或数据安全事件进行快速响应、初步判断与止损处理。协调相关资源进行故障排查与恢复,执行应急预案中的操作步骤。事后主导或参与根因分析,编写事件报告,并推动整改措施落地,以提升系统韧性。
6)技术架构与运维知识库文档服务
负责绘制、更新和维护系统架构图、网络拓扑图、部署关系图等技术图纸。编写、修订运维手册、系统安装配置手册、应急预案手册及标准化操作流程(SOP)。将运维过程中遇到的典型问题、解决方案归纳沉淀至统一知识库,形成经验共享,助力团队能力提升。
7)综合技术支撑与临时专项任务
配合其他团队完成办公环境网络、桌面系统等的基础技术支撑。响应并完成甲方安排的各项临时性技术任务,如新技术调研报告撰写、配合审计提供技术资料、重要活动期间的技术保障支持等,确保部门整体技术工作顺利开展。
8)领导交办的其它事务。
相似职位
很抱歉,暂无相似职位!