职位详情
职位描述:
1. 负责应用的故障发现、故障应急、故障恢复等稳定性领域的工作
2. 负责基础业务的构建部署、监控告警等日常运维工作
3. 负责基础设施内部平台、中间件的设计、研发、运维等工作
4. 推动提升服务稳定性、可拓展型以及成本、性能优化,保障系统SLA
任职要求:
1. 5年以上SRE或devops工程师工作经验
2. 精通linux系统使用,熟练掌握shell、nginx、网络等知识
3. 精通k8s、docker、helm等容器化技术
4. 有使用gitlab、jenkins等工具部署CI/CD经验
5. 了解常用的监控告警工具,比如:prometheus、grafana、vm等
6. 熟练使用阿里云各种云产品(加分项)
7. 参与7*24 oncall值班,有责任心和抗压能力
8. 熟悉常用构建工具:bazel、maven、gradle、npm、yarn
9. 了解主流微服务网关技术,如kong,istio
加分项:
1. 熟悉微服务配置管理,依赖管理
2. 熟悉IaC的管理模式
3. 熟练使用bazel构建工具
4. 有对kong网关插件二开的经验
其他要求:
1. 了解常用密码管理工具
2. 有建设大型基础设施系统经验者优先
其他信息
行业要求:全部行业