工作职责
-负责云运维平台的设计与研发工作,构建云时代的运维平台
-设计及开发大规模云平台的自动化管理系统(含变更/故障/监控/容量等子系统),提升云平台的可用性和运维效率
-和运维同学合作,实现平台对云的可用性管理,如变更、故障、监控、容量等方向的自动化与平台化工作
任职要求
-计算机基础扎实,了解常见网络协议(TCP/IP,HTTP等),扎实的编程能力,一定的算法和数据结构功底,较好的合作开发能力
-有云计算、运维系统、分布式系统、Web后端等1个或多个系统的研发经验
-熟练掌握1门以上开发语言( Python、Go、C/C++、PHP、Java 等),并具备快速迁移能力,可以快速掌握别的语言
-具有1年以上研发经验,熟悉 Linux 开发环境
-了解常见的设计模式,并有自己的理解,能够设计分布式、高并发、高可靠的服务
-务实、自我驱动、follow through、主动学习能力强
加分项:
-开源项目贡献者优先
-对 SRE、运维、DevOps 拥有深刻理解并且有实践经验者优先
-了解 OpenStack、Docker、Kubernetes、PaddlePaddle、Docker、Kubernetes、CUDA并有相关开发经验者优先