職位描述

崗位職責:
1、從事米大師海外計費相關網站類/后臺類系統運營維護、規劃建設工作;版本上線變更/業務聯調/現網監控/故障處理等日常運維工作,保障現網安全運營質量;在線上系統生命周期的各階段進行全方位的穩定性評審,發現薄弱點,組織和實施各類改進措施、預案演練等工作;
2、維護大型 k8s 集群及數據庫、消息隊列中間件,保障業務高度穩定性;提供云原生改造、架構優化建議服務和技術支持,不斷提升性能與可靠性;
3、提供高效的監控、故障快速自愈的手段和能力,應用數據驅動、自動化運維等方式提升運維效率和穩定性運營能力,持續向自動化,標準化方向迭代優化,不斷提升線上服務整體質量;
4、參與業務系統容量測算和規劃設計,提升業務穩定性,優化資源運維成本,持續提升效率、成本、質量、安全等方面的核心sre能力;
5、通過體系化的監控、運維、容量管理、資源成本管理、跨區域容災建設、撥測巡檢、流程規范建設、應急響應、事故管理等方式維護線上服務穩定性,保證服務slo;
6、與海內外團隊共同實施各類全球、全鏈路活動重保,抗擊流量洪峰,保障全鏈路穩定性;完善跨團隊/時區/區域合作機制,基于業務導向,提供符合實際業務場景的sre解決方案;
任職要求:
1、計算機或相關技術專業本科及以上學歷,良好的英語溝通能力,從事過業務系統開發或者運維,了解系統的業務邏輯,熟悉運維規范;有大型云計算公司從業經驗,對于騰訊云、aws / gcp / azure 運維、應用工作經驗者優先;
2、熟悉linux 內核,對內核網絡、存儲、文件系統、內存、調度器、cgroup有相關實踐;能夠熟練排查系統層、網絡層等性能問題及故障;熟悉linux下常用web應用軟件/數據庫軟件的應用和配置調優,以及系統均衡容災設計,有大集群系統建設維護經驗者優先;
3、具有一種或多種編程語言的經驗,如java、c++、go或shell和python腳本編寫經驗;熟悉容器化開發,有kubernetes社區貢獻者優先;
4、具有資深的kubernetes運維經驗,有較深入的業務高可用、容災架構優化實踐經驗;具備etcd/zookeeper/hdfs/kafka/elk/nginx/pulsar/mysql/redis/lvs/ keepalived 等開源軟件的運維經驗者優先;
5、具有較強的責任心,積極主動的團隊合作精神,并有很強的溝通、綜合分析以及主動推進問題直至解決的能力;有較強的危機和風險意識,較強的owner意識,能夠經受較大工作壓力;
工作地點
地址:深圳南山區深圳-南山區深圳灣科技生態園12棟a座


職位發布者
HR
深圳市騰訊計算機系統有限公司


-
互聯網·電子商務
-
1000人以上
-
股份制企業
-
深圳市南山區高新區高新南一路飛亞達大廈5-10樓