Opportunity Description
AI数据中⼼⽹络运营⼯程师 深圳 分享 在腾讯,优秀的技术运营工程师始终赋能业务,关注技术运营的质量、成本、效率和安全。他们不仅是经验丰富的问题解决者,更是具有全局视角的架构师,通过自动化工具的建设,强力提升平台效能,助力业务发展。 岗位职责 1.⽹络运营保障:负责数据中⼼ RoCE ⽹络的⽇常运维,包括⽹络监控、告警处理、变更管理,保障⽹络⾼可⽤和低延迟;
2.故障诊断与应急:主导⽹络故障的快速定位与恢复,尤其是 PFC Storm / PFC Deadlock、丢包、链路降级、拥塞;
3.扩散等⽆损以太⽹典型问题的诊断处理;
4.性能调优:根据业务负载特征,调整拥塞控制策略(PFC 阈值 / ECN 标记 / DCQCN 算法参数)、交换机 Buffer;
5.策略(Headroom / Shared Buffer / α 值)、ECMP 负载均衡策略等,持续优化⽹络吞吐和延迟表现;
6.容量规划:参与⽹络架构评审和容量规划,评估现⽹瓶颈,为扩容/新建集群提供技术⽅案;
7.⾃动化运维:协同开发团队,推动⽹络运维⼯具和⾃动化平台的需求定义与落地,提升运维效率;
8.⽂档与知识沉淀:建设⽹络运营知识库,输出最佳实践、故障案例库和操作⼿册。 岗位要求 一、基本要求
1.计算机科学、通信⼯程、电⼦信息或相关专业本科及以上学历;2 年以上数据中⼼⽹络运维/运营经验;
2.熟悉数据中⼼⽹络架构(Spine-Leaf / Clos / Fat-Tree),有⼤规模(千台交换机以上)⽹络运营经验优先。
二、专业技能
1.路由与交换:熟练掌握 BGP(eBGP/iBGP)、ECMP、VLAN、LACP / MLAG(M-LAG)等协议的原理与配置;
2.RoCE ⽹络:理解 RoCEv2 协议栈、⽆损以太⽹设计原则,熟悉 PFC / ECN 机制与 DCQCN 算法参数调优...
分享岗位
方式1:复制岗位链接
方式2:分享岗位海报
手机扫描二维码分享
收藏 TEG 点击了解更多BG信息 技术 两年以上工作经验 更新于年06月29日2.故障诊断与应急:主导⽹络故障的快速定位与恢复,尤其是 PFC Storm / PFC Deadlock、丢包、链路降级、拥塞;
3.扩散等⽆损以太⽹典型问题的诊断处理;
4.性能调优:根据业务负载特征,调整拥塞控制策略(PFC 阈值 / ECN 标记 / DCQCN 算法参数)、交换机 Buffer;
5.策略(Headroom / Shared Buffer / α 值)、ECMP 负载均衡策略等,持续优化⽹络吞吐和延迟表现;
6.容量规划:参与⽹络架构评审和容量规划,评估现⽹瓶颈,为扩容/新建集群提供技术⽅案;
7.⾃动化运维:协同开发团队,推动⽹络运维⼯具和⾃动化平台的需求定义与落地,提升运维效率;
8.⽂档与知识沉淀:建设⽹络运营知识库,输出最佳实践、故障案例库和操作⼿册。
1.计算机科学、通信⼯程、电⼦信息或相关专业本科及以上学历;2 年以上数据中⼼⽹络运维/运营经验;
2.熟悉数据中⼼⽹络架构(Spine-Leaf / Clos / Fat-Tree),有⼤规模(千台交换机以上)⽹络运营经验优先。
二、专业技能
1.路由与交换:熟练掌握 BGP(eBGP/iBGP)、ECMP、VLAN、LACP / MLAG(M-LAG)等协议的原理与配置;
2.RoCE ⽹络:理解 RoCEv2 协议栈、⽆损以太⽹设计原则,熟悉 PFC / ECN 机制与 DCQCN 算法参数调优...