12700E堆疊重啟6小時45分鐘,AP仍然無法上線。
1、AP存在認證掉線記錄,掉線原因是IP沖突:IP Address conflict
2、AP上線需要MAC 認證
3、設備也存在AP的ARP沖突日志
處理過程
1、12700E備升主時DHCP Server IP分配記錄丟失,而AP未重啟,導致12700E待分配的IP被未重啟的AP占用;
2、12700E分配IP前Ping檢測沖突功能關閉(dhcp sever ping packet 0,默認值2);
3、和現場工程師了解連接AP的接入設備配置端口隔離,導致AP DHCP獲取IP后ARP探測IP沖突功能也失效。
4、進一步檢查DHCP Server配置,發現地址池可分配IP數量不足、DHCP Server可分配地址掩碼被設置為24位,而AP數量有379個
5、由于地址池被手動清除過分配記錄,部分AP使用沖突的IP地址上線,因此上線AP數量超過254個
6、部分AP使用沖突的IP地址上線
根因
通過云控制器修改接口地址池IP地址掩碼,擴大可分配地址范圍,備用主控板基于舊掩碼自動生成dhcp sever mask x.x.x.x配置,備用主控板只能分配舊掩碼范圍內的IP地址,舊掩碼范圍之外的地址分配記錄丟失。
解決方案
業務恢復方案:
開啟DHCP Server分配IP地址前Ping檢測功能,重新配置AP地址池,重啟所有AP,之后AP上線正常。
最終解決方案:
開發補丁解決云控制器修改接口地址池IP地址掩碼導致備用主控板地址分配記錄丟失問題,預計9月初發布。