전체 글 (212) 썸네일형 리스트형 [NSX] Statistics|Received Packets dropped|Cumulative metric has increased Aria Operations에서 특정 Tier-1 Gateway의 "Received Packets dropped" Count의 누적 값이 비정상적으로 증가하는 문제가 있어, 이에 대한 확인해 본 과정을 공유 합니다. [Symptom] 아래 캡쳐 화면을 보면, 전체 통계치가 1억을 넘는데, 개별 인터페이스 통계치의 합은 3600개 정도 [Troubleshooting Notes] 먼저 각 개별 Metric에 대한 내용을 확인하기 위해서 내부 Lab 환경을 이용하여 Metric별 API 확인 1. 내부 LAB 환경에서 Aria Operation UI 확인 Router Interface Statistics|Down Link|Received Packets dropped|Cumulative Router Interf.. Python and Powershell can be used for NSX Support Bundle NSX/Edge Support Bundle에 있는 대부분의 파일은 json format이기 때문에, 여러 가지 형태로 Filtering을 시도해 볼 수 있습니다. 아래는 Python과 Powershell을 활용하여, Edge Support Bundle에 있는 lb-stats.txt 파일을 Filtering 해보는 예제입니다. 다양한 방식으로 접근해 볼 수 있어 분석할 때 활용도가 높을 것으로 생각합니다. 1. Python import json d = {} with open("lb-stats.txt") as f: d = json.load(f) msg = "" for lb in d.get("lbs") or []: lb_display_name = lb.get("display_name") lb_l4_curr_s.. [NSX] false-positive alarm : Edge node NIC eth0 link is down NSX의 Transport인 ESXi와 Edge Node에는 System Health를 Report하기 위해 NSX-SHA(System Health Agent) 서비스가 위치합니다. 해당 서비스는 각종 State 정보에 대한 변경이 있는 경우 NSX Manager 쪽으로 이를 Report하는 것으로 확인되는데, 간혹 실제로 문제가 없는 상황이지만 Alarm을 전달하는 경우가 있습니다. Hypervisor Level의 이슈로 인해 Edge VM내의 NSX-SHA 서비스가 영향받고 결국 false-positive alarm까지 발생시키는 사례에 대해서 알아보겠습니다. [Symptom] eth0 NIC down 알람표시지만 edge 에서는 up상태 /var/log/syslog 확인시 down 없음. 2일동안 .. 이전 1 ··· 8 9 10 11 12 13 14 ··· 71 다음