실전 사례 ①CPU 사용률은 정상인데, 성능은 느린 이유운영 중인 서버에서 다음과 같은 리포트를 받았다고 가정해 보자.CPU 사용률: 평균 40~50%Load Average: 정상메모리 여유 충분APM: 주요 API 응답 시간 “정상 범위”사용자 체감: “전체적으로 느림”이 상황은 의외로 매우 흔하다.그리고 가장 골치 아픈 유형이기도 하다.1. 문제의 핵심: “정상 지표”의 함정전통적 모니터링 지표CPU: 45%Memory: 62%Disk IO: 낮음Network: 정상→ 문제 없어 보인다.APM 지표/api/search 평균 110ms/api/order 평균 180ms에러율 0% → 역시 문제 없어 보인다.이 단계에서 흔히 나오는 결론은 이것이다.“일시적인 네트워크 문제였나 봅니다.”하지만 사용자는 여..