본문으로 건너뛰기
버전: 4.6.1-saas

메트릭 빠른 참조

이 페이지는 트래픽 제어 흐름 단계별로 구성된 NetFUNNEL의 실시간 모니터링 및 통계에서 사용되는 모든 메트릭에 대한 포괄적인 빠른 참조를 제공합니다. 각 메트릭의 의미와 전체 트래픽 제어 프로세스에서의 위치를 빠르게 이해하는 데 사용하세요.

트래픽 제어 흐름 개요

다음 다이어그램은 전체 트래픽 제어 흐름과 각 메트릭이 측정되는 위치를 보여줍니다:

트래픽 흐름 단계별 메트릭

1단계: 요청 도착

메트릭실시간 모니터링통계단위
진입 요청량기본: 진입 요청량
클래식: 진입 요청량
진입 요청TPS
모든 요청량(표시되지 않음)전체 요청 수TPS

진입 요청량:

  • 정의: 초당 평균 진입 요청 수로, 특정 시간 윈도우 내에서 초당 요청 수(TPS)로 측정됩니다
  • 쉽게 풀어낸 의미: 1초에 평균적으로 몇 명의 사용자가 서비스에 처음 액세스하려고 시도했는지를 보여줍니다
  • 알 수 있는 것: NetFUNNEL이 없었을 때 실제로 서비스에 도달했을 순수한 트래픽 양을 추정할 수 있어, 트래픽 제어가 적용되기 전의 순수한 수요를 파악하는 데 도움이 됩니다
  • 해석: 높은 값은 많은 사용자가 동시에 서비스에 액세스하려고 함을 나타냅니다. 이 메트릭은 트래픽의 수요 측면을 나타냅니다. 각 요청은 대기실이 적용된 서비스에 진입하려는 새 사용자를 나타냅니다
  • 주요 인사이트: 이것은 시스템에 들어오는 원시 수요입니다. 높은 값은 더 많은 동시 액세스 시도를 의미합니다. 이러한 요청 중 일부는 진입 허용 수 임계값 미만이면 대기실을 우회할 수 있고, 진입 허용 수를 초과하는 요청은 대기실로 이동합니다

모든 요청량:

⚠️ 중요: 범위가 다른 두 가지 "전체 요청 수" 메트릭이 있습니다:

  1. 프로젝트/세그먼트 수준 전체 요청 수:

    • 정의: NetFUNNEL 에이전트가 만든 모든 트래픽 제어 API 호출의 평균 TPS. 여기에는 다음이 포함됩니다: 초기 진입 요청, 재진입 요청, Alive Notice 요청, 완료 요청
    • 쉽게 풀어낸 의미: 애플리케이션과 NetFUNNEL 서버 간의 총 트래픽 제어 통신량을 보여줍니다
    • 알 수 있는 것: 전체 트래픽 제어 통신 부하를 이해하고 트래픽 제어 운영을 위한 용량 계획을 수립하는 데 도움이 됩니다
  2. NetFUNNEL 서버 수준 전체 요청 수:

    • 정의: NetFUNNEL 서버에 대한 모든 유형의 API 요청의 평균 TPS로, 트래픽 제어 요청, 데이터 쿼리 요청, 관리 API 요청 및 기타 모든 API 호출을 포함합니다
    • 쉽게 풀어낸 의미: NetFUNNEL 서버가 모든 작업에서 초당 처리하는 총 요청 수를 보여줍니다
    • 알 수 있는 것: 서버 엔지니어 관점에서 총 시스템 부하를 파악할 수 있어, NetFUNNEL 서버 수준에서 모든 API 호출 및 트래픽 제어 작업을 포함한 전체 워크로드를 이해하는 데 도움이 됩니다

핵심 사항:

  • 실시간: 현재 수요 표시 (지금 몇 명의 사용자가 진입을 시도하고 있는지)
  • 통계: 초기 진입 요청의 과거 평균 표시

2단계: 진입 허용 수 결정

메트릭실시간 모니터링통계단위
진입 허용 수진입 허용 수진입 허용-
활성 사용자 수기본: 현재 사용자 수
클래식: 현재 사용자 수
사용자
활성 사용자 수 비율기본: 현재 사용률
클래식: 현재 사용률
(표시되지 않음)%

진입 허용 수:

  • 정의: 서비스 동시 활성 사용자 수를 제한하는 설정된 한도 값으로, 측정 시점의 스냅샷으로 표시됩니다
  • 쉽게 풀어낸 의미: 서비스에 동시에 사용할 수 있는 최대 사용자 수를 나타내며, 어느 시점에서든 허용되는 최대 동시 사용자 수를 보여줍니다
  • 알 수 있는 것: 다른 메트릭이 기록될 때 적용되었던 용량 한도 값을 파악할 수 있어, 용량 조정 결정을 내리는 데 필요한 컨텍스트를 제공합니다

활성 사용자 수:

  • 정의: 서비스 진입과 서비스 종료 사이에서 서비스를 실제로 활성적으로 사용하고 있는 사용자 수로, 측정 시점의 스냅샷 값으로 표시됩니다
  • 쉽게 풀어낸 의미: 측정 시점에 실제로 서비스를 사용 중인 사용자 수를 보여줍니다
  • 알 수 있는 것: 진입 허용 수 대비 실제 사용자 수를 비교하여 현재 용량 활용도를 평가할 수 있어, 용량 조정이 필요한지 판단하는 데 도움이 됩니다
  • 계산: 요청이 PASS를 받고 서비스에 진입할 때 +1, 요청이 서비스를 종료할 때 -1 (명시적 키 반환)
  • 중요 관계: 이 값은 진입 허용 수와 직접 관련됩니다. NetFUNNEL의 핵심 원칙은 활성 사용자 수를 진입 허용 수 미만으로 유지하는 것입니다. 활성 사용자 수가 진입 허용 수에 접근하면 NetFUNNEL은 PASS 응답 발급을 중단하고 대신 WAIT 응답을 보내 요청을 대기실로 보냅니다

활성 사용자 수 비율:

  • 정의: 현재 사용 중인 진입 허용 수의 비율로, 측정 시점에 (활성 사용자 수 / 진입 허용 수 × 100)로 계산됩니다
  • 쉽게 풀어낸 의미: 허용된 최대 용량의 몇 퍼센트가 현재 활성 사용자에 의해 사용되고 있는지를 보여줍니다
  • 알 수 있는 것: 용량 활용 효율성을 평가할 수 있어, 높은 비율은 한도가 거의 가득 찼음을 나타내고 낮은 비율은 추가 사용자를 수용할 수 있는 여유 용량이 있음을 알려줍니다
  • 해석: 100%는 진입 허용 수가 완전히 활용됨을 의미하고, ~80%는 진입 허용 수가 100%에 가깝거나 100%일 가능성을 나타냅니다 (모니터링 해상도 제한으로 인해). 50%는 약 절반의 진입 허용 수가 사용 가능함을 의미하고, <50%는 상당한 진입 허용 수가 사용 가능함을 의미합니다
  • 모니터링 해상도 고려사항: NetFUNNEL 서버는 매우 많은 수의 요청을 실시간으로 고속으로 처리합니다. 모니터링 시스템의 해상도가 이 빠른 처리 속도를 따라가지 못할 수 있습니다. 따라서 활성 사용자 수 비율이 약 80%로 보이면, 20%의 여유 진입 허용 수가 있다고 해석하지 말고 시스템이 100% 진입 허용 수에 가깝거나 100%에서 작동하고 있을 가능성이 높다고 해석해야 합니다
모니터링 해상도 제한

NetFUNNEL의 고속 요청 처리로 인해 모니터링 해상도가 모든 빠른 상태 변경을 캡처하지 못할 수 있습니다. 활성 사용자 수 비율 80%는 효과적으로 100% 진입 허용 수 활용으로 처리해야 합니다. 그에 따라 진입 허용 수 조정을 계획하세요.

핵심 사항:

  • NetFUNNEL은 활성 사용자 수와 진입 허용 수를 비교하여 PASS 또는 WAIT를 결정
  • 활성 사용자 수 < 진입 허용 수 → PASS (직접 진입)
  • 활성 사용자 수 ≥ 진입 허용 수 → WAIT (대기실로 이동)

3단계: 대기실

메트릭실시간 모니터링통계단위
대기자 수기본: 대기자 수
클래식: 대기자 수
대기자
대기 시간기본: 대기 시간
클래식: 대기 시간
대기 시간
대기 상태기본: 대기 상태
클래식: 대기 상태
(표시되지 않음)
예상 이탈자 수기본: 예상 이탈자 수
클래식: 예상 이탈자 수
(표시되지 않음)

대기자 수:

  • 정의: 대기실에서 대기 중인 사용자 수의 평균값으로, 특정 시간 윈도우 내에서 계산됩니다
  • 쉽게 풀어낸 의미: 측정 기간 동안 평균적으로 몇 명의 사용자가 대기실에서 대기하고 있었는지를 보여줍니다
  • 알 수 있는 것: 시스템에 대한 수요 압력을 모니터링할 수 있어, 대기 중인 사용자 수의 변화를 추적하여 용량 조정이 필요한지 판단하고 대기 시간을 줄이는 데 도움이 됩니다
  • 해석: 이것은 현재 대기자 수이며, 과거 평균이 아닙니다. 높은 값이 반드시 문제를 의미하는 것은 아니므로 대기 시간도 함께 고려하세요. 진입 요청량이 사용 가능한 진입 허용 수(진입 허용 수 - 현재 사용자)를 초과하면 대기자 수가 증가합니다
  • 다른 메트릭과의 관계: 대기자 수는 진입 요청 속도(수요)의 영향을 받고, 진입 허용 수에 의해 제한됩니다. 전체적인 분석을 위해 대기 시간과 함께 평가되어야 합니다
  • 예상 이탈자 수 참고: 대기자 수에는 브라우저를 닫거나 연결이 끊긴 사용자(예상 이탈자 수)가 포함됩니다. 실제로 활발히 대기 중인 사용자 수는 대략 (대기자 수 - 예상 이탈자 수)입니다. 진입 허용 수 계획 결정을 위해 대기자 수를 해석할 때 예상 이탈자 수를 고려하세요
대기자 수 해석

대기자 수가 높은 것만으로는 문제를 나타내지 않으므로 대기 시간도 함께 고려하세요. 대기자 수가 크지만 대기 시간이 짧으면 사용자는 오래 대기하지 않습니다. 둘 다 높으면 진입 허용 수를 늘려야 할 수 있습니다.

대기 시간:

  • 정의: 대기실에서 대기 중인 모든 사용자가 경험한 대기 시간의 평균값으로, 특정 시간 윈도우 내에서 계산됩니다
  • 쉽게 풀어낸 의미: 측정 기간 동안 사용자들이 평균적으로 몇 초 동안 대기했는지를 보여줍니다
  • 알 수 있는 것: 사용자 경험을 평가할 수 있어, 대기 시간이 허용 가능한 수준인지 판단하고 진입 허용 수가 수요에 비해 너무 낮게 설정되었는지 식별하는 데 도움이 됩니다
  • 해석: 이 메트릭은 사용자 경험 품질을 나타냅니다 (사용자가 대기해야 하는 시간) 전체 맥락을 위해 대기자 수와 함께 평가되어야 합니다. 낮은 값은 일반적으로 더 나은 사용자 경험을 나타냅니다
  • 운영 고려사항: NetFUNNEL은 서버의 내부 상태(CPU, 메모리, I/O 부하)를 직접 모니터링하지 않습니다. 대신 간접 지표를 사용합니다. 높은 대기자 수 그리고 높은 대기 시간을 관찰하지만 서버 리소스가 실제로는 미활용 상태인 경우, 이것은 진입 허용 수가 너무 낮게 설정되었을 수 있음을 시사합니다. 더 많은 트래픽을 수락할 진입 허용 수가 있지만 "게이트"가 너무 좁게 열려 있습니다. 진입 허용 수를 10-20% 증가시키는 것을 고려하세요
대기자 수 vs 대기 시간

항상 대기자 수와 대기 시간을 함께 고려하세요:

  • 큰 대기자 수 + 짧은 대기 시간 = 많은 사용자이지만 빠른 처리
  • 큰 대기자 수 + 긴 대기 시간 = 진입 허용 수가 너무 낮게 설정되었을 가능성 (진입 허용 수 문제 가능성 높음)
  • 작은 대기자 수 + 긴 대기 시간 = 진입 허용 수가 너무 보수적으로 낮게 설정되었을 가능성 (매우 높음)

대기 상태:

  • 정의: 평균 대기 시간을 미리 정의된 임계값 기준으로 세 가지 상태 레벨(Fast/Medium/Slow)로 분류하는 시각적 표시기입니다
  • 쉽게 풀어낸 의미: 대기 시간을 원활(Fast)/대기(Medium)/지연(Slow) 세 가지 상태로 나누어 빠른 상태 개요를 제공합니다
  • 알 수 있는 것: 구체적인 시간 값을 해석할 필요 없이 대기 조건에 대한 즉각적인 시각적 인사이트를 제공하여 시스템 성능을 빠르게 평가할 수 있습니다

예상 이탈자 수:

  • 정의: 대기실에 입장한 후 브라우저를 닫거나 연결이 끊긴 사용자 수로, 측정 시점의 스냅샷 값으로 표시됩니다
  • 쉽게 풀어낸 의미: 대기자 수에는 포함되지만 실제로는 대기하지 않고 있는 사용자 수를 보여줍니다
  • 알 수 있는 것: 보고된 대기자 수와 실제로 활발히 대기 중인 사용자 수의 차이를 이해할 수 있어, 더 정확한 진입 허용 수 계획 및 대기열 관리 결정을 내리는 데 도움이 됩니다

4단계: 서비스 진입

메트릭실시간 모니터링통계단위
진입량기본: 진입량
클래식: 진입량
(표시되지 않음)TPS

진입량:

  • 정의: 초당 평균 서비스 진입 사용자 수로, 특정 시간 윈도우 내에서 초당 요청 수(TPS)로 계산됩니다
  • 쉽게 풀어낸 의미: 대기를 거치고 들어오든 바로 입장하든, 초당 몇 명이 실제로 서비스에 입장하는지를 보여줍니다
  • 알 수 있는 것: NetFUNNEL의 효과를 측정할 수 있어, 실제 서비스 진입 속도(진입량)를 초기 수요(진입 요청량)와 비교하여 얼마나 많은 트래픽 감소가 달성되었는지 파악하는 데 도움이 됩니다
  • 주요 차이점: 진입 요청량은 진입하려는 모든 시도 (NetFUNNEL 처리 전)를 나타내고, 진입량은 PASS를 받고 서비스에 진입하는 요청만 (NetFUNNEL 처리 후)을 나타냅니다
  • 진입량의 원천: 진입량은 두 가지 경로를 통해 진입하는 요청을 포함합니다: 1) 직접 진입 - 즉시 PASS를 받는 초기 요청 (진입 허용 수 미만일 때), 2) 재진입 - 대기 후 PASS를 받는 대기실의 요청
  • 이 메트릭이 중요한 이유: 서비스가 받는 실제 부하를 보여줍니다. NetFUNNEL의 트래픽 제어 효과를 보여줍니다. 예를 들어, 이전에 100 RPS를 받았고, NetFUNNEL 적용 후 20 RPS인 경우, 서비스 부하는 실제로 1/5로 감소했습니다

핵심 사항:

  • 실시간 진입량: PASS를 받고 서비스에 진입한 요청 (직접 진입 + 대기실에서 재진입 포함)
  • 통계: 통계 보기에서 "진입 요청"은 초기 진입 요청(1단계: 요청 도착)을 의미하며, 서비스 진입 속도가 아닙니다. 자세한 설명은 통계 메트릭을 참조하세요

5단계: 서비스 사용

메트릭실시간 모니터링통계단위
처리 시간기본: 처리 시간
클래식: (표시되지 않음)
처리 시간

처리 시간:

  • 정의: 서비스 진입부터 서비스 종료까지의 평균 시간 지속 기간으로, 특정 시간 윈도우 내에서 수집된 데이터의 평균값으로 계산됩니다
  • 쉽게 풀어낸 의미: 사용자들이 서비스에 입장한 후 종료할 때까지 평균적으로 얼마나 오래 활성 상태로 머물렀는지를 보여줍니다
  • 알 수 있는 것: 서버 부하 및 성능의 간접 지표 역할을 하여, 처리 시간의 증가 또는 감소를 기반으로 진입 허용 수 조정이 필요한지 판단하는 데 도움이 됩니다
  • 통합 유형별 해석: 정확한 의미는 NetFUNNEL을 적용하는 위치에 따라 다릅니다:
    • 코드 기반 통합 예시: 진입은 사용자가 로그인 버튼 클릭 (nfStart() 트리거), 종료는 로그인 완료 및 메인 페이지 로드 (nfStop() 트리거), 처리 시간은 로그인 로직 수행 및 메인 페이지 로드 시간
    • URL 트리거 통합 예시: 진입은 사용자가 이벤트 페이지 URL 액세스 (대기실 진입, 그 다음 PASS 수신), 종료는 이벤트 페이지 완전 로드, 처리 시간은 이벤트 페이지 로드 및 렌더링 시간
    • 보편적 정의: 통합 유형에 관계없이 처리 시간은 **"NetFUNNEL로 보호되는 서비스가 실행하는 데 걸리는 시간"**을 나타냅니다.
  • 이 메트릭이 중요한 이유: NetFUNNEL은 서버 내부 상태(CPU, 메모리, I/O)를 직접 모니터링하지 않습니다. 처리 시간은 다음의 간접 지표 역할을 합니다:
    1. 서버 부하 상태: 부하가 높을수록 → 처리 시간이 길어짐 → 처리 시간 증가
    2. 사용자 경험: 서비스 완료를 위해 사용자가 대기하는 시간을 직접 반영
    3. 진입 허용 수 조정 기준: 처리 시간 트렌드를 사용하여 진입 허용 수 조정

핵심 사항:

  • 실시간: 현재 평균 처리 시간 표시
  • 통계: 과거 평균 처리 시간 표시 (실시간과 동일한 계산 방법)
  • 서버 부하 및 성능의 간접 지표
  • 처리 시간이 증가하면 서버가 과부하 상태일 수 있음
  • 타임아웃 설정 최적화에 사용

6단계: 서비스 종료

메트릭실시간 모니터링통계단위
완료량기본: (표시되지 않음)
클래식: 처리 완료량
(표시되지 않음)TPS
완료율기본: 처리 완료율
클래식: 처리 완료율
완료율(%)%
타임아웃 최적화

서비스가 일반적으로 1-2초 내에 완료되지만 타임아웃이 20초(기본 최대값)로 설정된 경우, 불필요한 진입 허용 수 보유를 방지하기 위해 타임아웃을 1-2초로 조정하세요.

추가 메트릭

트래픽 제어 작업

메트릭실시간 모니터링통계단위
우회량(표시되지 않음)우회TPS
차단량(표시되지 않음)차단TPS

우회량:

  • 정의: 세그먼트 비활성화 기능 또는 프로젝트 비활성화 기능을 통해 대기를 타지 않고 서비스로 직접 진입하는 초당 평균 사용자 수로, 특정 시간 윈도우 내에서 초당 요청 수(TPS)로 계산됩니다
  • 쉽게 풀어낸 의미: 일반적으로 세그먼트 또는 프로젝트 비활성화로 인해 대기실을 거치지 않고 서비스에 직접 진입하는 사용자 수를 보여줍니다
  • 알 수 있는 것: 세그먼트나 프로젝트가 비활성화되었을 때 우회 기능이 의도대로 작동하는지 확인할 수 있어, 사용자가 트래픽 제어 없이 서비스에 접근할 수 있음을 검증하는 데 도움이 됩니다

차단량:

  • 정의: 초당 BLOCK 응답을 받은 요청의 평균 속도. 진입이 차단된 요청입니다
  • 쉽게 풀어낸 의미: 세그먼트의 진입 상태가 차단 모드로 설정되었을 때 차단되어 차단실로 이동하는 사용자 수를 보여줍니다
  • 알 수 있는 것: 차단 기능이 의도대로 작동하는지 확인할 수 있어, 차단 모드가 활성화되었을 때 사용자가 서비스 접근을 적절히 차단당하는지 검증하는 데 도움이 됩니다
  • 참고: 반복 요청 차단 기능에 의해 차단된 요청(302 상태 코드 반환)은 이 메트릭에 포함되지 않습니다

NetFUNNEL 서버 수준 메트릭

메트릭통계단위
CPU 점유율CPU 점유율 (%)%
모든 요청량 (서버 수준)전체 요청 수TPS
세션세션-
차단량차단TPS

CPU 점유율:

  • 정의: 측정 시점의 CPU 사용량을 백분율로 표시한 값으로, 스냅샷 값으로 표시됩니다
  • 쉽게 풀어낸 의미: 측정 시점에 NetFUNNEL 서버의 CPU 용량 중 몇 퍼센트가 사용되고 있는지를 보여줍니다
  • 알 수 있는 것: NetFUNNEL 서버 부하 상태를 평가하고 잠재적인 성능 문제를 식별할 수 있어, NetFUNNEL 서버가 부하 상태인지 여유 용량이 있는지 판단하는 데 도움이 됩니다

세션:

  • 정의: 서비스 진입부터 서비스 완료까지의 완료된 세션 수로, 특정 시간 윈도우 내에서 집계됩니다
  • 쉽게 풀어낸 의미: 측정 기간 동안 시작되어 정상적으로 완료된 사용자 세션의 총 개수를 보여줍니다
  • 알 수 있는 것: 서비스 사용 패턴과 완료율을 파악할 수 있어, 전체 서비스 상태와 사용자 참여도를 평가하는 데 도움이 됩니다

모든 요청량 (서버 수준):

  • 정의: NetFUNNEL 서버 수준에서의 초당 평균 모든 API 요청 수로, 관리 작업, 데이터 쿼리 및 기타 모든 API 호출을 포함하며, 특정 시간 윈도우 내에서 계산됩니다
  • 쉽게 풀어낸 의미: NetFUNNEL 서버가 1초에 평균적으로 처리해야 하는 모든 종류의 요청 수를 보여줍니다
  • 알 수 있는 것: 서버 엔지니어 관점에서 총 시스템 부하를 파악할 수 있어, 모든 API 호출 및 트래픽 제어 작업을 포함한 NetFUNNEL 서버 수준의 전체 워크로드를 이해하는 데 도움이 됩니다

차단량:

  • 정의: 초당 BLOCK 응답을 받은 요청의 평균 속도. 진입이 차단된 요청입니다
  • 쉽게 풀어낸 의미: 세그먼트의 진입 상태가 차단 모드로 설정되었을 때 차단되어 차단실로 이동하는 사용자 수를 보여줍니다
  • 알 수 있는 것: 차단 기능이 의도대로 작동하는지 확인할 수 있어, 차단 모드가 활성화되었을 때 사용자가 서비스 접근을 적절히 차단당하는지 검증하는 데 도움이 됩니다
  • 참고: 반복 요청 차단 기능에 의해 차단된 요청(302 상태 코드 반환)은 이 메트릭에 포함되지 않습니다