Security/AI

[AI] LLM OWASP #10: 2025 무제한 소비

Opal1031 2026. 4. 24. 15:18
※ 본 포스트는 "SW 산학협력 프로젝트"에 앞서 LLM 및 AI와 관련된 학습을 위해 읽은 논문의 요약본입니다.

※ 비영리적인 순수한 학습 기록용입니다.

※ 저작권 문제가 있을 경우, 즉시 수정 또는 삭제하겠습니다.

포스팅에 앞서 해당 논문은 아래의 링크에서 확인할 수 있습니다.
OWASP Top 10 2025 번역본


LLM10: 2025 무제한 소비

열 번째 챕터의 주제는 "무제한 소비"이다.

 

무제한 소비

무제한 소비는 LLM 애플리케이션이 이용자의 과도하고 통제되지 않은 추론을 허용할 때 발생한다.

 

이로 인해 아래와 같은 문제가 발생할 수 있다.

  • 서비스 거부
  • 경제적 손실
  • 모델 도용
  • 서비스 성능 저하

무제한 소비

LLM이 입력 쿼리 또는 프롬프트에 기반하여 출력을 생성하는 과정


일반적 취약점 예시

가변 길이 입력 플러딩

다양한 길이의 입력을 대량으로 전송하여 LLM의 처리 효율성 악용

 

지갑 거부 공격 (Denial of Wallet, DoW)

공격자가 대량의 연산 작업 수행하도록 유도하여 클라우드 기반 AI 서비스의 종량제 비용 모델 악용

 

지속적 입력 오버플로우

컨텍스트 윈도우를 초과하는 입력을 지속적으로 보내 자원 소비 유발

 

자원 집약적 쿼리

과도하게 높은 연산 비용이 필요한 쿼리 제출을 통해 리소스 소모 및 처리 속도 저하

 

API를 통한 모델 추출

  • 입력 및 프롬프트 인젝션 기법을 활용하여 모델 API를 통해 충분한 출력 수집
  • 기존 모델의 일부를 복제하거나 그림자 모델 생성

기능적 모델 복제

  • 합성 훈련 데이터 기반으로 기본 모델을 미세 조정
  • 기존 모델과 기능적으로 동일한 모델 제작

부채널 공격

  • 입력 필터링 기법을 악용하여 부채널 공격 수행
  • 모델 가중치 및 이키텍쳐 정보 추출

    부채널 공격
    암호 알고리즘 자체의 논리적 결함이나 취약점보다, 암호가 시스템에서 구현 / 실행될 때 발생하는 물리적 정보를 가공 / 분석하는 해킹 기법

예방 및 완화 전략

01. 입력 검증

입력 유혀성 검사를 구현하여 입력의 크기 제한

 

02. Logits 및 Logprobs 노출 제한

  • API 응답에서 logit_bias 및 logprobs 노출 제한 및 난독화

    Logits
    LLM이 다음 토큰을 예측할 때, 내부적으로 각 후보의 토큰 점수 계산

    logit_bias
    확률 임의 조정 변수

    logprobs
    로그 확률 값

03. 속도 제한

속도 제한 및 사용자 할당량 적용

 

04. 자원 할당 관리

자원 할당을 동적으로 모니터링하고 관리

 

05. 타임아웃 및 조절

자원을 많이 사용하는 작업에 대해 타임아웃 설정

 

06. 샌드박스 기술

네트워크 자원, 내부 서비스 및 API에 대한 LLM의 액세스 제한

 

07. 포괄적인 로깅, 모니터링 및 이상 징후 탐지

자원 사용량을 지속적으로 모니터링하고 로깅 구현

 

08. 워터마킹

워터마킹 프레임워크 구현

 

09. 단계적 성능 저하

과부하에도 부분적인 기능을 유지

 

10. 대기열에 처리 제한 및 확장성 확보

  • 총 작업에 대한 제한 구현
  • 동적 확장 및 로드 밸런싱 통합

11. 적대적 견고성 훈련

적대적 쿼리 및 추출 시도 탐지 훈련

 

12. 글리치 토큰 필터링

알려진 글리치 토큰의 목록 구축 및 필터링

 

13. 접근 통제

역할 기반 접근 제어(RBAC) 및 최소 권한 원칙 적용하여 무단 접근 제한

 

14. 중앙 집중형 ML 모델 인벤토리

ML 모델 인벤토리 및 레지스트리를 사용하여 적절한 거버넌스 및 액세스 제어 보장

 

15. 자동화된 MLOps 배포

  • 거버넌스, 추적, 승인 워크플로우를 포함한 자동화된 MLOps 배포 구현

    MLOps
    ML의 전 과정을 자동화하고 효율화하는 관행

공격 시나리오 예시

#01. 통제되지 않은 크기 입력

비정상적으로 큰 입력 제출 -> 시스템 다운 및 서비스 속도 저하

 

#02. 반복 요청

대량의 요청 전송 -> 계산 리소스 과도하게 소모

 

#03. 자원 집약적 쿼리

계산 비용이 많이 드는 프로레스 트리거하도록 설계된 특정 입력 조작 -> 시스템 오류

 

#04. 지갑 거부 공격

유료 모델을 악욕하기 위해 과도한 작업 생성 -> 지속 불가능한 비용 초래

 

#05. 기능적 모델 복제

LLM의 API를 상요하여 합성 학습 데이터 생성 및 모델 미세 소정 -> 동등한 모델 생성 및 기존 모델 추출 제한을 우회

 

#06. 시스템 입력 필터링 우회

입력 필터링 기술 및 LLM의 프리앰블 우회 -> 부채널 공격 수행