본문 바로가기
네트워크&웹 기술(Network&Web)

HTTP 알아보기 5 - 캐시, 프록시 캐시

by codeyaki 2022. 4. 15.
반응형

캐시가 없을 때

같은 데이터를 반복해서 보낼 때 HTTP 헤더의 크기가 1MB, 바디의 크기가 10MB라면 총 11MB의 데이터를 반복해서 전송해야 한다. 따라서 사용자는 반복되는 데이터를 불필요하게 계속 받아야 하므로 로딩 속도가 느려지게 된다.

해당 문제를 해결하기 위해서 캐시라는 기술을 적용하게 되었다.

캐시

클라이언트가 최초로 서버에 요청을 할때 데이터를 정상적으로 보내준다.
헤더에 cache=control: max-age=60 (생명 주기, 초 단위)를 포함하여 보낸다.

클라이언트는 두번째 요청부터는 캐시에 해당 데이터가 유효 상태로 있다면 서버에서 받을 필요 없이 바로 캐시 저장소에서 꺼내서 쓸 수 있게 된다. 캐시 시간이 초과되면 최초로 서버에 요청하는 단계를 반복한다.

정리

  • 캐시 가능 시간동안 네트워크를 사용하지 않아도 됨. 따라서 비싼 네트워크 사용량을 줄일 수 있다.
  • 불필요한 로딩이 사라져 로딩 속도가 빨라진다.
  • 캐시 유효 시간이 초과하면, 서버를 통해 데이터를 다시 조회하고, 캐시를 갱신한다. (네트워크 다운로드)

캐시 유효시간 초과됐을 때

캐시 유효 시간이 초과해서 서버에 다시 요청하면 다음 두 가지 상황이 나타난다.

  1. 서버에서 기존 데이터를 변경
  2. 서버에서 기존 데이터를 변경하지 않았음

이 두가지 경우에서 2번의 경우에는 또다시 전송을 하지 않고 캐시 저장소에 만료된 데이터를 재사용해보자.

해당 방법을 이용하려면 서버의 데이터와 캐시의 데이터가 같은 데이터임을 검증할 수 있는 정보가 필요하다.

따라서 검증 헤더를 추가하게 되었다.


검증 헤더1 - Last-Modifed, If-Modified-Since

캐시에 데이터 최종 수정일을 추가하여 서버와 비교하고 같으면 재사용한다.
수정이 없다면 서버에서 해당 메시지를 전송한다.

HTTP/1.1 304 Not Modified
Content-Type: image/jpeg
cache-control: max-age=60
Last-Modified: 2020년 11월 10일 10:00:00
Content-Length: 34012

해당 메시지와 같이 HTTP Body가 없이 전송을 하게 된다. (BODY부분을 없애 데이터를 획기적으로 줄임)
해당 메시지를 받으면 클라이언트는 유효가 만료된 캐시를 재사용하게 된다.

Last-Modified 정리

  • 캐시 유효 시간이 초과해도, 서버의 데이터가 갱신되지 않으면
  • 304 Not Modified + 헤더 메타 정보만 응답한다(바디 X)
  • 클라이언트는 서버가 보낸 응답 헤더 정보로 캐시의 메타 정보를 갱신
  • 클라이언트는 캐시에 저장되어 있는 데이터 재활용
  • 결과적으로 네트워크 다운로드가 발생하지만 용량이 적은 헤더 정보만 다운로드하게 된다.

 

검증 헤더와 조건부 요청

 

  • 검증 헤더
    - 캐시 데이터와 서버 데이터가 같은지 검증하는 데이터
    - Last-Modified, ETag
  • 조건부 요청 헤더
    - 검증 헤더로 조건에 따른 분기
    - If-Modified-Since: Last-Modified 사용
    - If-None-Match: ETag 사용
    - 조건이 만족하면 200 OK
    - 조건이 만족하지 않으면 304 Not Modified

If-Modified-Since: 이후에 데이터가 수정되었으면?

  • 데이터 미변경 시 예
    - 캐시: 2022년 4월 15일 10:00:00 vs 서버: 2022년 4월 15일 10:00:00
    -> 304 Not Modified, 헤더 데이터만 전송 (BODY 미포함)
    -> 전송 용량: 헤더 용량
  • 데이터 변경시 예
    - 캐시: 2022년 4월 15일 10:00:00 vs 서버: 2022년 4월 15 13:00:00
    -> 200 OK, 모든 데이터 전송 (BODY 포함)
    -> 전송 용량: 헤더 용량 + 바디 용량

단점

  • 1초 미만(0.x초) 단위로 캐시 조정 불가능
  • 날짜 기반의 로직 사용
  • 데이터를 수정해서 날짜가 다르지만, 같은 데이터를 수정해서 데이터 결과가 같은 경우 구별 불가능
  • 서버에서 별도의 캐시 로직을 관리하고 싶은 경우
    예) 스페이스나 주석처럼 크게 영향이 없는 변경에서 캐시를 유지하고 싶은 경우

검증 헤더 2 - ETag, If-None-Match

  • ETag(Entity Tag)
  • 캐시용 데이터에 임의의 고유한 버전 이름을 달아둠
    예) ETag: "v1.0", ETag: "a2jiodwjekjl3"
  • 데이터가 변경되면 이 이름을 변경함 (Hash를 다시 생성)
    예) ETag: "aaaaa" -> ETag: "bbbbb"
  • 단순히 ETag만 비교해서 같으면 유지, 다르면 다시 받는 메커니즘

클라이언트에서 If-None-Match: "aaaaa"를 헤더에 포함해서 전송.

서버에서 비교 후 같으면 304 Not Modified 응답 (HTTP BODY 없음)

클라이언트에서 캐시 재사용

 

ETag 정리

  • ETag만 서버에서 보내서 같으면 유지, 다르면 재전송
  • 캐시 제어 로직을 서버에서 완전히 관리
  • 클라이언트는 단순히 이 값을 서버에 제공함 (클라이언트는 캐시 메커니즘을 모른다.)
  • 예)
    - 서버는 베타 오픈 기간인 3일 동안 파일이 변경되어도 ETag를 동일하게 유지시키기
    - 애플리케이션 배포 주기에 맞춰 ETag모두 갱신

캐시 제어 헤더 

Cache-Control: 캐시 지시어(directives)

  • Cache-Control: max-age
    - 캐시 유효 시간(초단위)
  • Cache-Control: no-cache
    - 데이터는 캐시 해도 되지만, 항상 원(origin) 서버에 검증하고 사용해야 한다.
    (로컬에 있는 캐시 데이터가 변했는지 서버에 항상 검증을 하고 사용해야 한다.)
  • Cache-Control: no-store
    - 데이터에 민감한 정보가 있으므로 저장하면 안 됨.(메모리에서 사용 후 최대한 빠르게 삭제)

Pragma: 캐시 제어(하위 호환)

  • Pragma: no-cache
  • http/1.0 하위 호환 (현재는 거의 사용하지 않음)

Expires: 캐시 만료일 지정(하위 호환)

  • 예) expires: Mon, 01 Jan 1990 00:00:00 GMT
  • 캐시 만료일을 정확한 날짜로 지정함.
  • HTTP/1.0부터 사용 가능
  • 지금은 더 유연한 Cache-Control: max-age 사용 권장 (두 개 동시 사용 시 Expires는 무시된다.)

요약

  • 검증 헤더(Validator)
    - ETag: "v1.0", ETag: "asid93jkrh2l"
    - Last-Modified: Thu, 04 Jun 2020 07:19:24 GMT
  • 조건부 요청 헤더
    - If-Match, If-None-Match: ETag 값 사용
    - If-Modified-Since, If-Unmodified-Since: Last-Modified 값 사용

프록시 캐시

한국에서 미국에 있는 원(Origin) 서버에 접속을 한다고 생각해보자. 아무리 인터넷이 빨라졌다고 하지만 한국에서 미국의 네트워크에 접속하는 건 한국에 있는 서버에 접속하는 것보다 상대적으로 시간이 걸리게 된다. 이를 해결하기 위해서 한국에 미리 미국의 원서버의 데이터들을 미리 저장해놓을 프록시 캐시 서버를 만들게 되었다. 따라서 한국에 있는 클라이언트들은 자동으로 프록시 캐시 서버에 접속을 하게되어 빠르게 접속할 수 있게 된다.

프록시 캐시에는 두가지 종류가 있다.

  • public 캐시: 프록시 서버에 저장되는 캐시
  • private 캐시: 클라이언트(각 웹 브라우저)에 저장되는 캐시, 사용자가 직접적으로 사용하는 캐시

프록시 캐시 지시어(directives)

  • Cache-Control: public
    응답이 public 캐시에 저장되어도 됨.
  • Cache-Control: private
    응답이 해당 사용자만을 위한 것 프록시 서버에 저장되지 않음. private 캐시에 저장해야 됨.(기본값)
  • Cache-Control: s-maxage
    프록시 캐시에만 적용되는 max-age
  • Age: 60 (HTTP 헤더)
    원(Origin) 서버에서 응답 후 프록시 캐시 내에 머문 시간(초)

캐시 무효화 Cache-Control

확실한 캐시 무효화 응답. 아래 내용을 전부 조합해서 적용 권장.

Cache-Control: no-cache, no-store, must-revalidate
Pragma: no-cache

  • Cache-Control: no-cache
    - 데이터는 캐시 해도 되지만, 항상 원 서버에 검증하고 사용해야 함.
  • Cache-Control: no-store
    - 데이터가 민감한 정보를 포함하고 있으므로 저장 금지
  • Cache-Control: must-revalidate
    - 캐시 만료 후 최초 조회 시 원 서버에 검증해야 함.
    - 원 서버 접근 실패 시 반드시 오류가 발생해야 함 - 504(Gateway Timeout)
        ex) 은행 계좌를 조회했는데 원서버와 통신이 오류가 발생해 프록시 데이터(과거 데이터)가 조회되면 문제가 됨.
        ->>해당 문제를 해결하기 위해서 must-revalidate 추가.
    - 캐시 유효 시간이라면 캐시를 사용
  • pragma: no-cache
    HTTP/1.0 하위 호환을 위해 추가함.

추가적으로 HTTP 스펙을 보고 싶다면 RFC 2616으로 공부하는 것은 비추천

새로 나온 RFC 7230~7235를 보는 걸 추천

반응형