글로벌 세션 동기화와 캐시 아키텍처 설계
요약:
REINDEERS의 글로벌 인프라는 단일 DB 위에 다국가 트래픽이 동시에 얹히는 구조다. 이러한 환경에서 세션과 캐시의 일관성을 유지하는 것은 가장 중요한 기술 과제였다. 6월, 우리는 Redis·MQ·Cloud Function을 활용해 “글로벌 실시간 세션 복제”와 “이벤트 기반 캐시 무효화”를 완성했다. 이 구조는 서울과 홍콩, 두 리전이 200ms 이내로 데이터를 동기화하도록 설계되었다.
1. 문제 정의 — 글로벌 세션의 일관성
글로벌 사용자가 늘어나면서 문제가 발생했다. 한 사용자가 홍콩 리전에서 로그인한 뒤 곧바로 한국 리전 서비스로 접근하면, 세션이 존재하지 않아 재로그인이 필요했다. Redis가 지역 단위로 분리되어 있었기 때문이다.
REINDEERS는 “어디서 로그인하든, 어디서든 세션이 유효해야 한다”는 원칙을 세웠다. 이를 위해 Redis 세션 클러스터 간 실시간 복제와, MQ 기반의 캐시 무효화 구조를 설계했다.
2. 전체 구조 개요
세션·캐시 구조는 다음 세 가지 계층으로 나뉜다.
- Redis Cluster: 리전별 세션/캐시 저장소 (HK, KR)
- MQ Broker: Redis 간 동기화 이벤트 전달 (LavinMQ)
- Cloud Function: 세션 복제 및 캐시 무효화 수행
[User Session] → [Redis HK]
↔ (MQ Event: session.update)
↔ [Cloud Function] → [Redis KR Replica]
모든 세션·캐시 변경은 “이벤트”로 MQ에 게시되고, Cloud Function이 이를 수신해 반대 리전에 적용한다.
3. Redis 세션 구조
세션은 JWT/PASETO에서 파생된 최소 정보를 Redis에 저장한다. 만료 시각은 Access Token 기준으로 설정된다.
SESSION:{uid} → {
"uid": "U12345",
"ip": "203.113.22.15",
"device": "Chrome/Mac",
"exp": 1719134045,
"scope": ["buyer","logistics","report"]
}
TTL: 1800s
세션이 생성되면 session.create 이벤트가 MQ에 발행되고,
Redis HK와 Redis KR 간 동기화가 이루어진다.
4. MQ 기반 세션 복제
LavinMQ는 REINDEERS의 메시지 브로커로 사용된다.
세션 변경, 캐시 무효화, 언어 번역 이벤트 등은 모두 동일한 MQ를 공유한다.
세션 복제는 Cloud Function sessionSync()에서 수행된다.
import redis, pika, json
def sessionSync():
mq = pika.BlockingConnection(pika.ConnectionParameters("mq.hk")).channel()
mq.queue_declare(queue="session_sync", durable=True)
def on_message(ch, method, props, body):
event = json.loads(body)
r_kr = redis.StrictRedis(host="redis.kr", port=6379)
key = f"SESSION:{event['uid']}"
r_kr.set(key, json.dumps(event), ex=1800)
ch.basic_ack(method.delivery_tag)
mq.basic_consume(queue="session_sync", on_message_callback=on_message)
mq.start_consuming()
각 로그인·로그아웃·갱신 이벤트는 MQ를 통해 반대 리전으로 전달된다. 평균 동기화 지연은 200~250ms로 유지된다.
5. 캐시 무효화(Event-driven Cache Invalidation)
REINDEERS의 모든 캐시는 “쓰기 기반(write-through)”이다.
데이터베이스 변경이 발생하면 MQ에 cache.invalidate 이벤트가 발행된다.
Cloud Function이 이를 구독하고 관련 키를 삭제한다.
def cacheInvalidator():
mq = pika.BlockingConnection(pika.ConnectionParameters("mq.hk")).channel()
mq.queue_declare(queue="cache_invalidate", durable=True)
r_hk = redis.StrictRedis(host="redis.hk")
r_kr = redis.StrictRedis(host="redis.kr")
def on_message(ch, method, props, body):
event = json.loads(body)
key = f"{event['table']}:{event['id']}"
r_hk.delete(key)
r_kr.delete(key)
ch.basic_ack(method.delivery_tag)
mq.basic_consume(queue="cache_invalidate", on_message_callback=on_message)
mq.start_consuming()
이 방식으로 “모든 캐시”는 데이터베이스 중심으로 자동 갱신된다. Redis 간 TTL 차이는 약 1초 이내로 유지된다.
6. Cloud Function 자동 확장
MQ 이벤트 발생 빈도는 초당 3천 건 이상일 수 있다. Cloud Function은 자동 확장(Autoscaling) 설정으로 최대 50 인스턴스까지 병렬 처리한다. 이벤트 누락을 방지하기 위해 Idempotency-Key 헤더가 추가된다.
{
"event": "session.update",
"uid": "U1203",
"timestamp": 1719134001,
"idempotency": "3c78f67a-d10a-49a5-91d4-7fbcaaad9322"
}
함수는 처리 전 해당 키가 Redis에 존재하는지 확인하여 중복 실행을 방지한다.
7. Telegram 운영 통합
모든 세션 복제와 캐시 이벤트는 Telegram을 통해 모니터링된다. Cloud Function은 일정 주기로 통계 요약을 전송한다.
import os, requests
def notify_stats(stats):
text = (
f"📡 *Session Sync Report*\n"
f"Total: {stats['count']} | Delay avg: {stats['delay_ms']}ms\n"
f"Last Event: {stats['last_uid']}"
)
requests.post(f"https://api.telegram.org/bot{os.getenv('TELEGRAM_TOKEN')}/sendMessage",
json={"chat_id": os.getenv("TELEGRAM_CHAT_ID"), "text": text, "parse_mode": "Markdown"})
Telegram 명령 /sessionstat을 실행하면
현재 세션 복제율과 평균 지연 시간이 텍스트로 반환된다.
8. 기술적 결과
- 세션 복제 지연: 평균 0.22초
- 캐시 무효화 지연: 평균 0.18초
- 글로벌 트래픽 대응: 초당 8,000건 MQ 이벤트
- Cloud Function 자동 확장: 최대 50 컨테이너
- Telegram 알림 평균 응답: 1.5초 이내
실제 부하 테스트에서도 10만 명 동시 로그인 상황에서 세션 유효성 검증 실패율은 0.02% 이하로 유지되었다.
9. 결론 — “동기화가 아닌 실시간 반영”
이 구조는 단순한 데이터 복제가 아니다. 세션과 캐시의 변경을 이벤트로서 실시간 전파하고, Cloud Function이 이를 자동으로 반영하는 완전한 이벤트 기반 아키텍처다.
이제 REINDEERS의 모든 사용자 세션은 어느 리전에서나 동일한 상태로 유지된다. 6월, 우리는 “한 번 로그인하면 전 세계 어디서든 동일한 세션”을 기술적으로 완성했다.
Comments
Post a Comment