i18n·다국어·다통화 엔진 및 DTS/Redis 일관성 구조
1. 문제 정의 — "언어, 통화, 그리고 시간"
글로벌 플랫폼을 설계할 때 가장 어려운 점은 단순히 번역이 아니다. 사용자의 언어와 통화, 그리고 거래가 발생하는 시간대(timezone)가 동시에 일관성을 가져야 한다는 것이다. 태국 바이어가 THB(바트)로 주문을 생성하고, 한국 공급사가 KRW(원화) 기준으로 송장을 발행하면, 모든 계산은 "실제 결제일 환율"을 기준으로 변환되어야 한다. 시스템은 태국어·영어·한국어·중국어로 각각 동일한 상품 정보를 제공해야 하며, 어떤 리전에서 접속하더라도 동일한 데이터가 지연 없이 노출되어야 한다.
이 복잡성의 핵심은 세 가지 축이 서로 연결되어 있다는 점이다. 언어가 바뀌면 표시할 텍스트가 달라지고, 통화가 바뀌면 가격 계산 로직이 달라지며, 리전이 바뀌면 캐시 원본 위치가 달라진다. 하나라도 어긋나면 바이어가 보는 가격과 공급사가 받는 정산액이 불일치하는 사고로 이어진다. REINDEERS는 6월에 i18n + Currency + DTS + Redis 통합 구조를 완성하여 이 세 축을 하나의 파이프라인으로 묶었다.
2. i18n 엔진 — 언어 데이터의 추상화와 저장 전략
REINDEERS의 다국어(i18n) 엔진은 단순한 문자열 번역이 아니다.
언어 데이터는 모든 비즈니스 엔터티(Product, Category, Notice 등)와 독립적으로 관리된다.
상품 테이블에 직접 name_th, name_ko 컬럼을 두는 방식은
언어가 추가될 때마다 스키마를 변경해야 하므로 확장성이 없다.
대신 i18n_text 테이블을 도입하여 키-값 기반으로 모든 다국어 텍스트를 관리한다.
CREATE TABLE i18n_text (
id BIGINT PRIMARY KEY AUTO_INCREMENT,
key_name VARCHAR(255) NOT NULL,
lang_code VARCHAR(5) NOT NULL,
value TEXT NOT NULL,
quality ENUM('MACHINE','HUMAN','APPROVED') DEFAULT 'MACHINE',
updated_at DATETIME DEFAULT CURRENT_TIMESTAMP,
UNIQUE (key_name, lang_code)
);
모든 다국어 텍스트는 "키(key_name)" 중심으로 관리된다.
예를 들어 상품명은 product.name.1001, 설명은 product.desc.1001 식으로 저장된다.
이 구조 덕분에 새 언어를 추가하려면 해당 lang_code의 행만 INSERT하면 된다.
스키마 변경은 전혀 필요 없다.
번역이 누락되면 Translator-Agent가 자동으로 기계 번역을 수행하고
품질 상태를 MACHINE으로 지정한다.
운영팀의 인적 검수 후 HUMAN으로 승격되고,
최종 승인 시 APPROVED로 변경되면 해당 키는 Redis 캐시에 고정된다.
APPROVED 상태의 텍스트는 TTL 없이 영구 캐싱되어 DB 조회를 완전히 생략한다.
# i18n 자동 번역 워크플로우
event: product.created
→ translator-agent.translate(key_name, source_lang)
→ i18n_text.insert(lang, value, quality='MACHINE')
→ publish("cache.invalidate", {"type":"i18n", "key": key_name})
API 응답 시에는 요청 헤더의 Accept-Language 값을 기준으로
해당 lang_code의 텍스트를 자동으로 선택한다.
클라이언트가 th를 보내면 태국어, ko를 보내면 한국어 데이터가 반환된다.
4개 언어(TH, KO, ZH, EN) 중 하나라도 누락된 키가 있으면
Translator-Agent가 이를 감지하여 비동기로 채워넣는 자가 보정 루프가 동작한다.
3. 다통화 처리 — 중앙은행 기준 환율 파이프라인
통화 데이터는 각국 중앙은행의 공시 환율을 기준으로 한다. 하루 1회 서버리스 함수가 각 중앙은행(BOT, BNM, PBoC, BOK) 사이트에서 환율 정보를 수집하고, 정규화 테이블에 저장한다. 4개국 환율을 하나의 통합 스키마로 관리하기 때문에 국가 추가 시에도 데이터 구조가 변하지 않는다.
CREATE TABLE currency_rate_norm (
id BIGINT PRIMARY KEY AUTO_INCREMENT,
base_currency CHAR(3) NOT NULL,
quote_currency CHAR(3) NOT NULL,
rate DECIMAL(20,10) NOT NULL,
effective_at DATETIME NOT NULL,
provenance JSON NOT NULL,
UNIQUE (base_currency, quote_currency, effective_at)
);
각 환율 정보는 원본 HTML의 해시와 기관명을 provenance 필드에 기록한다.
이는 나중에 특정 환율 값의 출처를 역추적해야 할 때 사용된다.
수집 과정에서 각국 은행 웹사이트의 구조가 다르고,
안티봇 대책도 제각각이기 때문에 국가별로 별도의 스크래퍼가 동작한다.
환율이 저장되면 MQ를 통해 currency.updated 이벤트가 발행되고,
이를 구독하는 서비스들이 가격 표시를 자동 갱신한다.
바이어가 THB로 보는 가격과 공급사가 KRW로 보는 가격은
동일한 effective_at 기준 환율로 계산되므로 양쪽의 금액이 정확히 대응된다.
정산 시점과 주문 시점의 환율이 다를 경우,
DTS(Distributed Transaction Sync) 모듈이 양쪽 리전에서 동일한 환율 스냅샷을 참조하도록 보장한다.
4. DTS — 리전 간 데이터 복제의 신뢰성 확보
REINDEERS는 홍콩(HK)을 Primary, 서울(KR)을 Secondary로 설정했다. 두 리전 간의 데이터 복제는 DTS(Data Transmission Service)를 기반으로 구성되며, 비동기 복제(Async GTID Mode)로 평균 지연은 350~500ms 수준이다. 이 지연은 일반적인 API 응답에는 영향을 주지 않지만, 결제나 정산처럼 두 리전의 데이터가 정확히 일치해야 하는 트랜잭션에서는 문제가 될 수 있다.
이를 해결하기 위해 DTS 모듈은 Cloud Function에서 지속적으로 모니터링된다. 지연이 500ms를 초과하면 자동으로 복제 재시작 명령이 실행되고, Telegram으로 알림이 발송된다. 지연이 2초를 초과하는 극단적 상황에서는 Secondary 리전의 쓰기가 자동 차단되어 데이터 불일치를 원천적으로 방지한다.
def dts_guard(event):
delay = event["dts_delay_ms"]
if delay > 2000:
set_readonly("kr-secondary")
publish("alert", {"text": f"KR set read-only, delay {delay}ms", "level": "critical"})
elif delay > 500:
resume_dts("hk-seoul")
publish("alert", {"text": f"DTS Delay {delay}ms, resuming", "level": "warn"})
DTS 상태 데이터는 매 5분마다 집계되어 dts_health_log 테이블에 기록된다.
운영자는 Telegram 명령 /dts로 현재 지연 시간, 복제 상태, 최근 장애 이력을 즉시 확인할 수 있다.
이 자동 복구 루틴은 인프라의 인간 의존도를 크게 줄여주었고,
실제 운영에서 DTS 관련 수동 개입은 월 평균 1회 미만으로 감소했다.
5. Redis 일관성 — Write-through + Event-driven Invalidation
Redis는 리전별 캐시 역할을 담당한다.
데이터는 Write-through 방식으로 저장된다.
즉, DB에 쓰기가 발생하면 동시에 Redis에도 동일 데이터가 기록되고,
MQ를 통해 cache.invalidate 이벤트가 발행되어
반대 리전의 캐시도 무효화되거나 최신 상태로 동기화된다.
import redis, pika, json
r = redis.StrictRedis(host="redis.ap.hk", port=6379)
ch = pika.BlockingConnection(pika.ConnectionParameters("mq.ap.hk")).channel()
ch.queue_declare(queue="cache_invalidator", durable=True)
def on_message(ch, method, _, body):
evt = json.loads(body)
r.delete(f"cache:{evt['table']}:{evt['id']}")
ch.basic_ack(method.delivery_tag)
ch.basic_consume(queue="cache_invalidator", on_message_callback=on_message)
ch.start_consuming()
캐시 키는 cache:{table}:{id} 패턴을 사용한다.
MQ 메시지에는 idempotency-key 헤더가 추가되어
동일한 이벤트가 중복 실행되지 않도록 한다.
Redis TTL은 일반 데이터 15분, i18n APPROVED 데이터는 무기한으로 차등 적용된다.
캐시 미스가 발생하면 DB에서 조회한 후 Redis에 다시 적재하는 Cache-Aside 패턴이 보조적으로 동작한다. Cross-region 시나리오에서는 HK 리전의 캐시가 Primary 역할을 하고, KR 리전은 MQ 이벤트를 통해 수백 밀리초 내에 동기화된다. 캐시 적중률은 평균 96% 이상을 유지하며, 적중 실패 시에도 DB fallback 경로가 300ms 이내에 응답을 반환한다.
6. 검증 루틴 — 데이터·언어·환율의 삼중 동기화 테스트
데이터 검증은 세 가지 관점에서 수행된다.
- 데이터 정합성: DTS 복제 후 rowcount/CRC 비교. Primary와 Secondary의 테이블별 행 수와 체크섬을 대조하여 복제 누락을 탐지한다.
- 언어 일관성: 각 언어별 키 누락 검사. 4개 언어 중 하나라도 빠진 키가 있으면 Translator-Agent에 재번역 이벤트를 발행한다.
- 환율 정확성: 삼각검증 USD→KRW→THB 경로와 USD→THB 직접 경로의 오차율이 20bps 이하인지 확인한다. 초과 시 해당 환율 데이터를 무효 처리하고 재수집을 트리거한다.
-- 언어 키 누락 검사
SELECT key_name FROM i18n_text
GROUP BY key_name HAVING COUNT(DISTINCT lang_code) < 4;
-- 삼각 환율 검증
SELECT ABS(
(SELECT rate FROM currency_rate_norm WHERE base_currency='USD' AND quote_currency='THB' ORDER BY effective_at DESC LIMIT 1)
-
(SELECT rate FROM currency_rate_norm WHERE base_currency='USD' AND quote_currency='KRW' ORDER BY effective_at DESC LIMIT 1)
*
(SELECT rate FROM currency_rate_norm WHERE base_currency='KRW' AND quote_currency='THB' ORDER BY effective_at DESC LIMIT 1)
) AS triangular_gap;
검증 결과는 data_quality_check 테이블에 기록되며,
CI/CD 파이프라인에서 매 배포 전 자동 실행된다.
오류 발생 시 Telegram 알림이 발송되고 배포가 차단된다.
이 삼중 검증 체계가 가동된 이후, 환율 관련 정산 오류는 0건을 유지하고 있다.
7. 결론 — "Localization을 넘은 Systemization"
많은 글로벌 플랫폼이 언어나 통화 문제를 '현지화(Localization)'로 다룬다. 하지만 REINDEERS는 접근 방식이 다르다. 우리는 현지화가 아니라 "Systemization"을 선택했다. 즉, 시스템 자체가 다국어·다통화를 처리하도록 구조화한 것이다.
이번 개편으로, 다국어 문장 하나가 누락되어도 시스템이 자동으로 번역을 생성하고, 환율이 변동되면 자동으로 정산 금액을 재계산하며, Redis는 지역 간 일관성을 유지하면서 캐시를 자동으로 교체한다. DTS는 리전 간 복제 지연을 스스로 감시하고 복구한다. 사람이 개입해야 하는 지점은 최종 번역 승인과 환율 이상 알림 확인, 이 두 가지뿐이다.
5개 플랫폼, 4개 국가, 4개 언어, 4개 통화가 하나의 파이프라인 위에서 동작한다. 6월은 REINDEERS가 "사람이 아니라 시스템이 운영을 보정하는 구조"로 진화한 달이었다.