Skip to main content

Translator-Agent와 데이터 품질 관리 체계

Translator-Agent와 데이터 품질 관리 체계

요약:
본 기록은 Translator-Agent의 도입 및 고도화 과정에서 발생한 기술적 이슈와 해결 과정을 다룬다. 다국어 상품 데이터의 품질을 AI가 자동으로 평가·보정하는 구조를 확립하는 것이 목적이었다. 번역 정확도, MQ 이벤트 동기화, 캐시 구조, 재번역 루프, 품질 메트릭 자동 보고 기능이 주요 내용이다.

1. 초기 Translator-Agent 도입 배경

7월 초, 플랫폼 내 등록된 상품 수가 20만 건을 초과하면서 다국어 데이터 품질 문제가 심각하게 드러났다. 기존에는 외부 번역 API를 호출해 결과를 저장하는 단순 구조였다. 하지만 언어별 품질 편차가 심했고, 카테고리·단위·브랜드명 등이 잘못 번역되는 사례가 누적되었다. 수동 교정 인력을 투입하지 않기 위해 “Translator-Agent”를 내부적으로 개발하기로 결정했다.

Translator-Agent의 설계 목표는 다음과 같았다.

  • 번역 품질 자동 평가 및 등급화 (MACHINE / HUMAN / APPROVED)
  • 다국어 텍스트 캐시 및 중복 요청 제거
  • 문장 단위가 아닌 문맥 단위 번역 처리
  • MQ 기반 병렬 번역 및 품질 피드백 루프 자동화

2. 아키텍처 설계 및 초기 구조

Translator-Agent는 MQ 이벤트 소비자로 동작한다. product.created 또는 i18n.missing 이벤트를 수신하면 해당 상품의 기본 언어 데이터를 조회하고, DeepSeek과 ChatGPT 모델을 혼합하여 번역을 수행한다. DeepSeek은 대량 번역용, ChatGPT는 문맥 검증용으로 사용되었다.

def translate_product(evt):
    pid = evt["product_id"]
    base = db.get_product(pid)
    for lang in ["en","ko","zh-CN","th","ms"]:
        if lang == base.lang: continue
        raw = glossary.apply(base.name, base.description)
        draft = deepseek.translate(raw, target=lang)
        refined = chatgpt.refine(draft, context=base.category)
        db.save_translation(pid, lang, refined, quality="MACHINE")
        publish("i18n.updated", {"id": pid, "lang": lang})

MQ 큐는 국가별로 분리되어 병렬 처리가 가능했다. 다만 초기에 DeepSeek API 요청 한도가 낮아, 하루 약 3만 건 이상 처리 시 오류가 빈번하게 발생했다. 이 문제는 캐시 구조를 추가하여 이미 번역된 문장은 재요청하지 않도록 수정함으로써 해결했다.

3. 중복 번역 및 품질 저하 문제

두 번째 이슈는 동일 문장이 중복 번역되는 문제였다. MQ 이벤트가 일시적으로 중복 발행되거나, DB 저장 직후 재번역 이벤트가 발행되는 경우였다. Translator-Agent가 이미 번역된 텍스트를 덮어쓰면서 품질 점수가 불안정하게 변했다.

우리는 Redis 기반의 번역 키 해시를 추가했다. 각 번역 요청 전에 hash(content+lang) 키를 조회해 중복 여부를 판단하도록 했다. 이미 존재하면 MQ 메시지를 소비하지 않고 로그만 남기도록 수정했다.

key = f"tr:{hashlib.md5((content+lang).encode()).hexdigest()}"
if redis.exists(key):
    publish("i18n.skipped", {"lang": lang, "pid": pid})
else:
    redis.set(key, 1, ex=86400)
    process_translation(content, lang)

이 변경 이후 MQ 소비량은 약 35% 감소했고, 중복 번역은 90% 이상 줄었다. 품질 점수의 표준편차도 0.18 → 0.05 수준으로 안정화되었다.

4. 품질 평가 및 자동 보정 루프

번역 품질은 BLEU와 TER 지표를 기반으로 측정했다. 각 언어별 기준 점수는 BLEU ≥ 0.7, TER ≤ 0.3으로 설정했다. Translator-Agent는 번역 후 품질이 기준 이하인 문장은 자동 재번역 대상에 등록한다. 재번역은 모델을 ChatGPT 단독으로 변경하고, context aware correction 모드를 적용한다.

score = bleu_score(ref_text, translated)
if score < 0.7:
    corrected = chatgpt.correct(translated, base.category)
    db.update_translation(pid, lang, corrected, quality="REWRITE")
    publish("i18n.rewrite", {"id": pid, "lang": lang, "score": score})

평균 품질 점수는 3회 루프 이후 0.68 → 0.83으로 상승했다. BLEU 점수가 일정 임계값 이상일 경우 품질 등급을 “APPROVED”로 갱신하고, MQ를 통해 다른 서비스에 전파했다. 이후 Translator-Agent는 매일 새벽 품질 요약 보고서를 자동 생성하여 Telegram으로 발송했다.

5. 캐시 무효화 및 데이터 일관성 문제

번역 데이터가 갱신될 때 Redis 캐시와 MySQL 간 일관성이 깨지는 문제가 있었다. 일부 페이지가 갱신된 번역을 반영하지 못하고 이전 데이터를 그대로 노출했다. 이는 Cloud Function이 “i18n.updated” 이벤트를 받지 못했을 때 발생했다.

해결책으로 MQ 재시도 큐(DelayQueue)를 추가했다. 이벤트 수신이 실패한 경우 30초 후 재발행되도록 구성했다. Function 로그는 Ops-Agent가 수집하여 Telegram /cache 명령으로 즉시 조회 가능하게 했다.

publish("cache.invalidate", {"kind":"i18n","id":pid,"lang":lang}, delay=30)

이후 페이지 캐시 불일치율은 2.4% → 0.3% 수준으로 감소했다. 동일 상품의 다국어 데이터를 동시에 요청해도, Redis TTL(15분) 내에서는 항상 최신 상태를 유지했다.

6. AI 에이전트 간 협업 및 우선순위 체계

Translator-Agent는 Classifier-Agent 및 Crawler-Agent와 동일한 MQ를 사용한다. 이벤트 혼선이 발생하지 않도록, 각 에이전트에 우선순위를 부여했다. Crawler → Classifier → Translator 순으로 이벤트를 처리하며, Translator-Agent는 product.normalized 이벤트를 반드시 수신한 이후에만 작동한다.

이 관계는 Agent-Registry에 선언적으로 정의되었다.

agents:
  - name: crawler
    priority: 1
  - name: classifier
    priority: 2
    depends_on: ["crawler"]
  - name: translator
    priority: 3
    depends_on: ["classifier"]

이 설정 이후, 각 에이전트의 처리 순서가 명확히 보장되었고, MQ 지연률은 60% 이상 개선되었다. 하루 평균 번역 처리량은 약 18만 건, 품질 점검 루프는 2만 건 수준에서 안정적으로 유지되고 있다.

7. 품질 보고 자동화 및 운영 피드백

Translator-Agent는 모든 번역 결과와 품질 점수를 요약해 Telegram으로 자동 보고한다. Ops-Agent는 /quality 명령으로 지난 24시간의 번역 통계를 텍스트로 출력한다. 또한 품질 저하나 모델 응답 지연이 감지되면 /agent restart translator 명령으로 재시작을 수행한다.

품질 리포트 형식은 다음과 같다.

📊 *Translator-Agent Report*
Processed: 183,412 items
Average BLEU: 0.81
Rewrites: 2,948
Failures: 46
Skipped: 5,130
Cache Miss: 0.4%

8. 결론 및 현재 상태

Translator-Agent의 도입 이후, 수동 번역 프로세스는 완전히 제거되었다. AI는 크롤링된 원문 데이터를 수집하고, 자체적으로 번역, 검증, 보정, 저장, 품질 평가를 수행한다. MQ 이벤트를 통해 실시간으로 다른 시스템과 연동되며, 사람은 Telegram 리포트만 검토하면 된다.

번역 품질은 언어별 BLEU 기준 0.8 이상을 유지 중이며, 캐시 일관성, 이벤트 동기화, 품질 자동보정 루프 모두 안정화되었다. 향후에는 Classifier-Agent와 연계하여 문맥 기반 번역 재학습을 자동화할 예정이다.

Comments

Popular posts from this blog

JD 플랫폼 매니저 (Platform Manager )

🇰🇷 플랫폼 매니저 (운영 / 글로벌 B2B & AI 기반 자동화 플랫폼) 회사명: (주)레인디어스 | Reindeers Co., Ltd. 근무지: 서울 / 방콕 (Hybrid 가능) 고용형태: 정규직 (계약-전환형 가능) ⸻ 회사 소개 레인디어스는 산업자재 및 무역 중심의 글로벌 B2B 플랫폼을 운영하는 기술 기반 기업입니다. 한국, 태국, 말레이시아, 중국 등 주요 아시아 시장에서 **견적–발주–물류(3PL)–통관–정산–재고관리(WMS)**를 통합 관리하는 시스템을 제공하며, AI 기반 자동화와 데이터 인사이트로 업무 효율과 무역 생산성을 혁신하고 있습니다. 레인디어스는 운영 중심의 플랫폼 관리 전문가를 찾습니다. 본 포지션은 플랫폼의 운영·유지·관리·발전·확장을 담당하며, 서비스가 안정적으로 성장하도록 전체적인 흐름을 관리하는 역할을 맡습니다. (※ 개발 업무를 직접 수행하지 않으며, 개발팀과 협업을 통해 개선을 주도합니다.) ⸻ 주요 업무 • REINDEERS B2B 플랫폼의 운영 및 서비스 유지관리 • 상품, 주문, 물류(3PL), 통관, 정산 등 운영 프로세스 실행 및 관리 • 사용자(공급사·고객사) 중심의 운영 이슈 대응 및 개선 요청 관리 • 운영 효율화 및 신규 기능 제안을 위한 서비스 개선 기획 및 테스트 • AI 기반 자동화 기능(데이터 매칭, 견적 추천 등) 운영 및 모니터링 • 국가별 서비스 환경(태국·말레이시아·중국·한국) 유지 및 운영 품질 관리 • 운영 데이터 분석을 통한 서비스 개선 및 운영 인사이트 도출 • 개발·물류·영업 등 유관 부서와의 운영 협의 및 실행 관리 ⸻ 자격 요건 • 플랫폼 운영 또는 서비스 관리 경력 3~7년 내외 • e-Commerce, B2B, 무역, Fulfillment(3PL/WMS) 관련 서비스 운영 경험 • 플랫폼 운영 프로세스(주문·정산·물류·CS 등)에 대한 이해 • 데이터 기반 문제 해결 및 서비스 ...

팀과 기술의 리빌드 — 다시 일하는 법을 정비하다

팀과 기술의 리빌드 — 다시 일하는 법을 정비하다 요약: REINDEERS는 시스템을 다시 설계하기 전에 먼저 팀을 해체했다. 기존 인력 전원이 퇴사한 후, 기술 커트라인을 통과한 새로운 엔지니어들로 조직을 재구성했다. 이후 Drone 기반 CI/CD, Git 워크플로우, 테스트 자동화, AI 협업 체계까지 모든 기술 문화가 새롭게 정의되었다. 1. 리빌드의 시작 — 사람부터 바꿨다 2025년 4월 초, REINDEERS는 중대한 결정을 내렸다. 시스템을 새로 만드는 일보다 먼저, 사람을 바꾸기로 한 것이다. 플랫폼은 기술로 움직이지만, 운영의 일관성을 무너뜨리는 것은 언제나 사람이다. 결국 기존 직원들은 모두 퇴사했다. 이전 팀은 실험적이었지만, 운영 가능한 구조를 만들기엔 역부족이었다. 남은 것은 코드 일부와 배포 스크립트뿐이었다. 우리는 그 위에 새로운 문화를 세우기보다, 완전히 새 팀을 만드는 길을 선택했다. “사람을 남긴 게 아니라, 기준을 남겼다.” 2. 새 팀의 탄생 — 기술 커트라인부터 통과해야 했다 신규 채용의 기준은 단순했다. “ 운영 가능한 기술을 이해하는가 .” 단순히 코드를 작성할 줄 아는 개발자가 아니라, 시스템이 어떻게 동작하고 복제되며, 장애를 어떻게 복구해야 하는지를 아는 엔지니어만이 합류할 수 있었다. 기술 커트라인 (필수 항목) Nuxt 3 / Vue3 + SSR 구조 이해 Python / Node.js 기반 API 서버 설계 경험 Drone CI/CD 파이프라인 구축 및 유지 경험 Tencent Cloud CLI 활용 및...

레인디어스, Buybly로 동남아시아 산업자재 시장 혁신

B2B 오픈마켓 Buybly, 한국 기업의 글로벌 진출을 돕다 레인디어스, 머신러닝 기반의 산업자재 매칭 솔루션으로 경쟁력 강화 김명훈 레인디어스 대표 산업자재 시장의 복잡성과 유통장벽은 많은 기업들에게 큰 도전 과제가 되어왔다. 특히 동남아시아 시장 진출을 원하는 한국의 산업자재 제조사들은 현지의 불투명한 거래 환경과 물류 문제로 어려움을 겪어왔다. 이러한 상황에서 레인디어스의 Buybly 플랫폼은 새로운 기회를 제시하고 있다. Buybly는 B2B 오픈마켓으로, 한국 기업들이 손쉽게 동남아시아 시장에 진출할 수 있도록 지원하며, 유통의 복잡성을 해결하는 혁신적인 솔루션으로 주목받고 있다. 이러한 변화의 중심에는 레인디어스 대표가 있다. 그는 지난 9년간 태국에서의 경험을 바탕으로 고객의 pain point를 해결하기 위해 Buybly를 개발했다. 이번 인터뷰를 통해 그의 비전과 경영 철학, 그리고 Buybly가 어떻게 산업자재 시장을 변화시키고 있는지에 대해 깊이 있는 이야기를 나누게 되었다. 김명훈 레인디어스 대표 -.소개  레인디어스는 국내 산업자재 제조사들이 동남아시아 시장에 쉽게 진출할 수 있도록 돕는 B2B 오픈마켓인 Buybly를 운영하고 있다. 해외 시장 진출에서 가장 큰 장애물인 유통, 물류, 무역의 장벽을 해결해주는 것이 이 플랫폼의 핵심이다. Buybly는 단순한 거래 플랫폼이 아니라, 산업자재 구매와 공급 과정을 간소화하고 최적화하는 One-Stop 솔루션으로 자리 잡았다. 레인디어스의 서비스는 Buybly와 Enterprise Solution(ERP, POP, WMS)으로 구성되어 있다. 이 솔루션은 동남아시아 현지의 고객사와 공급사에 맞춤형으로 제공되며, 산업현장의 선진화를 이끌어낸다. 기업 운영과 생산 관리, 재고 관리를 전산화해 이익을 극대화하는 데 기여하고 있다. Buybly는 산업현장에서 획득한 Raw data를 활용해 인공지능 분석을 통해 발주 주기와 재고에 따른 최적의 산업자재 및 공급사 매칭 기능을 제공한다. 이로...