대규모 기계 번역 프로젝트의 효율적 관리: 대량, 짧은 납기, 어려운 언어 쌍

기계 번역 엔진의 훈련을 위해 다양한 주제의 문서들을 대상으로 두 개의 언어 쌍으로 번역하는 작업을 수행하였으며 도전적인 3개월이라는 기간 내에 400만 단어 이상의 번역을 완료했습니다. 이 프로젝트는 대규모 번역 작업을 처리하면서 자원 관리, 프로세스 관리, 품질 관리 측면에서 우리의 기술적 역량을 잘 보여주는 대표적인 사례입니다. 한샘글로벌이 이러한 어려움들을 어떻게 극복했는지 그 과정을 소개합니다.

기계 번역 엔진의 훈련을 위해 다양한 주제의 문서들을 대상으로 두 개의 언어 쌍으로 번역하는 작업을 수행하였으며 도전적인 3개월이라는 기간 내에 400만 단어 이상의 번역을 완료했습니다. 이 프로젝트는 대규모 번역 작업을 처리하면서 자원 관리, 프로세스 관리, 품질 관리 측면에서 우리의 기술적 역량을 잘 보여주는 대표적인 사례입니다. 한샘글로벌이 이러한 어려움들을 어떻게 극복했는지 그 과정을 소개합니다.

프로젝트 개요

고객사는 한국을 대표하는 IT 기업으로, 주요 검색 엔진과 다양한 디지털 서비스를 제공하고 있습니다. 2017년, 이 회사는 자사의 기계 번역 엔진을 개선하기 위해 한샘글로벌과 함께 대규모 프로젝트를 진행했습니다. 이 프로젝트는 기계 번역 엔진 훈련을 위한 방대한 말뭉치를 번역하는 작업이었으며, 소스 언어는 한국어였고 대상 언어는 프랑스어와 스페인어였습니다. 각 언어당 200만 단어를 3개월 내에 번역해야 하는 도전적인 과제였습니다. 대량의 작업과 빡빡한 일정에도 불구하고, 한샘글로벌은 효율적이고 효과적인 프로세스를 개발하여 고객사가 요구한 품질 기준을 충족시키며 정해진 기간 내에 프로젝트를 성공적으로 완료했습니다.

도전 과제

이중 언어 번역가 자원 확보 및 관리

  • 한국어를 이해할 수 있는 프랑스어 및 스페인어 원어민 번역가 필요
  • 짧은 납기, 대량 작업이므로 이슈를 최소화하고 일관성과 품질을 관리하려면 이들을 한 곳에 모아서 작업할 수 있도록 해야 함
  • 언어 페어당 15명, 최소 30명 이상 확보 필요

다양한 분야
문서는 법률, 경제, 문화, IT 등 다양한 분야에 걸쳐 있었습니다. 각 분야마다 고유한 용어와 문체가 존재하므로, 해당 분야에 대한 깊은 이해와 전문 지식을 갖춘 언어 전문가를 포함시켜야 했습니다.

복잡한 파일 관리
프로젝트는 1,000개 이상의 파일을 관리해야 했기 때문에 파일을 분류하고 추적 관리하는 과정이 복잡했습니다. 각 파일은 서로 다른 주제와 내용을 담고 있었고 제출 시기도 달랐으므로 이를 체계적으로 관리하지 않으면 혼란이 발생할 수 있습니다. 파일을 분류하고, 진행 상황을 추적하며, 각 파일이 적절한 번역가에게 배정되도록 하는 것이 필수적이었습니다.

품질 기준
번역물은 BLEU 점수 60% 이하를 충족해야 했습니다. BLEU(Bilingual Evaluation Understudy) 점수는 번역의 품질을 평가하는 척도로, 낮을수록 더 나은 품질을 의미합니다. 이는 번역 결과물이 원문과 얼마나 유사한지를 평가하는 기준으로 사용됩니다. 기계 번역 후 사후 인간 편집자의 수정을 통해 이 기준을 충족하는 것이 목표였습니다.

한샘글로벌의 대응

자원 발굴 및 관리
우리는 단기간에 30명 이상의 원어민 번역가를 발굴 및 관리하기 위해 광범위한 자원 관리 기술을 활용했습니다. 주제 분야별 전문성을 충족하기 위해 법률, 경제, 일상 대화, 문화, IT 등 각각의 전문성을 갖춘 번역가를 찾아야 했습니다. 이를 위해 소셜 미디어 플랫폼을 적극적으로 활용하여 번역가를 모집하고, 인터뷰를 통해 선별한 후 각 번역가의 역량과 경험에 따라 프로젝트에 적절히 배치했습니다. 또한, 정기적인 미팅과 피드백 세션을 통해 번역가들의 작업 진척 상황을 모니터링하고, 필요에 따라 지원과 지침을 제공하여 프로젝트의 일관성과 품질을 유지했습니다.

클라우드 기반 관리 시스템
1,000개 이상의 번역 및 검수 파일을 효율적으로 관리하기 위해 클라우드 기반 플랫폼을 사용하여 작업 서버를 간소화하고 이메일 시스템을 통해 파일을 처리할 필요를 없앴습니다. 클라우드 기반 관리 시스템은 팀원들이 언제 어디서나 쉽게 접근할 수 있도록 하여 협업을 촉진했습니다. 또한, 실시간으로 파일 상태를 추적하고 업데이트할 수 있어 프로젝트의 진행 상황을 명확하게 파악할 수 있었습니다. 이를 통해 파일 분실이나 중복 작업을 방지하고, 프로젝트 지연을 최소화할 수 있었습니다.

BLEU 점수 계산 방법
MTPE 작업을 위한 BLEU 점수 60% 이하의 요구를 충족하기 위해 Python과 Excel 매크로(VBA)를 사용하여 자체 BLEU 점수 계산 방법을 도입했습니다. 한샘글로벌의 도큐먼트 엔지니어는 이 방법을 사용하여 2,700만 단어 이상의 말뭉치와 번역/수정된 콘텐츠의 BLEU 점수를 효율적으로 계산했습니다. 이를 통해 번역의 품질을 객관적으로 평가하고, 필요에 따라 즉각적인 피드백을 제공하여 번역 결과를 개선할 수 있었습니다. 또한, 이 계산 방법은 대규모 데이터 세트에서도 정확하고 일관된 품질 평가를 가능하게 하여, 전체 프로젝트의 품질을 유지하는 데 중요한 역할을 했습니다.

결과

이 프로젝트는 대규모 작업량과 짧은 납기에도 불구하고 고품질의 번역을 정상적으로 납품할 수있었습니다. 이 작업을 계기로 고객과의 강력한 파트너십을 강화할 수 있었습니다. 원어민 작업자들은 기간 동안 한샘글로벌 내부에서 같이 작업을 진행했는데 중도 포기하고 떠나는 사람, 서로 다른 문화로 인해 사소한 충돌도 발생했습니다. 우리는 언어 페어별로 원어민 리더를 배정해서  그들끼리의 소통도 강화시켰습니다. 당시 프랑스 리더였던 Anais는 그 프로젝트를 계기로 한샘글로벌에 입사했고 오늘까지 한샘글로벌의 소중한 인적 자원으로 함께 일하고 있는 것은 그 프로젝트로 인해 우리가 맞이한 또 하나의 행운이기도 합니다.

대규모의 작업, 짧은 납기, 고난도의 언어 페어 자원, 어떤 어려움도 한샘글로벌은 극복할 수 있습니다. 번역이나 현지화 작업에 관한 어려움을 한샘글로벌과 함께 의논해 주세요.