기계 번역과 포스터 에디팅 (Post-editing)

구글 번역은 일상 생활 속 외국인과의 대화에서, 여행지 메뉴판에서 많은 영역에서 큰이 됩니다. ChatGPT는 당신이 모르는 언어로 된 기사를 읽을 때 매우 유용하구요. DeepL Pro는 자동 번역은 물론, 텍스트 개선까지 알아서 해줍니다. 그러나 이런 영역은 생활 속의 편의를 위한 것이지 법적 구속력이나 공신력을 담보하지 않습니다. 외국어로 된 메뉴 번역에 작은 오류가 있다고 해서 당신이 구글에 소송을 걸 수는 없잖아요.

포스터 에디팅이란?

기계 번역(Machine Translation, MT)은 계속 발전하고 있습니다. 엔진은 고도화되고 있으며, 특정 도메인 전용으로 훈련된 엔진의 성능은 더욱 뛰어납니다. 최근 도입되고 있는 신경망 기계 번역(Neural Machine Translation, NMT)은 정확성이 크게 향상되었습니다. 언어 페어에 따라 편차는 있지만, 동일한 어족에 속한 언어라면 정확성은 더욱 높아집니다. 그러나 아직 완벽하지는 않습니다.

브랜드 메시지를 일관성 있게 전달해야 하는 마케팅 자료, 번역 오류가 환자의 생명과도 연관될 수 있는 의료 분야, 법적 소송을 야기할 수 있는 법적 문서 번역 등 아직도 많은 전문 영역에서는 기계 번역만으로 문서 처리를 할 수 없습니다. 기계 번역의 편리함을 활용하면서도 전문 번역가가 직접 수행한 작업과 유사 품질을 만들어 내기 위해서 기계 번역 사후 편집, 즉 포스터 에디팅 서비스가 만들어 졌습니다.

포스터 에디팅은 기계와 인간이 협업하여 기계 번역의 처리 속도와 비용 효율성을 누리면서, 결과물에 대한 평가 및 수정을 진행하는 인간 번역가의 협업 서비스입니다. 포스터 에디팅은 기계 번역 엔진으로 원본 텍스트를 대상 언어로 자동으로 번역한 후, 인간 번역가가 이를 검토하고 수정하는 과정을 말합니다. 이 과정은 기계 번역의 속도와 인간 편집자의 언어적, 문화적 지식을 결합하는 과정입니다.

아래 예시를 보세요.

‘Blackouts’는 베트남어로 ‘mất điện’ (정전) 또는 ‘ngất xỉu’ (실신)으로 번역될 수 있습니다. 그러나 해당 문서가 의료 번역 문서였고 이 상황에서는 후자가 적절합니다. 구글 번역은 이를 간과했고, 인간 편집자가 이 오역을 수정하는 역할을 맡습니다. 이처럼 포스터 에디팅이란 기계 번역의 한계를 보완하고, 더 나은 품질의 번역 결과물을 제공하는 데 중요한 역할을 합니다.

기계 번역이 유리한 영역

가장 열정적인 AI 지지자들조차도 인간이 AI 알고리즘보다 더 깊고 미묘한 언어 이해력을 가지고 있다는 사실을 부인할 수 없습니다. 최고 품질의 번역을 위해 번역 단계에서 인간 언어학자에게 의존하는 것이 더 안전하지 않을까요? 일부 경우는 확실히 ‘예’입니다. 그러나 많은 유형의 번역 작업에서 MTPE 과정은 다음과 같은 큰 장점을 제공합니다:

속도
기계 번역 엔진은 인간 번역가보다 훨씬 빠르게 작업합니다. 과거에는 며칠 또는 몇 주가 걸리던 작업이 이제는 몇 분 만에 완료될 수 있습니다. 포스터 에디팅 시간은 제외한 경우입니다. 포스터 에디팅 시간을 적용해 봅시다. 인간 번역가의 평균 번역 능력은 하루 약 2,000단어인 반면, 평균적인 포스터 에디팅 작업은 하루 3,500에서 7,000단어입니다. 이는 최대 350%의 생산성 향상을 의미합니다.

비용
MTPE (Machine Translation Post-editing, 기계 번역과 포스터 에디팅)는 인간 번역가가 처음부터 투입되는 서비스에 비해 비용이 낮습니다. 특히 포스터 에디팅이 필요하지 않은 영역, 예를 든다면 사용자 생성 콘텐츠나 회사나 기관, 학교에서 내부 자료용으로 사용되는 문서, 회의록, 공지사항, 강의 노트, 참고자료와 같은 법적 책임이나 공신력이 요구되지 않는 영역에서는 기계 번역만으로 충분히 활용할 수 있고 비용은 더욱 낮아 집니다.

문법적 품질
기계는 번역 과정에서 기계적인 정확성 면에서 인간보다 우수합니다. 기계 번역 엔진은 오타, 구두점, 공백, 대문자 오류와 같은 비언어적 오류를 거의 저지르지 않습니다. 문화적 뉘앙스를 다루거나 맥락을 고려해야 하는 복잡하고 까다로운 상황이 아니라면 일반적인 주제에서는 기계가 인간보다 효과적일 수 있습니다.

이와 같이 기계 번역이 가진 장점, 속도, 비용, 문법적 품질에서의 요구 정도에서 부합된다면 기계 번역이 유리합니다. 그래서 오늘날 대부분의 기업에서 적지 않은 영역에 기계 번역을 활용하고 있습니다.

기계 번역이 불리한 영역

MTPE를 사용하지 말아야 할 때는 언제인가요? MTPE (또는 MT 자체)를 사용하는 것이 의미가 없는 경우도 있습니다. 아래와 같은 경우입니다:

홍보 마케팅 자료
브랜드 메시지를 일관성 있게 전달해야 하는 이런 종류의 문서에서는 기술 번역보단 Transcreation이 필요합니다. 기계 번역으로는 기업이 유지하고 싶은 톤 앤 매너를 유지하기 어렵습니다. Transcreation은 단순히 텍스트를 번역하는 것이 아니라, 창의적으로 재창작하여 브랜드의 메시지를 정확하게 전달하는 과정입니다. 예를 들어, 슬로건이나 광고 문구는 문화적 뉘앙스와 감정을 정확하게 전달해야 하므로, 기계 번역이 아닌 경험 많은 카피라이터나 마케팅 전문가가 필요합니다.

문학 같은 창의적인 텍스트
문학 번역은 원어의 뉘앙스를 타겟 언어로 동일하게 전달하는 것이 중요합니다. 기계 번역은 이러한 문화적 뉘앙스를 잘 이해하지 못하므로, 창의적인 번역이 필요합니다. 문학 번역은 번역 서비스 중에서도 최고 난이도의 작업으로, 경험과 역량을 갖춘 문학 번역가가 반드시 필요합니다. 예를 들어, 시나 소설의 경우, 기계 번역은 텍스트의 미묘한 의미와 감정, 문체를 제대로 살리지 못합니다.

엔진을 훈련할 수 있는 소스 언어와 타깃 언어 모두에서 데이터가 부족한 언어 쌍
데이터가 부족한 언어 쌍의 경우, 기계 번역의 품질이 저하됩니다. 기계 번역 엔진은 많은 양의 데이터로 훈련되어야 정확한 번역을 할 수 있는데, 데이터가 부족하면 번역의 정확성과 일관성이 떨어집니다. 예를 들어, 소수 언어나 비주류 언어의 경우, 충분한 훈련 데이터를 확보하기 어려워 기계 번역의 품질이 낮아질 수 있습니다. 이러한 경우, 기계 번역보다는 인간 번역가를 사용하는 것이 더 적합합니다.

복잡한 구문과 문법을 가진 텍스트
기계 번역 엔진은 복잡한 문장 구조와 문법을 정확하게 처리하는 데 어려움을 겪습니다. 문장이 길거나 복잡한 구조를 가지고 있을 경우, 번역 품질이 크게 떨어질 수 있습니다. 예를 들어, 법률 문서나 기술 문서처럼 복잡한 문장이 많은 경우, 기계 번역은 문장의 정확한 의미를 전달하지 못할 수 있습니다. 이러한 텍스트는 전문 번역가에 의한 후속 편집이 필수적입니다.

법적 구속력이 있는 텍스트
법률, 의료, 금융, 공공 기관 제출 문서와 같은 법적 구속력이 있는 텍스트는 번역 오류로 인한 피해가 클 수 있습니다. 기계 번역된 콘텐츠는 부정확할 수 있으며, 작은 오류도 큰 법적 문제를 초래할 수 있습니다. 이러한 문서의 경우, 전문 번역가에 의한 정확한 번역과 철저한 검토가 필수적입니다. 예를 들어, 계약서나 의료 기록은 작은 실수도 법적 책임을 초래할 수 있으므로, 기계 번역보다는 인간 번역가가 더 신뢰할 수 있습니다.

이처럼 MTPE를 사용하지 말아야 할 상황에서는 기계 번역의 한계를 인식하고, 인간 번역가의 전문 지식과 경험을 활용하여 더 높은 품질의 번역을 제공하는 것이 중요합니다.

기계 번역의 품질을 개선하는 방법

기계 번역의 가장 큰 문제는 정확성에 있어서 완전하지 않다는 것과 문화적 뉘앙스에 맞춘 미묘한 차이를 재현하지 못하는 것입니다. 그러나 상당한 숫자의 영역에서 기계 번역의 혜택을 누리면서도 고품질 번역을 구현할 수 있는 몇가지 방법이 있습니다.

가장 적합한 기계 번역 엔진 사용
모든 MT 엔진의 기능이 동일하지 않습니다. 예를 들어, DeepL Translator는 지원하는 언어의 범위가 넓지 않지만, 지원하는 언어에서는 뛰어난 성능을 발휘합니다. 주로 유럽 언어를 지원하며, 최근에는 중국어, 일본어, 한국어도 추가되었습니다. Baidu Translate는 중국어 번역에 특화되어 있으며, 중국어를 다른 언어로 번역하는 데 있어 탁월한 성능을 보입니다. Bing Translate는 경우에 따라 문학 번역에 가장 효과적인 선택입니다.

작업 중인 언어 쌍과 번역 도메인에 따라 각 MT 엔진은 장단점이 있습니다. 번역 도메인이란 번역 작업이 이루어지는 특정 분야를 말하는데 예를 들어, 법률, 의학, 기술, 마케팅과 같은 다양한 도메인이 있습니다. 따라서, 최적의 번역 엔진을 선택하기 위해 가능한 한 많은 MT 엔진을 테스트하는 것이 좋습니다. 일부 회사는 산업 용어와 회사 데이터를 사용하여 엔진을 훈련시키거나 맞춤형으로 개조하여, 특정 도메인에 맞춘 높은 품질의 번역을 제공합니다.

원본 텍스트의 단순화 및 용어집 사용
MT는 경험과 지식을 갖춘 인간 언어학자의 언어 능력에 미치지 못합니다. 복잡한 구문, 비유적 표현 및 말장난과 같은 문장에서 어려움을 겪을 수 있습니다. Bing Translate가 Demi Lovato의 ‘Give Your Heart a Break’ 가사를 베트남어로 번역하는 방식을 분석하여 MT가 이러한 상황에서 얼마나 형편없이 수행되는지 사례가 있습니다.

Bing은 가사에서 두 번째 ‘break’가 ‘부수다’ (làm tan nát)가 아니라 ‘위로하다’ 또는 ‘치유하다’ (xoa dịu)를 의미한다는 것을 이해하지 못했습니다. 이 예시에서 드러나는 것처럼 MT는 은유, 중의적 표현, 문화적 뉘앙스를 이해하고 정확하게 번역하는 데 한계가 있습니다.

따라서, MT 엔진을 효과적으로 사용하려면 원본 텍스트가 단순하고, 의미가 명확하며, 복잡한 표현이나 중의적 표현을 피해야 합니다. 예를 들어, 법률 문서나 기술 매뉴얼처럼 명확하고 구조화된 텍스트는 MT 엔진으로 더 정확하게 번역될 가능성이 높습니다. 일부 회사들은 이러한 이유로 번역할 텍스트를 작성할 때 MT 엔진의 특성을 고려하여 간결하고 명확하게 작성하는 지침을 따릅니다. 추가로, 사용자 정의 사전 및 용어집을 활용하는 것도 번역 품질을 높이고, MT 엔진이 특정 산업의 용어와 문맥을 더 잘 이해할 수 있도록 돕습니다.

콘텐츠에 적합한 포스터 에디팅 수준 선택
공식 문서에 MT를 사용한다면 반드시 포스터 에디팅을 수행해야 합니다. 이때, 모든 MT 출력물이 동일한 수준의 포스팅 에디팅을 필요로 하는 것은 아닙니다. 문서의 종류나 품질 요구 사항에 따라 간단한 방식의 검수 (Light Post-Eiding) 또는 전면 검수 (Full Post-Editing을 적용할 수 있습니다. 두 방식의 차이를 간단하게 비교해 보겠습니다.

Light Post-EditingFull Post-Editing
주요 수정 내용기본적인 오류 수정 (철자, 문법, 구두점 등)철자, 문법, 구두점 외에도 문체, 용어, 문장의 흐름까지 전반적인 수정
목적번역된 텍스트가 이해 가능하고 큰 문제가 없도록 하는 것번역된 텍스트가 원문과 같은 품질을 가지도록 하는 것
작업 시간작업 시간이 짧음작업 시간이 길어짐
적용 상황내부 문서나 비공식적인 용도로 사용될 때 적합공식 문서, 출판물, 마케팅 자료 등 고품질이 요구될 때 적합

MT 결과물의 품질을 개선하려면 문서의 종류나 사용 목적에 맞추어 간단 검수 또는 전면 검수를 수행하십시오.

유능한 포스터 에디터 선택
포스터 에디터는 기계 번역된 결과물을 검수하는데 필요한 기술과 경험을 보유하고 있습니다; 모든 포스터 에디터는 번역가이지만 모든 번역가가 포스터 에디터로서 역량이 뛰어난 것은 아닙니다. 번역 기술 외에도 포스터 에디터는 특정한 방식으로 기계가 반복하는 오류를 발견하고 분류하며 수정하는 데 능숙하며, MT 시스템을 개선시키는 방향으로 협업할 수 있어야 합니다.

예를 들어, 포스터 에디터는 기계 번역 엔진의 오류 패턴을 인식할 수 있어야 합니다. 각 번역 엔진에는 고유한 오류 패턴이 있으며, 예를 들어 Google 번역은 특정 날짜 형식을 잘못 번역할 수 있습니다. 이처럼 MT 프로젝트에서 성공적인 결과를 얻으려면 원본 텍스트가 단순하고 명확하며 오류가 없어야 합니다. 경험 많은 포스터 에디터는 작업해야 할 각 엔진이 자주 발생하는 실수를 잘 알고 있고 이를 빨리 파악하고 수정할 수 있습니다. 이로 인해 기계 번역의 결과물의 품질을 높이는 데 중요한 역할을 합니다.

ISO 18587은 기계 번역 사후 편집 (Post-Editing) 서비스를 위한 국제 표준입니다. 이 표준은 기계 번역된 텍스트를 포스터 에디터가 어떻게 검토하고 수정해야 하는지 지침을 제공하고 있습니다. 그러므로 ISO 18587 표준을 준수하면서 작업하는 유능한 포스터 에디터를 선정해야 합니다.

기술 도구 활용
우수한 성능의 CAT (Computer-aided Tool, 번역을 지원하는 플랫폼을 일컫는 업계 표준 용어) 툴은 MT 정확도를 확인하는 데 도움이 되는 QA 기능을 내장하고 있습니다. 예를 들어, memoQ의 QA 기능은 번역 엔진이 클라이언트가 요청한 용어와 일치하지 않는 용어를 사용할 경우 포스터 에디터에게 이를 알려주는 기능을 포함하고 있습니다. memoQ는 다양한 QA 체크를 통해 문서의 품질을 확인하고, 용어 일치 여부, 숫자 형식, 문법 오류 등을 검토하여 번역의 정확성을 높이는 데 도움을 줍니다. Trados의 QA Checker는 기계가 번역하지 말아야 할 브랜드 이름을 실수로 번역할 경우 경고 메시지를 표시합니다. Trados는 이외에도 용어 관리, 문법 체크, 포맷 일관성 확인 등 다양한 기능을 통해 번역의 품질을 유지하고 오류를 줄이는 데 중요한 역할을 합니다​.

한샘글로벌의 MTPE 서비스

한샘글로벌의 MTPE 서비스를 경험해 보세요. 대용량의 문서 처리도 빠른 시간 안에 처리됩니다.기계 번역물에 잠재된 오류는 한샘글로벌의 경험많고 뛰어난 포스터 에디터들에게 맡겨 주세요. 인간 번역보다 짧은 시간에 완료하지만 결과물은 인간 번역과 유사한 품질로 나옵니다. 특히 한샘글로벌은 기계 번역 사후 표준인 ISO 18587 인증기업입니다. 체계적인 프로세스를 수립하고 있습니다. 경험도 많구요. 어떤 작업에 기계 번역 서비스를 활용할 수 있을지 안내해 드리겠습니다.