
“다국어 소스 파일 형식에 대해 무엇을 알고 계신가요?”
작년 초 우리 팀이 트라도스 스튜디오의 다국어 소스 파일 지원을 개선하는 임무를 맡았을 때 제가 받은 질문입니다. 당시 저는 여러 언어로 번역 가능한 콘텐츠가 포함되어 있고 이러한 파일의 레이아웃이 표준 형식을 따르지 않는다는 점을 제외하고는 해당 주제에 대해 거의 알지 못했으므로 일반적인 지원을 제공하고자 할 때 상당히 복잡했습니다.
이 질문에 대한 제 반응은, 애초에 우리가 왜 다국어 형식을 지원하는 데 신경을 써야 되냐는 것이었습니다! 기존 트라도스 스튜디오로도 이중 언어 문서를 처리할 수 있는데요. 그렇지 않나요? 따라서, 소스 파일의 복사본을 만들고 각 타겟 언어에 대해 이중 언어 문서를 만든 뒤, 기존 번역을 마법처럼 복사한 다음 나머지를 번역하고, 완료되면 마지막으로 마술 지팡이를 흔들어 모든 번역을 다국어 네이티브 파일로 다시 복사하는 것이 더 쉽지 않을까요?
하지만, 여러분의 이름이 간달프고 샤이어에서 바람을 맞으며 산책을 하는 사람이 아니라면, 그런 마법은 그리 쉽게 마스터할 수 없습니다. 현실의 PM은 일반적으로 두 개의 명령(Ctrl + C 및 Ctrl + V)으로 무장하고 번역을 연결하는 지루한 과정을 거쳐야 합니다. 먼저 준비 과정에서 이중 언어 문서를 작성한 다음, 번역이 완료된 후 다시 다국어 소스 파일로 돌아갑니다. 이 반복 작업을 하다 보면 금방 손목 터널 증후군이 오는데요...
그렇다면, 번역 환경에서 다국어 형식을 관리하는 것이 그렇게 어려운 이유는 무엇이며, 표준으로 이중 언어가 아닌 다국어 문서를 관리하는 것은 어떨까요? 컴퓨터 보조 번역(CAT) 도구는 링귀스트가 품질과 일관성을 보장하면서 프로젝트를 더 빨리 납품할 수 있도록 하는 기능을 가지도록 설계되었습니다. 그리고 다양한 소스 파일 형식에서 번역 가능한 콘텐츠를 추출하여 각 타겟 언어에 대해 이중 언어 형식( SDLXLIFF) 구조를 생성하도록 설계되었습니다.
도전 과제를 보다 잘 이해하려면 번역 환경에서 다국어 문서 개념을 도입하지 않는 이유를 살펴볼 필요가 있습니다. 콘텐츠가 여러 타겟 언어로 번역되고 해당 언어를 전문으로 다루는 여러 링귀스트에게 번역 작업을 배포하려는 일반적인 상황을 고려해 보겠습니다. 이 프로세스는 일반적으로 번역자 한 명이 타겟 언어 하나를 처리하므로 이중 언어 문서를 관리하는 데 적합합니다. CAT 툴을 사용하여 개별 이중 언어 문서를 별도로 배포할 수 있습니다.
이제 한 언어의 텍스트 단락 세그먼트 분할이 다른 언어와 다를 수 있다는 점도 고려해 봅시다. 이중 언어 문서는 소스와 타겟 콘텐츠를 1:1 대응하여 매끄럽게 표시할 수 있으므로, 원본 단락의 무결성을 유지하면서 여러 번역 유닛(TU)을 추가로 분할 및/또는 병합할 수 있습니다. 하지만, 다국어 문서는 소스 콘텐츠가 타겟 언어마다 다르게 분할될 수 있어, 단일 번역 유닛에서 여러 번역을 정렬할 수 없기 때문에 간달프의 마법이 필요합니다.
진정한 질문은 '트라도스 스튜디오에서 다국어 문서를 관리하는 것이 어떨까요?'가 아니라, '주로 이중 언어를 사용하는 환경에서 다국어 형식을 관리하도록 설득할까요?'라는 것을 깨닫기 시작하셨을 겁니다.
트라도스 스튜디오가 소스 파일에서 번역 가능한 콘텐츠를 추출하고 이중 언어 문서를 만든 다음 분석, 사전 번역 등을 수행하는 핵심 기능을 이미 갖추고 있기 때문에 얼핏 쉽다고 생각하실 수 있습니다. 그렇다면, 다국어 소스 파일에서 각 타겟 언어에 대한 이중 언어 문서를 만들기 위해 이러한 절차를 자동화하는 일은 얼마나 어려울까요? 알고 보니 전혀 어렵지 않았습니다! 트라도스 스튜디오가 제공하는 API를 이용하면 개발자는 독자적인 파일 형식과 해당 용도에 맞는 일괄 처리 작업을 생성할 수 있습니다.
트라도스 스튜디오에서 다국어 소스 파일을 지원하는 문제를 해결하기 위한 가장 실용적인 접근 방식은, 기존 트라도스 스튜디오에서 사용 가능한 핵심 기능을 다시 이용하는 파일 형식을 개발한 다음, 두 가지 새로운 자동화 작업을 도입하는 것이라는 사실을 발견했습니다. 첫 번째 작업인 "다국어 번역 가져오기"는 타겟 언어는 물론 번역자 지원을 위해 제공되는 추가 컨텍스트 정보도 가져와야 합니다. 이 작업은 일반적인 트라도스 스튜디오 세그먼트 분할 규칙을 사용하여 소스를 분할한 후에 수행됩니다. 소스를 적절하게 번역하기 위해 단락에 더 많거나 더 적은 문장이 있을 수 있으므로 항상 소스를 타겟에 매핑할 수는 없다는 점을 고려해야 합니다. 따라서, 단락에 여러 문장이 포함된 경우 타겟 번역은 첫 번째 소스 문장에만 대응하도록 배치됩니다. 두 번째 작업인 "다국어 번역 생성"은 프로젝트가 완료되면 다국어 소스 파일을 다시 생성합니다. 따라서, 번역을 원본 다국어 소스 파일로 다시 가져오기 위해 더 이상 스크립트를 복사, 붙여넣기 또는 생성할 필요가 없습니다.
먼저 번역에 사용되는 가장 일반적인 두 가지 다국어 형식인 다국어 Excel 및 다국어 XML 파일 형식에 대한 지원을 개발했습니다. 다국어 Excel 파일은 로컬라이제이션 문자열을 제공하기 위한 사실상의 게임 업계 표준이며 용어 저장에도 자주 사용됩니다.
트라도스 스튜디오와 함께 배포되는 API는 개발자가 비즈니스 요구 사항에 맞는 고유한 기능을 번역 환경에 추가할 수 있도록 해 주는 에코시스템의 중요 부분입니다. 트라도스 앱스토어 팀에서 개발한 다국어 파일 형식은 수행 가능한 작업의 일부 예시일 뿐이며, 대부분의 작업과 마찬가지로 GitHub\RWS Community에서 모두 오픈 소스로 제공됩니다. 당사는 모든 개발자가 이러한 프로젝트에 참여하여 서로 배우고 공통의 문제를 함께 해결하는 새롭고 혁신적인 솔루션을 계속 제공할 수 있도록 권장합니다. 제3자 개발자들이 성공적으로 개발한 많은 앱도 RWS 앱스토어에 있습니다. 확인해 보세요!
여기에서 새로운 다국어 앱에 대해 자세히 알아보세요.