-
토터스 태거 (Tortoise Tagger)TeX과 친구들 2021. 11. 16. 15:54
워드, 파워포인트, HTML, XML 따위의 파일들을 트라도스나 메모큐 같은 CAT 프로그램들이 잘 처리한다. (그렇다고 하더라.) 사실 이것들의 스타일 포맷은 모두 동일하다고 말할 수 있다. 아래 예와 같이 한 쌍의 태그가 문장이나 단어를 감싸고 있다. 그래서, 스타일들을 일관되게 적용했다면, 번역사가 손대지 말아야 할 것들을 손쉽게 가려낼 수 있다.
<w:t xml:space="preserve"> 전에 안전하고 올바른 설치와 관리를 위해 이 </w:t>
하지만 이와 같은 형식을 사용하지 않는 레이텍이나 마크다운 같은 것들은 CAT 프로그램들이 지원하지 않는다. 대신 번역사가 고치지 않아야 할 특정 어절이나 문자들을, "\\\\[a-zA-Z*]{1,25}" 같은, 정규 표현식을 사용하여 CAT 프로그램에 지정할 수 있다.
\chapter{Introduction} -> \chapter{Introduction}
그러면 "\chapter{"와 "}"를 삭제하거나 고치는 것이 불가능해진다.
CAT 프로그램 없이 번역해야 하는 상황에서는 어떻게 해야 할까? 토터스 태거가 대안이다. 토터스 태거는 워드에서 사용하는 매크로 프로그램이다. 다음과 같은 설정 파일을 만들어야 한다.
~~~FindAsIs
~~~WriteExternal
~~~WC-ON
\\\\documentclass*^13
\\\\input*\}
\\\\include*\}
~~~FindAsIs
~~~WriteInternal
~~~WC-OFF
{
}\documentclass를 찾아 줄 끝까지 External 스타일을 적용하라는 뜻이다.
tw4winExternal 스타일이 적용된 텍스트는 회색으로, tw4winInternal이 적용된 것은 빨간색으로 바뀌어 있다. 번역사는 검은색 텍스트만 번역하면 된다.
위의 설정 파일도 정규 표현식을 사용하는 것인데, 워드에서는 텍스트 에디터에 비해 제한된 표현식을 사용할 수 있다. 이를테면 줄 끝을 가리키는 "$"를 사용할 수 없다.
CAT 프로그램을 이용한 레이텍 문서의 번역에 적용할 정규 표현식들을 만들어 detex.tsv에 담고 scripts.db에 넣었다. ((스크립트를 추출하는 방법에 대해서는 hoze.tistory.com/1916를 보시라.) detex.tsv는 wordig.py를 이용하여 레이텍 문서에서 텍 매크로들을 제거하는 데에도 이용된다.
'TeX과 친구들' 카테고리의 다른 글
스핑크스의 레이텍 색인 스타일 (0) 2022.03.17 다국어 식자를 위한 ucharclasses 패키지 (0) 2022.02.11 장을 강조하는 차례 스타일 (0) 2021.10.01 프린팅박스 (3) 2021.09.03 xindex (0) 2021.07.19