ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 오로지 첫가끝만 쓴다면
    테크니컬 라이팅 2011. 6. 13. 16:57
    한글 인코딩의 역사는 즐거이 추억하기에는 지나치게 많은 방식들이 출현했었고 그 만큼 논쟁도 많았다. 컴퓨터 제조사들이 저마다 다른 인코딩 방식을 만들어 썼다. 삼보, 금성, 삼성, 대우 등등.

    정부에서 완성형 인코딩을 채택하고 그것이 유니코드에까지 이어진 것이 통탄할 만큼 잘못된 선택이라고 조합형주의자들이 주장한다. 조합형이 천지인 원리에 맞고, 중세 한글을 포함하여 모든 글자를 표현할 수 있다는 것이 제일 먼저 내세우는 논거이다.

    태국어는 완성형을 쓰지 않는 것으로 보인다. 글자 생김새를 가만히 살펴 보면 완성형이 필요하지 않음을 알 수 있다. 태국어에서 몇몇 모음은 자음의 위 또는 아래에 위치한다. 그런데 그것이 자음의 형태에 영향을 미치지 않는다. 쉽게 말해, 우리글에서는 아래 글자들에서 볼 수 있듯이 다양한 형태의 ㄱ자가 필요하다.

    가, 간, 구, 국, 권

    그런데 베트남어에서는 한글에서처럼 완성형과 조합형이 모두 쓰일 수 있다고 한다. 이유가 뭘까? 모음 위에 강세 표시와 억양 표시를 또는 다른 어떤 발음 구별 부호를 함께 썼을 때 글자 모양이 보기에 좋지 않을 뿐더러 심한 경우 알아보기 어렵기 때문일 터이다.

    한글 폰트에 실제로 유니코드에 할당된 수 만큼 글자들이 들어 있는 게 아니라고 한다. 이삼천 자만 만들어져 있고 나머지 글자들은 모두 그 만들어져 있는 글자들을 조합해서 표현한다고 한다. character 인코딩과 glyph 인코딩은 별개란 얘기인데, 이것은 단지 글자의 미학에 머무르는 문제가 아니다.

    캐릭터 인코딩에서 첫가끝만 쓴다고 해도 글리프를 어떻게 표현할지의 다른 언어와는 비교할 수 없을 만큼 중대하고 어려운 문제가 우리에게 남는다.  글리프를 조합해서 구현한다고 할 때 그것을 폰트에 맡길까(폰트도 프로그램이므로), 아니면 운영체제에 맡길까? 

    첫가끝을 쓰면 유니코드에 정의되어 있지 않은 글자를 만들어 쓰는 것이 가능할 것이다. 이것을 다룰 수 있는 이상적인 IME가 있다고 가정하더라도 비교나 검색 같은 텍스트 연산의 처리는 그다지 쉽지 않아 보인다. 

    한글의 인코딩 방식에 대한 논쟁은 여전히 끝나지 않은 문제가 아닐까?

    '테크니컬 라이팅' 카테고리의 다른 글

    보조사  (0) 2011.06.14
    오로지 첫가끝만 쓴다면 II  (0) 2011.06.14
    베트남어 알파벳  (0) 2011.06.13
    태국어 알파벳  (0) 2011.06.13
    첫가끝  (2) 2011.06.11

    댓글

Designed by Tistory.