사전은 어떻게 만들어지는가: 디지털 시대

종이사전의 편찬 과정을 알아본 지난 포스팅(http://skjmail.blog.me/220723157903)
 
에 이어 오늘은 디지털 시대의 사전 편찬 과정에 대해 알아보겠습니다. 사실 종이사전도 이미 1960년대부터는 컴퓨터와 통계학에 기반해 과학적인 방법으로 만들어졌습니다.
​우리가 실제로 쓰는 언어 중에서 유의미한 규모로 언어 샘플을 채취한 뒤 계량화해 사용한 것이죠. 그 샘플을 일일이 분석하면 일상 언어를 통계적으로 반영한 결과를 볼 수 있는데 이것을 '말뭉치 언어학'이라고 부릅니다. 말뭉치 언어학이 탄생한 이후로는 말뭉치에서 예문을 뽑아 사전에 실을 수 있고, 몇 번이나 사용되었는지 숫자로 근거를 제시할 수도 있게 되었습니다.
 
또 하나 사전에 큰 영향을 주고 있는 것은 집단지성입니다. 인터넷 발달 이후 여러 사람이 하나의 문서를 공동으로 작업할 수 있는 '위키위키wikiwiki'를 기반으로 한 '위키백과Wikipedia'가 등장했습니다. 위키백과 영문판은 이미 500만 표제어를 넘어섰습니다. <브리태니커 백과사전>의 규모가 10만 표제어 정도였다는 걸 생각해보면 어마어마한 분량이죠.
 
 
 
이렇게 컴퓨터와 인터넷이라는 도구가 보편화되면서 이제는 여러 장소에서 여러 사람들이 사전을 편집할 수 있게 되었습니다. 예문도 인터넷에서 가져올 수 있으며, 인터넷 말뭉치를 검색해서 빈도와 분포도 확인할 수 있죠. 그뿐 아니라 불특정 다수가 사전을 읽고 제보해주는 오류들을 받아서 내용을 곧장 수정할 수도 있습니다. 이제는 고통스럽게 10교씩 교정을 보지 않아도 됩니다. 흑흑
 
이제 사전 편찬자는 ​사전을 편집/집필하는 사람일 뿐 아니라 다수의 참여를 유도하는 기획자가 되어야 합니다. 사람들이 공동 작업을 할 수 있도록 적절한 도구를 만들고 권한을 부여해야 합니다. 개별 작업자가 올리는 결과물의 흐름을 측정하고 품질이 균질한지 파악해야 합니다. 또 사전 이용자에게 어떤 내용을 주고 어떤 반응을 받아서 다시 내용에 반영할지도 결정해야 합니다. 이전에 비해 적나라하게 들어오는 사용자들의 피드백은 사전의 품질을 측정할 때 가장 엄혹한 기준이 됩니다.
 
 
 
 
 
디지털 시대의 사전 편찬자는 이전처럼 고독하게 언어의 세계로 침잠하는 사람이 아니라 많은 이들과 떠들면서 언어가 끊임없이 기술될 수 있는 환경을 조성하는 사람입니다. 지난 시대의 편집자들처럼 작업하면 그는 사전을 기술하는 사람일 뿐 사전 기획자나 편찬자라고 할 수 없습니다.
 
 
* 이 글은 카카오의 웹사전 기획자 정철의 책 <검색, 사전을 삼키다>의 80~85쪽에 나오는 내용을 요약한 것입니다.  
 
작가
정철
출판
사계절
발매
2016.05.27.