음성인식 개발자를 위한 영어 발음 사전 제작 프로젝트 2편

반응형
본 글은 영어 발음 평가 모델 및 음성인식 모델에 사용하는 영어 발음사전을 구축하기 위한 과정을 담고 있습니다.

 

 
음성 인식 모델을 개발하기 위해서는 여러 단계가 있습니다. 음성을 획득하는 단계, 음성의 특징을 추출하는 단계, 음소를 인식하는 단계, 음소열에 가장 적합한 단어를 언어 모델을 통해 찾는 단계 등을 거쳐 최종적으로 음성을 단어 혹은 문장으로 인식할 수 있게 됩니다. 본 포스팅은 음소열을 발음 사전을 이용해 단어로 매핑하는 단계를 다룹니다. 음성 인식 모델뿐만 아니라, 여러 목적으로 사용할 수 있는 영어 발음 사전을 구축하기 위한 과정입니다. 
 
 

1. 영어 발음 사전의 구성 요소

이전 포스팅에서 다루었듯이, 영어 발음 사전의 구성 요소는 총 3가지입니다. 단어, 음절 경계가 표시된 단어, 음절 경계가 표시된 발음열, 이렇게 세 가지 요소가 발음 사전에 필수적으로 필요한 요소라고 할 수 있습니다. 
 

발음 사전에 필요한 3 요소

 
발음 사전을 구축하기 위해서 음절 경계가 표기된 사전을 사용할 수 있지만, 세상에 있는 모든 단어와 발음열의 음절을 표기한 사전은 존재하지 않기 때문에, 사전에 음절 경계가 표시되지 않은 단어에 대해 음절을 나눌 수 있으려면 영어의 음절 규칙을 알아야 합니다. 따라서 이번 포스팅에서는 영어의 음절 규칙에 대해서 다루어보도록 하겠습니다.
 
 


 

2. 영어 음절 규칙

한국인이 영어의 음절을 영어 모국어 화자보다 어려워하는 이유는 영어와 한국어의 음절 규칙이 다르기 때문입니다. 한글은 초성(onset), 중성(nucleus), 종성(coda)을 한 글자에 담을 수 있어 글자수와 음절 수가 완전히 일치합니다. 예를 들어 "스트레스"라는 단어는 4글자를 가지고 있고, 각각 "스", "트", "레", "스"로, 음절을 4개로 구분할 수 있습니다. 
 
한글과 다르게 영어는 글자수보다 대부분 모음의 개수에 음절의 수가 결정이 됩니다. "stress"는 모음이 "e" 한 개로 음절이 한 개입니다. 하지만 모음의 개수와 음절의 개수가 상이한 영어 단어도 있습니다. "chasm"은 글자 중 모음은 "a" 한 개이지만 음절은 "cha"과 "sm" 두 개입니다. 이후에 설명하겠지만 "m"은 모음 없이도 음절을 형성하는 음절 자음(syllabic consonant)입니다. 이렇듯 영어의 모음의 개수만으로는 음절의 개수를 판별하기 힘들기 때문에, 영어의 음절을 쉽게 알 수 없습니다.
 

1) 영어 음절의 음소 배열 제약

음절은 언어에서 음소 배열 제약과 관련해 중요한 역할을 합니다. 음소 배열 제약은 소리나 소리의 연쇄들을 배열하는 체계를 말하는데, 음소열의 초성이나 종성에 나타날 수 있는 음소들을 한정하는 역할을 합니다. 
 
영어는 초성, 중성, 종성을 한 글자에 담아 한 음절을 이루는 한글과 달리 각각의 글자들이 일정한 규칙에 따라 초성, 중성, 종성을 이루고 그것이 한 음절이 됩니다. 따라서 가능한 음소 배열을 알고 있다면, 음절 경계를 구분할 때 가능하지 않은 음소 배열로 음절을 구분하지 않을 수 있습니다.
 

 
위의 표에서 blit [blɪt] bmit [bmɪt]은 모두 영어에서는 존재하지 않는 단어들입니다. 하지만 blit은 영어 단어로 가능하고, bmit은 영어 단어로 가능하지 않다는 점에서 차이를 가집니다. 그 이유는 blit의 초성인 [bl]은 영어에서 음절의 초성에 나타날 수 있는 자음군이지만, bmit의 초성인 [bm]은 가능하지 않은 자음군이기 때문입니다.
 
"submarine"과 "submission"과 같은 단어는 영어에서 /b/ 뒤에 /m/이 따라 나올 수 있다는 사실을 보여줍니다. 하지만, 이것은 두 소리들이 서로 다른 음절에 위치해 있을 때만 가능합니다. "submarine"은 "sub", "marine"으로 2음절이고, "submission"은 "sub", "mis", "sion"으로 3음절입니다.
 
가능하지 않은 단어지만 존재하는 단어도 있습니다. schwa(/ə/)는 모음 사각도의 중앙에서 조음 되는 중설중모음(central-mid vowel)을 말합니다. 이 단어는 19세기 독일 문헌학자들에 의해 언어학에서 처음 사용되었기 때문에 독일어 철자법인 schwa를 사용하게 되었습니다. 이처럼 외래어가 다른 언어에 채택되어 사용되는 경우는, 해당 언어의 규칙에 따르지는 않지만 통용되게 됩니다.
 
 

2) 음소 배열 공식

/sl/는 영어에서는 가능한 초성이지만, 스페인어에서는 /sl/로 시작되는 초성무리들은 대부분 허용되지 않습니다. 따라서 asleep(/ə s l i p/)이라는 단어를 음절화 할 때, 영어를 모국어로 사용하는 화자들은  a.sleep(/ə.s l i p/)과 같이 음절화를 하겠지만, 스페인어 화자들은 as.leep(/ə s.l i p/)과 같이 음절화를 시도할 수 있습니다. 

또한 위에서 말한 blit[blɪt] 과 bmit [bmɪt] 둘 중 영어 단어로 가능한 단어를 알기 위해서는 가능한 음소 클러스터의 조합을 알아야 합니다. /bl/은 단어의 초성 위치에서 나타나는 이중 초성(initial digraph consonant)이지만, /bm/은 가능하지 않은 조합입니다. 

따라서 가능한 음소 클러스터를 알고 있다면, 한 단어를 음절화 할 때 큰 도움이 됩니다. 먼저 음소배열의 보편적인 공식은 다음과 같습니다. 
 

 
가운데 노란색 박스로 표시된 V는 모음 혹은 이중 모음입니다. V는 음절의 핵으로 영어의 음절에서 유일하게 필수적인 요소입니다. 하얀색 박스로 표시된 (C)들은 자음으로 선택적 요소들입니다. 따라서 우리는 모음 앞에 하나의, 두 개의, 혹은 세 개의 자음을 단일, 이중, 삼중 초성으로 자음을 가질 수도 있고, 단일, 이중, 삼중 종성으로서 자음들을 더할 수도 있습니다. 
 

 
마지막으로 회색 박스로 표시된 {C}는 접미사에 속할 경우에 가능한 자음을 말합니다.
 

 
CCCVCCCC는 논리적으로는 가능한 음절구조이지만, 해당되는 단일형태소로 된 어휘를 영어에서는 찾아볼 수 없습니다.
 
 

3) 음소 클러스터

초성

아래는 초성으로 가능한 자음의 목록을 ARPA 기호를 통해 표기한 그림입니다. ()로 표시된 음소열은 대부분의 미국 영어 화자에게서는 발견되지 않는 초성들입니다.

 
영어에서 초성 위치에서 나타날 수 없는 유일한 자음은 /ŋ/ 입니다. 또 다른 자음인 /ʒ/(ZH)는 'genre'와 같은 몇 가지 단어들을 제외하고는 영어의 단어의 첫 위치에 나타나는 경우가 매우 드뭅니다. /ð/(DH) 역시 문법적 어휘들(기능어 : function words)의 어두 위치에서만 발견됩니다. 예를 들어 the, then, there 등이 있습니다.  
 

종성

아래는 종성으로 가능한 자음의 목록을 ARPA 기호를 통해 표기한 그림입니다. ()로 표시된 음소열은 대부분의 미국 영어 화자에게서는 발견되지 않는 초성들입니다.
 

 
영어에서 종성 위치에서 나타날 수 없는 유일한 자음은 /h/(HH)입니다. 종성으로 가능한 자음의 목록에 더해 /t/(T), /d/(D), /s/(S), /z/(Z), /θ/(TH)를 가진 접미사(과거 시제, 복수형, 소유격, 서수 등)에 의해 만들어진 자음 군을 더하게 되면 그 수가 훨씬 많아지게 됩니다. 예를 들어, camp(k æ m p)의 복수형 camps(k æ m p s)의 종성 /m p s/이 있습니다.
 
 


 

3. 영어 음절 규칙의 예외

1) 음절 자음(Syllabic Consonant)

 
음소 배열 공식에서는 음절에서 모음 혹은 이중 모음은 음절의 핵으로 영어의 음절에서 유일하게 필수적인 요소라고 했습니다. 하지만 음소 중에 음절 자음(syllabic consonant)은 자음이 음절을 구성할 수 있는 음절의 핵이 되기도 합니다. 음절 자음은 m, n, l과 같은 음소로, 발음할 때 schwa(/ə/)와 함께 발음합니다. 

예를 들어, 'alcoholism'은 'al', 'co', 'ho', 'li', 'sm'으로 5개의 음절을 가집니다. 마지막 음절 'sm'은 모음이 없어, 음절이라고 말하기 헷갈리지만, 'm'이라는 음절 자음을 가지고 있기 때문에 실제로 'alcoholism'을 발음할 때는 'æ l k ə h ɑ l ɪ z ə m' 이러한 발음 기호를 가지고 있어, 'm' 앞에 schwa(/ə/)가 삽입된 것을 볼 수 있습니다. 
 
실제로 'alcoholism'을 사전에 검색해 보면 철자 음절 경계는 'al.co.hol.ism'으로 표기되어 4음절이고, 발음 음절 경계는 'æ l.k ə.h ɑ.l ɪ.z ə m'으로 5음절입니다. 따라서 어떤 음절 경계를 따를 것인지는 사용자의 판단에 따라 결정해야 합니다. 
 
 

2) 음절 삭제

"I ate very interesting chocolate in the restaurant."

위 문장에서 "interesting", "chocolate", "restaurant" 세 단어를 음절화하는 것은 특히 어렵습니다. "interesting"은 "in.ter.est.ing"이라고 읽는 것이 아닌, "in.tere.sting"으로 3음절로 발음합니다. 실제로 "interesting"의 발음 기호는 'ɪ n.t ɹ ə.s t ɪ ŋ'으로 가운데 'e'음소가 삭제된 것처럼 발음하게 됩니다. 따라서 사전에 "interesting"을 검색해 보면, 철자 음절 경계는 'in.ter.est.ing'이라고 표기되어 있지만, 발음 음절 경계는 'ɪ n.t ɹ ə.s t ɪ ŋ'으로 표기되어 있습니다.
 
영어 단어에서 특정 부분의 음절이 삭제된 것처럼 발음되는 이유는 강세와 관련이 있습니다. 영어에서는 한 단어마다 한 음절이 강세를 가지게 됩니다. 음절이 강세를 가지게 되면, 그 음절의 모음을 크고, 길고, 높은 음으로 발음해야 합니다. 단어에서 가장 중요한 음절을 강조할 때, 다른 음절들은 상대적으로 작고, 짧고, 낮은음으로 발음하게 됩니다. 이때 강조되지 않는 음절의 모음들은 매우 차분한 /ə/ 나 /ɪ/ 소리로 바뀌게 됩니다. 이때 입은 이러한 강조되지 않는 음절을 짧게 발음하기 위해 생략하기도 합니다. 
 
이렇게 음절이 삭제되는 단어들 중에서는 한국인들이 발음하기 어려운 단어들이 특히 많습니다. 아래에 있는 단어들은 음절 삭제가 되는 일반적인 단어들의 목록입니다.
 

interesting, comfortable, every, favorite, different, average, several, vegetable, chocolate, beverage, restaurant, grocery, evening, family, business, camera, basically, specifically, naturally, probably

따라서 발음 음절 삭제가 일어나는 위와 같은 단어들을 발음 사전에 기재할 때에는 철자음절 경계와 발음 음절 경계에 차이가 있기 때문에, 특히 주의해서 표기해야 합니다.
 
 


 
이번 포스팅에서는 영어 발음 사전을 구축하기 위해 필요한 영어 음절 개념에 대해 소개했습니다. 발음 사전에는 철자 음절 경계와 발음 음절 경계가 표현된 단어와 음소열이 표기되기 때문에, 음절 개념에 대해 이해하는 것은 중요합니다.
 
재미있게 읽으셨다면 댓글 남겨주세요. 감사합니다. 

반응형