본문 바로가기메뉴 바로가기

뷰 본문

다음앱 채널

알렉사, 8개의 새로운 목소리 추가

번역beta

Translated by kakao i

번역할 언어 선택

아마존 알렉사에 8개의 새로운 목소리가 추가된다. 


아마존 폴리(Amazon Polly)가 제공하는 8개의 무료 음성 기술을 사용하여 개발자들이 음성 애플리케이션에 독특한 성격을 부여할 수 있다. 


아마존 폴리는 2016년 11월 아마존의 개발자 행사인 re:Invent에서 처음 공개되었다. 


오늘날 텍스트 음성 변환 서비스는 음색 효과, 다이내믹 레인지 압축 등의 기능을 제공하므로 실제 음성보다 자연스럽게 들리게 만들 수 있다.

현재 아마존 폴리는 24개 언어로 거의 50개에 달하는 목소리로 이야기할 수 있지만, 현재는 8개의 목소리만 알렉사의 스킬 개발에 사용할 수 있다. 


폴리는 딥러닝 기술을 활용해 실제 사람 목소리처럼 음성을 합성하는 텍스트 음성 변환(TTS, Text To Speech) 서비스다.


한국어로는 ‘Seoyeon’이라는 이름으로 샘플 텍스트를 음성으로 들어볼 수 있다. (아마존 폴리 한국어 웹사이트)


한국어로는 ‘Seoyeon’이라는 이름으로 샘플 텍스트를 음성으로 들어볼 수 있다.



아마존의 알렉사 관련 프로그램을 개발하는 개발자는 이제 다양한 음성을 사용할 수 있게 됐다. 또한, 워드프레스의 게시물을 팟캐스트로 전환할 수 있는 플러그인을 제공함으로써 더 많은 사용자가 폴리에 더욱 쉽게 ​​접근할 수 있도록 노력하고 있다.


한국어로는 ‘Seoyeon’이라는 이름으로 샘플 텍스트를 음성으로 들어볼 수 있다.

아마존의 알렉사 관련 프로그램을 개발하는 개발자는 이제 다양한 음성을 사용할 수 있게 됐다.


또한, 워드프레스의 게시물을 팟캐스트로 전환할 수 있는 플러그인을 제공함으로써 더 많은 사용자가 폴리에 더욱 쉽게 ​​접근할 수 있도록 노력하고 있다.

출처AWS

techNeedle 인사이트


아마존은 아무래도 지난주 구글의 발표가 내심 신경 쓰였던 모양이다. 구글 I/O에서 구글 듀플렉스가 인간의 목소리를 거의 흡사하게 구사하는 모습이 공개됐다. 


또한, 구글은 2016년부터 시작한 웨이브넷(WaveNet) 기반의 TTS를 활용한 6개의 새로운 음성을 발표했고, 유명 가수인 존 레전드(John Legend)의 음성도 포함되어 있다. 


이에 따라 아마존 역시 알렉사 생태계를 더 많은 사람이 활용할 수 있도록 알렉사 스킬 강화에 나섰다. 본문 마지막 차트를 보면 구글의 스마트 스피커 점유율이 상승하고 아마존의 점유율은 하락 할 것으로 예상하고 있다. 


아마존이 음성인식 스피커 시장의 우위를 이어나가기 위해서는 지금보다 더 다양한 음성 기반 서비스를 에코를 통해 제공할 필요가 있다.


글쓴이 : Juntak Yoon

SK플래닛 11번가, 한국IBM, SK하이닉스에서 근무했습니다. 뉴욕대학교(NYU) 기술경영 석사과정을 마쳤습니다. IT와 커머스 분야에 대해 주로 글을 쓰면서 강연을 하고 있습니다. 아마존, 블록체인, 커머스에 관심이 많습니다. 저서로 <아마존 이노베이션-특허를 통해 살펴본 아마존의 기술혁신 전략 보고서>가 있습니다.

해시태그

작성자 정보

다음앱 채널

    번역중 Now in translation
    잠시 후 다시 시도해 주세요 Please try again in a moment