북한 음성인식프로그램 대동강 1.0을 보니

휴대폰에서 인공지능 기반의 음성 인식 기능을 이용하는 모습.
휴대폰에서 인공지능 기반의 음성 인식 기능을 이용하는 모습. (사진-연합뉴스)

0:00 / 0:00

여러분 안녕하십니까, 우리 생활과 친숙해진 과학과 기술을 알기 쉽게 풀어보는 <북한 IT와 과학기술> 시간입니다. 진행에 정영입니다.

오늘도 현대 과학기술 지식에 관해 북한 김책공업종합대학에서 컴퓨터를 전공했던 김흥광 ‘NK지식인연대 대표’와 함께 알아보겠습니다

진행자: 김흥광 대표님, 안녕하십니까,

김흥광: 안녕하십니까,

진행자: 저희가 현재 북한에서 새로 개발되고, 도입되고 있는 아이티 기술에 대해서 하나씩 알아보고 있는데요, 오늘은 어떤 재미있는 주제를 준비했습니까,

김흥광: 네, 김책공업종합대학의 정보기술연구소에서 ‘대동강 1.0’이라고 하는 음성인식프로그램을 개발했다고 자랑했습니다. 그래서 북한의 음성인식기술이 어느정도인지, 그리고 세계적인 수준이 어느 정도인지에 대해서 이야기하겠습니다.

진행자: 여기 미국에서는 북한에서 운영하는 해외선전웹사이트를 볼 수 있는데요. 남쪽에는 좀 막히지 않았습니까,

김흥광: 네 북한에서 직접 운영하는 웹사이트에 남한주민들이 접속하는 것은 경찰청이 다 막기 때문에 어려운데, 미국의 한 사이트가 중개해주기 때문에 그곳 사이트까지 가는 것은 문제가 되지 않습니다. 에돌아서 볼 수 있습니다(웃음).

진행자: 미국에서는 우리민족끼리, 서강, 내나라와 같은 선전용 웹사이트에 자유자재로 접속할 수 있는데요. 서강 웹사이트 10월 31일자 기사를 보니까, 조선어 음성인식기술이 손전화용, 판형 컴퓨터 내장용으로 개발되어 사용자들의 호평을 받고 있다고 전했습니다. 대표님께서 오늘 설명해주실 내용이 이런 부분입니까,

김흥광: 네, 서강이라는 인터넷 사이트는 작년 5월 경부터 처음 개방되었는데요. 여기서는 주로 북한의 다양한 측면에 대해서 소개하지만, 특히 과학기술분야에서 최신 일어난 과학기술들을 소개합니다.

그런데 서강이 최근에 음성인식 기술이 대단하다. 그것도 김책공대가 만들었다고 선전했거둔요. 이게 인식속도가 굉장히 높다고 선전했는데요. 물론 그들의 이야기 한대로 능력이 그 정도라고 하면 평가받을만 하지요. 그런데 그걸 세계적 기술, 남한의 기술에 비해 어느 정도일지 청취자분들이 궁금해 할 것입니다.

진행자: 북한이 소개한 음성인식 프로그램은 일반 손전화를 쓰는 청취자들에게도 생소한 기술같은데요. 그 원리를 좀 소개해주십시오.

김흥광: 우리 손전화기나 판형 컴퓨터를 쓸 때, 문서작업을 한다. 그러면 타이핑을 해야 하지 않습니까, 손가락으로 꼭꼭 눌러서 찾는 대신에 음성인식 프로그램은 컴퓨터나 손전화 자판에 마이크처럼 생긴 아이콘이 있을 것입니다.

그 버튼을 누르면 그 다음부터 휴대폰이 사람의 목소리를 인식합니다. 사람이 문자를 일일이 한자씩 또박또박 쓰자면 얼마나 힘듭니까, 그런데 음성인식 기술을 이용하면 굳이 사람의 손으로 타이핑 하지 않고도 판형 컴퓨터에서 문서작업을 할 때 파일 열기, 검색, 지령들을 줄 수 있거든요. 그것까지 할 수 있다고 대동강 음성인식 기술프로그램이 소개했습니다.

진행자: 요즘 젊은 사람들은 타이핑 속도가 엄청 빠르지 않습니까, 1분에 300~500자 이렇게 치지 않습니까, 그런데 북한의 노동당 간부들은 나이가 있어서 타이핑 속도가 떠서 제대로 치지 못하지 않겠습니까, 그런 사람들에게는 음성인식프로그램이 기막힌 수단이 될 것 같은데요.

저도 현대적으로 개발된 네비게이션 음성인식 프로그램을 쓰고 있는데요. 네비게이션이라고 하면 길을 찾아가는 프로그램이 있지 않습니까, 차에 비치된 네비게이션에서 마이크처럼 생긴 것을 누르고 버지니아, 월마트라고 말하면 딱딱 찾아줍니다. 그래서 상당히 좋아 하는데요. 그러면 북한에서 만든 음성인식 프로그램도 이런 원리가 되는 겁니까,

김흥광: 그래서 제가 직접 확인해 보았습니다. 올해 7월에 처음 생산해 출시한 손전화에 내장되어 있는 것을 시험해보았습니다. 실제로 음성인식을 하는 지 시험해보았습니다. 아, 그런데 인식속도가 괜찮았습니다. 손전화(휴대전화)에서 통보문을 보낼 때 북한에서는 문자를 통보문이라고 하거든요. 버튼을 누르고 ‘어디까지 왔어요?라고 하니까, 문자로 나타났습니다.

말하는 것이 글자로 나타나거든요. 그래서 참 이처럼 손전화기에 음성인식 프로그램이 들어왔다는 것이 발전된 것이고요. 그리고 북한이 가장 최근에 만든 판형 컴퓨터를 봤는데, 거기에서 문서작업하는 워드 문서가 있습니다. 그리고 엑셀 문서도 있었습니다.

이런 기능에 음성인식 프로그램이 있다고 하면 참 좋겠다는 생각이 들었습니다. 타이핑 하고 싶은 문서를 불러주면 컴퓨터가 알아 들어가지고 글자로 쭉 나타나면 얼마나 좋겠습니까,

그런데 북한이 아직 거기까지는 가지 못하고, 지령은 줄 수 있었습니다. 문서열기, 화면 펼치기, 찾기, 삽입, 인쇄 같은 것은 되더군요. 그런데 좀 괜찮은 것은 엑셀문서라고, 북에서는 표계산 프로그램이라고 하는데, 엑셀을 사용할 때 음성인식프로그램을 사용할 때는 숫자는 아주 잘 되어있었습니다. 1329, 2,220이렇게 숫자는 잘 나왔습니다.

그래서 북한이 이쪽 분야에서 뭔가 음성기술 프로그램을 개발하여 상용화 하기 위해서 굉장히 박차를 가하고 있구나 하는 것을 확인할 수 있었습니다.

진행자: 방금 말씀한데 의하면 북한의 대동강 조선어음성인식 프로그램은 본문인식, 지령인식, 숫자인식 기능을 가진 기술로 발전하는 것 같은데요. 북한에 아마 그런 기술진이 있는 것 같습니다.

김흥광: 그렇지요. 대동강 1.0은 소개는 10월에 되었지만, 실제로 대동강 음성인식 프로그램이 이미 전에 상용화 되었던 것으로 알고 있습니다.

음성인식 기술에 대해서 청취자분들이 어떻게 컴퓨터가 사람의 목소리를 인식할 수 있지하고 생각하실 수 있겠는데요, 이게 간략하게 이야기 한다면 사람이 다른 사람의 말을 알아듣는것 처럼 컴퓨터가 사람의 목소리를 알아 듣는 것입니다. 이 기술은 인간이 바라던 것이거든요.

우리가 지금까지 컴퓨터에 글을 입력시키는 원리는 건반을 하나씩 눌렀을 때, 키를 누르는 순간, 접점이 붙어서 전기신호가 발생하는 방식이거든요. 이런 방식으로 하면 엄청 많은 작업을 해야 하지 않습니까,

그래서 손목이 아프고, 중앙당 간부들 경우에는 타이핑 속도가 늦어서 컴퓨터를 회피하려고 하는데, 그런데 이렇게 타이핑을 일일이 치지 않고 말로 쭉 불러주면 얼마나 좋겠습니까,

바로 이 음성기술을 북한은 물론 세계적으로도 많은 연구를 해왔습니다. 사람의 목소리를 그래프로 보면요. 시간적으로 쫙 움직이는 오실로그라프처럼 높낮이가 나오는데, 사람마다 소리 색갈과 그리고 그 떨림이 다르거든요. 자음과 모음을 했을 때 또 다릅니다. 그래서 그것을 시간에 따르는 어떤 특정들을 자음과 모음으로 숫자로 만듭니다.

진행자: 네 그렇군요. 음성인식기술은 사람들의 목소리를 컴퓨터가 알아서 그 사람이 원하는 결과를 만들어주는 도우미와 같겠군요. 그걸 북한도 개발한다고 하니까 앞으로 그 성능에 대해 곧 밝혀지리라 봅니다.

오늘은 시간상 관계로 여기서 마치고 다음 시간에 또 뵙겠습니다. 감사합니다.