여러분 안녕하십니까, 우리 생활과 친숙해진 과학과 기술을 알기 쉽게 풀어보는 <북한 IT와 과학기술> 시간입니다. 진행에 정영입니다. 오늘도 현대 과학기술 지식에 관해 북한 김책공업종합대학에서 컴퓨터를 전공했던 김흥광 'NK지식인연대 대표'와 함께 알아보겠습니다.
진행자: 김흥광 박사님, 안녕하십니까,
김흥광 박사: 안녕하십니까,
진행자: 지난 시간에 북한이 자동번역프로그램 개발 현황에 대해 이야기를 나누었는데요. 오늘은 세계적인 기계번역프로그램의 발전 수준과 북한의 바람직한 과학기술방향에 대한 이야기를 나누겠습니다. 혹시 김박사님께서는 구글이라는 자동번역기를 사용해본적이 있습니까,
김흥광 박사: 네 그럼요. 구글 자동번역기를 사용하지 않으면 일을 도저히 할 수 없습니다. 제가 구글 번역이라는 것을 클릭하면 네모 창이 두개 뜨는데, 왼쪽 창에 제가 한글을 씁니다. 아니면 다른 문서편집기에서 만들어낸 문장을 카피해서 붙여놓으면 제가 손을 떼는 즉시에 오른쪽 박스에는 번역된 문장이 나타나거든요.
제가 거기에 원하는 외국어 설정을 해놓으면, 즉 영어, 일본어, 중국어라고 해놓으면 즉시 나오기 때문에 번역 속도에 대해서 이야기할 필요가 없습니다. 다만 번역의 질인데 이것이 얼마나 정확히 번역되었는가 하는 것은 저도 영어를 그리 유창하게 하는 편은 아니기 때문에 절대적으로 평가할 수 없습니다만, 그래도 이런 정도 감을 가지고 봅니다. 이런 경우에 번역의 질이 엄청 높아졌다는 것입니다.
제가 한가지 우스운 실례를 들겠습니다. 세계적으로 기계번역 기술을 가장 발전시킨 나라가 미국인데, 그 미국안에서도 구글이라고 하는 회사입니다. 이 구글 회사의 창시자인 세르게이라는 사람이 남한에 있는 어떤 한 고객으로부터 편지를 받았어요. 그런데 남한에서는 편지를 쓸 때 "회답을 바랍니다"라는 문장 대신에 "회신을 바랍니다"라고 씁니다.
그런데 그 편지가 한글로 왔기 때문에 이 사람이 이게 도대체 뭐라고 썼을까 하고 자동번역기를 통해 번역했는데, 그 회신이라고 하는 것은 어떻게 영어로 번역되었는가 하면, '회'라고 하는 글자는 (물)고기를 날것으로 먹는 회'Sliced raw fish'라고 번역되었고, 신은 신발이라는 'Shoe'로 번역되었다는 일화가 있습니다. 그래서 그는(세르게이) 자동번역기 질을 획기적으로 개선해야 하겠다는 결심을 하고 달라붙었다는 일화가 있습니다.
이렇게 2006년부터 시작된 구글의 기계번역체계는 14년만에 완성도가 89~90%정도로 올라갔습니다. 특히 다른 나라 언어들보다 한글은 좀 힘듭니다. 이것은 전체적인 감을 가지고 하는 것이거든요. 이런 언어까지도 90%로 결과를 내기 때문에 엄청난 기술 발전이라고 볼 수 있습니다.
진행자: 자동번역기 발전 역사를 보면 북한은 2000년부터 시도했고, 그리고 구글은 2006년부터 본격적으로 해서 북한이 좀더 앞섰다고 볼 수 그런 시점이었는데, 구글이 제공하는 자동번역기는 정확도가 80~90%까지 올랐다고 평가받고 있습니다. 그런데, 북한이 개발했다는 자동번역프로그램의 특징은 무엇입니까
김흥광 박사: 구글이 개발해온 역사와 거의 일치되는데요. 한 나라의 말을 다른 나라의 말로 번역할 때 우리가 일대일로 단어를 대치시켜 연결시키는 최초의 방식이 있었고요. 그 다음에는 '말 눈치'라고 해서, 번역이 대체로 좌우에는 어떤 단어가 온다는 게 있지 않습니까, 예를 들어 '아버지는' 라는 말은 있는데, '아버지이'라는 단어는 없단 말이지요. '아버지는 나를 사랑하셨다', '아버지가 나를 엄격하게 훈육하셨다' 이렇게 이런 통계적 방법이 있습니다.
그래서 뒤에 오는 단어를 붙여주는 통계적 방법이 있습니다. 그리고 오늘날에는 다 수용하면서도 사람의 뇌에서 통역원들이 번역하는 심층 인공지능이라고, 영어로는 '딥 러닝(Deep learning) 기술을 도입하면 번역의 질이 80~90%까지 올라갈 수 있습니다.
그런데 북한에서 나온 자료를 보면 아직 '딥 러닝(Deep learning) 기술을 도입했다는 보고가 없습니다. 왜냐면 북한이 이런 기술에서의 차이가 있는데, 아직 북한이 딥 러닝 기술을 몰라서가 아니라, 이 딥 러닝 기술을 도입하기 위해서는 컴퓨터에 엄청난 단어를 저장하고, 번역 사례를 학습시켜야 합니다. 그러자면 그 딥 러닝 기술을 위해서는 방대한 량의 컴퓨터가 있어야 합니다.
컴퓨터가 한두개가 되어서는 안됩니다. 수백 수천대의 컴퓨터들이 클라우딩 방식으로 연결되어 있어야 합니다. 미국에서는 구글이라고 하는 웹사이트가 있는가 하면, 네이버에서 만든 한국 최고의 번역프로그램은 '파파고'라는 하는 번역프로그램이 있습니다. 한번에 번역할 수 있는 양이 파파고에서는 200단어라고 하면, 구글의 경우에는 5천 단어로 되어 있습니다. 최근에는 파파고의 번역 숫자가 많이 올라갔습니다. 한글의 파파고는 서버라고 하는 초대형 컴퓨터가 적기 때문이고, 구글은 엄청난 컴퓨터가 있기 때문입니다.
제가 말씀 드릴 수 있는 것은 구글과 북한의 번역 프로그램은 결국 컴퓨터라고 하는 장비 부족때문에, 그리고 기계번역의 프로그램 기술 때문에 어렵다는 것입니다. 그런데 진짜 하나는 무엇인가 하면 북한의 번역프로그램들은 다 독립형 기계번역 프로그램들입니다. 이 말은 무엇인가 하면 북한 번역프로그램을 쓰자면 돈으로 사서 설치해서 내 컴퓨터에서만 쓸 수 있다는 것입니다.
그런데, 국제사회는 그렇지 않습니다. 구글이라고 하는 것은 전세계 누구든지 인터넷에만 접속하면 다 쓸 수 있습니다. 구글 번역이라고 치면 구글 번역 창이 뜨거든요. 인터넷 번역을 하는 방식이 바로 구글 방식입니다. 웹 번역이라고 하는 건데요.
그리고 인터넷 익스플로러를 가리켜 북한은 아마 인트라넷 열람기라고 하는 데요. 국제사회에서는 그걸 웹 브라우저라고 하거든요. 이 구글 웹브라우저는 번역 기능을 심어 놓았기 때문에 우리가 구글로 전세계 웹사이트를 방문할 때 영어가 됐든, 인도어가 됐든, 일본어가 됐든 거기다 마우스만 갖다 대면 "이것을 번역해야 하는 가?"고 문의합니다.
그래서 번역 버튼을 누르면 바로 전세계 어떤 언어든 내가 원하는 언어로 확 바뀝니다. 내가 원하는 방식으로 확 바뀌거든요.
진행자: 그렇지요. 저도 경험을 해보고 있는데요. 그러면 북한의 대학생들과 연구사들은 구글 자동번역기에 접속할 수 있을까요?
김흥광 박사: 아 전혀 할 수 없지요. 일반인들은 도대체 구글이 있는지 모릅니다. 참 대학생들이나 연구사들은 그들이 밤새워 하는 연구가 이미 다른 나라에서는 몇 십년 전에 다 끝나고, 이미 일반 문서로 공개된 것일 수 있다는 것이지요. 그래서 좀 안타깝습니다.
그 대신 북한 대학생, 연구사들이 요즘 환영하면서 쓰는 것이 바로 별이라고 하는 번역 프로그램이라고 하는데, 최근에는 부흥 1.4도 쓰고 있고요. 그런데 이런 프로그램들은 다 돈 주고 사야 합니다. 제가 알기로는 좀 비싼 것 같습니다. 몇 만원 하는 것 같은데, 그러니까 북한에서도 (재정)능력이 안되는 연구원들이나 대학생들은 개인적으로 쓰기는 어렵고, 기관이 아마 사다가 설치해서 쓰는 경우가 대부분인 것 같습니다.
진행자: 북한의 대학생들, 연구원들도 인터넷에 마음대로 접속하면 구글 자동번역기, 남한의 네이버가 무료로 제공하는 자동번역기를 사용할 수 있겠는데, 좀 안타깝습니다. 자, 오늘은 시간상 관계로 여기까지 마치고 다음 시간에 또 재미있는 주제로 찾아 뵙겠습니다. 오늘 말씀 감사합니다.
김흥광 박사: 감사합니다.
0:00 / 0:00