IBM왓슨이 얼마 전 한국어 학습을 마쳤다고 합니다. 왓슨은 언어 공부를 열심히 하는 것으로 알려져 있습니다. 인공지능 왓슨이 할 줄 아는 언어 8가지에 대해 소개해드립니다. 



1.  영어


영어는 세계적인 공용어입니다. 영어를 모국어로 하는 나라가 매우 많습니다. 영국에서 시작한 언어이고 현재는 전 세계적으로 가장 영향력 있는 언어라고 볼 수 있습니다. 'UN의 6대 공용어[각주:1]' 중에 하나이기도 하지요. 영어는 영국의 언어일 뿐만 아니라 미국을 비롯한 캐나다, 호주 모국어이자 현재 그 외에도 필리핀, 인도, 싱가폴, 스리랑카, 파키스탄 등 50여개 국가의 공용어이기도 합니다. 


영어는 비즈니스 파트너를 만나서 대화할 때 가장 편하게 사용하는 언어이며, 고급수준은 아니지만 웹상에서 가장 편하게 대화를 주고 받을 때 사용하는 언어이지요. 그리고 IT 업계 개발자들이 주로 사용하는 '스택오버플로우'라는 커뮤니티에서도 인도, 한국, 스페인, 독일, 프랑스 그 국적에 상관없이 다수의 개발자들이 영어로 질문을 올리고 답변해주고 있습니다.



2.  프랑스어

프랑스어는 전세계적으로 보았을 때 비교적 많은 인구가 사용하는 언어 중에 하나입니다. 프랑스의 모국어이지만, 프랑스 외에도 프랑스어를 사용하는 국가는 상당히 많습니다. 벨기에, 캐나다, 스위스 등 30여개 국가에서 공식 언어로 지정되어 있습니다. 사용 국가들의 지리적인 분포를 보면 주로 과거 제국주의로 인한 정복전쟁으로 르완다, 세네갈, 토고 등 아프리카에 주로 많이 퍼져있습니다. 또한 북미의 캐나다 퀘벡에서도 사용합니다. 프랑스어는 영어처럼 전 세계적인 공용어는 아니지만 전통적으로 유럽의 외교언어로서 큰 역할을 했습니다. 그리고 현재도 UN의 6대 공용어 중에 하나입니다. 



3.  스페인어

Hola! 는 스페인어로 '안녕'이라는 뜻입니다. 스페인하면 관광지 내지는 축구가 떠오르실 텐데요. 스페인은 과거 유럽의 강대국으로서 수많은 정복전쟁을 통해 스페인어를 전세계적으로 퍼뜨린 국가이기도 합니다. 스페인어는 우리나라에서는 비주류이지만 미국에서는 무시할 수 없는 언어입니다. 중남미 대륙은 크게 포르투갈과 스페인의 식민지로 나눠볼 수 있으며 포르투갈의 식민지였던 브라질을 제외하고는 거의 스페인어를 사용하고 있다고 보시면 됩니다. 그리고 북미대륙에서 미국은 스페인어를 사용하는 멕시코와 국경을 맞대고 있으며 미국에서 히스패닉 인구는 점점 증가하고 있습니다. 



4.  이탈리아어

이탈리아에서 사용하는 모국어입니다. 이탈리아어는 영어와 프랑스어, 그리고 스페인어 보다 사용하는 국가가 적습니다. 하지만 IBM 왓슨은 빠르게 배울 수 있는 언어였던 것 같습니다. 그 이유는 프랑스어, 스페인어, 이탈리아어는 라틴어를 공통 조상으로 하는 언어이기 때문이지요. 아마도 어순에 있어서 스페인어 내지는 프랑스어를 잘 학습했다면 이탈리아어는 금방 배울 수 있는 언어라 빠르게 학습한 게 아닐까 하는 추측을 해봅니다. 



5.  독일어


독일어는 독일의 모국어입니다. 위에서 라틴어를 부모로 갖는 프랑스어, 스페인어, 이탈리어와 다르게 게르만어에 속합니다. 독일어를 사용하는 국가는 많지 않습니다. 독일을 비롯한 오스트리아, 리히텐슈타인의 언어이며, 룩셈부르크와 스위스, 벨기에, 나미비아 국가들에서는 공용어 중에 하나입니다. 적은 나라가 사용한다고 무시할 수 있는 언어일까요? 일상생활 속에 우리가 명차로 여기는 대다수의 차가 독일 차라는 사실을 잊으시면 안 됩니다. 벤츠, BMW, 아우디, 포르쉐 이런 명차 뿐만 아니라 기술력 있고 탄탄한 기업들을 많이 갖고 있는 나라의 언어니까요. 



6.  중국어

인구 숫자로 치면 으뜸인 나라, 중국이죠. 따라서 중국어는 세계에서 사용 인구가 많은 모국어로 치면 1위입니다. 중국어는 한자 사용 등이 어렵지만 어순으로 볼 때 영어와 비슷한 어순을 사용합니다. 따라서 문자가 어렵긴 하지만 중국어 자체를 학습시키는 것은 크게 어려운 일이 아니었던 것 같습니다. 중국어는 사용 인구가 많은 만큼 그 방언이 엄청나다고 하죠. 해안에 위치한 사람들의 중국어와 대륙 내 서쪽에 위치한 사람들이 사용하는 중국어는 거의 다른 언어라고 합니다. 



7.  포르투갈어

왓슨은 브라질의 포르투갈어도 학습했습니다. 포르투갈어는 스페인어와 비슷한 라틴어계열입니다. 특히 스페인어랑 비슷한 어휘가 상당히 많습니다. 포르투갈어는 포르투갈의 모국어지만, 포르투갈의 과거 정복 전쟁으로 인해 브라질의 모국어이기도 합니다. 현대에 와서 포르투갈이 쓰는 포르투갈어와 브라질에서 사용하는 브라질 포르투갈어로 나눕니다. 왓슨이 학습한 것은 브라질 포르투갈어입니다. 포르투갈어는 사용 국가의 수는 10개 미만으로 적은 편에 속하지만, 인구가 2억 이상인 브라질의 모국어이기 때문에 실제로 사용 인구수는 많다고 보시면 됩니다. 



8.  한국어

얼마전 왓슨이 한국어 학습을 마쳤다는 소식이 들려왔습니다. 한국어는 모국어로 우리나라만 사용하는 언어이기는 하지만 우리나라 5천만 인구와 IMF가 발표한 세계 GDP 규모 11위라는 경제 수준을 고려할 때 상당히 위상이 있는 언어입니다. 하지만 세계적인 IT기업들에게 한국어는 일본어 만큼 지원받지는 못했던 것이 사실이지요. 그래서 이번에 인공지능 왓슨의 한국어 습득 소식이 매우 반갑습고 SK C&C와 함께 공동 연구 개발 중으로 우리나라에 어떤 서비스를 보여줄 지 결과물이 기대됩니다.


또한 왓슨의 한국어 정복은 IBM 블루믹스 플랫폼이 제공하는 다른 서비스 예를 들어 시각화 자료 인지 서비스, 음성 텍스트 인식 서비스 등 그 범위를 넓혀 다양한 비즈니스에 사용될 것으로 보고 있습니다. 




  1. UN의 6대 공용어에는 영어, 스페인어, 프랑스어, 아랍어, 중국어, 러시아어 있다. [본문으로]
  • 네이버 블러그 공유하기
  • 네이버 밴드에 공유하기
  • 페이스북 공유하기
  • 카카오스토리 공유하기