소름끼치는 직관과 추론, 우린 알파고의 영혼을 보았다 (펌)

깨어있는 달팽이

소름끼치는 직관과 추론, 우린 알파고의 영혼을 보았다 (펌)

거울닦는 달팽이 2016. 3. 16. 03:08

미국 오리건주의 소도시 더댈러스(The Dalles)에 설치된 구글 데이터센터에서 한 직원이 구글 서버의 중앙처리장치(CPU)를 검사하고 있다. 구글은 미국과 유럽, 아시아 등 세계 14곳에 데이터센터를 두고 있으며, 2006년 12억달러를 들여 이곳에 지었다. 구글 제공

[토요판] 정재승의 영혼공작소
(8) 인공지능의 현재와 미래

이번주, 대한민국은 충격적인 결말이 기다리고 있는 두 편의 바둑 에스에프(SF)를 보았다. 흔히들 바둑은 반상 위의 인생 드라마, 전략과 뒤통수가 난무하는 무협 사극 등으로 비유되지만, 이번 바둑의 장르는 에스에프. 그 주인공이 구글 딥마인드가 만든 인공지능 알고리듬 알파고(AlphaGo)와 초인류 바둑 최고수 이세돌 9단이었기 때문이다.

한 수 한 수 착점에 돌을 놓을 때마다, 한순간도 안심할 수 없는 순간들의 연속이었다. 이세돌과 알파고는 우리에게 안도와 당혹, 통쾌함과 난감함, 의아함과 뒤통수, 그리고 소름 끼치는 반전들이 만들어낸 한 편의 과학영화를 두 번이나 경험하게 해주었다.

첫 대국에서는 이세돌이 긴장한 듯, 혹은 상대의 인공지능 알고리듬을 의식한 듯, 정석과는 거리가 먼 바둑을 두었고, 실수도 있었으며, 종반전에서 알파고의 예상치 못한 한 수까지 더해져 덜미를 잡히고 말았다. 그러나 그때만 해도 이세돌이 실수하지 않고 마음의 평정심을 유지한다면 알파고를 이길 수 있을 거란 판단도 가능한 대국이었다.

마치 터미네이터의 티(T)1000처럼

하지만 두 번째 대국은 우리에게 더 큰 충격을 안겨주었다. 이세돌은 실기하지 않았으며, 좋은 수들을 두며 시종일관 여유롭게 이끌었고, 오히려 알파고가 흔히 두지 않는 수들을 두면서 실수하는 것처럼 보였다. 그러나 그는 마치 터미네이터의 티(T)1000처럼, 초반에 뒤진 집수를 차곡차곡 만회해가면서 이세돌을 추격했다. 종반전으로 치닫자, 예상치 못한 수들을 두면서 한동안 우리를 의아하게 만들더니, 순식간에 상황을 역전하며, 이세돌에게 연이어 불계패를 안긴 것이다.

이세돌은 최선을 다했고, 끝까지 평정심을 유지했으며, 이기기 위한 바둑을 두었고, 실수를 하거나 패착을 하지도 않았다. 시간이 갈수록 장고가 이어졌다. 그럼에도 불구하고, 알파고에게 졌다. 이세돌은 좋은 수들을 놓았지만, 알파고는 최선의 수들을 둔 것이다.

그들이 바둑을 두는 동안, 바둑 전문가들은 종종 “이건 명백히 알파고의 실기네요!”라고 외쳤지만, 시간이 지나고 나면 그것이 실기가 아니라 의미 있는 수였다는 사실을 깨닫게 되곤 했다. 알파고는 인간이 흔히 두는 방식으로 두지 않았을 뿐, 가장 승률이 높은 착점들을 계산해 돌을 놓았다. 다시 말해, 지난 수십년 동안 인간이 두었던 바둑으로 학습했지만, 그것을 뛰어넘는 자신만의 전략들을 추론해낸 것이다.

우린 남자와 여자 얼굴을 어떻게
거의 100%의 정확도로 구별하나
가르쳐 주지 않아도 학습해왔다
이 추상화 과정이 바로 추론능력
알파고도 바로 이런 능력 가졌다
알파고가 기보 보듯 인공지능이
인간의 행동 패턴을 분석한다면
또다른 서비스 가능해질 것이다
사물인터넷과 빅데이터 기술은
인공지능과 결합할 때 폭발적 발전

알파고에 입력된 수천만건의 기보와 수백만건의 대국들은 지난 수십년간의 아마추어와 프로 바둑기사들로부터 온 것들이었다. 그중에서는 초인류 최고수라 일컫는 9단들의 대국도 있었겠지만, 그 수는 상대적으로 적었을 것이다. 이세돌 대국을 분석하거나, 이세돌에게 강한 중국의 커제 스타일을 학습하지도 않았다. 그렇다면, 알파고는 하수들에게 배워 고수를 꺾었다는 얘기다.

이번 세기의 대국이 인간에게 각별히 충격적인 것은 인간의 고유 능력이라 생각했던 직관도 컴퓨터가 계산할 수 있다는 사실을 일깨워주었다는 데 있다. 또 과거의 기보들을 학습해서 승률을 높이는 전략을 찾아내는 추론 과정도 계산할 수 있다는 사실이다. 더 나아가, 지금까지 바둑 고수들은 직관을 통해 수읽기를 해가면서 착점 가능한 수들 중에서 좋은 수들을 골라냈으나, 사실은 모든 착점 가능한 수들에 대해 향후 승리에 미치는 영향을 계산할 수 있고, 이를 통해 그저 ‘좋은 수’가 아닌, ‘최적의 수’를 찾을 수 있다는 걸 알게 됐다. 우주 삼라만상의 운행을 읽는 반상 위의 직관, 그 미학과 경이로움이 컴퓨터로 계산 가능한 결과값일 수 있음을 목도하는 경험이란 충격적일 수밖에 없다.

9일 오후 서울 종로구 포시즌스 호텔에서 열린 ‘구글 딥마인드 챌린지 매치’에서 구글 딥마인드가 개발한 인공지능 프로그램 ‘알파고’와 이세돌 9단(오른쪽)의 대국이 진행되고 있다. 구글 제공

알파고는 ‘어린 이세돌’

인공지능이란 ‘특정한 업무를 수행하기 위해 인간이 만든 지능적 시스템’을 뜻한다. 앨런 튜링이 인간의 뇌를 포함한 보편적인 계산기계이자 지능 시스템을 제안한 것이 1950년, 컴퓨터 과학자 존 매카시가 지적으로 업무를 수행하는 시스템을 개발하는 모든 과학기술을 ‘인공지능’이라고 명명한 것은 1955년. 그러니까 인공지능을 연구한 지 약 60년이 되는 올해, 구글 딥마인드의 데미스 하사비스와 그의 동료들은 4천년 동안 인류가 즐기고 기풍을 쌓았다는 바둑의 최고 고수에게 도전장을 내민 것이다.

불과 일주일 전만 해도 많은 바둑 전문가들은 이세돌의 낙승을 점쳤다. 지난해 10월 유럽 바둑 챔피언 판후이를 5-0으로 꺾은 알파고의 실력을 살펴보니 이세돌에 비할 바는 아니었다. 올해 1월 <네이처>에 실린 알파고의 알고리듬을 들여다보니, 바둑기사가 바둑을 두는 과정을 모사하긴 했으나, 그다지 위협적이진 않았다. 다만, 그 후 5개월 동안 알파고가 얼마나 많은 프로바둑기사들의 기보를 학습했는지, 실제 대국을 펼치며 학습능력을 발휘해왔는지 미지수였다.

막상 뚜껑을 열자, 알파고가 ‘어린 이세돌’이라는 사실을 알게 됐다. 직관과 추론 실력이 어마어마하다는 것을 알게 됐고, 그에게 지난 5개월의 학습은 인간이 지난 1천년간 학습한 분량에 맞먹는다는 것이 드러났다. 총 1202개의 시피유(CPU·중앙처리장치)와 176개의 지피유(GPU·그래픽처리장치)로 구성된 알파고에는 100여명의 과학자들이 달라붙어 있었다. 그 결과, 1천명이 넘는 인원의 두뇌가 동시에 동원돼 순식간에 10만개에 이르는 경우의 수를 연산해 낼 수 있었다. ‘어린 이세돌’이 빅데이터까지 손에 넣었으니 무엇이 불가능하랴! 언론은 ‘인공지능이 인간 최고수의 뇌를 꺾은 날’이라며 충격의 언어들을 쏟아냈고, ‘이러다가 인공지능이 인간을 지배할 미래가 오는 건 아니냐’며 불안에 떨었다.

알파고는 도대체 어떻게 직관과 추론이 가능했던 걸까? 바둑은 그 경우의 수가 너무 많아 착수 지점을 선정하기 어렵고, 완벽한 수읽기도 불가능해 직관과 경험을 통한 추상적인 전략만이 최고수로 가는 길이라 믿었다. 19×19, 즉 361개의 착점을 순서대로 놓으니, 경우의 수는 361!, 즉 361×360×359×358…. 대칭구조를 고려하고, 모양이 반복해서 나오는 패와 사석을 제거한다고 해도, 정석과 포석을 고려한다고 해도, 그 경우의 수는 흔히들 하는 말로 우주의 원자 수보다 많다.(사실은 정확하게 비교할 수 없다!)

알파고는 이런 상황에서, 몬테카를로 시뮬레이션 방법을 사용했다. 마치 국민 여론을 이해하기 위해 수천명의 표본을 추출해 여론조사를 하듯, 알파고도 모든 경우의 수를 다 고려하지 않고 표본을 추출해 승률을 어림잡는 방법을 사용했다. 이것은 마치 단면을 보고 전체를 파악하는 직관과 유사하다. 알파고도 ‘일감’(어떤 국면에서 단번에 떠오르는 수)을 하고 있는 것이다.

딥러닝으로 깊어진 학습 수준

알파고가 착점을 찾는 방법에는 크게 두 가지 과정이 포함된다. 흔히들 프로바둑기사들이 하는 것처럼, 현재 신경 쓸 필요가 없는 지역은 제치고 중요한 착수 지점들이 어디인지 범위를 좁히면서 최적의 지역을 찾는 과정, 지역이 정해지면 모든 가능한 착점에 대해 승률을 계산해서 최적의 착점을 찾는 과정이다.

첫 번째 과정은 답이 있어 보인다. 대국 기보와 승패자 정보를 바탕으로 영 엉뚱한 수들은 제친다. 이때 바둑 고수들을 흉내 내는 전략을 짜는 과정이 필요한데, 이때 사용되는 방법이 ‘딥 러닝’(Deep learning)이라는 학습 방법이다. 바둑 기보를 통째로 복잡한 신경망의 입력 데이터로 넣어주고, 신경세포들 사이의 매개변수값을 바꾸어가면서 적절한 결과값을 만들어내게 한다. 사람의 뇌를 매우 단순한 수준에서 모사한 이 방법의 핵심은 층이 여럿 있다는 것. 각 층에서 실제 데이터들 간의 공통점·차이점 등을 파악해 이른바 전략이라는 걸 추출해내는 추상화 과정이 벌어진다.

비유를 들어보자. 우리는 어떻게 남자의 얼굴과 여자의 얼굴을 구별하는가? 이를 구별할 수 있는 규칙이 있는가? 여자는 남자에 비해 얼굴이 작고, 피부가 뽀얗고, 이목구비가 오밀조밀하다? 과연 이런 규칙이 남녀의 얼굴을 구별하는 기준이 될 수 있을까? 예전의 인공지능은 이런 규칙들을 찾아내 알고리듬 안에 넣어두고 일일이 이목구비의 크기를 측정하면서 답을 내려 애썼다. 그러나 좋은 결과가 나올 턱이 없다. 우리도 그렇게 남녀 얼굴을 구별하지 않으니까 말이다.

그렇다면 우리는 말로 표현할 수 없는 규칙은 어떻게 배웠을까? 어떻게 거의 100%에 가까운 정확도로 남녀 얼굴을 구별할 수 있는 걸까? 우리는 어릴 때 “이 사람은 남자야, 이 사람은 여자야” 하면서 경험적으로 가르침을 받았다. 이때 우리 뇌는 남자 혹은 여자의 얼굴들 사이에 존재하는 어떤 유사성을 추상적으로 학습한다. 그래서 처음 보는 사람에 대해 적용해 남녀를 구별할 수 있는 것이다. 심지어 다른 인종의 얼굴을 보더라도 말이다.(즉, 그동안 배운 경험치와 상당히 먼 입력이 들어오더라도 말이다.)

이 추상화 과정이 바로 인간의 추론 능력이다. 가르쳐주지 않은 것을 배우는 능력이다. 알파고도 이런 능력을 가지고 있다. 우리는 그저 수천만건의 기보를 통해 이기는 수와 지는 수, 이기는 대국과 지는 대국을 보여주었을 뿐인데, 알파고는 이 과정에서 이기기 위해서는 어떤 전략이 필요한지를 배우는 것이다. 이 과정을 수행하는 신경망이 정책망(policy network)이다. 큰 집들을 확보하기 위해 포석을 두려면 이 과정이 매우 중요하다. 교전을 끝내고 다른 지역으로 이동하려 할 때도, 내 세력을 확정하려 할 때도 정책망의 역할은 필수적이다. ‘모라베크의 역설’처럼 컴퓨터한테 쉬운 일이 우리에겐 어렵고 인간에게 쉬운 일이 컴퓨터한텐 어렵다지만, 알파고는 그 역설을 여지없이 깨부수었다.

지역이 선정되면 그 안에 온갖 착수 가능한 지점들을 분석해야 한다. 이세돌 9단이라면, 좋은 수를 찾기 위해 형세를 판단하고 수읽기를 할 것이다. 알파고도 같은 과정이 포함돼 있다. 한 지점에 돌을 놓았을 때 그 이후 모든 경우의 수를 따져, 그 지점에 놓았을 때의 승률을 계산한다.(실제로는 모든 경우의 수를 다 따질 수 없으므로 몬테카를로 기법을 사용해 승률 표본 조사를 하는 것이다.)

이때 대국 승리라는 결과값은 알파고에게는 가장 원하는 보상으로 작용한다. 알파고가 동물이라면 마치 음식을 주는 것과 같고, 알파고가 어린 이세돌이라면 칭찬을 해주는 것과 유사하다. 그러면 알파고는 승률이 가장 높은 곳을 찾아 착수할 것이다. 더 많은 음식을 얻기 위해, 혹은 더 큰 칭찬을 받기 위해서 말이다. 이 과정을 가치망(value network)이 수행하는데, 인간이 어린 시절 학습을 하는 원리와 유사하다.

지금까지 학습한 모든 기보들이라는 무시무시한 빅데이터를 학습해서, 이들 패턴을 관통하고 있는 승리 전략, 이기는 전술을 스스로 파악해 매 상황에 적용하는 알파고의 모습을 우리는 지난 두 번의 대국에서 보았다. 종반으로 갈수록 경우의 수가 현저히 줄어들면서 수읽기가 빨라졌고, 한 치의 오차도 없는 계산으로 최고의 착점들을 찾아내는 모습도 보였다. 딥러닝과 강화이론, 몬테카를로 기법이 합쳐져서 인간의 직관과 추론을 모사한 것이다.

비즈니스 지형도가 바뀐다

인간의 직관과 추론과는 상당히 거리가 멀지만, 알파고가 그나마 유사하게 흉내 내었다는 점에서 놀랍고, 그 성능이 인간의 그것을 능가하는데 입이 딱 벌어진다.

이번 두 차례 대국을 보면서 흥미로웠던 점은 바둑해설가가 알파고를 사람처럼 대하는 모습이었다. “알파고가 하상귀는 포기하는 것처럼 보이네요.” “이번 교전에서는 만족스럽다고 판단한 걸까요, 우상귀로 옮겨가네요.” “이세돌의 가운데 대마를 견제하기 위해 여기에 포석을 둔 것 같네요.” 그러나 알파고는 실제로 아무런 생각이 없다. 그는 미친 듯이 영국에서 계산을 하고 있을 뿐이다. 데미스 하사비스 대표의 말처럼, 알파고의 최대 장점은 감정적 동요, 두려움이 없다는 점이다. 승률이 높아서 두었을 뿐, 포기도, 만족도, 견제도 없다. 그래서 스타일도 없고, 기풍도 없다. 그것이 그의 스타일이라고 하면 모를까.

지금으로부터 20년 전, 그러니까 1997년 아이비엠(IBM)의 인공지능 알고리듬 ‘딥 블루’가 전설적인 세계 체스 챔피언 가리 카스파로프를 2승3무1패로 꺾은 날이 인공지능이 인간의 계산능력을 압도한 날이었다면, 이번주는 인공지능이 흉내 내고 있는 직관과 추론이 인간 최고수를 꺾은 날이라고 역사는 기록할 것이다.

인공지능이 연구된 지 60년. 그 덕분에 많은 공장들은 자동화되었고, 인공지능은 장난감에서부터 자동차에 이르기까지, 온갖 제품에 사용되었지만, 일자리를 줄어들게 하지는 않았다. 제조업에서는 일자리가 줄어들었지만, 그 못지않게 서비스업의 일자리가 늘었기 때문이다. 서비스업이란 본질적으로 서비스를 제공할 인간과의 상호작용이 필수적이다. 그런데 인간의 행동은 모두 예측할 수 없기 때문에, 인공지능의 적용이 쉽지 않았다.

다양한 요구에 적절히 대응하기 위해서는 사람에 대한 정확한 인식과 감정 파악, 그 사람에 대한 공감, 행동 대처에 대한 직관과 추론이 필요한데, 가르쳐주지 않은 것을 학습하는 능력, 창의적인 대응이 필수적이다.

그런데 우리는 이번주 알파고를 통해 그 가능성을 조금 엿보았다. 페이스북 같은 소셜미디어나 사물 인터넷이 등장하면, 인간의 모든 행동이 기록에 남는 시대가 될 것이다. 알파고가 기보를 분석하듯, 만약 인간의 모든 행동 패턴을 인공지능이 분석한다면, 우리가 뭘 원하는지 뭘 필요로 하는지 알아낼 것이며, 이를 통해 적절한 서비스가 가능할 것이다. 향후 사물 인터넷과 빅데이터 기술은 인공지능과 결합할 때 폭발적인 발전을 이룰 것이다.

아직 감정을 갖기는커녕 남의 감정도 못 읽고, 스스로 판단하거나 의사결정을 하는 것이 어려운 인공지능이 우리 사회에 어떤 쓸모가 있겠냐고? 물론 인간의 복잡한 감정도 잘 읽고, 마음도 충분히 공감하고 헤아릴 수 있는 인공지능 로봇이 등장한다면, 그래서 사람 못지않게 친근하고 사려깊은 서비스와 배려를 받을 수 있다면, 서비스업에서 인간은 심각하게 일자리를 위협받을 것이다.

그러나 아직 그런 시대가 오지 않더라도 나름 의미가 있을 수 있다. 오히려 인공지능이 제한된 수준의 사회적 상호작용만 가능하다는 것이 각별한 의미가 있을 수도 있다는 얘기다. 알파고가 두려움이 없었기에, 이세돌과의 막판 수읽기에서 흔들리지 않았듯이 말이다. 농담 같은 예를 들자면, 서점에서 야한 책이나 디브이디(DVD)를 구입하려고 할 때 점원 대신 인공지능 로봇이 결제를 해주길 원할 것이다. 모텔에 들어갈 때 내게 서비스는 최선으로 하되 감정이나 판단은 없는 인공지능 점원을 원할 것이다.

인간 뇌를 닮아가는 길로 우회

딥러닝과 빅데이터의 결합이 만들어낸 성공들은 인공지능학계의 연구 지형도를 바꾸어 놓고 있다. 인공신경망 분야, 즉 머신 러닝(machine learning)의 전신이었던 이 분야는 실제 인간 뇌의 신경망에 비하면, 단순하고 조악하기 이를 데 없는 시스템이었고 실제로 성능도 다른 인공지능 방법론에 비해 그다지 특별하지 않았다. 그런데도 이 정도의 단순한 신경망에 층을 몇 개 더 쌓았더니 딥러닝이 가능해져서 놀라운 추상능력을 갖게 됐다는 것은 실제 인간 뇌와 유사한 구조를 넣어주면 훨씬 놀라운 결과들을 쏟아내지 않을까 예측하게 만든다.

그래서 오바마 행정부가 주도하는 ‘브레인 프로젝트’(BRAIN initiative)가 각별히 의미가 있다. 세포 수준에서 뇌의 구조, 즉 천억개가 넘는 신경세포들이 서로 어떻게 정교하게 연결돼 있는지 그 커넥톰 구조(뇌 속 신경세포의 연결을 그린 지도)를 밝혀내는 데에 앞으로 10년간 1조3천억원을 사용하겠다는 것이다. 유럽연합에서도 유사한 ‘인간 뇌 프로젝트’(Human Brain Project)라는 이름으로, 앞으로 10년간 1조2천억원을 투자해 인간 뇌와 유사하게 계산하는 컴퓨터 모델을 만들겠다는 야심찬 프로젝트를 수행 중이다.

영국의 과학자 앨런 튜링이 ‘유니버설 머신’이라는 개념을 세상에 내놓은 이래, 그동안 인공지능의 탐구 역사는 인간의 뇌를 흉내 내려는 노력이 미약했다. 인간 뇌에 대한 이해가 없기도 했거니와, 지능적일 수만 있다면 굳이 인간 뇌를 흉내 낼 필요가 없다고 생각했다. 그 덕분에 패턴 인식, 전문가 시스템 등 흥미로운 개념이 등장해 놀라운 결과로 사람들을 깜짝 놀라게 만들었지만, 기대는 여지없이 실망으로 이어졌다. 1970년대 말, 1980년대 말, 이른바 두 번의 ‘인공지능의 겨울’을 맞이하게 됐다. 연구비가 끊기고 인공지능 무용론이 나올 정도였다. 세 번째 인공지능의 겨울을 맞이하지 않기 위해서는 이제 인간의 뇌에게서 힌트를 얻을 필요가 있다. 이제 신경과학과 뇌공학의 발전이 인공지능에 버금가고 있기 때문이다.

이세돌과 알파고의 대국에서 사람들이 목격한 건 혹시 ‘알파고의 영혼’이었을까? 영혼도 계산의 결과물로 얻을 수 있는 거라는 끔찍한 현실을 목도한 건 아닐까? 조만간 봄이 올 것이다. 인공지능에게도.

정재승 교수

'깨어있는 달팽이' 카테고리의 다른 글

하버드에 선 이재명 시장 “행동하는 소수가 세상 바꾼다” (0)	2016.05.26
미국이 민주주의 국가라는 착각 (0)	2016.05.26
가짜 민주주의 식별법 5가지 기준 (0)	2016.01.19
신혜정-라면의 정치학 (0)	2016.01.15
카툰 한장으로 보는 문/안 사태.jpg (0)	2015.12.13

현재글소름끼치는 직관과 추론, 우린 알파고의 영혼을 보았다 (펌)

맑은 마음, 밝은 지혜, 스스로 행복 뜬 세상의 아름다움을 음미할 것. 슬픈 세상을 기쁘게 살아낼 것. 나날이 평온해지는 삶.. 그 지혜의 창고!

맑은 마음, 밝은 지혜, 스스로 행복

뜬 세상의 아름다움을 음미할 것. 슬픈 세상을 기쁘게 살아낼 것. 나날이 평온해지는 삶.. 그 지혜의 창고!

오바마, 유시민, 법륜스님, 노무현, 즉문즉설, 성시경, 명상, 조동진, TeD, 이적, 행복, 법상스님, Twitter, 깨어나십시오, 법륜 스님, 나태주, 조셉 캠벨, Beatles, 신자유주의, 자유,

Today :
Yesterday :

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

맑은 마음, 밝은 지혜, 스스로 행복