2014년 4월 5단 17승 1패
2014년 4월 6단 15승 3패(vs 7단 정선 포함)
2014년 4월 7단 19승 8패
2014년 4월~8월 8단 44승 1무 47패
2014년 8월~9월 7단 15승 5패
2014년 9월~12월 7단~8단에서 왔다갔다 함.
=====================================================
deepmind는 2014년 4월 등장하자마자
5단에서 8단으로 바로 감.
애초부터 타이젬 8단 실력이었음.
7단에선 엄청 강하지만 8단에서 승률이 50% 약간 안되는 실력.
당시엔 딥마인드가 알파고가 아니라 사람이었던 것으로 추정된다.
이후 6개월동안 deepmind는 자취를 감춤.
2015년 6월 돌연 등장 후 3판을 둠.
8단에서 1승 2패
그리고 한 달 보름간 또 자취를 감춤.
2015년 8월부터 다시 등장한 deepmind의 성적을 보면
8단에서 5승 11패로 7단으로 떨어지고
7단에서 16승 6패로 8단으로 다시 승단.
여기서부터 deepmind의 기력이 갑자기 확! 좋아진다.
2015년 8월 23일~9월 5일까지 대국을 보면
7단에서 8단으로 다시 승단했지만 8단에서 6연패를 기록하고
다시 7연승을 함. (슬슬 이상한 느낌이 오지 않냐?)
이 7연승이 의문의 7연승이라고 본다.
이 7연승 이후 실력이 엄청나게 좋아거든.
그리고 다시 4연패를 기록했지만
이후 8승 1패의 기록으로 9단으로 승단한다.
2015년 9월 16일, 8단에서 9단으로 승단한 알파고는 딱 한 판만 뒀는데
9단한테 졌음. 알파고가 뒀는지 사람이 뒀는지 확실치 않음.
그리고 딥마인드는 석달동안 등장하지 않는다.
이 기간동안 왕후이와 대국이 있었음.
2015년 12월 2일, 석달만에 등장한 딥마인드는 무려 프로기사 2명을
꺾는 파란을 연출하며 9단 승단 한 후 펼친 20대국에서 무려 16승 4패를 기록한다.
타이젬에 10단이 있었다면 승단할 기록이지.
이건 빼박캔트 알파고라고 본다.
9단 승단 하자마자 16승 4패를 할 때 딥마인드에 졌던 홍검(p)는
알파고와 대국 당시 타이젬 9단에서 최근 20국에서 10승 10패를 기록했던 9단이었고
QQ(P)는 최근 20국에서 9승 11패를 기록했던 9단이었다.
12월 2일부터 12월 9일까지 deepmind는 타이젬에 거의 매일 출현했고
이기간동안 거둔 기록은 9단에서 25승 13패.
이후 열흘간 자취를 감춘 후
12월 19일부터 12월 21일까지 다시 등장해서 15승 1무 12패를 기록함.
이후 9단에서 연패를 하게 되는데 이게 의문이다.
일부러 연패를 해서 타이젬 8단 기력을 테스트 한건지...
어쨌든 1월말 다시 등장한 deepmind는 9단에서 의문의 8연패를 기록하고
8단으로 내려온 deepmind는 8단에서 14승 1무 5패를 기록했다.
지난 달 deepmind가 8단에서 프로와 정선으로 뒀는데
deepmind가 졌다. 당시 프로 아이디는 JiaW(P)였고
최근 20대국 기록 11승 9패중인 프로기사였음.
그래서 2월 2일 9단으로 다시 승단한 deepmind는 지금까지 9단을 유지하며 18승 9패를 기록중이다.
도중엔 9연승을 하기도 했고 4연패를 하기도 했다.
이번 달에 deepmind가 두는 대국을 관전 했는데
그 대국은 확실히 알파고는 아니었다.
왜냐하면 알파고라면 두지 않을 노타임 착수가 여러번 나왔기 때문이다.
아마도 타이젬에서 알파고를 돌리면 9단에서 연승을 하는 것 같고
개발자 중 타이젬 8단 실력을 가진 사람이 대신 두면 연패를 하는 것 같다.
요약하면 deepmind 아이디는 원래 타이젬 8단 실력이었는데
2015년 8월 말부터 기력이 급격히 상승한다. 아마도 알파고의 타이젬 입성시기가 이때로 추정.
타이젬 9단 승률 50%를 기록하는 프로기사를 이기기도 하는 등 9단 승단 하자마자 20국 기준 16승 4패를 기록하기도 했고
최근엔 9연승을 하기도 했다.
실제 대국을 보면 노타임 착수가 등장하는 것으로 봐서 deepmind 타이젬 계정은 알파고와 기존 타이젬 8단 유저가
번갈아가며 이용중인 계정인 것으로 추정.
그러니까 타이젬의 딥마인드 계정이 알파고가 두고 있는 거라면 실력이 우리가 상상하는 이상일 수 있다는 것임.
어떤 바둑학 교수는 이런 분석을 내놓았다.
이병두 세한대 생활체육학과(바둑학) 교수는 11일
알파고가 유럽 바둑 챔피언 판후이 2단을 이겼지만 판후이의 유럽바둑연맹 엘로(ELO) 세계순위는 2월7일 현재 631위에 불과하다”며
유럽바둑연맹 승률곡선을 적용하면 이세돌 9단(ELO 세계 4위)이 72.2%로 승리가 예견된다”고 밝혔다.
엘로 순위는 미국의 아르파드 엘로 물리학 박사가 고안한 방식으로 체스 등 2명이 벌이는 게임에서 실력측정 및 산출방법으로 널리 쓰이고 있다.
이병두 교수는 또 중국기원 승률곡선을 적용하면 90% 이상 승리가 보장된다고 덧붙였다.
이 교수에 따르면 알파고의 기력은 현재 유럽바둑연맹 엘로 세계순위로 283위이며, 이를 한국기원 기준으로 살펴보면 프로랭킹 약 65위 정도이다.
알파고의 기력이 프로랭킹 65위 정도의 실력이라면 이세돌이 실수를 하면 질 수도 있다는 말임.
이세돌의 특징은 '이 수가 된다'고 생각하는 장면에선 자신이 유리한 국면에서도 강수가 튀어나온다.
이게 이세돌의 강점이자 약점이기도 하지.
손근기 프로도 알파고 vs 왕후이 4번째 대국에서는 알파고가 손근기 본인보다 더 잘 둔 것 같다는 평을 내놓기도 했다.
내가 보기엔 이세돌이 5:0으로 이길 확률이 50%라고 본다. 이세돌의 실력은 의심안한다만 이세돌의 3월 일정이 너무 빡빡하다.
게다가 이세돌의 스타일상 강수를 잘 터뜨리기 때문에 이세돌의 강수를 알파고가 맞받아치는 의외의 반격을 허용하면 바둑이 역전 될 수도 있다.
마지막으로
대국조건.
이거 불공평할 확률이 높다.
선요약하면 이세돌 vs 알파고가 아니라 이세돌 vs 알파고+사람 일 확률이 높다 이거다.
처음에 IBM이 체스 세계챔피언 꺾을 때도 그랬다고 알고 있다. 순수하게 컴퓨터가 체스챔피언을 꺾은건 2000년대를 지나서의 일로 알고 있다.
내가 볼 땐 이세돌이 서울에서 둘 것이 아니라 슈퍼컴퓨터가 있는 런던으로 날아가서
딥마인드 관계자가 슈퍼컴퓨터의 소프트웨어엔 절대 노터치 하는 기준으로 대국을 해야 한다.
타이젬의 deepmind를 왜 알파고와 오토고(자동착수 프로그램) 를 이용해서 계속 두지 않을까?
내가 보기엔 타이젬 8단 기력을 가진 '사람'이 뻔한 장면에선 알파고의 도움 없이 '사람'의 직관을 이용해서 두고
수읽기가 필요한 장면에선 알파고를 이용하는 느낌을 받았다.
왜 사람과 알파고가 같이 둘까...
내가 생각한 이유는 알파고의 딥러닝 기술은 몬테카를로 트리에서 나오는 낮은 확률을 제거하는 용도로 밖에 쓰이지 않기 때문이다.
예를 들면 몬테카를로 트리서칭을 이용한 바둑프로그램들에서 공통적으로 나타나는 단점은 '당연한 자리를 두지 않을 때가 종종 있다.' 는 것이다.
알파고가 제시한 착점이 유력한 자리를 기준으로만 몬테카를로 알고리즘이 돌아가는데 알파고가 최초로 제시한 착점이 사람의 직관과 일치하지 않을 땐
아무리 알파고가 컴퓨터의 코어를 태워도 엉뚱한 곳에서만 경우의 수를 계산하고 이상한 곳에 착수를 한다. 이게 몬테카를로 알고리즘의 단점이다.
그리고 지금 알파고의 딥러닝은 스스로 새로운 트리를 만들지 못하기 때문에 수천만 판이나 소화한 알파고가 신형정석이나 신형포석을 두지 못하는 거다.
오죽하면 알파고한테 필요한건 최신프로기사들의 기보라고 했을까.
여튼 타이젬 딥마인드 계정을 보고 들었던 생각을 조금 적어봤음.
댓글 영역
획득법
① NFT 발행
작성한 게시물을 NFT로 발행하면 일주일 동안 사용할 수 있습니다. (최초 1회)
② NFT 구매
다른 이용자의 NFT를 구매하면 한 달 동안 사용할 수 있습니다. (구매 시마다 갱신)
사용법
디시콘에서지갑연결시 바로 사용 가능합니다.