분석엿까지말래
자동이답이래...
디스트에게 추천하고싶은 분석오류에 관한 논리를 전해주갓어
속박확률, 마르코프 체인과 몬테카를로법
‘앞서 나온 당첨번호의 확률분포를 따름으로써 당첨 확률을 높일 수 있다’는 주장이나, ‘앞서 나온 당첨번호의 확률분포를 피해야 당첨 확률을 높일 수 있다’는 주장이나 모두 ‘선행 사건의 확률이 후행 사건의 확률을 속박한다’는 그릇된 전제 위에 서 있다. 수학적으로 명백한 오류임에도 이 착각이 지속되는 이유는 뭘까? 그것은 발생 확률이 선행하는 사건들에 구속되는 현상이 실제로 존재하기 때문이다. 가령 가위바위보를 생각해보라. 여기서 다음에 어느 것을 내느냐는 앞의 사건에 심리적으로 구속된다.
사건이 앞의 사건에 확률적으로 속박되는 것은 자연 속에 광범위하게 존재하는 현상이다. 이런 현상을 설명하려고 러시아의 수학자 마르코프는 따로 속박확률의 이론을 만들어냈다. 당첨번호를 찾아주는 프로그램은 사실 하위헌스의 독립확률이 아니라, 마르코프의 속박확률을 전제한다. 한마디로, 기본 가정에서부터 범주 오류(category mistake)를 범하고 있는 셈이다. 당첨번호를 뽑는 것은 철저하게 랜덤한 현상이다. 하지만 그 프로그램은 (마치 DNA의 발현처럼) 앞뒤 당첨번호 사이에 무슨 인과관계가 있는 양 가정한다.
이제까지 당첨번호 속에 가장 많이 등장한 숫자는 ‘37’이고, 가장 적게 등장한 번호는 ‘22’라고 한다. 이런 식으로 각 번호의 발생 확률을 구한 뒤, 그 확률분포에 따라 랜덤하게 생성한 숫자로 새 번호들을 생성해낸다. 이렇게 생성된 번호들은 랜덤하게 발생했지만, 적어도 확률분포라는 면에선 앞의 당첨번호들과 거의 동일하다. 이 확률분포의 동일성을 통해 생성된 번호들이 과거의 당첨번호들과 유사해질 수 있다는 발상이다. 이 원리는 초기 컴퓨터 예술가들이 컴퓨터로 예술작품을 시뮬레이션하는 데 사용한 것과 거의 동일하다.
초기 컴퓨터 예술은 ‘마르코프 체인’과 ‘몬테카를로법’을 사용했다. 먼저 마르코프 체인을 이용해 인간이 만든 음악에서 음렬의 속박확률을 구한 뒤, 몬테카를로법으로 얻어진 확률분포에 따라 새로운 음렬을 생성해내는 식이다. 이 경우 컴퓨터가 생성한 음악은 확률분포의 동일성을 통해 인간이 만든 음악에 어느 정도 근접하게 된다. 당첨번호를 생성하는 방법도 이와 크게 다르지 않다. 문제는, 인간의 음악작품은 ‘정보’를 가진 구조물(neg-entropy)인 반면, 로또의 당첨번호는 애초에 ‘정보’가 없는(entropy) 수열에 불과하다는 데 있다.
로또의 당첨번호는 ‘정보’가 아니다. 당첨번호 속에서 각 숫자의 발생 확률에 차이가 나는 것은 일시적 현상일 뿐, 추첨이 반복적으로 이루어질수록 그 차이는 점점 사라져갈 것이다. 엔트로피 증가에 의한 당첨번호의 열사(熱死)라고 할까? 그때쯤이면 물론 당첨번호 뽑아주는 사이트도 문을 닫아야 한다. 로또를 통해 더 부유해질 가능성은 수학적으로 제로다. 당첨금을 당첨 확률로 곱해서 얻어지는 숫자는 내가 로또 사는 데 쓴 돈의 50% 아래로 떨어지기 때문이다. 이 수학적 명증성에도 불구하고 왜 사람들은 계속 로또를 사는 걸까?
기대효용을 사는 사람들
로또를 사는 결정은 ‘기대가치’(expected value)가 아니라 ‘기대효용’(expected utility)에서 나온다. 즉 로또로 얻을 수 있는 경제적 가치가 그것을 사는 데 들인 비용보다 적을지라도, 추첨을 기다리며 환상에 젖는 행복은 분명히 존재한다. 당첨번호 서비스도 마찬가지. 그들이 정말로 당첨번호를 예측할 수 있다면, 애초에 그런 사업으로 돈 벌 생각을 했겠는가? 하지만 그들이 골라주는 번호가 내 로또의 당첨 확률을 높여준다는 환상 속에서 나는 좀더 행복할 수 있다. 이것이 로또와 당첨번호 서비스의 진짜 효용이다.
댓글 영역
획득법
① NFT 발행
작성한 게시물을 NFT로 발행하면 일주일 동안 사용할 수 있습니다. (최초 1회)
② NFT 구매
다른 이용자의 NFT를 구매하면 한 달 동안 사용할 수 있습니다. (구매 시마다 갱신)
사용법
디시콘에서지갑연결시 바로 사용 가능합니다.