전체기사 최신뉴스 GAM
KYD 디데이
산업

속보

더보기

[인간 vs 인공지능]알파고 데이비드 박사 "인간의 모방 아닌, 이기는 것이 우리 목표"

기사입력 :

최종수정 :

※ 본문 글자 크기 조정

  • 더 작게
  • 작게
  • 보통
  • 크게
  • 더 크게

※ 번역할 언어 선택

구글 알파고의 학습 비법은 '심층 신경망'과 '트리 탐색'

[뉴스핌=이수경 기자] "알파고(AlphaGo)가 흥분을 가져다주는 이유는 기계가 더 높은 수준으로 지식을 쌓아갈 수 있다는 기대에 부응하기 때문이다. 인간이 입력한 정보만 수행하는 것에 그치는 것이 아니라, 기계가 스스로 학습해서 인간과 같은 사고(思考)를 하게 만드는 것이 알파고의 최종 목표다." - 데이비드 실버 구글 딥마인드 리서치 사이언티스트 

미래창조과학부가 주최하고 소프트웨어정책연구소가 주관하는 '성큼 다가온 인공지능' 컨퍼런스가 8일 경기창조혁신센터에서 개최됐다. 

이날 데이비드 실버 구글 딥마인드 리서치 사이언티스트가 '심층 신경망과 트리 탐색을 이용한 바둑 게임 마스터하기'라는 주제로 발표에 나섰다. 

알파고는 지난 2014년 구글이 인수한 인공지능 기업 딥마인드에서 개발한 인공지능 컴퓨터로, 실버 박사는 알파고 프로젝트 팀 리더를 맡고 있다. 

구글 알파고 프로젝트 팀 리더를 맡은 데이비드 실버 박사가 8일 경기창조경제혁신센터에서 열린 '성큼 다가온 인공지능' 컨퍼런스에 참석했다. <사진=이수경 기자>

알파고의 학습 원리에 대해 실버 박사는 "무작위 대입을 통해 모든 경우의 수를 계산하는 '딥블루'와는 달리 알파고는 자가학습을 통해 지식체계를 구축해나간다"며 "남은 경기 내용을 미리 여러 번 진행해 미래를 예측하며, 선별적인 시뮬레이션을 통해 가장 성공적인 수를 찾는 것이 알파고의 특징"이라고 말했다. 

데이비드 실버 박사는 "알파고는 탐색의 최적화를 위해 정책망과 가치망이라는 2종류의 신경망을 구축했다"고 설명했다. 

'정책망'은 이길 가능성이 큰 후보군 위주로 탐색 너비를 줄여준다. 승률이 가장 높은 전략만 추려주는 것. '가치망'은 승자를 예측하며 탐색의 깊이를 줄여준다. 가상으로 게임을 플레이하지 않고도 승자를 예측할 수 있게 해주는 셈이다. 

이 신경망을 구축하기 위해 알파고는 3000만개의 바둑 기보를 '지도학습'했다. 5단 이상의 프로 전문기사가 바둑을 두는 방식을 교본삼아 4주 동안 스스로 학습한 것이다. 이후 자가대국(강화학습)을 통해 신경망을 정교하게 구축했다. 그 결과 인간이 두는 바둑의 수를 예측하는 정확도가 43%에서 57%로 높아졌다.  

실버 박사는 "지도학습을 통해 알파고가 기보를 스스로 학습할 수 있도록 하고 강화학습으로 스스로 학습을 통해 시행착오를 거쳐 승률을 높일 수 있도록 했다"며 "낮은 수준의 기보를 학습했다고 해서 알파고 학습 수준이 낮아지는 것은 아니고 최적의 탐색 알고리즘을 탐색하는 방향으로 학습 수준을 높이는 데 주력했다"고 말했다. 

특정 바둑 기사의 기보 스타일이 기계학습에 영향을 미치느냐는 질문에 실버 박사는 "아니다"라고 선을 그었다. 그는 "알파고가 바둑을 학습하기 위해서는 최소 수십만 개의 기보가 필요하다"며 "특정 기사의 기보를 소량 학습한다고 해서 알파고의 학습 결과에 큰 영향을 미치지는 않는다고 생각한다"고 설명했다. 

실버 박사는 "인간이 당면한 다양한 과제들을 하는 데 밑거름이 되도록 하는 데 알파고가 이바지하고자 한다"며 "구글 딥마인드에서 향후 고려하고 있는 것은 개개인의 의료 데이터를 학습해서 최적화된 치료법을 제공하는 맞춤형 의료 서비스 등이 있다"고 말했다. 

마지막으로 실버 박사는 "우리의 목표는 인간의 행동을 모방하는 것이 아니라 인간을 이기는 것"이며 "다양한 변수가 있어서 누가 이길지는 알 수 없지만, 개인적으로는 알파고가 이기길 기대하고 있다"고 밝혔다. 

 

[뉴스핌 Newspim] 이수경 기자 (sophie@newspim.com)

[뉴스핌 베스트 기사]

사진
尹, '한덕수 재판 위증' 1심 무죄 [서울=뉴스핌] 홍석희 기자 = 윤석열 전 대통령이 28일 한덕수 전 국무총리 재판에 증인으로 출석해 위증했다는 혐의 사건 1심에서 무죄를 선고받았다. 현재 총 8개의 형사재판을 받고 있는 윤 전 대통령이 법원에서 무죄를 선고받은 것은 이번이 처음이다. 서울중앙지법 형사합의32부(재판장 류경진)는 이날 오전 위증 혐의를 받는 윤 전 대통령에게 무죄를 선고했다. 윤석열 전 대통령이 28일 한덕수 전 국무총리 재판에 증인으로 출석해 위증했다는 혐의 사건 1심에서 무죄를 선고받았다. 현재 총 8개의 형사재판을 받고 있는 윤 전 대통령이 법원에서 무죄를 선고받은 것은 이번이 처음이다. 윤석열 전 대통령 [사진=뉴스핌DB] 윤 전 대통령은 지난해 11월 한 전 총리의 내란 중요임무 종사 혐의 재판에 증인으로 출석해 처음부터 국무회의를 거쳐 계엄 선포를 하려 했던 것처럼 허위로 증언한 혐의를 받는다. 윤 전 대통령은 처음부터 국무위원을 불러야 한다고 생각했느냐는 질문에, 당연히 요건은 갖춰야 했다며 원래부터 그렇게 하려 했다는 취지로 답했다. 그러나 윤 전 대통령이 한 전 총리의 건의를 받고 나서야 국무회의를 열려고 했다는 것이 특검 측 시각이다. 이날 재판부는 "피고인이 한덕수 등 6명과 처음으로 집무실에서 회동했을 당시 2차로 연락받고 온 최상목에게 교부할 계엄 문건이 미리 준비된 점, 피고인이 (1차) 회동을 마치자마자 김정환 (전 대통령실 수행실장)에게 최상목 등 국무위원 6명을 특정해 대통령실로 오라고 연락한 걸 보면 6인 회동 이후 국무위원을 2차로 소집할 계획을 가지고 있었던 걸로 보인다"고 판단했다. 또한 "김용현이 계엄 직후 검찰 조사에서 피고인이 계엄할 때 뭐가 필요한지 물어봐서 계엄 선포문, 국무회의 안건 상정, 포고령 등을 얘기한 적이 있다고 했다"며 "피고인은 한덕수의 건의와 상관없이 처음부터 국무위원 소집하려고 했을 가능성이 높아 보인다"고 덧붙였다. 재판부는 "위증죄는 경험한 사실에 관해 기억에 반하는 사실을 진술할 때 성립하며 주관적 평가 등은 위증죄의 대상이 아니다"며 "당시 국무회의가 법률상 심의에 해당할 수 있는지는 별론으로 하고, 처음부터 의사정족수를 갖춘 국무회의를 소집할 생각이 있었다는 피고인의 진술은 피고인의 의견 내지 주관적 평가에 불과해 위증죄의 대상이 될 수 없다"고 했다. 약 7분 동안 진행된 선고 내내 서 있던 윤 전 대통령은 무죄의 공시를 원하느냐는 재판장의 질문에 고개를 끄덕인 뒤 퇴정했다. 윤 전 대통령은 현재 총 8개의 형사재판을 받고 있다. 이중 내란 우두머리 혐의 1심에서 무기징역, 체포방해 혐의 항소심에서 징역 7년을 각각 선고받았다. 나머지 재판들은 현재 1심 심리가 진행 중이거나 선고를 앞두고 있다. hong90@newspim.com 2026-05-28 10:58
사진
서울 정원오 48.8% 오세훈 41.4% [서울=뉴스핌] 박서영 기자 = 6·3 지방선거가 1주일 앞으로 다가온 가운데 서울시장 선거에 출마한 정원오 더불어민주당 후보와 오세훈 국민의힘 후보 지지도 차이가 7.4%포인트(p)인 것으로 27일 조사됐다. 종합뉴스통신사 뉴스핌이 리얼미터에 의뢰해 지난 24~25일 서울 18살 이상 803명을 대상으로 실시한 후보 지지도 조사 결과, 정 후보 48.8%, 오 후보 41.4%다. 두 사람의 격차는 근소하게 오차범위 밖이다. ◆"정원오, 과반 가까운 지지율 확보"…"오세훈, 여전히 경쟁력 유지"  김정철 개혁신당 후보는 1.9%, 기타 후보 2.2%, '없음' 2.4%, '잘 모름' 3.4%였다. 리얼미터는 "정 후보가 과반인 50%에 가까운 지지율을 확보하며 우위를 점한 가운데, 최근 서울 민심의 변화 흐름과 정권 안정론이 일정 부분 반영된 결과"라며 "오 후보도 40%대 초반의 지지율을 보이며 여전히 경쟁력을 유지한 것으로 조사됐다"고 분석했다.  지역별로는 ▲동북권(강북구, 광진구, 노원구, 도봉구, 동대문구, 성동구, 성북구, 중랑구) 정 후보 54.8%, 오 후보 35.5% ▲서북권(마포구, 서대문구, 용산구, 은평구, 종로구, 중구) 정 후보 49.9%, 오 후보 39.0% ▲서남권(강서구, 관악구, 구로구, 금천구, 동작구, 양천구, 영등포구) 정 후보 49.9%, 오 후보 41.4% ▲동남권(강남구, 강동구, 서초구, 송파구) 정 후보 38.0%, 오 후보 51.6%였다. 강남구와 강동구, 서초구, 송파구의 서울 동남권을 제외한 모든 지역서 정 후보가 크게 앞서는 흐름이다.  연령별로는 ▲18~29살 정 후보 36.5%, 오 후보 43.8% ▲30대 정 후보 35.6%, 오 후보 55.1% ▲40대 정 후보 56.0%, 오 후보 32.8% ▲50대 정 후보 69.1%, 오 후보 24.6% ▲60대 정 후보 53.7%, 오 후보 40.8% ▲70세 이상 정 후보 41.7%, 오 후보 52.4%다. 20대와 30대, 70살 이상에서는 오 후보, 40대와 50대, 60대에서는 정 후보가 많이 앞섰다.  ◆'적극 투표층' 정 후보 53.6%, 오 후보 40.6%…격차 더 벌어져  성별로는 ▲남성 정 후보 46.7%, 오 후보 43.5% ▲여성 정 후보 50.8%, 오 후보 39.5%다.  정 후보는 여성 유권자에서 크게 앞섰다.  지지 정당별로는 민주당 지지층의 91.8%가 정 후보, 국민의힘 지지층 89.9%가 오 후보를 지지했다. 조국혁신당 지지층은 정 후보 70.9%, 오 후보 22.5%, 진보당 지지층은 정 후보 56.2%, 오 후보 8.0%다. 개혁신당 지지층은 정 후보 19.3%, 오 후보 61.9%, 김 후보 12.0%로 조사됐다. 투표 의향 별로는 '적극 투표층'에서 정 후보 53.6%, 오 후보 40.6%였다. 이번 조사는 무선 전화 가상번호(100%)를 활용한 자동응답(ARS) 방식으로 진행됐다. 표본오차는 95% 신뢰수준에서 ±3.5%p, 응답률은 6.7%다. 성별·연령대·권역별 인구 비례에 따른 가중치를 줬다. 2026년 4월 말 행정안전부 주민등록인구통계를 기준으로 했다. 자세한 내용은 중앙선거여론조사심의위원회 홈페이지를 참조하면 된다. seo00@newspim.com 2026-05-27 05:00
기사 번역
결과물 출력을 준비하고 있어요.
종목 추적기

S&P 500 기업 중 기사 내용이 영향을 줄 종목 추적

결과물 출력을 준비하고 있어요.

긍정 영향 종목

  • Lockheed Martin Corp. Industrials
    우크라이나 안보 지원 강화 기대감으로 방산 수요 증가 직접적. 미·러 긴장 완화 불확실성 속에서도 방위산업 매출 안정성 강화 예상됨.

부정 영향 종목

  • Caterpillar Inc. Industrials
    우크라이나 전쟁 장기화 시 건설 및 중장비 수요 불확실성 직접적. 글로벌 인프라 투자 지연으로 매출 성장 둔화 가능성 있음.
이 내용에 포함된 데이터와 의견은 뉴스핌 AI가 분석한 결과입니다. 정보 제공 목적으로만 작성되었으며, 특정 종목 매매를 권유하지 않습니다. 투자 판단 및 결과에 대한 책임은 투자자 본인에게 있습니다. 주식 투자는 원금 손실 가능성이 있으므로, 투자 전 충분한 조사와 전문가 상담을 권장합니다.
안다쇼핑
Top으로 이동