전체기사 최신뉴스 GAM
KYD 디데이

AI의 무서운 진화...도쿄대 입시 '합격 수준' 도달

기사입력 :

최종수정 :

※ 본문 글자 크기 조정

  • 더 작게
  • 작게
  • 보통
  • 크게
  • 더 크게

※ 번역할 언어 선택

[서울=뉴스핌] 오영상 기자 = 2022년 11월 오픈AI가 챗GPT를 세상에 내놓은지 2년여가 지났다. 기업은 물론 국가까지도 AI를 핵심 전략으로 삼고 있는 지금 AI는 과연 어디까지 진화했을까.

11일 니혼게이자이신문은 이제 AI는 일본에서 가장 난이도가 높다는 도쿄대학교 2차 시험의 수학 문제를 '합격 수준'으로 풀 수 있게 됐다고 전했다.

AI 이미지 [사진=픽사베이]

◆ 'o1' 등 추론 모델 등장하며 AI 급진화

지금까지 다른 과목에 비해 수학은 AI가 약한 분야였으며, 오픈AI의 초기 대화형 AI인 챗GPT는 간단한 산수 문제에서도 실수를 자주 범했다. 하지만 2024년 9월 이후 오픈AI의 'o1', 'o3' 등 추론 모델로 불리는 AI들이 속속 등장하면서 상황이 급변했다.

일본국립정보학연구소의 아라이 노리코 교수는 "o1은 2025년 2월 출제된 도쿄대 2차 시험의 이과 수학 문제뿐만 아니라 과거의 난이도 높은 문제들도 거의 풀어낼 수 있다"며 "도쿄대의 합격선을 넘어 상위 합격자 수준에 도달한 것 같다"고 말했다.

2024년 2월까지만 해도 챗GPT는 도쿄대 수학 문제를 전혀 풀지 못했다. 하지만 1년 만에 비약적인 발전을 이룬 것은 추론 모델의 등장 덕분이다. 추론 모델은 단순한 대규모 언어 모델(LLM)이 아니라 수학 등 논리적 사고가 필요한 문제 해결에 특화된 AI다.

o1과 o3 외에도 중국 딥시크의 'R1', 일론 머스크가 이끄는 xAI의 'Grok(그록) 3', 앤스로픽의 'Claude(클로드) 3.7 소넷' 등이 추론 능력이 뛰어난 모델로 평가된다.

오픈AI 챗GPT와 딥시크.[사진=로이터 뉴스핌]

◆ 美 수학올림피아드 정답률 90%에 육박

미국 수학올림피아드(AIME)의 정답률을 보면 AI의 급격한 발전이 더욱 뚜렷하게 드러난다.

2024년 5월 오픈AI가 발표한 'GPT-4o'의 AIME 정답률은 9.3%에 불과했다. 하지만 같은 해 9월 출시된 'o1 프리뷰'는 56.7%로 높아졌다, 이어 12월 정식 버전 o1은 83.3%, 2025년 1월 발표된 o3-mini는 87.3%로 급격히 향상됐다. R1과 그록 3의 정답률도 80~90%에 도달했다.

수학이나 프로그래밍과 같이 논리적 사고가 필요한 문제에서 추론 모델이 높은 성과를 낼 수 있는 메커니즘은 아직 명확하게 밝혀지지 않았다.

다만 올바른 추론을 했을 때 보상을 주는 '강화 학습', 문제를 단계별로 해결하는 '사고의 연쇄', 그리고 추론에 필요한 계산량(계산 시간) 증가 등의 기술이 성능 향상의 요인으로 꼽히고 있다.

추론 모델의 수학적 성능이 높다고 해도, 아직 인간 수학자처럼 극도로 어려운 문제를 해결하거나 새로운 정리를 창출할 수 있는 수준에는 이르지 못했다.

니혼게이자이는 "인간처럼 광범위한 지적 활동을 수행할 수 있는 범용 인공지능(AGI)이나, 인간 능력을 월등히 초월하는 인공지능(ASI)의 실현을 위해서는 여전히 기술적 돌파구가 필요하다"고 지적했다.

goldendog@newspim.com

[관련키워드]

[뉴스핌 베스트 기사]

사진
李대통령, 한성숙 총리 임명안 재가 [서울=뉴스핌] 김미경 기자 = 이재명 대통령은 30일 한성숙 국무총리 임명안을 재가했다. 강유정 청와대 수석대변인은 이날 밤 "한 총리의 임명 일자는 7월 1일"이라며 이같이 밝혔다. [서울=뉴스핌] 이건주 기자 = 한성숙 국무총리 후보자가 26일 오전 서울 여의도 국회에서 열린 인사청문회에서 의원 질의에 답하고 있다. 2026.06.26 kunjoo@newspim.com 한 총리는 이재명 정부 두 번째 총리이자 50대 총리로 취임한다. 또 노무현 정부에서 2006년 첫 여성 국무총리로 임명된 한명숙 전 총리에 이어 두 번째 여성 총리가 된다.  한 총리 임명동의안은 국회 본회의 투표 결과 재석 의원 167명 중 찬성 166명, 무효 1명으로 가결됐다. 표결에 국민의힘은 불참했다. 정점식 국민의힘 원내대표는 국회 본회의장 앞에서 기자들과 만나 "총리 인준안에 반대 의사를 이미 명확히 했기 때문에 인준 투표에 들어가지 않을 것"이라고 밝혔다. the13ook@newspim.com 2026-06-30 23:57
사진
동탄 등 주담대 LTV 40% 적용 [서울=뉴스핌] 채송무 기자 = 정부가 주택시장 과열을 막기 위해 경기도 화성시 동탄구, 용인시 기흥구, 구리시를 규제지역으로 추가 지정함에 따라, 해당 지역에 대한 고강도 대출 규제가 7월 1일부터 시행된다. [사진=금융위원회] 금융위원회는 30일 신진창 사무처장 주재로 국토교통부, 한국은행, 금융감독원 및 주요 금융협회와 '가계부채 점검회의'를 열고 이 같은 내용을 골자로 한 대출 규제 강화 방안을 발표했다. 이번 회의는 최근 반도체 벨트 등 일부 지역을 중심으로 주택가격 변동성이 확대됨에 따라 시장 불안을 조기에 차단하기 위해 마련됐다. 내일부터 규제지역으로 지정된 지역에서는 강화된 대출 규제가 적용된다. 우선 규제지역 내 주담대 취급 시 LTV가 기존 70%에서 40%로 대폭 축소된다. 단, 생애최초 주택구입이나 정책모기지 등은 완화된 비율(60~70%)이 적용된다. 또한, 다주택자는 수도권 내 주택 구입 시 규제지역 여부와 상관없이 LTV 0%가 적용된다. 이와 함께 투기과열지구 내에서 전세대출 보유 차주가 3억 원을 초과하는 아파트를 구입하는 것이 제한된다. 반대로, 규제지역 내 3억 원 초과 아파트 구입자 역시 전세대출을 받을 수 없다. 또, 1억 원을 초과하는 신용대출을 보유한 차주는 대출 실행일로부터 1년간 규제지역 내 주택 구입이 제한되며, 규제지역 내 1주택 보유자의 재건축·재개발 중도금·이주비 대출 시 추가 주택 구입이 제한된다. 주택 매매·임대사업자 외 여타 사업자의 규제지역 내 주택 구입 목적 주담대도 원천 차단된다. 금융당국은 시장의 혼란과 차주의 불측의 피해를 방지하기 위해 경과 규정을 뒀다. 규제지역 효력 발생일 전일인 30일까지 금융회사 전산상 대출 신청 접수가 완료됐거나, 주택매매계약을 체결하고 계약금 납부를 증명한 차주는 종전 규정을 적용받는다. 토지거래허가 대상 주택의 경우, 30일까지 관할 지자체에 토지거래허가를 신청했다면 예외가 인정된다. 신진창 금융위 사무처장은 이날 회의에서 "강화된 대출 규제가 즉시 시행되는 만큼, 일선 현장에서 혼선이 발생하지 않도록 금융권의 적극적인 협조가 필요하다"며 "각 금융회사는 직원 교육과 전산 시스템 점검 등에 만전을 기해달라"고 주문했다. 또한 주택 실수요자를 향해서도 "강화된 대출 규제 내용을 사전에 숙지하여 자금조달계획에 차질이 생기지 않도록 각별히 유의해 달라"고 당부했다. 아울러 금융위는 최근 기타대출을 중심으로 가계부채 증가세가 지속되고 있다고 지적하며, 관리 목표를 미준수하는 금융회사에 대해서는 현장 점검 등 더욱 강력한 대응에 나서겠다는 방침을 밝혔다. dedanhi@newspim.com 2026-06-30 17:48
기사 번역
결과물 출력을 준비하고 있어요.
종목 추적기

S&P 500 기업 중 기사 내용이 영향을 줄 종목 추적

결과물 출력을 준비하고 있어요.

긍정 영향 종목

  • Lockheed Martin Corp. Industrials
    우크라이나 안보 지원 강화 기대감으로 방산 수요 증가 직접적. 미·러 긴장 완화 불확실성 속에서도 방위산업 매출 안정성 강화 예상됨.

부정 영향 종목

  • Caterpillar Inc. Industrials
    우크라이나 전쟁 장기화 시 건설 및 중장비 수요 불확실성 직접적. 글로벌 인프라 투자 지연으로 매출 성장 둔화 가능성 있음.
이 내용에 포함된 데이터와 의견은 뉴스핌 AI가 분석한 결과입니다. 정보 제공 목적으로만 작성되었으며, 특정 종목 매매를 권유하지 않습니다. 투자 판단 및 결과에 대한 책임은 투자자 본인에게 있습니다. 주식 투자는 원금 손실 가능성이 있으므로, 투자 전 충분한 조사와 전문가 상담을 권장합니다.
안다쇼핑
Top으로 이동