전체기사 최신뉴스 GAM
KYD 디데이

AI 최강자 등극 구글 '제미나이', GPT-4와 비교해 보니

기사입력 :

최종수정 :

※ 본문 글자 크기 조정

  • 더 작게
  • 작게
  • 보통
  • 크게
  • 더 크게

※ 번역할 언어 선택

[서울=뉴스핌] 최원진 기자= 구글이 오픈AI의 최신 생성형 인공지능(AI) 거대언어모델(LLM) 'GPT-4'를 능가하는 자체 모델 '제미나이(Gemini) 1.0'을 6일(현지시간) 공개해 화제다.

지난해 11월 챗GPT로 생성형 AI의 미래를 제시한 오픈AI가 기술 최강 자리를 굳건히 지킬 것이란 예상이 GPT-4 출시 후 불과 약 9개월 만에 깨진 것이다. 구글 제미나이가 AI 업계의 치열한 개발 경쟁에 다시 한번 불을 지폈다.

◆ 제미나이의 강점은 '멀티 플레이어'

제미나이는 3가지 버전으로 나온다. 구글이 지금까지 내놓은 것 중 가장 강력한 LLM이자 데이터센터와 기업용 모델인 '제미나이 울트라', 구글의 AI 챗봇 '바드'의 모델인 '제미나이 프로', 스마트폰 등 모바일 기기에서 사용 가능한 컴팩트한 사이즈의 '나노'다.

제미나이 프로는 제품 공개한 이날 바로 바드에 탑재됐다. 제미나이 프로가 적용된 바드는 170개 이상 국가 및 지역에서 영어로 제공되며, 향후 서비스 확장 및 새로운 지역과 언어도 지원될 예정이다. 

'제미나이 울트라'는 내년 초 '바드 어드밴스드'라는 이름으로 바드에 장착되며, '제미나이 나노'는 구글이 지난 10월 공개한 최신 스마트폰인 '픽셀8 프로'에 탑재된다.

구글은 제미나이가 "선천적"(natively)으로 멀티모달(Multi-Modal·다중모드) AI 모델이라고 소개한다. 멀티모달은 말그대로 텍스트뿐만 아니라 이미지, 동영상 등 비언어 입력값도 이해해 응용할 수 있는 '멀티 플레이어'다.

오픈AI가 이미지 생성 AI '달리'(DALL-E), 음성 인식 AI '위스퍼'(Whisper)를 각각 개발한 방식과 달리 구글은 애초부터 텍스트·이미지·오디오 등 다양한 데이터로 제미나이를 훈련해왔다는 것이다.

제미나이가 학생의 물리학 문제를 풀이해주는 예시. [사진=구글 딥마인드 제공]

특히 제미나이는 이미지와 동영상을 이해한 데이터를 응용하고 상호 작용하는 데 강점을 보인다.

예컨대 한 학생이 물리학 문제를 풀이하는 과정을 펜으로 쓴 이미지를 교사가 제미나이 프롬프트에 넣어 문제 풀이 과정에 어떤 부분이 틀렸는지 질문하면 제미나이는 정확히 문제의 정답과 학생의 손 글씨를 이해해 잘못된 문제 풀이 과정을 수정해 준다.

구글 딥마인드는 "제미나이가 이미지 속 텍스트를 이해하는 것을 넘어 교사가 어떻게 문제를 다르게 설정했는지 등을 이해해야 가능하다"고 설명했다. 제미나이는 오답 풀이 뿐만 아니라 학생이 틀린 유형의 다른 연습 문제도 제공해 교육 환경에서의 활용도가 높다는 게 자체 평가다.

이 밖에 제미나이는 동영상 속 언어를 감지해 번역 자막을 달아주고, 동영상 속 상황을 이해해 질문에 답할 수 있다.

◆ 32개 벤치마크 테스트 중 30개, 최고 성적

이미지와 영상의 이해부터 수학적 추론까지 가능한 제미나이 울트라가 업계에서 LLM 연구개발 평가 시 널리 사용되는 학술 벤치마크 기준 32개 가운데 30개 항목에서 GPT-4를 뛰어넘는 성적을 기록했다.

구체적으로 제미나이 울트라는 텍스트와 추론 벤치마크 부문 12개 중 10개, 이미지 이해 부문 9개 중 9개, 동영상 이해 벤치마크 6개 중 6개, 음성 인식 부문 5개 중 5개에서 GPT-4보다 높은 신기록을 썼다.

특히 대규모 다중작업 언어 이해(MMLU) 벤치마크에서 제미나이 울트라는 90% 이상의 정답률을 기록했다.

MMLU는 수학, 물리학, 역사, 법률, 의학, 윤리 등 57개의 주제를 복합적으로 활용해 지식과 문제 해결 능력을 평가하는 대표 격 LLM 벤치마크다.

구글 딥마인드는 제미나이 울트라의 MMLU 점수가 GPT-4의 86.4%를 앞선 것에서 나아가 AI 모델로는 최초로 인간 전문가 점수인 89.8%를 뛰어넘었다고 밝혔다. 

이 밖에 여러 단계의 추론을 요구하는 여러 문제 해결 능력을 평가하는 빅 벤치 하드(BIG-Bench-Hard)와 독해력 벤치마크인 DROP에서 각각 80%가 넘는 점수로 GPT-4를 능가했다. 

WMT23 벤치마크는 LLM의 번역 능력을 평가한다. 제미나이 울트라는 74.40%로 GPT-4보다 번역 능력이 우수했다.

다만 일상에 필요한 상식 추론 능력을 보는 헬라스웨그(HellaSwag) 벤치마크에서는 제미나이 울트라가 GPT-4에 못미쳤다. 

제미나이 울트라의 이미지 이해 능력은 GPT-4 보다 뛰어났다.

과학, 기술, 인문 과학, 음악 등 6개 핵심 부문 대학교 시험과 교과서에서 수집된 차트, 표, 악보 이미지를 이해하는 능력을 평가하는 다소 새로운 벤치마크인 MMMU에서 제미나이 울트라는 59.4%를 기록, GPT-4를 앞섰다.

이미지를 보고 이해해 관련 질문에 답할 수 있는 능력을 확인하는 VQAv2 벤치마크와 서류상 이미지를 이해하는 능력을 보는 DocVQA, 그래프 등을 보고 수학적 추론 능력을 보는 매스 비스타(MathVista) 벤치마크에서도 GPT-4 보다 좋은 성적을 거뒀다.

AI 모델의 동영상 이해를 평가하는 벤치마크들에서도 제미나이 울트라는 두각을 보였다. 

영상 속 상황을 텍스트로 옮기는 능력을 평가하는 VATEX 벤치마크와 영상과 관련된 질문에 답해 전반적인 영상 이해도를 평가하는 인식 테스트 MCQA 벤치마크 모두 GPT-4를 뛰어넘었다. 

이밖에 중국어 텍스트로 영상 속 상황을 옮기는 능력을 평가하는 VATEX ZH, 영어로 복잡한 요리 과정이 담긴 영상을 텍스트로 옮기는 YouCook2 등 여러 벤치마크에서도 높은 성적을 거뒀다.

제미나이 프로의 음성 인식 이해도도 우수했다. 21개 언어의 음성을 인식해 텍스트로 변환하는 능력을 평가하는 CoVoST 2 벤치마크에서 제미나이 프로는 40.1을 기록, 오픈AI의 음성 인식 AI 모델 '위스퍼' 버전 2(v2) 보다 10 이상 높았다.

62개 언어로 음성 인식 여부를 확인하는 FLEURS 벤치마크에서도 제미나이 프로는 7.6%를 기록, 위스퍼 v3 보다 월등했다. FLEURS는 AI 모델이 음성 인식 정확도를 측정하는 테스트로 점수가 낮을 수록 인식 오류가 적다는 의미다. 

이밖에 제미나이는 파이선(Python), 자바(JAVA), C++, Go 등 세계에서 널리 사용되는 프로그래밍 언어로 코드를 이해하고 생성할 수 있다. 

코딩 작업 성능을 평가하는 업계 표준인 휴먼이발(HumanEval) 벤치마크에서 제미나이 울트라는 74.4%를 기록해 GPT-4(67.0%)를 능가했다. 파이썬 코드 생성 능력을 평가하는 내추럴2코드(Natural2Code) 벤치마크에서도 GPT-4 보다 1%포인트(p) 높은 74.9%를 기록했다. 

[사진= 구글 홈페이지]

wonjc6@newspim.com

 

[뉴스핌 베스트 기사]

사진
황대헌 "결승서 플랜B 급변경" [서울=뉴스핌] 박상욱 기자 = 한국 남자 쇼트트랙 선수로는 처음으로 3개 대회 연속 메달을 따낸 황대헌(강원도청)은 "이 자리에 오기까지 너무 많은 시련과 역경이 있었다. 너무 소중한 메달"이라고 말했다. 황대헌은 "월드투어 시리즈를 치르면서 많은 실패와 도전을 했고, 그런 부분을 제가 많이 연구하고 공부해서 좋은 결과로 이어졌다"고도 했다. 황대헌은 15일(한국시간) 2026 밀라노·코르티나담페초 동계 올림픽 쇼트트랙 남자 1500m 결승에서 옌스 판트 바우트(네덜란드)에 이어 2위로 은메달을 거머쥐었다. 그는 2018 평창 대회 남자 500m 은메달을 시작으로 2022 베이징 대회에서 남자 1500m 금메달과 남자 5000m 계주 은메달을 땄다. [밀라노 로이터=뉴스핌] 박상욱 기자= 황대헌이 15일(한국시간) 2026 밀라노·코르티나담페초 동계올림픽 쇼트트랙 남자 1500m 시상식에 오르며 주먹을 불끈 쥐고 있다. 2026.02.15 psoq1337@newspim.com 황대헌에게 이번 올림픽은 출발부터 쉽지 않았다. 지난해 11월 네덜란드 도르드레흐트에서 열린 2025-2026 국제빙상경기연맹(ISU) 쇼트트랙 월드투어 4차 대회에서 왼쪽 무릎을 다쳤다. 부상 치료가 완전히 끝나지 않은 상태에서 올림픽을 준비했다. 이날 결승은 9명이 함께 뛰었다. 황대헌은 "2022년 베이징 대회 때는 결승에서 10명이 뛰었다. 그리 놀라운 상황은 아니었다"며 "쇼트트랙 레이스의 흐름이 많이 바뀌어서 공부도 많이 했고, 계획했던 대로 경기를 풀어갈 수 있었다"고 설명했다. 이어 "경기 운영엔 다양한 전략이 있었다. 순간적으로 플랜B로 바꿨다"며 "자세한 내용은 제가 많이 연구한 결과라 소스를 공개할 수는 없다"며 미소를 보였다. psoq1337@newspim.com 2026-02-15 09:10
사진
최가온이 전한 긴박했던 순간 [서울=뉴스핌] 장환수 스포츠전문기자= "들것에 실려 나가면 그대로 끝이었어요." 2026 밀라노·코르티나담페초 동계올림픽 스노보드 여자 하프파이프에서 한국 설상 종목 사상 첫 금메달을 따낸 최가온(세화여고)이 가장 아찔했던 순간을 돌아봤다. 최가온. [사진=대한체육회] 최가온은 14일(한국시간) 이탈리아 밀라노 코리아하우스에서 열린 대한체육회 공식 기자회견에서 전날 결선 1차 시기를 떠올렸다. 그는 리비뇨 스노파크에서 열린 결선 1차 시기에서 크게 넘어지며 한동안 일어나지 못했다. 의료진이 내려와 상태를 확인했고, 들것이 대기한 긴박한 상황이었다. 최가온은 "들것에 실려 나가면 병원으로 가야 했고, 그러면 대회를 포기해야 하는 상황이었다"며 "포기하면 평생 후회할 것 같았다. 다음 선수가 기다리고 있어 시간이 많지 않았는데 잠시만 시간을 달라고 하고 발가락부터 힘을 주며 움직이려 했다"고 말했다. 다행히 걸을 수는 있었지만 코치는 기권을 권유했다. 최가온은 "나는 무조건 뛰겠다고 했지만 코치님은 걸을 수 없는 상태로 보셨다"며 "이를 악물고 계속 걸어보려 했고, 다리 상태가 조금씩 나아져 2차 시기 직전 기권을 철회했다"고 설명했다. [리비뇨 로이터=뉴스핌] 장환수 스포츠전문기자= 최가온이 13일 스노보드 여자 하프파이프 결선 1차 시기에서 넘어지자 의료진이 달려와 상태를 살펴보고 있다. 2026.02.13 zangpabo@newspim.com 1, 2차 시기 연속 실수로 벼랑 끝에 몰렸지만 3차 시기에서 반전이 일어났다. 최가온은 "긴장감이 오히려 사라졌다. 기술 생각만 하면서 출발했다. 내 연기를 완성하겠다는 생각뿐이었다"고 돌아봤다. 그리고 900도와 720도 회전을 안정적으로 연결하며 90.25점을 받아 극적인 역전 우승을 완성했다. 은메달을 차지한 교포 선수 클로이 김(미국)과 관계도 화제가 됐다. 최가온은 "클로이 언니가 안아줬는데 정말 행복했다. 그 순간 '내가 언니를 넘어섰구나' 하는 감정이 몰려왔고 눈물이 터졌다"고 했다. 이어 "경기 전에는 언니가 금메달을 땄으면 좋겠다는 생각이 들 정도로 마음이 복잡했다. 존경하는 선수라 기쁨과 서운함이 동시에 들었다"고 솔직하게 털어놨다. 부상 직후 재도전에 대한 두려움은 없었을까. 그는 "어릴 때부터 겁이 없었다. 언니, 오빠들과 함께 타며 자연스럽게 생긴 승부욕이 두려움을 이겨낸 것 같다"며 웃었다. [리비뇨=로이터뉴스핌] 밀라노-코르티나 2026 동계올림픽 스노보드 여자 하프파이프에서 금메달을 획득한 최가온 선수가 지난 12일 이탈리아 리비뇨 스노파크에서 열린 시상식에서 태극기를 들어 보이고 있다. 2026.02.13 photo@newspim.com 많은 눈이 내린 경기 환경에 대해서도 담담했다. "첫 엑스게임 때 눈이 정말 많이 왔는데 그때에 비하면 괜찮았다. 경기장에 들어갔을 때 함박눈이 내려 오히려 예쁘다고 느꼈다. 시상대에서도 눈이 내려 클로이 언니와 '이렇게 눈이 내리니 좋다'고 이야기했다"고 전했다. 몸 상태는 완전하지 않았다. 그는 "무릎이 아주 아팠지만 많이 좋아졌다"며 "올림픽을 앞두고 훈련 중 다친 왼쪽 손목은 귀국 후 점검해야 한다"고 밝혔다. 이어 "이번 올림픽에서 최고의 경기력을 보여드리지는 못했다. 기술 완성도를 더 높이고 긴장감을 다스리는 법도 보완하고 싶다"며 "먼 미래보다 당장 지금의 나보다 더 나은 선수가 되는 게 목표"라고 말했다. 최가온. [사진=올댓스포츠] 가족에 대한 고마움도 전했다. 최가온은 "아버지가 내가 어릴 때 일을 그만두고 이 길을 함께 걸었다. 많이 싸우기도 했지만 끝까지 포기하지 않고 함께해줘 지금 이 자리에 있는 것 같다"며 고개를 숙였다. 귀국 후 계획을 묻자 "할머니가 해주는 밥을 먹고 싶다. 친구들과는 파자마 파티를 하기로 했다"며 수줍게 웃었다. 금메달과 함께 포상금과 고급 시계를 받게 된 데 대해서는 "과분한 것들을 받게 돼 영광이다. 시계는 잘 차겠다"고 말했다. 스노보드 꿈나무들에게는 "하프파이프는 즐기면서 타는 게 가장 중요하다. 다치지 말고 즐기면서 탔으면 좋겠다"고 조언했다. 들것 앞에서 멈추지 않았던 17세의 선택은 결국 한국 설상 종목의 새 역사가 됐다. zangpabo@newspim.com 2026-02-14 22:35
기사 번역
결과물 출력을 준비하고 있어요.
종목 추적기

S&P 500 기업 중 기사 내용이 영향을 줄 종목 추적

결과물 출력을 준비하고 있어요.

긍정 영향 종목

  • Lockheed Martin Corp. Industrials
    우크라이나 안보 지원 강화 기대감으로 방산 수요 증가 직접적. 미·러 긴장 완화 불확실성 속에서도 방위산업 매출 안정성 강화 예상됨.

부정 영향 종목

  • Caterpillar Inc. Industrials
    우크라이나 전쟁 장기화 시 건설 및 중장비 수요 불확실성 직접적. 글로벌 인프라 투자 지연으로 매출 성장 둔화 가능성 있음.
이 내용에 포함된 데이터와 의견은 뉴스핌 AI가 분석한 결과입니다. 정보 제공 목적으로만 작성되었으며, 특정 종목 매매를 권유하지 않습니다. 투자 판단 및 결과에 대한 책임은 투자자 본인에게 있습니다. 주식 투자는 원금 손실 가능성이 있으므로, 투자 전 충분한 조사와 전문가 상담을 권장합니다.
안다쇼핑
Top으로 이동