전체기사 최신뉴스 GAM
KYD 디데이
글로벌·중국 미국·북미

속보

더보기

AI 최강자 등극 구글 '제미나이', GPT-4와 비교해 보니

기사입력 :

최종수정 :

※ 본문 글자 크기 조정

  • 더 작게
  • 작게
  • 보통
  • 크게
  • 더 크게

※ 번역할 언어 선택

[서울=뉴스핌] 최원진 기자= 구글이 오픈AI의 최신 생성형 인공지능(AI) 거대언어모델(LLM) 'GPT-4'를 능가하는 자체 모델 '제미나이(Gemini) 1.0'을 6일(현지시간) 공개해 화제다.

지난해 11월 챗GPT로 생성형 AI의 미래를 제시한 오픈AI가 기술 최강 자리를 굳건히 지킬 것이란 예상이 GPT-4 출시 후 불과 약 9개월 만에 깨진 것이다. 구글 제미나이가 AI 업계의 치열한 개발 경쟁에 다시 한번 불을 지폈다.

◆ 제미나이의 강점은 '멀티 플레이어'

제미나이는 3가지 버전으로 나온다. 구글이 지금까지 내놓은 것 중 가장 강력한 LLM이자 데이터센터와 기업용 모델인 '제미나이 울트라', 구글의 AI 챗봇 '바드'의 모델인 '제미나이 프로', 스마트폰 등 모바일 기기에서 사용 가능한 컴팩트한 사이즈의 '나노'다.

제미나이 프로는 제품 공개한 이날 바로 바드에 탑재됐다. 제미나이 프로가 적용된 바드는 170개 이상 국가 및 지역에서 영어로 제공되며, 향후 서비스 확장 및 새로운 지역과 언어도 지원될 예정이다. 

'제미나이 울트라'는 내년 초 '바드 어드밴스드'라는 이름으로 바드에 장착되며, '제미나이 나노'는 구글이 지난 10월 공개한 최신 스마트폰인 '픽셀8 프로'에 탑재된다.

구글은 제미나이가 "선천적"(natively)으로 멀티모달(Multi-Modal·다중모드) AI 모델이라고 소개한다. 멀티모달은 말그대로 텍스트뿐만 아니라 이미지, 동영상 등 비언어 입력값도 이해해 응용할 수 있는 '멀티 플레이어'다.

오픈AI가 이미지 생성 AI '달리'(DALL-E), 음성 인식 AI '위스퍼'(Whisper)를 각각 개발한 방식과 달리 구글은 애초부터 텍스트·이미지·오디오 등 다양한 데이터로 제미나이를 훈련해왔다는 것이다.

제미나이가 학생의 물리학 문제를 풀이해주는 예시. [사진=구글 딥마인드 제공]

특히 제미나이는 이미지와 동영상을 이해한 데이터를 응용하고 상호 작용하는 데 강점을 보인다.

예컨대 한 학생이 물리학 문제를 풀이하는 과정을 펜으로 쓴 이미지를 교사가 제미나이 프롬프트에 넣어 문제 풀이 과정에 어떤 부분이 틀렸는지 질문하면 제미나이는 정확히 문제의 정답과 학생의 손 글씨를 이해해 잘못된 문제 풀이 과정을 수정해 준다.

구글 딥마인드는 "제미나이가 이미지 속 텍스트를 이해하는 것을 넘어 교사가 어떻게 문제를 다르게 설정했는지 등을 이해해야 가능하다"고 설명했다. 제미나이는 오답 풀이 뿐만 아니라 학생이 틀린 유형의 다른 연습 문제도 제공해 교육 환경에서의 활용도가 높다는 게 자체 평가다.

이 밖에 제미나이는 동영상 속 언어를 감지해 번역 자막을 달아주고, 동영상 속 상황을 이해해 질문에 답할 수 있다.

◆ 32개 벤치마크 테스트 중 30개, 최고 성적

이미지와 영상의 이해부터 수학적 추론까지 가능한 제미나이 울트라가 업계에서 LLM 연구개발 평가 시 널리 사용되는 학술 벤치마크 기준 32개 가운데 30개 항목에서 GPT-4를 뛰어넘는 성적을 기록했다.

구체적으로 제미나이 울트라는 텍스트와 추론 벤치마크 부문 12개 중 10개, 이미지 이해 부문 9개 중 9개, 동영상 이해 벤치마크 6개 중 6개, 음성 인식 부문 5개 중 5개에서 GPT-4보다 높은 신기록을 썼다.

특히 대규모 다중작업 언어 이해(MMLU) 벤치마크에서 제미나이 울트라는 90% 이상의 정답률을 기록했다.

MMLU는 수학, 물리학, 역사, 법률, 의학, 윤리 등 57개의 주제를 복합적으로 활용해 지식과 문제 해결 능력을 평가하는 대표 격 LLM 벤치마크다.

구글 딥마인드는 제미나이 울트라의 MMLU 점수가 GPT-4의 86.4%를 앞선 것에서 나아가 AI 모델로는 최초로 인간 전문가 점수인 89.8%를 뛰어넘었다고 밝혔다. 

이 밖에 여러 단계의 추론을 요구하는 여러 문제 해결 능력을 평가하는 빅 벤치 하드(BIG-Bench-Hard)와 독해력 벤치마크인 DROP에서 각각 80%가 넘는 점수로 GPT-4를 능가했다. 

WMT23 벤치마크는 LLM의 번역 능력을 평가한다. 제미나이 울트라는 74.40%로 GPT-4보다 번역 능력이 우수했다.

다만 일상에 필요한 상식 추론 능력을 보는 헬라스웨그(HellaSwag) 벤치마크에서는 제미나이 울트라가 GPT-4에 못미쳤다. 

제미나이 울트라의 이미지 이해 능력은 GPT-4 보다 뛰어났다.

과학, 기술, 인문 과학, 음악 등 6개 핵심 부문 대학교 시험과 교과서에서 수집된 차트, 표, 악보 이미지를 이해하는 능력을 평가하는 다소 새로운 벤치마크인 MMMU에서 제미나이 울트라는 59.4%를 기록, GPT-4를 앞섰다.

이미지를 보고 이해해 관련 질문에 답할 수 있는 능력을 확인하는 VQAv2 벤치마크와 서류상 이미지를 이해하는 능력을 보는 DocVQA, 그래프 등을 보고 수학적 추론 능력을 보는 매스 비스타(MathVista) 벤치마크에서도 GPT-4 보다 좋은 성적을 거뒀다.

AI 모델의 동영상 이해를 평가하는 벤치마크들에서도 제미나이 울트라는 두각을 보였다. 

영상 속 상황을 텍스트로 옮기는 능력을 평가하는 VATEX 벤치마크와 영상과 관련된 질문에 답해 전반적인 영상 이해도를 평가하는 인식 테스트 MCQA 벤치마크 모두 GPT-4를 뛰어넘었다. 

이밖에 중국어 텍스트로 영상 속 상황을 옮기는 능력을 평가하는 VATEX ZH, 영어로 복잡한 요리 과정이 담긴 영상을 텍스트로 옮기는 YouCook2 등 여러 벤치마크에서도 높은 성적을 거뒀다.

제미나이 프로의 음성 인식 이해도도 우수했다. 21개 언어의 음성을 인식해 텍스트로 변환하는 능력을 평가하는 CoVoST 2 벤치마크에서 제미나이 프로는 40.1을 기록, 오픈AI의 음성 인식 AI 모델 '위스퍼' 버전 2(v2) 보다 10 이상 높았다.

62개 언어로 음성 인식 여부를 확인하는 FLEURS 벤치마크에서도 제미나이 프로는 7.6%를 기록, 위스퍼 v3 보다 월등했다. FLEURS는 AI 모델이 음성 인식 정확도를 측정하는 테스트로 점수가 낮을 수록 인식 오류가 적다는 의미다. 

이밖에 제미나이는 파이선(Python), 자바(JAVA), C++, Go 등 세계에서 널리 사용되는 프로그래밍 언어로 코드를 이해하고 생성할 수 있다. 

코딩 작업 성능을 평가하는 업계 표준인 휴먼이발(HumanEval) 벤치마크에서 제미나이 울트라는 74.4%를 기록해 GPT-4(67.0%)를 능가했다. 파이썬 코드 생성 능력을 평가하는 내추럴2코드(Natural2Code) 벤치마크에서도 GPT-4 보다 1%포인트(p) 높은 74.9%를 기록했다. 

[사진= 구글 홈페이지]

wonjc6@newspim.com

 

[뉴스핌 베스트 기사]

사진
손흥민, 새해 첫 경기 1골·3도움 [서울=뉴스핌] 박상욱 기자 = 얼마나 발이 근질근질했을까 싶다. 손흥민(LAFC)이 지난해 11월 22일 밴쿠버 화이트캡스전 이후 3개월 만에 출전한 새해 첫 경기에서 1골, 3도움으로 자신의 역대 한 경기 최다 공격포인트 4개를 몰아쳤다. 손흥민의 '환상의 짝궁' 데니스 부앙가는 해트트릭을 기록했다. 손흥민은 18일(한국시간) 온두라스 산페드로술라 프란시스코 모라산 스타디움에서 열린 레알 에스파냐(온두라스)와의 2026 북중미카리브해축구연맹(CONCACAF) 챔피언스컵 1라운드 1차전 원정 경기에 최전방 공격수로 선발 출전했다. LAFC는 '흥부 듀오'를 앞세워 에스파냐를 6-1로 완파했다. 손흥민이 18일(한국시간) 레알 에스파냐(온두라스)와의 2026 북중미카리브해축구연맹(CONCACAF) 챔피언스컵 1라운드 1차전 원정 경기에서 페널티킥을 성공시키고 찰칵 세리머니를 하고 있다. [사진=LAFC] 마크 도스 산토스 LAFC 감독은 손흥민, 부앙가, 마르티네스, 델가도, 틸먼, 에스타퀴오, 팔렌시아, 타파리, 포티우스, 세구라, 요리스를 선발로 내세웠다. 킥오프 51초 만에 동료 다비드 마르티네스가 페널티킥을 얻어냈고 전반 3분 드니스 부앙가가 오른발로 선제골을 성공시키며 LAFC가 일찌감치 리드를 잡았다. 손흥민의 이번 시즌 첫 공격포인트는 전반 11분에 나왔다. 역습 상황에서 하프라인 근처에서 공을 잡은 손흥민은 단독 드리블로 전진하며 수비 라인을 끌어당겼다. 레알 에스파냐 수비수 3명이 동시에 달라붙었지만 균형을 잃지 않고 볼을 지켜낸 뒤, 페널티 에어리어 오른쪽으로 침투하던 마르티네스를 향해 정확한 침투 패스를 찔러 넣었다. 마르티네스는 이를 왼발 인사이드 감아차기로 마무리하며 골문 왼쪽 구석을 갈라 손흥민은 2026 시즌 첫 도움을 기록했다. 손흥민은 전반 22분 이번 시즌 첫 골을 성공시켰다. 좌측면에서 공을 잡은 부앙가가 개인 기술로 박스 안으로 파고드는 과정에서 수비수에 걸려 넘어졌고, VAR 끝에 페널티킥이 선언됐다. 키커로 나선 손흥민이 낮고 빠른 슈팅으로 왼쪽 골망을 갈랐다. 손흥민은 곧바로 추가 도움까지 기록했다. 전반 24분, 후방에서 넘어온 공을 손흥민이 감각적인 터치를 한 후 패스를 내주자 부앙가가 넘어지며 논스톱 슈팅으로 자신의 두 번째 골을 완성했다. 손흥민(오른쪽)이 18일(한국시간) 레알 에스파냐(온두라스)와의 2026 북중미카리브해축구연맹(CONCACAF) 챔피언스컵 1라운드 1차전 원정 경기에서 자신의 어시스트로 골을 성공시킨 티모시 틸먼과 기쁨을 나누고 있다. [사진=LAFC] 손흥민은 전반 39분 박스 오른쪽에서 문전에 있던 동료 티모시 틸먼에게 낮고 빠른 패스로 연결했고, 틸먼은 감각적인 힐슛으로 팀의 다섯 번째 골을 넣어 손흥민은 도움 해트트릭을 기록했다. LAFC는 전반을 5-0으로 앞선 채 마쳤고 손흥민은 전반에만 자신의 역대 한 경기 최다 타이인 4개의 공격포인트를 올렸다. 그는 2020년 9월 20일 잉글랜드 프리미어리그 사우샘프턴전에서 해리 케인의 4개 도움을 받아 4골을 몰아쳤다. 이날 1골 3도움을 보탠 손흥민은 LAFC에서의 통산 14경기에서 13골 7도움으로 공격포인트 20개를 채웠다. 경기당 1.43개에 달하는 놀라운 수치다. 후반 에스파냐의 만회골이 터졌고 손흥민은 후반 15분 오르다즈와 교체되어 벤치로 들어왔다. 부앙가는 손흥민이 교체된 뒤인 후반 26분 오르다즈의 도움을 받아 시즌 첫 해트트릭을 달성했다. 부앙가가 18일(한국시간) 레알 에스파냐(온두라스)와의 2026 북중미카리브해축구연맹(CONCACAF) 챔피언스컵 1라운드 1차전 원정 경기에서 멀티골을 넣고 포효하고 있다. [사진=LAFC] 이날 경기는 손흥민에게 북중미 챔피언스컵 데뷔전이었다. 신임 도스 산토스 감독에게는 팀 부임 후 첫 경기였다. 프리시즌 친선경기를 단 하나도 뛰지 않은 채 컨디션 관리에 주력해온 손흥민은 일각의 부상 우려를 말끔히 씻었고, 도스 산토스 감독은 LAFC 데뷔전에서 대승을 거두며 기분 좋은 첫 스타트를 끊었다. psoq1337@newspim.com 2026-02-18 14:14
사진
14억 짜리 스포츠 브라 세리머니 [서울=뉴스핌] 장환수 스포츠전문기자= 동계올림픽에서 금빛 질주만큼이나 강렬한 장면이 화제를 모으고 있다. 유타 레이르담(네덜란드)의 금메달 세리머니가 '100만 달러 가치'라는 평가가 나왔다. 영국 매체 더 선은 17일(한국시간) 레이르담이 우승 직후 경기복 상의 지퍼를 내려 스포츠 브라를 드러낸 장면을 두고 "100만 달러짜리 세리머니"라고 보도했다. [밀라노 로이터=뉴스핌] 장환수 스포츠전문기자= 유타 레이르담이 10일 스피드스케이팅 여자 1000m에서 우승한 뒤 상의 지퍼를 내려 스포츠 브라를 노출시키고 있다. 2026.02.17 zangpabo@newspim.com 레이르담은 10일 이탈리아 밀라노에서 열린 2026 밀라노·코르티나담페초 동계올림픽 스피드스케이팅 여자 1000m에서 1분12초31의 올림픽 신기록으로 우승, 네덜란드에 대회 첫 금메달을 안겼다. 우승이 확정된 뒤 그는 환호와 함께 상의 지퍼를 내렸고, 안에 착용한 흰색 스포츠 브라가 노출됐다. 레이르담이 착용한 제품은 글로벌 스포츠 브랜드 나이키의 스포츠 브라였다. 매체는 "마케팅 전문가들에 따르면 이 장면은 소셜미디어 팔로워 2억9800만명을 보유한 나이키 계정을 통해 막대한 홍보 효과를 거뒀을 것"이라며 "7자리 숫자(100만 달러 이상)의 보너스를 받을 만하다"고 전했다. 경제 전문지 쿼트 편집장 마인더트 슈트의 분석도 인용됐다. 레이르담 개인 소셜미디어 팔로워가 620만명에 달하는 만큼, 팔로워 1명당 1센트만 적용해도 게시물 하나의 가치는 약 9000만원에 이른다는 계산이다. [밀라노 로이터=뉴스핌] 장환수 스포츠전문기자= 유타 레이르담이 16일 스피드스케이팅 여자 500m에서 은메달을 차지한 뒤 눈물을 글썽이고 있다. 2026.02.17 zangpabo@newspim.com 레이르담의 우승 장면은 네덜란드 브랜드 헤마의 광고에도 활용됐다. 눈물을 흘리며 화장이 번진 모습이 포착되자, 헤마는 자사 아이라이너를 홍보하며 '눈물에도 번지지 않는 방수 제품'이라는 메시지를 덧붙였다. 유명 복서 제이크 폴과 약혼한 사실로도 잘 알려진 레이르담은 이번 대회에 전용기를 이용해 이탈리아에 도착했고, 화려한 일상을 담은 사진을 지속적으로 공유하면서도 개회식에는 불참해 또 다른 화제를 낳기도 했다. zangpabo@newspim.com 2026-02-17 20:08
기사 번역
결과물 출력을 준비하고 있어요.
종목 추적기

S&P 500 기업 중 기사 내용이 영향을 줄 종목 추적

결과물 출력을 준비하고 있어요.

긍정 영향 종목

  • Lockheed Martin Corp. Industrials
    우크라이나 안보 지원 강화 기대감으로 방산 수요 증가 직접적. 미·러 긴장 완화 불확실성 속에서도 방위산업 매출 안정성 강화 예상됨.

부정 영향 종목

  • Caterpillar Inc. Industrials
    우크라이나 전쟁 장기화 시 건설 및 중장비 수요 불확실성 직접적. 글로벌 인프라 투자 지연으로 매출 성장 둔화 가능성 있음.
이 내용에 포함된 데이터와 의견은 뉴스핌 AI가 분석한 결과입니다. 정보 제공 목적으로만 작성되었으며, 특정 종목 매매를 권유하지 않습니다. 투자 판단 및 결과에 대한 책임은 투자자 본인에게 있습니다. 주식 투자는 원금 손실 가능성이 있으므로, 투자 전 충분한 조사와 전문가 상담을 권장합니다.
안다쇼핑
Top으로 이동