AI 최강자 등극 구글 '제미나이', GPT-4와 비교해 보니

기사입력 : 2023년12월07일 14:53

최종수정 : 2023년12월08일 07:49

[서울=뉴스핌] 최원진 기자= 구글이 오픈AI의 최신 생성형 인공지능(AI) 거대언어모델(LLM) 'GPT-4'를 능가하는 자체 모델 '제미나이(Gemini) 1.0'을 6일(현지시간) 공개해 화제다.

지난해 11월 챗GPT로 생성형 AI의 미래를 제시한 오픈AI가 기술 최강 자리를 굳건히 지킬 것이란 예상이 GPT-4 출시 후 불과 약 9개월 만에 깨진 것이다. 구글 제미나이가 AI 업계의 치열한 개발 경쟁에 다시 한번 불을 지폈다.

◆ 제미나이의 강점은 '멀티 플레이어'

제미나이는 3가지 버전으로 나온다. 구글이 지금까지 내놓은 것 중 가장 강력한 LLM이자 데이터센터와 기업용 모델인 '제미나이 울트라', 구글의 AI 챗봇 '바드'의 모델인 '제미나이 프로', 스마트폰 등 모바일 기기에서 사용 가능한 컴팩트한 사이즈의 '나노'다.

제미나이 프로는 제품 공개한 이날 바로 바드에 탑재됐다. 제미나이 프로가 적용된 바드는 170개 이상 국가 및 지역에서 영어로 제공되며, 향후 서비스 확장 및 새로운 지역과 언어도 지원될 예정이다.

'제미나이 울트라'는 내년 초 '바드 어드밴스드'라는 이름으로 바드에 장착되며, '제미나이 나노'는 구글이 지난 10월 공개한 최신 스마트폰인 '픽셀8 프로'에 탑재된다.

구글은 제미나이가 "선천적"(natively)으로 멀티모달(Multi-Modal·다중모드) AI 모델이라고 소개한다. 멀티모달은 말그대로 텍스트뿐만 아니라 이미지, 동영상 등 비언어 입력값도 이해해 응용할 수 있는 '멀티 플레이어'다.

오픈AI가 이미지 생성 AI '달리'(DALL-E), 음성 인식 AI '위스퍼'(Whisper)를 각각 개발한 방식과 달리 구글은 애초부터 텍스트·이미지·오디오 등 다양한 데이터로 제미나이를 훈련해왔다는 것이다.

제미나이가 학생의 물리학 문제를 풀이해주는 예시. [사진=구글 딥마인드 제공]

특히 제미나이는 이미지와 동영상을 이해한 데이터를 응용하고 상호 작용하는 데 강점을 보인다.

예컨대 한 학생이 물리학 문제를 풀이하는 과정을 펜으로 쓴 이미지를 교사가 제미나이 프롬프트에 넣어 문제 풀이 과정에 어떤 부분이 틀렸는지 질문하면 제미나이는 정확히 문제의 정답과 학생의 손 글씨를 이해해 잘못된 문제 풀이 과정을 수정해 준다.

구글 딥마인드는 "제미나이가 이미지 속 텍스트를 이해하는 것을 넘어 교사가 어떻게 문제를 다르게 설정했는지 등을 이해해야 가능하다"고 설명했다. 제미나이는 오답 풀이 뿐만 아니라 학생이 틀린 유형의 다른 연습 문제도 제공해 교육 환경에서의 활용도가 높다는 게 자체 평가다.

이 밖에 제미나이는 동영상 속 언어를 감지해 번역 자막을 달아주고, 동영상 속 상황을 이해해 질문에 답할 수 있다.

◆ 32개 벤치마크 테스트 중 30개, 최고 성적

이미지와 영상의 이해부터 수학적 추론까지 가능한 제미나이 울트라가 업계에서 LLM 연구개발 평가 시 널리 사용되는 학술 벤치마크 기준 32개 가운데 30개 항목에서 GPT-4를 뛰어넘는 성적을 기록했다.

구체적으로 제미나이 울트라는 텍스트와 추론 벤치마크 부문 12개 중 10개, 이미지 이해 부문 9개 중 9개, 동영상 이해 벤치마크 6개 중 6개, 음성 인식 부문 5개 중 5개에서 GPT-4보다 높은 신기록을 썼다.

특히 대규모 다중작업 언어 이해(MMLU) 벤치마크에서 제미나이 울트라는 90% 이상의 정답률을 기록했다.

MMLU는 수학, 물리학, 역사, 법률, 의학, 윤리 등 57개의 주제를 복합적으로 활용해 지식과 문제 해결 능력을 평가하는 대표 격 LLM 벤치마크다.

구글 딥마인드는 제미나이 울트라의 MMLU 점수가 GPT-4의 86.4%를 앞선 것에서 나아가 AI 모델로는 최초로 인간 전문가 점수인 89.8%를 뛰어넘었다고 밝혔다.

이 밖에 여러 단계의 추론을 요구하는 여러 문제 해결 능력을 평가하는 빅 벤치 하드(BIG-Bench-Hard)와 독해력 벤치마크인 DROP에서 각각 80%가 넘는 점수로 GPT-4를 능가했다.

WMT23 벤치마크는 LLM의 번역 능력을 평가한다. 제미나이 울트라는 74.40%로 GPT-4보다 번역 능력이 우수했다.

다만 일상에 필요한 상식 추론 능력을 보는 헬라스웨그(HellaSwag) 벤치마크에서는 제미나이 울트라가 GPT-4에 못미쳤다.

제미나이 울트라의 이미지 이해 능력은 GPT-4 보다 뛰어났다.

과학, 기술, 인문 과학, 음악 등 6개 핵심 부문 대학교 시험과 교과서에서 수집된 차트, 표, 악보 이미지를 이해하는 능력을 평가하는 다소 새로운 벤치마크인 MMMU에서 제미나이 울트라는 59.4%를 기록, GPT-4를 앞섰다.

이미지를 보고 이해해 관련 질문에 답할 수 있는 능력을 확인하는 VQAv2 벤치마크와 서류상 이미지를 이해하는 능력을 보는 DocVQA, 그래프 등을 보고 수학적 추론 능력을 보는 매스 비스타(MathVista) 벤치마크에서도 GPT-4 보다 좋은 성적을 거뒀다.

AI 모델의 동영상 이해를 평가하는 벤치마크들에서도 제미나이 울트라는 두각을 보였다.

영상 속 상황을 텍스트로 옮기는 능력을 평가하는 VATEX 벤치마크와 영상과 관련된 질문에 답해 전반적인 영상 이해도를 평가하는 인식 테스트 MCQA 벤치마크 모두 GPT-4를 뛰어넘었다.

이밖에 중국어 텍스트로 영상 속 상황을 옮기는 능력을 평가하는 VATEX ZH, 영어로 복잡한 요리 과정이 담긴 영상을 텍스트로 옮기는 YouCook2 등 여러 벤치마크에서도 높은 성적을 거뒀다.

제미나이 프로의 음성 인식 이해도도 우수했다. 21개 언어의 음성을 인식해 텍스트로 변환하는 능력을 평가하는 CoVoST 2 벤치마크에서 제미나이 프로는 40.1을 기록, 오픈AI의 음성 인식 AI 모델 '위스퍼' 버전 2(v2) 보다 10 이상 높았다.

62개 언어로 음성 인식 여부를 확인하는 FLEURS 벤치마크에서도 제미나이 프로는 7.6%를 기록, 위스퍼 v3 보다 월등했다. FLEURS는 AI 모델이 음성 인식 정확도를 측정하는 테스트로 점수가 낮을 수록 인식 오류가 적다는 의미다.

이밖에 제미나이는 파이선(Python), 자바(JAVA), C++, Go 등 세계에서 널리 사용되는 프로그래밍 언어로 코드를 이해하고 생성할 수 있다.

코딩 작업 성능을 평가하는 업계 표준인 휴먼이발(HumanEval) 벤치마크에서 제미나이 울트라는 74.4%를 기록해 GPT-4(67.0%)를 능가했다. 파이썬 코드 생성 능력을 평가하는 내추럴2코드(Natural2Code) 벤치마크에서도 GPT-4 보다 1%포인트(p) 높은 74.9%를 기록했다.

wonjc6@newspim.com

[관련기사]

[관련키워드]

제미나이

GAM - 해외주식 투자 도우미

[미국 특징주] 씨티 "'매그니피센트7'이라는 용어, 이제는 AI 승자 구분에 무의미"

반도체주, 대규모 실적 개선 예고…과연 시장을 만족시킬까

[홍콩 대장주] 메이퇀 ③ 신성장 동력의 '폭발적 성장'

[홍콩 대장주] 메이퇀② 실적은 고속 상승, 밸류는 역대 저점

[뉴스핌 베스트 기사]

사진

스페인, 아르헨 꺾고 월드컵 우승 [서울=뉴스핌] 박상욱 기자 = '무적함대' 스페인이 '축구의 신' 리오넬 메시를 울리며 세계 축구 정상을 탈환했다. 스페인은 20일(한국시간) 미국 뉴욕 뉴저지 스타디움에서 열린 2026 북중미 월드컵 결승전에서 연장 후반 1분에 터진 페란 토레스의 결승골로 아르헨티나를 1-0으로 꺾었다. 스페인은 2010 남아공 월드컵 이후 16년 만에 사상 두 번째 월드컵 우승을 달성하며 역대 7번째로 월드컵 2회 이상 우승국 반열에 올랐다. 반면 디펜딩 챔피언 아르헨티나는 타이틀 방어에 실패했다. 메시의 통산 6번째이자, 사실상 그의 월드컵 '라스트 댄스'도 눈물로 막을 내렸다. 스페인은 여자 월드컵(2023년 우승)과 남자 월드컵 우승 트로피를 모두 보유하는 최초의 국가가 됐다. 유럽의 역대 우승 횟수는 13회로 늘었다. 남미는 10회다. 스페인은 우승 상금 5000만 달러(약 745억원), 아르헨티나는 3300만 달러를 받는다. [이스트 러더퍼드 로이터=뉴스핌] 박상욱 기자=아르헨티나의 리오넬 메시가 20일(한국시간) 북중미 월드컵 결승 스페인과 아르헨티나의 경기 연장전에서 골을 허용하자 아쉬운 표정을 짓고있다. 2026.7.20 psoq1337@newspim.com 경기 초반부터 양 팀은 강력한 압박과 정교한 빌드업으로 맞붙었다. 전반 5분 스페인의 '19세 초신성' 라민 야말이 다니 올모와 패스를 주고받은 뒤 왼발 슈팅으로 포문을 열었으나 에밀리아노 마르티네스 골키퍼의 선방에 막혔다. 아르헨티나도 곧바로 메시의 배후 침투로 반격했으나, 우나이 시몬 골키퍼가 빠르게 뛰어나와 공을 걷어냈다. 이후 주도권은 서서히 스페인 쪽으로 넘어갔다. 스페인은 유기적인 패스 워크와 즉각적인 전방 압박으로 아르헨티나를 몰아붙였다. 아르헨티나는 전반 44분 핵심 수비수 리산드로 마르티네스가 허벅지 부상으로 쓰러져 니콜라스 오타멘디와 교체되는 악재까지 맞았다. 아르헨티나는 전반 동안 단 1개의 슈팅도 기록하지 못했다. [이스트 러더퍼드 로이터=뉴스핌] 박상욱 기자=아르헨티나 선수들이 20일(한국시간) 북중미 월드컵 결승 스페인과 아르헨티나의 경기 연장전에서 골을 허용하자 낙심하고 있다. 2026.7.20 psoq1337@newspim.com 월드컵 역사상 최초로 열린 대규모 하프타임 쇼에서는 마돈나에 이어 한국의 방탄소년단(BTS)이 등장해 인기곡 '다이너마이트'를 부르며 전 세계 팬들을 열광시켰다. 저스틴 비버와 샤키라의 공연까지 이어지며 축제 분위기를 고조시켰다. [이스트 러더퍼드 로이터=뉴스핌] 박상욱 기자=그룹 방탄소년단(BTS)가 20일(한국시간) 북중미 월드컵 결승 스페인과 아르헨티나의 경기 하프타임 쇼에서 공연을 펼치고 있다. 2026.7.20 psoq1337@newspim.com 후반전에도 스페인의 공세는 계속됐다. 아르헨티나는 후반 시작과 함께 미드필더 니코 곤살레스를 빼고 레안드로 파레데스를 투입하며 중원 싸움을 걸었다. 하지만 로드리를 중심으로 한 스페인의 정교한 빌드업을 제어하지 못했다. 스페인은 후반 17분 미켈 오야르사발과 파비안 루이스 대신 페란 토레스와 페드리를 투입해 공격을 강화했다. 후반 22분 야말의 크로스에 이은 토레스의 헤더와 후반 32분 파우 쿠바르시의 강력한 중거리 슈팅 등 결정적인 기회가 이어졌으나, 모두 아르헨티나의 마르티네스 골키퍼 선방에 걸렸다. [이스트 러더퍼드 로이터=뉴스핌] 박상욱 기자=스페인의 페란 토레스가 20일(한국시간) 북중미 월드컵 결승 스페인과 아르헨티나의 경기 연장전에서 결승골을 터뜨리고 환호하고 있다. 2026.7.20 psoq1337@newspim.com 정규시간 종료 직전 큰 변수가 발생했다. 후반 추가시간 아르헨티나의 핵심 미드필더 엔소 페르난데스가 쿠바르시에게 거친 반칙을 범해 경고 누적으로 퇴장당했다. 아르헨티나는 수적 열세에 처했다. 이어진 프리킥 상황에서 야말의 날카로운 슈팅마저 마르티네스 골키퍼가 몸을 날려 막아내며 경기는 0의 균형을 깨지 못한 채 연장전으로 돌입했다. 전·후반 90분 동안 슈팅 수 14대0이 말해주듯 스페인이 일방적으로 압도한 흐름이었다. 연장전에서도 스페인의 공세가 이어졌다. 연장 전반 6분 니코 윌리엄스가 골망을 흔들었으나, 앞선 과정에서 미켈 메리노의 반칙이 선언돼 득점이 취소됐다. 아르헨티나는 공격수 훌리안 알바레스를 빼고 수비수 마르코스 세네시를 투입하며 대놓고 승부차기를 노리는 수비 전략으로 버텼다. [이스트 러더퍼드 로이터=뉴스핌] 박상욱 기자=라민 야말 등 스페인 선수들이 20일(한국시간) 북중미 월드컵 결승 스페인과 아르헨티나의 경기 연장전에서 골을 넣은 페란 토레스를 끌어 안고 기뻐하고 있다. 2026.7.20 psoq1337@newspim.com 철통같던 아르헨티나의 방어벽은 연장 후반 시작과 동시에 무너졌다. 연장 후반 1분 페드로 포로가 오른쪽에서 길게 올린 크로스를 윌리엄스가 문전에서 헤더 백패스로 연결했다. 뒤에서 문전으로 쇄도하던 토레스가 이를 강력한 왼발 슈팅으로 연결해 아르헨티나 골문 상단을 꿰뚫었다. 대회 내내 이어진 마르티네스 골키퍼의 선방 쇼를 끝내는 한 방이었다. [이스트 러더퍼드 로이터=뉴스핌] 박상욱 기자=스페인 선수들이 20일(한국시간) 북중미 월드컵 결승 스페인과 아르헨티나의 경기 연장전에서 골을 넣은 페란 토레스와 기쁨을 나누고 있다. 2026.7.20 psoq1337@newspim.com [이스트 러더퍼드 로이터=뉴스핌] 박상욱 기자=아르헨티나를 꺾고 우승한 스페인의 로드리가 20일(한국시간) 월드컵 우승 트로피를 들어 올리며 동료들과 환호하고 있다. 도널드 트럼프 미국 대통령이 시상식에서 박수를 보내고 있다. 2026.7.20 psoq1337@newspim.com 실점한 아르헨티나는 뒤늦게 반격에 나섰다. 연장 후반 12분 메시가 페널티 박스 바깥에서 아르헨티나의 경기 첫 번째 슈팅을 날렸으나 메리노의 얼굴에 맞고 굴절됐다. 연장 후반 막판 코너킥 상황에서는 흘러나온 공을 줄리아노 시메오네가 페널티 박스 중앙에서 결정적인 오른발 슈팅으로 연결했으나 골대 위로 벗어났다. 수적 열세를 극복하지 못한 아르헨티나는 끝내 동점골을 터뜨리지 못했다. 이번 대회 월드컵 결승 무대에 오른 역대 최고령 필드 플레이어 기록을 메시가 39세 25일로 새로 썼다. 스웨덴의 군나르 그렌이 보유한 종전 기록 37세 241일을 경신했다. 야말은 쿠바르시(이상 19세)와 함께 20세 미만 월드컵 최다 7경기 출전 타이기록을 세웠다. 이 기록을 단독으로 보유했던 음바페와 동률이다. psoq1337@newspim.com 2026-07-20 07:14

사진

신진서, AI 카타고에 첫 패배 안기다 [서울=뉴스핌] 한지용 기자 = 세계 최강 프로기사 신진서 9단이 인공지능(AI) 카타고의 벽을 넘었다. 신진서는 19일 서울 중구 한국경제TV 스튜디오에서 열린 쎈수학·한경 기신전 2국에서 바둑 AI 카타고를 상대로 290수 만에 흑 4집 반 승리를 거뒀다. [서울=뉴스핌] 생성형 AI가 제작한 AI '카타고(KataGo)'와 신진서 9단 기신전(棋神戰) 3번기 일러스트. [그래픽:CHAT GPT] 이로써 신진서는 지난 17일 1국 패배를 설욕하고 승부를 1승 1패 원점으로 돌렸다. 최종 승자는 3국에서 가려진다. 이번 승리는 2점 접바둑으로 치러졌지만 의미가 작지 않다. 신진서는 현존 최고 성능의 바둑 AI로 평가받는 카타고를 공식 대국에서 꺾은 첫 프로기사가 됐다. 카타고는 그동안 프로기사들과의 연습 대국에서 2점 핸디캡을 주고도 압도적인 모습을 보여왔다. 3점으로 버티는 기사도 많지 않았고, 4점을 놓고도 패하는 사례가 있었다. 신진서는 이날 초반부터 두텁게 판을 짜며 자신이 준비한 흐름으로 대국을 끌고 갔다. 신진서는 160수까지 우세를 유지하며 안정적으로 판을 운영했다. 카타고는 중앙에서 전투를 걸며 반격을 시도했지만, 신진서는 침착하게 대응했다. 승부처에서도 흔들리지 않았다. 신진서는 192수와 194수로 카타고를 압박하며 다시 흐름을 가져왔다. 이후 카타고가 재차 중앙에서 변화를 만들었지만, 신진서는 자신의 구상을 지키며 끝내 리드를 내주지 않았다. 10년 전 이세돌 9단은 알파고와 호선 대국에서 역사적인 1승(4패)을 거뒀다. 이후 AI의 기력이 비약적으로 발전한 상황에서 나온 신진서의 2점 접바둑 승리도 인간 기사에게 의미 있는 성과로 평가된다. 신진서는 이번 대국 승리로 승리 수당 5000만원도 확보했다. 대국은 3번기로 진행되며, 신진서가 2승 이상을 거두면 부상으로 제네시스 G90을 받는다. football1229@newspim.com 2026-07-19 15:41