- 챗GPT에 쓰인 'GPT-3.5'보다 언어 능력 크게 향상...한국어 답변도 잘해
- 챗GPT 플러스 유료 가입자 대상 선공개, 무료 이용자는 아직 사용불가
- 구글·페이스북 등 경쟁사와 AI 격차 벌리려는 행보...마이크로소프트와 동맹 과시
1
오픈AI가 차세대 초거대 언어모델(NLP) 'GPT-4'를 공개.
GPT-4는 챗GPT의 근본 기술인 GPT-3.5와 비교해 AI의 언어 생성 능력이 15% 이상 향상,
영어로만 제대로 된 답변을 하던 GPT-3.5와 달리 한국어를 포함한 27개 언어로 답변.
2
구글, 페이스북 등 경쟁 사업자가 연내 초거대 언어모델 출시를 예고한 상황에서
차세대 언어모델을 선보임으로써 자연어 처리 분야에서 경쟁자와 큰 격차가 있음을 입증하려는 것이
샘 앨트먼 오픈AI CEO의 전략
14일(현지시간) 오픈AI는 차세대 언어모델인 GPT-4를 자사 홈페이지를 통해 공개하고 유료 구독 서비스인 '챗GPT 플러스'를 통해 사용할 수 있다고 밝혔다.
GPT-4는 GPT-3.5와 비교해 언어 생성 능력이 더욱 향상되고 이미지를 인식(컴퓨터 비전)할 수 있는 기능이 추가된 것이 특징이다.
이를 두고 오픈 AI는 "GPT-4는 다양한 시험과 학술 벤치마크에서 인간 수준의 성능을 보여주는 초거대 멀티 모달 AI(Large Multimodal Model)로, 미국 변호사 시험에서 하위 10%의 성적을 낸 GPT-3.5와 달리 상위 10% 점수를 받을 수 있을 정도로 언어 능력을 향상했다"고 밝혔다
3
"한 번에 처리할 수 있는 단어량을 3000개에서 2만5000개로 8배 이상 확대(영어 기준)함으로써 이용자가 더 자세하고 긴 맥락의 답변을 얻을 수 있게 됐다".
이는 언어 생성 능력이 다른 딥러닝(인공신경망) 기술보다 우수하지만, 긴 문장 생성에 약점을 보인 트랜스포머 모델의 문제점을 해결한 것이다.
4
오픈AI는 과거 GPT3에서 GPT-3.5로 AI 모델을 업그레이드하는 데 2년이 넘는 시간이 필요
GPT-3.5에서 GPT-4로 모델을 강화하는 것에는 불과 6개월
오픈AI에 대규모 투자를 하고 클라우드를 통해 대규모 AI 반도체 인프라(엔비디아 GPU팜)를 제공한 마이크로소프트와 긴밀한 협력이 있었기에 가능
5
오픈AI는
"회사는 지난 2년 동안 전체 딥러닝 스택을 재구축했으며 (초거대 AI 모델 실행을 위한)
작업 부하를 최소화하기 위해 마이크로소프트와 클라우드 기반 슈퍼컴퓨터를 공동 설계했다"
"이를 통해 GPT-4 학습 과정은 전례 없이 안정적이었으며 AI 모델의 학습 성능을 사전에 정확하게 예측할 수 있는 최초의 대형 모델이 됐다".
6
이용자는 챗GPT 플러스에 가입하면 GPT-4 기반 차세대 챗GPT를 사용할 수 있다.
다만 GPT-4 기반 챗GPT는 클라우드 서버 부하로 인해 현재 사용량이 4시간에 질문 100개로 제한되어 있고,
사용 한도가 꽉 차면 GPT-3.5 기반으로 사용해야 한다.
오픈AI는 지속해서 AI 모델을 최적화하고 AI 반도체를 확충함으로써 일일 사용량을 확대할 계획이라고 밝혔다.
7
챗GPT 무료 이용자는 GPT-4 기반 챗GPT를 사용할 수 없다.
기업과 개발자는 GPT-4 유료 API 사용 신청을 함으로써 GPT-4와 자사 서비스를 연결할 수 있다.
8
오픈AI는 GPT-4의 언어 능력을 두고
"일상적인 대화에선 (GPT-3.5와) 큰 차이를 느낄 수 없지만 전문적인 질문을 하면 차이가 나타난다"
"더 안정적이고 창의적이며 미묘한 질문에 대해 답변한다"
◆美 변호사 시험 상위 10%...약점인 수학 능력도 강화
9
GPT-3.5는 미국 변호사 시험에서 400점 만점에 213점을 받았지만,
GPT-4는 400점 만점에 298점을 받아 법률 지식을 한층 끌어올렸다.
10
미국 수학능력시험인 SAT의 경우
읽기 및 쓰기의 경우 800점 만점 기준 670점에서 710점으로 향상,
특히 GPT-3.5의 약점으로 지적받은 수학 능력의 경우 590점에서 700점으로 크게 향상.
11
의학지식 자가 진단도 정답률이 53%에서 75%로 향상됐다.
각종 시험에서 챗GPT-4와 챗GPT-3.5 정답률 비교 [사진=오픈AI]
12
GPT-4는 다양한 언어 데이터를 학습함으로써
영어 외에 다른 언어에서도 GPT-3.5를 넘어서는 답변 능력을 보여주는 게 특징이다.
13
먼저 영어 답변 능력은 초거대 AI의 자연어 처리 능력을 보여주는 MMLU 벤치마크 기준 70.1%에서 85.5%로 향상.
한국어 답변 능력도 77.0%로 나와 GPT-3.5에 영어로 질문할 때보다 더 자세하고 정확한 답변을 얻을 수 있게 됐다.
답변 능력이 70%를 넘는 언어만 25개에 이른다.
**MMLU 벤치마크는 57개 주제 1만4000여개의 질문을 하고 이에 대한 정답률을 확인함으로써 초거대 AI의 언어 능력을 검증하는 테스트다.
14
또 오픈AI는 다방면으로 활용할 수 있는 트랜스포머 모델의 특징을 살려
GPT-4에 자연어 처리뿐 아니라 이미지를 이해할 수 있는 능력(컴퓨터 비전)도 추가.
이용자가 업로드한 이미지를 보고 이에 맞는 최적의 답변을 한다.
다만 이미지 이해하기는 시험 기능으로 이용자에게 바로 제공하지는 않는다.
15
오픈AI는 GPT-4가 GPT-3.5의 단점으로 지적받은 '환각 오류'를 완전히 해결하지는 못했다고 강조했다.
**사실 환각이란 AI가 사실(팩트)과 다른 것을 마치 진실인 것처럼 강한 확신을 담아 답변하는 문제를 말한다.
때문에 GPT-4를 통해 얻은 답변이라도 실제 업무나 논문 등에 활용하려면 강력한 팩트 체크 과정을 거쳐야 한다.
다만 GPT-4는 오픈AI가 실시한 적대적 사실성 평가에서 GPT-3.5보다 40% 높은 점수를 받아 환각 오류를 상당 부분 줄이는 데 성공했다.
GPT-4.0 전 세계 언어 대답 능력 벤치마크 결과 [사진=오픈AI]
16
AI의 허점을 찌르는 질문을 함으로써 위험한 답변과 부정확한 정보, 악성 코드 등을 얻는 문제 해결에도 큰 노력을 기울였다.
오픈AI는 AI 보정, 사이버보안, 의학, 사회 안전 등 다양한 분야 전문가 50명과 함께 AI 모델이 위험한 답변을 하지 않도록 한층 강화한 안전 필터를 만들어 GPT-4에 적용했다.
이를 통해 AI 모델이 허용되지 않는 요청에 대한 답변에 응답하는 경향을 82% 줄였다.
17
다만 2021년 9월 이전 정보만 정확히 답변하고 그 이후 정보는 제한적으로만 답변하는 문제는 그대로다. 답변 데이터를 최신화하는 일정은 아직 공개하지 않았다.
18
샘 앨트먼 오픈AI CEO는 트위터를 통해 "GPT-4는 여전히 결함이 있고 제한적이다.
하지만 더 많이 사용해보니 처음 사용할 때보다 더 인상적이다"fk고 밝혔다.
19
한편 오픈AI는 듀오링고, 비마이아이즈, 스트라이프, 모건스탠리 등 미국 기업과 스타트업이 GPT-4를 자사 업무와 서비스에 도입하기로 했다고 밝히며 초거대 AI 수익화에도 속도를 내고 있음을 강조했다.
챗GPT 이제 한국어도 척척 답변...오픈AI 차세대 AI 'GPT-4' 전격 공개 | 아주경제 (ajunews.com)
댓글