Gemini 2.5는 점점 더 복잡해지는 문제를 해결하기 위해 설계된 사고 모델입니다. 첫 번째 2.5 모델인 Gemini 2.5 Pro Experimental은 의미 있는 차이로 일반적인 벤치마크를 선도하며 강력한 추론 및 코드 기능을 선보입니다.
오늘 저희는 가장 지능적인 AI 모델인 Gemini 2.5를 소개합니다. 이번에 처음 선보이는 2.5 버전은 2.5 Pro의 실험적 버전으로, 다양한 벤치마크에서 최신 기술을 선보이며 LMArena에서 큰 차이로 1위를 차지한 바 있습니다.
Gemini 2.5 모델은 생각하는 모델로, 응답하기 전에 생각을 통해 추론할 수 있어 성능이 향상되고 정확도가 개선되었습니다.
AI 분야에서 시스템의 '추론' 능력은 단순한 분류와 예측 그 이상을 의미합니다. 정보를 분석하고, 논리적 결론을 도출하고, 맥락과 뉘앙스를 통합하고, 정보에 입각한 결정을 내릴 수 있는 능력을 말합니다.
오랫동안 강화 학습과 연쇄 사고 프롬프트와 같은 기술을 통해 AI를 더 똑똑하고 추론할 수 있게 만드는 방법을 모색해왔습니다. 이를 바탕으로 최근 첫 번째 사고 모델인 Gemini 2.0 플래시 씽킹을 도입했습니다.
이제 Gemini 2.5에서는 대폭 강화된 기본 모델과 향상된 사후 학습을 결합하여 새로운 차원의 성능을 달성했습니다. 앞으로는 이러한 사고 기능을 모든 모델에 직접 구축하여 더 복잡한 문제를 처리하고 더욱 유능한 상황 인식 에이전트를 지원할 수 있도록 할 계획입니다.
제미니 2.5 프로 소개
제미니 2.5 프로 익스페리멘탈은 복잡한 작업을 위한 가장 진보된 모델입니다. 인간의 선호도를 측정하는 LMArena 리더보드에서 큰 차이로 1위를 차지하여 고품질의 스타일을 갖춘 고도로 유능한 모델임을 나타냅니다. 2.5 Pro는 또한 강력한 추론 및 코드 기능을 보여주며 일반적인 코딩, 수학 및 과학 벤치마크에서 선두를 달리고 있습니다.
Gemini 2.5 Pro는 현재 Google AI Studio와 Gemini Advanced 사용자를 위한 Gemini 앱에서 사용할 수 있으며, 곧 Vertex AI에도 출시될 예정입니다. 또한 몇 주 내에 요금제를 도입하여 사람들이 2.5 Pro를 더 높은 요금 제한으로 확장된 프로덕션 용도로 사용할 수 있도록 할 예정입니다.
향상된 추론
Gemini 2.5 Pro는 고급 추론이 필요한 다양한 벤치마크에서 최첨단 성능을 발휘합니다. 2.5 Pro는 다수결 투표와 같이 비용을 증가시키는 테스트 시간 기술을 사용하지 않고도 GPQA 및 AIME 2025와 같은 수학 및 과학 벤치마크에서 선두를 차지합니다.
또한 수백 명의 주제별 전문가들이 인간의 지식과 추론의 경계를 파악하기 위해 설계한 데이터 세트인 Humanity's Last Exam에서 도구를 사용하지 않은 모델에서 18.8%의 최첨단 점수를 기록했습니다.
고급 코딩
코딩 성능에 집중해 왔으며, Gemini 2.5를 통해 2.0보다 큰 도약을 이루었고 앞으로 더 많은 개선이 이루어질 예정입니다. 2.5 Pro는 코드 변환 및 편집과 함께 시각적으로 매력적인 웹 앱과 에이전트 코드 애플리케이션을 만드는 데 탁월합니다. 에이전트 코드 평가에 대한 업계 표준인 SWE-Bench Verified에서 Gemini 2.5 Pro는 사용자 지정 에이전트 설정으로 63.8%의 점수를 받았습니다.
다음은 2.5 Pro의 추론 기능을 사용하여 한 줄 프롬프트에서 실행 코드를 생성하여 비디오 게임을 만드는 방법의 예시입니다.
Gemini의 장점 기반으로 구축
Gemini 2.5는 Gemini 모델의 장점인 네이티브 멀티모달리티와 긴 컨텍스트 창을 기반으로 구축되었습니다. 2.5 Pro는 현재 100만 개의 토큰 컨텍스트 창(곧 200만 개 제공 예정)과 함께 제공되며, 이전 세대보다 향상된 강력한 성능을 제공합니다. 방대한 데이터 세트를 이해하고 텍스트, 오디오, 이미지, 비디오, 심지어 전체 코드 저장소를 포함한 다양한 정보 소스의 복잡한 문제를 처리할 수 있습니다.
개발자와 기업은 지금 Google AI Studio에서 Gemini 2.5 Pro를 실험해 볼 수 있으며, Gemini Advanced 사용자는 데스크톱과 모바일의 모델 드롭다운에서 선택할 수 있습니다. 앞으로 몇 주 내에 Vertex AI에서도 사용할 수 있습니다.
언제나 그렇듯이 Google은 더 유용한 AI를 만들기 위해 Gemini의 인상적인 새 기능을 빠른 속도로 개선할 수 있도록 피드백을 환영합니다.
'개발자 > 인공지능과 인간' 카테고리의 다른 글
MCP 모델 컨텍스트 프로토콜이란? (3) | 2025.04.07 |
---|---|
MCP(Model Context Protocol) 공부하는 학습 자료 (1) | 2025.04.05 |
Machines of Loving Grace, AI가 세상을 더 나은 곳으로 변화시키는 방법 (3) | 2025.04.02 |
Gemini Deep Research를 최대한 활용하기 위한 6가지 팁 (2) | 2025.03.27 |
MCP Model Context Protocol, AI 상호 운용성의 미래 (2) | 2025.03.25 |
AI에서 멀티모달이란 무엇일까? (5) | 2025.03.07 |
메타페어와 @bcbl_ 연구진의 연구 논문 - 브레인 투 텍스트 디코딩: 타이핑을 통한 비침습적 접근 방식 (0) | 2025.03.04 |
AI로 인간의 사고 능력 저하 유발 (0) | 2025.02.18 |
더욱 좋은 정보를 제공하겠습니다.~ ^^