개발자/인공지능과 인간

Phi-3 소개: SLM의 가능성에 대한 재정의

지구빵집 2024. 4. 25. 07:48
반응형

 

Phi-3 소개: SLM의 가능성에 대한 재정의 

 

Microsoft에서 개발한 개방형 AI 모델 제품군인 Phi-3를 소개하게 되어 기쁘게 생각합니다. Phi-3 모델은 다양한 언어, 추론, 코딩, 수학 벤치마크에서 동일한 크기 및 그 다음 크기의 모델보다 성능이 뛰어나고 비용 효율성이 가장 높은 소형 언어 모델(SLM)입니다. 이번 릴리스를 통해 고객은 고품질 모델 선택의 폭이 넓어져 제너레이티브 AI 애플리케이션을 구성하고 구축할 때 보다 실용적인 선택을 할 수 있습니다.

 

오늘부터 38억 개 언어 모델인 Phi-3-mini는 Microsoft Azure AI Studio, Hugging Face 및 Ollama에서 사용할 수 있습니다.

 

 

  • Phi-3-mini는 4K 및 128K 토큰의 두 가지 컨텍스트 길이 변형으로 제공됩니다. 이 모델은 동급 최초로 품질에 거의 영향을 주지 않으면서 최대 128K 토큰의 컨텍스트 창을 지원하는 모델입니다.
  • 인스트럭션 튜닝을 통해 사람들이 일반적으로 의사소통하는 방식을 반영하는 다양한 유형의 인스트럭션을 따르도록 훈련되었습니다. 따라서 모델을 즉시 사용할 수 있습니다.
  • 배포-평가-조정 툴체인을 활용하기 위해 Azure AI에서 사용할 수 있으며, 개발자가 랩톱에서 로컬로 실행할 수 있도록 Ollama에서 사용할 수 있습니다.
  • 그래픽 처리 장치(GPU), CPU, 심지어 모바일 하드웨어에 걸친 크로스 플랫폼 지원과 함께 Windows DirectML을 지원하여 ONNX 런타임에 최적화되었습니다.
  • 또한 어디서나 배포할 수 있는 표준 API 인터페이스를 갖춘 NVIDIA NIM 마이크로서비스로도 제공됩니다. 그리고 NVIDIA GPU에 최적화되어 있습니다.

 

향후 몇 주 내에 Phi-3 제품군에 추가 모델을 추가하여 고객에게 품질 비용 곡선 전반에 걸쳐 더 많은 유연성을 제공할 예정입니다. Phi-3-small(7B) 및 Phi-3-medium(14B)은 Azure AI 모델 카탈로그 및 기타 모델 가든에서 곧 제공될 예정입니다. Microsoft는 품질 비용 곡선 전반에서 최고의 모델을 지속적으로 제공하고 있으며, 오늘 출시되는 Phi-3는 최신 소형 모델로 모델 선택의 폭을 넓혔습니다. 

 

작은 크기에 획기적인 성능

 

Phi-3 모델은 주요 벤치마크에서 동일하거나 더 큰 크기의 언어 모델보다 훨씬 뛰어난 성능을 발휘합니다(아래 벤치마크 수치 참조, 높을수록 좋음). Phi-3-mini는 크기가 두 배인 모델보다 성능이 우수하며, Phi-3-small 및 Phi-3-medium은 GPT-3.5T를 포함한 훨씬 더 큰 모델보다 성능이 뛰어납니다.

 

보고된 모든 수치는 비교 가능한 수치를 보장하기 위해 동일한 파이프라인으로 생산되었습니다. 따라서 이러한 수치는 평가 방법론의 약간의 차이로 인해 다른 공개된 수치와 다를 수 있습니다. 벤치마크에 대한 자세한 내용은 기술 문서에서 확인할 수 있습니다.

 

참고: Phi-3 모델은 모델 크기가 작을수록 사실을 보유할 수 있는 용량이 줄어들기 때문에 사실 지식 벤치마크(예: TriviaQA)에서 좋은 성능을 발휘하지 못합니다.

 

 

 

 

 

안전을 최우선으로 하는 모델 설계

 

Phi-3 모델은 책임성, 투명성, 공정성, 신뢰성 및 안전성, 개인 정보 보호 및 보안, 포용성 등 6가지 원칙을 기반으로 하는 전사적 요구 사항 집합인 Microsoft 책임 AI 표준에 따라 개발되었습니다. Phi-3 모델은 엄격한 안전성 측정 및 평가, 레드팀, 민감한 사용 검토, 보안 지침 준수를 거쳐 Microsoft의 표준 및 모범 사례에 따라 책임감 있게 개발, 테스트 및 배포되도록 보장합니다.

 

* 참고: Microsoft 책임감 있는 AI 표준 문서

 

Microsoft Responsible AI Standard v2 General Requirements (0).pdf
0.68MB

 

 

 

Phi 모델에 대한 이전 작업("교과서만 있으면 충분합니다")을 기반으로 Phi-3 모델도 고품질 데이터를 사용하여 학습됩니다. 또한 인간 피드백을 통한 강화 학습(RLHF), 수십 가지 위험 범주에 대한 자동화된 테스트 및 평가, 수동 레드팀 등 광범위한 안전 사후 교육을 통해 더욱 개선되었습니다. 안전 교육 및 평가에 대한 접근 방식은 기술 문서에 자세히 설명되어 있으며, 모델 카드에는 권장 사용법과 제한 사항이 요약되어 있습니다. 모델 카드 컬렉션을 참조하세요. 

 

새로운 기능 활용하기

 

Microsoft는 코파일럿을 출시하고 고객이 Azure AI를 사용하여 생성형 AI로 비즈니스를 혁신할 수 있도록 지원한 경험을 통해 다양한 작업의 품질 비용 곡선에서 다양한 크기의 모델에 대한 필요성이 점점 더 커지고 있음을 강조했습니다. Phi-3와 같은 소규모 언어 모델은 특히 유용합니다:

 

  • 온-디바이스 및 오프라인 추론 시나리오를 비롯한 리소스 제약이 있는 환경.
  • 빠른 응답 시간이 중요한 지연 시간 제한 시나리오.
  • 비용 제약이 있는 사용 사례, 특히 단순한 작업의 경우.

 

소규모 언어 모델에 대한 자세한 내용은 Microsoft 소스 블로그를 참조하세요.

 

Phi-3 모델은 크기가 작기 때문에 컴퓨팅이 제한된 추론 환경에서도 사용할 수 있습니다. 특히 Phi-3-mini는 온디바이스에서 사용할 수 있으며, 특히 플랫폼 간 가용성을 위해 ONNX 런타임으로 더욱 최적화할 경우 더욱 그렇습니다. 또한 Phi-3 모델의 크기가 작아 미세 조정이나 커스터마이징이 더 쉽고 저렴합니다. 또한 연산 요구 사항이 낮기 때문에 지연 시간이 훨씬 더 짧고 비용도 저렴한 옵션입니다. 컨텍스트 창이 길어 문서, 웹 페이지, 코드 등 대용량 텍스트 콘텐츠를 가져와서 추론할 수 있습니다. Phi-3-mini는 강력한 추론 및 논리 능력을 보여주기 때문에 분석 작업에 적합합니다.

 

고객들은 이미 Phi-3로 솔루션을 구축하고 있습니다. Phi-3가 이미 그 가치를 입증하고 있는 한 가지 예는 인터넷에 쉽게 접근할 수 없는 농업 분야입니다. Phi-3와 같은 강력한 소형 모델과 Microsoft 코파일럿 템플릿은 농부들이 필요한 시점에 사용할 수 있으며, 저렴한 비용으로 실행할 수 있는 추가적인 이점을 제공하여 AI 기술을 더욱 쉽게 이용할 수 있게 해줍니다.

 

인도에 본사를 둔 선도적인 비즈니스 대기업인 ITC는 백만 명 이상의 농부에게 도달하는 농민 대상 앱인 크리시 미트라의 코파일럿을 위해 Microsoft와의 지속적인 협력의 일환으로 Phi-3를 활용하고 있습니다. 

 

"크리시 미트라 copilot의 목표는 대규모 언어 모델의 정확성을 유지하면서 효율성을 개선하는 것입니다. Microsoft와 협력하여 미세 조정된 Phi-3 버전을 사용하여 효율성과 정확성이라는 두 가지 목표를 모두 달성할 수 있게 되어 기쁩니다!" - 사이프 나익, 기술 책임자, ITCMAARS 

 

Microsoft Research에서 시작된 Phi 모델은 Phi-2가 2백만 번 이상 다운로드되는 등 광범위하게 사용되고 있습니다. Phi 시리즈 모델은 전략적 데이터 큐레이션과 혁신적인 확장을 통해 놀라운 성능을 달성했습니다. Python 코딩에 사용되는 모델인 Phi-1에서 시작하여 추론과 이해력을 향상시킨 Phi-1.5, 그리고 언어 이해력에서 최대 25배의 성능을 발휘하는 27억 개 매개변수 모델인 Phi-2에 이르기까지.1 각 반복은 고품질 학습 데이터와 지식 전달 기술을 활용하여 기존의 확장 법칙에 도전해 왔습니다.

 

지금 시작하기

 

Phi-3를 직접 체험하려면 Azure AI Playground에서 모델을 사용해 보세요. Hugging Chat 플레이그라운드에서도 모델을 찾을 수 있습니다. Azure AI Studio를 사용하여 시나리오에 맞게 Phi-3를 빌드하고 사용자 지정하기 시작하세요. AI Show의 특별 라이브 스트림에서 Phi-3에 대해 자세히 알아보세요. 

 

기사 출처

 

 

반응형