MiniMax-01

MiniMax-01: 456B 매개변수를 갖춘 고급 언어 모델

하이브리드 어텐션과 MoE 아키텍처를 특징으로 하는 강력한 언어 모델을 경험해보세요. 추론, 수학, 코딩 작업에서 뛰어난 성능을 발휘하며 최대 4M 토큰 컨텍스트 길이를 지원합니다

456B 매개변수

45.9B 활성 매개변수

4M 토큰 컨텍스트

MiniMax-01 체험하기 API 접근

무료 웹사이트 통합

간단한 iframe 코드로 고급 AI 채팅 인터페이스를 웹사이트에 통합하세요. 회원가입이 필요하지 않습니다.

MiniMax-01 채팅 체험하기

MiniMax 채팅

Mistral 채팅 시작하기 DeepSeek 채팅 시작하기

주요 기능

MiniMax-01의 강력한 기능을 발견하세요

하이브리드 아키텍처

총 4,560억 매개변수와 토큰당 459억 활성화 매개변수를 가진 Lightning Attention, Softmax Attention, Mixture-of-Experts (MoE)의 혁신적인 조합

•80층 아키텍처
•64개 어텐션 헤드
•32개 전문가 네트워크
•상위-2 라우팅 전략

벤치마크 성능

MMLU (88.5%), MMLU-Pro (75.7%), GSM8K (94.8%)를 포함한 다양한 벤치마크에서 탁월한 결과

•강력한 수학적 추론
•고급 코딩 기능
•복잡한 문제 해결
•긴 컨텍스트 이해

긴 컨텍스트 처리

추론 시 최대 4백만 토큰, 학습 시 1백만 토큰 지원

•확장된 컨텍스트 윈도우
•효율적인 토큰 처리
•문서 이해
•대규모 분석

고급 어텐션

7개의 lightning attention 레이어마다 softmax attention이 있는 하이브리드 어텐션 메커니즘

•향상된 컨텍스트 이해
•효율적인 정보 처리
•균형 잡힌 어텐션 분산
•최적화된 성능

전문가 네트워크

9,216 은닉 차원과 효율적인 라우팅 전략을 가진 32개의 전문화된 전문가 네트워크

•전문화된 처리
•동적 라우팅
•작업 최적화
•효율적인 계산

모델 아키텍처

최적의 성능과 효율성을 위해 설계된 최첨단 아키텍처

•은닉 크기: 6,144
•어휘 크기: 200,064
•RoPE 위치 인코딩
•고급 매개변수 공유

다양한 응용

수학, 코딩, 추론을 포함한 다양한 분야에서의 포괄적인 기능

•수학적 계산
•코드 생성
•복잡한 추론
•지식 검색

성능 최적화

학습과 추론 모두에서 고급 기술을 통한 고도의 최적화

•효율적인 매개변수 활성화
•균형 잡힌 부하 분산
•최적화된 메모리 사용
•빠른 추론 속도

MiniMax-01 성과

언어 및 비전 작업에서의 선도적인 성능

벤치마크 우수성

MiniMax-01은 MMLU에서 88.5%, MMLU-Pro에서 75.7%, GSM8K에서 94.8%를 달성하여 추론과 문제 해결에서 뛰어난 능력을 보여줍니다.

고급 아키텍처

토큰당 45.9B가 활성화되는 456B 매개변수를 갖춘 MiniMax-01은 Lightning Attention, Softmax Attention, MoE를 결합하여 최적의 성능을 제공합니다.

긴 컨텍스트 처리

추론 시 최대 4M 토큰, 학습 시 1M 토큰을 지원하여 광범위한 문서와 복잡한 작업을 효과적으로 처리할 수 있습니다.

비전 기능

MiniMax-VL-01은 336×336에서 2016×2016까지의 동적 해상도를 특징으로 하는 고급 시각 처리 기능을 모델에 확장하여 시각적 작업에서 강력한 성능을 달성합니다.

MiniMax-01 성능 지표

일반 지식 및 추론

MMLU (88.5%)

DROP (87.8%)

프로그래밍 및 개발

HumanEval (86.9%)

MBPP (71.7%)

수학적 추론

GSM8K (94.8%)

MATH (77.4%)

기술 사양

MiniMax-01의 고급 아키텍처와 기능 살펴보기

MiniMax-01 아키텍처 세부사항

Lightning Attention과 MoE를 결합한 고급 신경망 아키텍처

•총 456B 매개변수, 토큰당 45.9B 활성화

•하이브리드 어텐션 메커니즘이 있는 80개 레이어

•128 헤드 차원을 가진 64개의 어텐션 헤드

•9216 은닉 차원을 가진 32개의 전문가

•MoE를 위한 상위-2 라우팅 전략

•은닉 크기: 6144

•어휘 크기: 200,064

•RoPE 위치 인코딩

MiniMax-01 연구

혁신적인 아키텍처와 기술을 통한 AI 발전

하이브리드 아키텍처

Lightning Attention, Softmax Attention, Mixture-of-Experts (MoE) 아키텍처를 고급 병렬 전략과 혁신적으로 결합

긴 컨텍스트 처리

LASP+와 varlen ring attention과 같은 혁신적인 기술을 통해 추론 중 최대 4M 토큰을 지원하는 확장된 컨텍스트 기능

효율적인 스케일링

Linear Attention Sequence Parallelism Plus (LASP+)와 Expert Tensor Parallel (ETP)를 포함한 고급 병렬 전략

기술 논문

혁신적인 아키텍처와 성과를 상세히 설명하는 연구 논문 'MiniMax-01: Scaling Foundation Models with Lightning Attention'을 읽어보세요.

논문 읽기

MiniMax 소개

혁신적인 아키텍처를 통한 AI 발전

회사 개요

MiniMax는 혁신적인 아키텍처와 어텐션 메커니즘 및 전문가 시스템 분야의 첨단 연구를 통해 최첨단 AI 모델을 개발하는 데 전념하고 있습니다.

핵심 기술

당사의 주력 모델은 Lightning Attention, Softmax Attention 및 Mixture-of-Experts (MoE) 아키텍처를 결합하여 다양한 작업에서 우수한 성능을 달성합니다.

MiniMax-01 모델 다운로드

MiniMax-Text-01과 MiniMax-VL-01 모델 중 선택하세요

MiniMax-Text-01

하이브리드 어텐션과 MoE 아키텍처를 갖춘 고급 언어 모델

텍스트

•456B 총 매개변수
•45.9B 활성화 매개변수
•4M 토큰 컨텍스트 길이
•80층 아키텍처

텍스트 모델 다운로드

MiniMax-VL-01

MiniMax-Text-01을 기반으로 구축된 비전-언어 모델

비전-언어

•303M ViT 매개변수
•동적 해상도
•336×336에서 2016×2016
•고급 시각 처리

VL 모델 다운로드

설치 안내

Hugging Face를 통해 모델에 접근하세요:

# For Text Model
git lfs install
git clone https://huggingface.co/MiniMaxAI/MiniMax-Text-01

# For VL Model
git lfs install
git clone https://huggingface.co/MiniMaxAI/MiniMax-VL-01

텍스트 모델 보기 VL 모델 보기

MiniMax-01 배포 옵션

양자화 옵션

최적의 성능을 위한 특수 모듈과 함께 int8 양자화 지원

Int8 가중치 양자화
선택적 모듈 변환
최적화된 메모리 사용

다중 GPU 배포

고급 병렬 전략을 통한 여러 GPU에 효율적인 분산

디바이스 맵 구성
레이어 분산
균형 잡힌 워크로드

모델 로딩

bfloat16 지원과 버퍼 관리를 통한 유연한 로딩 옵션

Bfloat16 정밀도
버퍼 오프로딩
사용자 지정 디바이스 매핑

생성 설정

최적의 출력 제어를 위한 구성 가능한 생성 매개변수

사용자 지정 토큰 제한
캐시 관리
응답 형식 지정

MiniMax-01 사용 방법

MiniMax-01의 기능을 접근하고 활용하는 다양한 방법

옵션 1

접근 방법 선택

온라인 채팅 인터페이스(Hailuo AI), API 플랫폼, 또는 Hugging Face를 통한 직접 모델 접근 중 선택하세요

옵션 2

온라인 채팅

www.hailuo.ai를 방문하여 즉시 MiniMax-01과 채팅을 시작하세요 - 회원가입 불필요

옵션 3

API 통합

개발자 문서와 통합 가이드를 위해 intl.minimaxi.com의 API 플랫폼에 접속하세요

옵션 4

모델 배포

텍스트와 비전-언어 작업을 모두 지원하는 Hugging Face에서 모델을 다운로드하고 배포하세요

지금 시작하기

자주 묻는 질문

MiniMax-01에 대한 일반적인 질문

MiniMax-01의 아키텍처는 어떻게 되나요?

MiniMax-01은 Lightning Attention, Softmax Attention, Mixture-of-Experts (MoE)를 결합한 하이브리드 아키텍처를 특징으로 합니다. 토큰당 45.9B가 활성화되는 총 456B 파라미터, 80개의 레이어, 64개의 어텐션 헤드를 가지고 있습니다.

MiniMax-01의 컨텍스트 길이는 얼마인가요?

MiniMax-01은 추론 시 최대 4백만 토큰, 학습 시 1백만 토큰을 지원하여 긴 문서와 복잡한 작업을 효과적으로 처리할 수 있습니다.

MiniMax-01은 벤치마크에서 어떤 성능을 보이나요?

MiniMax-01은 MMLU에서 88.5%, MMLU-Pro에서 75.7%, GSM8K에서 94.8%를 달성하며 다양한 벤치마크에서 우수한 결과를 보여주어 추론과 문제 해결 능력이 뛰어남을 입증했습니다.

MiniMax-VL-01은 무엇인가요?

MiniMax-VL-01은 MiniMax-Text-01을 기반으로 구축된 비전-언어 모델입니다. 303M 파라미터의 Vision Transformer (ViT)를 특징으로 하며 336×336에서 2016×2016까지의 동적 해상도를 지원합니다.

MiniMax-01을 어떻게 사용할 수 있나요?

온라인 채팅 인터페이스(Hailuo AI), API 플랫폼(intl.minimaxi.com)을 통해 MiniMax-01에 접근하거나 Hugging Face에서 모델을 다운로드할 수 있습니다.

어떤 배포 옵션이 제공되나요?

MiniMax-01은 int8 양자화, 다중 GPU 분산, bfloat16 지원을 통한 유연한 로딩 등 다양한 배포 옵션을 지원합니다.

하드웨어 요구사항은 무엇인가요?

이 모델은 최적의 성능을 위해 사용자 지정 가능한 디바이스 매핑과 부하 분산을 통해 여러 GPU에 배포할 수 있습니다.

API를 사용할 수 있나요?

네, intl.minimaxi.com에서 개발자 문서와 통합 가이드가 포함된 종합적인 API 플랫폼을 제공합니다.

MiniMax-01 시작하기

온라인 채팅 체험

Hailuo AI 채팅 인터페이스를 통해 MiniMax-01의 기능을 체험해보세요

채팅 시작

MiniMax API 액세스

개발자 플랫폼을 통해 MiniMax-01의 기능을 애플리케이션에 통합하세요

플랫폼 방문

모델 탐색

Hugging Face를 통해 MiniMax-01 모델에 액세스하세요. 텍스트 및 비전-언어 버전으로 제공됩니다

모델 보기

연구 자료 읽기

연구 논문을 통해 우리의 아키텍처와 혁신에 대해 알아보세요

논문 보기