MiniMax-01

MiniMax-01: 4560億パラメータを持つ先進的な言語モデル

ハイブリッド注意機構とMoEアーキテクチャを特徴とする強力な言語モデルで、最大4Mトークンのコンテキスト長で推論、数学、コーディングタスクに優れています

4560億パラメータ

459億アクティブパラメータ

4Mトークンコンテキスト

MiniMax-01を試す APIにアクセス

無料ウェブサイト統合

シンプルなiframeコードで高度なAIチャットインターフェースをあなたのウェブサイトに統合できます。登録不要です。

MiniMax-01 チャットを試す

MiniMax チャット

Mistralチャットを試す DeepSeekチャットを試す

主な機能

MiniMax-01の強力な機能を発見する

ハイブリッドアーキテクチャ

Lightning Attention、Softmax Attention、Mixture-of-Experts (MoE)を革新的に組み合わせ、総パラメータ数456B、トークンごとの有効パラメータ数45.9B

•80層アーキテクチャ
•64個のアテンションヘッド
•32個のエキスパートネットワーク
•Top-2ルーティング戦略

ベンチマークパフォーマンス

MMLU (88.5%)、MMLU-Pro (75.7%)、GSM8K (94.8%)を含む複数のベンチマークで優れた結果を達成

•強力な数学的推論能力
•高度なコーディング能力
•複雑な問題解決能力
•長文脈理解能力

長文脈処理

推論時に最大400万トークン、学習時に最大100万トークンをサポート

•拡張されたコンテキストウィンドウ
•効率的なトークン処理
•文書理解
•大規模分析

高度なアテンション機構

7層のlightningアテンション層ごとにsoftmaxアテンションを配置したハイブリッドアテンション機構

•強化された文脈理解
•効率的な情報処理
•バランスの取れたアテンション分布
•最適化されたパフォーマンス

エキスパートネットワーク

隠れ層次元9216と効率的なルーティング戦略を持つ32の専門化エキスパートネットワーク

•専門化された処理
•動的ルーティング
•タスク最適化
•効率的な計算

モデルアーキテクチャ

最適なパフォーマンスと効率性のために設計された最先端のアーキテクチャ

•隠れ層サイズ: 6144
•語彙サイズ: 200,064
•RoPE位置エンコーディング
•高度なパラメータ共有

多用途アプリケーション

数学、コーディング、推論を含む様々な分野における包括的な能力

•数学的計算
•コード生成
•複雑な推論
•知識検索

パフォーマンス最適化

高度な技術による学習と推論の両方に対する高度な最適化

•効率的なパラメータ活性化
•バランスの取れた負荷分散
•最適化されたメモリ使用
•高速な推論速度

MiniMax-01 の成果

言語と視覚タスクにおける優れたパフォーマンス

ベンチマークにおける卓越性

MiniMax-01 は、MMLU で 88.5%、MMLU-Pro で 75.7%、GSM8K で 94.8% を達成し、推論と問題解決において優れた能力を実証しています。

先進的なアーキテクチャ

トークンごとに 45.9B のパラメータが活性化される 456B パラメータを搭載し、Lightning Attention、Softmax Attention、MoE を組み合わせて最適なパフォーマンスを実現します。

長文脈処理

推論時に最大 4M トークン、学習時に 1M トークンをサポートし、大規模な文書や複雑なタスクの効果的な処理を可能にします。

視覚処理能力

MiniMax-VL-01 は、336×336 から 2016×2016 までの動的解像度を特徴とし、視覚タスクで優れたパフォーマンスを達成する高度な視覚処理機能でモデルを拡張します。

MiniMax-01 性能指標

一般知識と推論能力

MMLU (88.5%)

DROP (87.8%)

プログラミングと開発

HumanEval (86.9%)

MBPP (71.7%)

数学的推論

GSM8K (94.8%)

MATH (77.4%)

技術仕様

MiniMax-01の先進的なアーキテクチャと性能を詳しく解説

MiniMax-01 アーキテクチャの詳細

Lightning AttentionとMoEを組み合わせた先進的なニューラルアーキテクチャ

•総パラメータ数456B、トークンあたり45.9Bが活性化

•ハイブリッドアテンション機構を持つ80層

•128次元の64アテンションヘッド

•隠れ次元9216の32エキスパート

•MoEのTop-2ルーティング戦略

•隠れ層サイズ: 6144

•語彙サイズ: 200,064

•RoPE位置エンコーディング

MiniMax-01 リサーチ

革新的なアーキテクチャと技術によるAIの進歩

ハイブリッドアーキテクチャ

Lightning Attention、Softmax Attention、Mixture-of-Experts (MoE)アーキテクチャを高度な並列戦略と組み合わせた革新的な設計

長文脈処理

LASP+や可変長リングアテンションなどの革新的な技術により、推論時に最大4Mトークンまでのコンテキストをサポート

効率的なスケーリング

Linear Attention Sequence Parallelism Plus (LASP+)やExpert Tensor Parallel (ETP)などの高度な並列戦略

技術論文

革新的なアーキテクチャと成果について詳述した研究論文「MiniMax-01: Scaling Foundation Models with Lightning Attention」をご覧ください。

論文を読む

MiniMaxについて

革新的なアーキテクチャによるAIの進歩

会社概要

MiniMaxは、革新的なアーキテクチャと、アテンションメカニズムおよびエキスパートシステムにおける先進的な研究を通じて、最先端のAIモデルの開発に専念しています。

コア技術

当社の主力モデルは、Lightning Attention、Softmax Attention、Mixture-of-Experts (MoE)アーキテクチャを組み合わせ、様々なタスクで優れたパフォーマンスを実現しています。

MiniMax-01 モデルのダウンロード

MiniMax-Text-01 と MiniMax-VL-01 モデルからお選びください

MiniMax-Text-01

ハイブリッド注意機構とMoEアーキテクチャを備えた高度な言語モデル

テキスト

•総パラメータ数 456B
•有効パラメータ数 45.9B
•コンテキスト長 4M トークン
•80層アーキテクチャ

テキストモデルをダウンロード

MiniMax-VL-01

MiniMax-Text-01 をベースに構築されたビジョン言語モデル

ビジョン言語

•ViT パラメータ数 303M
•動的解像度
•336×336 から 2016×2016
•高度な視覚処理

VL モデルをダウンロード

インストール手順

Hugging Face でモデルにアクセス：

# For Text Model
git lfs install
git clone https://huggingface.co/MiniMaxAI/MiniMax-Text-01

# For VL Model
git lfs install
git clone https://huggingface.co/MiniMaxAI/MiniMax-VL-01

テキストモデルを表示 VL モデルを表示

MiniMax-01 デプロイメントオプション

量子化オプション

最適なパフォーマンスのための専用モジュールによるint8量子化のサポート

Int8重み量子化
選択的モジュール変換
最適化されたメモリ使用

マルチGPUデプロイメント

高度な並列戦略による複数GPUへの効率的な分散

デバイスマップ設定
レイヤー分散
バランスの取れた負荷分散

モデルローディング

bfloat16サポートとバッファ管理による柔軟な読み込みオプション

Bfloat16精度
バッファオフローディング
カスタムデバイスマッピング

生成設定

最適な出力制御のための設定可能な生成パラメータ

カスタムトークン制限
キャッシュ管理
レスポンスフォーマット

MiniMax-01の使い方

MiniMax-01の機能にアクセスし活用する複数の方法

オプション 1

アクセス方法の選択

オンラインチャットインターフェース（Hailuo AI）、APIプラットフォーム、またはHugging Faceを通じた直接モデルアクセスから選択できます

オプション 2

オンラインチャット

www.hailuo.aiにアクセスして、すぐにMiniMax-01とチャットを開始できます - 登録不要

オプション 3

API連携

開発者向けドキュメントと連携ガイドについては、intl.minimaxi.comのAPIプラットフォームにアクセスしてください

オプション 4

モデルのデプロイ

Hugging Faceからテキストおよび視覚言語タスク対応のモデルをダウンロードしてデプロイできます

今すぐ始める

よくある質問

MiniMax-01に関するよくある質問

MiniMax-01のアーキテクチャとは？

MiniMax-01は、Lightning Attention、Softmax Attention、Mixture-of-Experts (MoE)を組み合わせたハイブリッドアーキテクチャを採用しています。総パラメータ数は456B、トークンごとに45.9Bが有効化され、80レイヤーと64のアテンションヘッドを備えています。

MiniMax-01のコンテキスト長は？

MiniMax-01は推論時に最大400万トークン、学習時に100万トークンをサポートし、長文書や複雑なタスクを効果的に処理できます。

MiniMax-01のベンチマーク性能は？

MiniMax-01は様々なベンチマークで優れた結果を達成しており、MMLUで88.5%、MMLU-Proで75.7%、GSM8Kで94.8%のスコアを記録し、推論と問題解決において優れた能力を示しています。

MiniMax-VL-01とは？

MiniMax-VL-01は、MiniMax-Text-01をベースに構築された視覚言語モデルです。303MパラメータのVision Transformer (ViT)を搭載し、336×336から2016×2016までの動的解像度をサポートしています。

MiniMax-01にはどうやってアクセスできますか？

MiniMax-01へは、オンラインチャットインターフェース（Hailuo AI）、APIプラットフォーム（intl.minimaxi.com）、またはHugging Faceからモデルをダウンロードしてアクセスできます。

どのようなデプロイメントオプションがありますか？

MiniMax-01は、int8量子化、マルチGPU分散、bfloat16サポートによる柔軟な読み込みなど、様々なデプロイメントオプションをサポートしています。

ハードウェア要件は何ですか？

モデルは複数のGPUにわたってデプロイでき、最適なパフォーマンスのためにカスタマイズ可能なデバイスマッピングとロードバランシングを提供します。

APIは利用可能ですか？

はい、開発者向けドキュメントと統合ガイドを備えた包括的なAPIプラットフォームをintl.minimaxi.comで提供しています。

MiniMax-01を始めよう

オンラインチャットを試す

Hailuo AIチャットインターフェースを通じてMiniMax-01の機能を体験

チャットを開始

MiniMax APIへのアクセス

開発者プラットフォームを通じてMiniMax-01の機能をアプリケーションに統合

プラットフォームへ

モデルを探索

Hugging Faceを通じてMiniMax-01のテキストおよび視覚言語バージョンのモデルにアクセス

モデルを見る

研究論文を読む

研究論文で私たちのアーキテクチャと革新について学ぶ

論文を見る