📌 本文重點
- M3 支援 100 萬 token 長上下文與多模態輸入
- 專門處理長文件、整個程式庫與 Agent 工作流
- 可雲端快速試用,也能本地自架整合現有工具鏈
- 先從一個最痛的長文或專案開始導入
用一句話說:MiniMax M3 是一個開放權重、支援 100 萬 token 長上下文 + 多模態輸入 的模型,專門幫你處理「報告太長、程式碼庫太大、Agent 工作流太複雜」這三種麻煩事。
💡 關鍵: 100 萬 token 長上下文代表可以一次塞進整份大型專案文件或程式庫索引,而不必自己切 chunk 或做向量搜尋。
官方介紹與下載:https://www.minimax.io/models/text/m3(The Decoder 報導:https://the-decoder.com/minimax-m3-open-weight-model-with-a-million-token-context-challenges-proprietary-leaders/)
核心功能:長文、程式碼、Agent 一次處理
1. 100 萬 token 長上下文:整份專案文件一次丟進去
能做什麼?
- 一次放入:完整專案文件夾匯出的 Markdown、法規 PDF、產品說明書、研究報告
- 不用切段:不必自己分 chunk、做向量搜尋,直接把「全部內容」交給模型
- 查詢風格:像在問一位看完整專案的同事
怎麼用(長文閱讀 Prompt 範本)
- 準備一個壓縮檔 / 合併文件,例如
project_docs.md(可用腳本把多個 Markdown / txt 串成一個檔案)。 - 在推理介面(API、Notebook 或 Web UI)中,把全文貼進
system/user區。
範例 Prompt 模板:
你是一位技術專案經理。以下是整個專案的所有文件(需求、設計、會議紀錄、API 文件):
--- 專案全文開始 ---
{{整份文件內容}}
--- 專案全文結束 ---
請依照以下格式輸出:
1. 專案一句話摘要(不超過 30 字)
2. 3 個主要目標
3. 5 個關鍵風險(附來源段落或章節名稱)
4. 下一步行動建議(列出 5–10 條,可直接貼進 Jira 當任務)
實際行動: 找一份你手上最頭痛、超長的專案文件,直接用上面模板測一次。
2. 原生多模態:文字 + 圖像一起理解
M3 支援把文字與圖片一起丟進上下文。例如:
- 產品 PRD + UI 圖稿,一次請它找出規格與設計不一致之處
- 報告 PDF 截圖 + 補充說明文字,一起整理重點
圖片搭配 Prompt 範本:
以下是某個產品的文字需求說明,以及對應的 UI 設計稿截圖(多張):
文字需求:
{{需求文字}}
圖片:
- image_1:登入頁
- image_2:帳號設定頁
- image_3:權限管理頁
請列出:
1. 每張圖和文字需求的對應關係
2. 不符合需求或缺漏的地方
3. 建議 UI 或流程調整(用條列)
實際行動: 把一份 PRD + 幾張 Figma 匯出的 PNG 丟給 M3,看它幫你做「設計對規格」檢查。
3. 為程式碼與 Agent 優化:整 repo 理解 + 多輪工具調用
根據社群測試與官方說明,M3 在程式碼生成與 Agent 任務上做了特別優化:
- 長上下文讓它能一次「看完整個 repo 的索引」
- 可以在一個對話裡做多輪「工具調用→讀結果→改方案」
💡 關鍵: 對整個 repo 建立「程式碼地圖」再交給 M3,可以讓它在第一次對話就掌握系統結構並規劃重構與 Agent 工作流。
整個 repo 程式碼導覽 Prompt
- 先用腳本產生「程式碼地圖」,例如:
# 只列出檔名 + 前幾行註解/類別宣告
python scripts/make_repo_index.py > repo_index.txt
- 把
repo_index.txt+ 關鍵檔案內容一起貼給 M3:
你是一位資深軟體工程師。以下是某個專案的程式碼地圖與部分檔案內容。
--- repo index ---
{{repo_index.txt}}
--- end repo index ---
問題:
1. 幫我畫出系統主要模組與資料流(用文字 + 簡單 ASCII 圖)
2. 指出如果要「加入 OAuth 登入」,可能要改動的檔案與大致步驟
3. 給出最小修改範圍的 refactor 計畫(列出任務清單)
Agent 工作流拆解 Prompt
把它當成「任務拆解器 + 工具 orchestrator」的腦:
你是一個 AI Agent 系統的規劃師。你可以使用以下工具:
- tool_search_issues:搜尋 Jira issue
- tool_run_tests:執行 CI 測試
- tool_open_pr:建立 Pull Request
需求:
「每天自動檢查新的 bug issue,找出影響登入流程的,跑測試,通過就開 PR。」
請輸出:
1. 將需求拆成 5–10 個可實作的 Agent 步驟
2. 每個步驟會用到的工具(如有)
3. 對 orchestrator 的假想 DSL / YAML 配置範例
實際行動: 選一個你常做的重複開發流程,用上面模板請 M3 幫你轉成可實作的 Agent 腳本草稿。
適合誰用:三種典型場景
1. PM / 研究員:長報告與專案文件總結
使用方式:
- 把所有會議紀錄、需求文件、Excel 轉成文字(或貼 PDF OCR 結果),合併成一份長文
- 用「長文閱讀模板」請 M3:
- 整理專案脈絡與時間線
- 整理「決策原因」與「未決事項」
- 產出可以直接貼進 Notion / Confluence 的摘要
行動建議: 對每個專案建立一份「M3 專案總結」,讓新成員用它快速上手。
2. 後端 / 全端工程師:整 repo 理解與重構
使用方式:
- 新接手專案,先用腳本生成 repo index → 丟給 M3 產生系統說明
- 要重構時,請它根據長上下文:
- 找出高度耦合模組
- 給出重構順序與風險點
- 產生對應的 Git 分支與 PR 策略建議
行動建議: 每次大改版前,用 M3 先產一份「重構設計」,再與團隊人工過一遍。
3. 自動化 / AI Agent 開發者:多輪工具調用工作流
使用方式:
- 把你現有的工具清單(API spec、CLI 說明)全部貼給 M3
- 要求它:
- 定義任務拆解(如報表產出、自動回覆客服)
- 設計工具調用順序與錯誤處理策略
行動建議: 先挑一個「每天會做,但步驟固定」的流程,例如:生成日報、同步任務狀態,讓 M3 幫你設計第一版 Agent workflow。
怎麼開始:雲端 / 本地快速跑起來
1. 雲端:直接用官方 / 社群 API
如果你只是想先試效果:
- 到官方頁面申請:https://www.minimax.io/models/text/m3
- 拿到 API key 後,在自己的腳本或 Postman 裡調用:
curl https://api.minimax.io/v1/chat/completions \
-H "Authorization: Bearer $MINIMAX_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "m3",
"messages": [
{"role": "user", "content": "幫我總結以下專案文件..."}
]
}'
適合: 想驗證長上下文/多模態效果、不急著本地部署的團隊。
2. 本地 / 自架:Hugging Face + 官方 Docker
A. 用 Hugging Face + vLLM / Ollama(範例)
- 在 Hugging Face 搜尋
MiniMax/M3(實際名稱以官方為準)。 - 用 vLLM 啟動:
pip install vllm
vllm serve MiniMax/M3 --port 8000 --dtype bfloat16
- 測試:
curl http://localhost:8000/v1/chat/completions \
-H "Content-Type: application/json" \
-d '{
"model": "MiniMax/M3",
"messages": [{"role": "user", "content": "你好,幫我總結這份文件"}]
}'
B. 用官方 Docker 快速跑起
- 下載官方映像(名稱以官方文件為準):
docker pull minimax/m3:latest
- 啟動:
docker run -d --gpus all -p 8000:8000 minimax/m3:latest
- 之後的使用方式就和一般 OpenAI 相容 API 類似。
實際行動: 用 Docker 跑起來後,先跑一個「長文閱讀模板」,確認你的 GPU 記憶體足夠,觀察響應時間。
💡 關鍵: 若你已採用 OpenAI 相容 API,將
base_url換成 M3 服務即可快速 A/B 測試長上下文任務的效果。
3. 跟現有工具鏈整合:VS Code、Orchestrator、CLI
VS Code:當成本地 Copilot
- 安裝任一個支援自訂 LLM endpoint 的 VS Code 擴充套件(如
Code GPT、Continue)。 - 將模型 endpoint 設為你自架的 M3 伺服器 URL。
- 專案開啟後:
- 用「整 repo 導覽」prompt 請它解釋架構
- 在單檔內請它重寫函式、加註解
與開源 orchestrator 整合
你可以在以下框架中把 M3 當成主要「腦」:
LangChain/LlamaIndex:用它處理長上下文和工具調用規劃CrewAI/ OpenAI-compatible orchestrators:直接把OPENAI_BASE_URL指到你的 M3 伺服器
簡單 YAML 範例(假想):
llm:
type: openai-compatible
base_url: http://localhost:8000/v1
model: MiniMax/M3
agent:
tools:
- search_issues
- run_tests
max_iterations: 10
實際行動: 在你現有的 Agent 專案,把原本的 gpt-4 或其他模型,先在「規劃/總結」節點換成 M3,測試對長上下文任務的改善。
小結:先從一個最痛的長文或程式庫開始
不用一次把所有流程都搬到 M3。挑一個:
- 最長、最難讀的一份文件
- 或你最不熟的一個 codebase
用上面給的三組模板(長文閱讀、程式碼導覽、Agent 任務拆解)跑一次,你就能感受到「百萬 token 長上下文 + 開放權重」在實際工作中的差別。
🚀 你現在可以做的事
- 挑選一份最頭痛的長報告或專案文件,套用「長文閱讀模板」實測 M3
- 對一個新接手的 repo 生成
repo_index.txt,用「整個 repo 導覽 Prompt」請 M3 說明架構- 在現有 Agent 專案中,把規劃/總結節點的模型改成 M3,觀察長上下文任務表現差異

