版本 1.2
GenAI Studio 版本 1.2 系列已經發行:
- 初始版 v1.2.0 於 2025/04/22 發行。
- 尚未發行修訂版。
✨ 新增功能
模型驗證自動化
引入 Twinkle 評估框架進行自動化的模型驗證及評估。獲得模型性能的客觀洞察,並充滿信心地做出資料驅動的決策。
模型轉換器
現在支援多種模型轉換器,以滿足不同的部署需求並在不同硬體平台上優化性能:
- Intel OpenVINO - 針對邊緣 Intel GPU 和 NPU 優化,提供高效推理
- Nvidia TensorRT LLM - 為 Nvidia 平台提供卓越的加速性能
- MLC - 對一般平台和 Nvidia Jetson 設備具有廣泛相容性
- GGUF Q4Q2 - 來自研華的創新技術,透過基於困惑度的權重識別和 Q2 量化將推理記憶體使用量減少 20%
訊息
這些轉換器是獨立的安裝程式,作為插件運作,與主要的 GenAI Studio 程式分離。
MCP 協議支援與工具
完整的 MCP(模型上下文協議)支援以及全面的工具:
- 方便的 CLI 工具,無縫整合第三方 MCP 伺服器
- 直觀的 UI 用於 MCP 伺服器和工具管理
- Grafana 儀表板整合 - 在監控儀表板中嵌入 MCP 伺服器,具有智能助理分析和可操作的建議
系統資源監控診斷工具
內建的 MCP 伺服器,將系統資源監控的重點數據透過模型分析並產生報告式的彙整結果。

🚀 增強功能
系統提示版本追蹤
在編輯工作區系統提示時,透過本地版本儲存增強提示管理:
- 輕鬆存取提示歷史
- 快速回滾到先前的高性能提示版本
- 為模型實驗提供更大彈性
資料集生成器多語言與模型支援
資料集生成器的重大增強:
- 多語言輸出支援 - 生成繁體中文、簡體中文、日文、韓文和英文的資料集
- 靈活的模型選擇 - 支援本地和雲端模型進行資料集生成
模型支援更新
為了讓您保持在 AI 的最前沿,我們大幅擴展了模型支援,包括 Gemma 3、Qwen 3 和 Phi 4 系列。 查看我們的支援模型以了解更多詳情。
⚙️ 升級與維護
- AnythingLLM 更新至 v1.8.2,提供最新功能和改善的安全性。
- Phison 韌體 升級至 NXUN203.00,增強硬體性能和穩定性。
第三方套件更新
GenAI Studio 使用以下第三方套件:
- dcgm-exporter (4.2.3-4.1.3-ubuntu22.04)
此套件將 GPU 的監控指標傳送給 Prometheus 進行搜集。 - Flowise (2.2.7-patch.1)
GenAI Studio 透過此套件提供自動化 RAGOps 的功能和工作流程。 - Grafana (12.0.2)
此套件將 Prometheus 搜集的監控數據展示成系統的資源監控儀表板。 - llama.cpp (full-cuda-b5947)
此套件提供 GenAI Studio 將模型轉換為 GGUF 檔案格式的能力。 - mlc-llm (0.20.dev31)
此套件提供將模型轉換為 MLC 檔案格式的能力。 - node-exporter (1.9.1)
此套件將所需的主機監控指標傳送給 Prometheus 進行搜集。 - Ollama (0.11.3)
此套件為模型推理伺服器。 - OpenVINO (1.24.0)
此套件提供將模型轉換為 OpenVINO 檔案格式的能力。 - Phison aiDAPTIVLink (NXUN203.00)
GenAI Studio 利用此套件提供使用者執行全參數模型微調功能。 - PostgreSQL (16.9)
此套件提供關聯式資料庫的功能。 - Prometheus (3.5.0)
此套件會收集監控所需的所有指標數據以作為 Grafana 的資料來源。 - Qdrant (1.15.0)
此套件提供向量資料庫的儲存能力。 - tensorrt-llm (0.19.0)
此套件提供將模型轉換為 TensorRT 檔案格式的能力。 - Unsloth (2025.8.5)
GenAI Studio 利用此套件提供使用者對模型執行 LoRA 微調的能力。 - vsFTP (3.0.5)
此套件提供 GenAI Studio 將轉換過的模型檔案可讓外部系統進行下載的功能。