跳至主要内容
版本:1.2.0

版本 1.2

GenAI Studio 版本 1.2 系列已經發行:

  • 初始版 v1.2.0 於 2025/04/22 發行。
  • 尚未發行修訂版。

✨ 新增功能

模型驗證自動化

引入 Twinkle 評估框架進行自動化的模型驗證及評估。獲得模型性能的客觀洞察,並充滿信心地做出資料驅動的決策。

模型轉換器

現在支援多種模型轉換器,以滿足不同的部署需求並在不同硬體平台上優化性能:

  • Intel OpenVINO - 針對邊緣 Intel GPU 和 NPU 優化,提供高效推理
  • Nvidia TensorRT LLM - 為 Nvidia 平台提供卓越的加速性能
  • MLC - 對一般平台和 Nvidia Jetson 設備具有廣泛相容性
  • GGUF Q4Q2 - 來自研華的創新技術,透過基於困惑度的權重識別和 Q2 量化將推理記憶體使用量減少 20%
訊息

這些轉換器是獨立的安裝程式,作為插件運作,與主要的 GenAI Studio 程式分離。

MCP 協議支援與工具

完整的 MCP(模型上下文協議)支援以及全面的工具:

  • 方便的 CLI 工具,無縫整合第三方 MCP 伺服器
  • 直觀的 UI 用於 MCP 伺服器和工具管理
  • Grafana 儀表板整合 - 在監控儀表板中嵌入 MCP 伺服器,具有智能助理分析和可操作的建議

系統資源監控診斷工具

內建的 MCP 伺服器,將系統資源監控的重點數據透過模型分析並產生報告式的彙整結果。 res-diag

🚀 增強功能

系統提示版本追蹤

在編輯工作區系統提示時,透過本地版本儲存增強提示管理:

  • 輕鬆存取提示歷史
  • 快速回滾到先前的高性能提示版本
  • 為模型實驗提供更大彈性

資料集生成器多語言與模型支援

資料集生成器的重大增強:

  • 多語言輸出支援 - 生成繁體中文、簡體中文、日文、韓文和英文的資料集
  • 靈活的模型選擇 - 支援本地和雲端模型進行資料集生成

模型支援更新

為了讓您保持在 AI 的最前沿,我們大幅擴展了模型支援,包括 Gemma 3、Qwen 3 和 Phi 4 系列。 查看我們的支援模型以了解更多詳情。

⚙️ 升級與維護

  • AnythingLLM 更新至 v1.8.2,提供最新功能和改善的安全性。
  • Phison 韌體 升級至 NXUN203.00,增強硬體性能和穩定性。

第三方套件更新

GenAI Studio 使用以下第三方套件:

  • dcgm-exporter (4.2.3-4.1.3-ubuntu22.04)
    此套件將 GPU 的監控指標傳送給 Prometheus 進行搜集。
  • Flowise (2.2.7-patch.1)
    GenAI Studio 透過此套件提供自動化 RAGOps 的功能和工作流程。
  • Grafana (12.0.2)
    此套件將 Prometheus 搜集的監控數據展示成系統的資源監控儀表板。
  • llama.cpp (full-cuda-b5947)
    此套件提供 GenAI Studio 將模型轉換為 GGUF 檔案格式的能力。
  • mlc-llm (0.20.dev31)
    此套件提供將模型轉換為 MLC 檔案格式的能力。
  • node-exporter (1.9.1)
    此套件將所需的主機監控指標傳送給 Prometheus 進行搜集。
  • Ollama (0.11.3)
    此套件為模型推理伺服器。
  • OpenVINO (1.24.0)
    此套件提供將模型轉換為 OpenVINO 檔案格式的能力。
  • Phison aiDAPTIVLink (NXUN203.00)
    GenAI Studio 利用此套件提供使用者執行全參數模型微調功能。
  • PostgreSQL (16.9)
    此套件提供關聯式資料庫的功能。
  • Prometheus (3.5.0)
    此套件會收集監控所需的所有指標數據以作為 Grafana 的資料來源。
  • Qdrant (1.15.0)
    此套件提供向量資料庫的儲存能力。
  • tensorrt-llm (0.19.0)
    此套件提供將模型轉換為 TensorRT 檔案格式的能力。
  • Unsloth (2025.8.5)
    GenAI Studio 利用此套件提供使用者對模型執行 LoRA 微調的能力。
  • vsFTP (3.0.5)
    此套件提供 GenAI Studio 將轉換過的模型檔案可讓外部系統進行下載的功能。