版本 1.1
GenAI Studio 版本 1.1 系列已經發行:
- 初始版 v1.1.0 於 2025/04/22 發行。
- 修訂版 v1.1.1 於 2025/04/23 發行。
- 最後修訂版 v1.1.2 於 2025/05/06 發行。
✨ 新增功能?
🔧 重新設計的管理介面與優化架構
- 完全重構的 GenAI Studio 管理介面
- 增強架構以更好地支援推理應用程式,如 Flux.1 Schnell(
文字轉圖像)和 ScrapeGraphAI
- 更輕鬆的管理和簡化多樣化 GenAI 應用程式的部署
🔄 RAGOps 自動同步
- 從指定資料夾自動文件同步直接到您的向量資料庫
- 顯著改善 RAG(檢索增強生成)工作流程效率
📊 即時系統監控
- 整合 Grafana 和 Prometheus 進行即時系統性能追蹤
- 主動檢測並解決潛在問題,避免問題升級

🚀 模型轉換與推理執行時
- 已新增模型轉換功能,以及 EdgeAI SDK 在推理端的可用性
- 下載和部署。這使得將模型部署到邊緣設備變得更加容易。
🎯 使用 LORA 增強微調
- 透過 Unsloth 整合 LORA(低秩適應)微調支援
- 與推理模型如 DeepSeek 相容,進行精確的自定義調整

⚙️ 升級與維護
- AnythingLLM 更新至 v1.7.5,提供最新功能和改善的安全性。
- Phison 韌體 升級至 NXUN202.00,增強硬體性能和穩定性。
第三方套件更新
GenAI Studio 使用以下第三方套件:
- node-exporter (1.8.2) 將所需的主機指標暴露給 Prometheus。
- dcgm-exporter (4.0.0-4.0.1-ubuntu22.04)
將主機 GPU 指標暴露給 Prometheus。 - Prometheus (3.1.0) 收集所需指標作為 Grafana 的資料來源。
- Grafana (11.4.0) 作為資源監控儀表板。
- Phison aiDAPTIVLink (NXUN202.00)
利用中間件進行全參數模型微調。 - Ollama (0.6.2)
作為推理伺服器。 - llama.cpp (full-cuda-b4897)
轉換 GGUF 模型檔案格式。 - vsFTP (3.0.5)
提供模型檔案下載。 - Qdrant (1.12.4)
作為向量資料庫。 - Flowise (2.2.7-patch.1)
自動化 RAGOps 功能和工作流程。 - PostgreSQL (16.4)
作為關聯式資料庫。 - Unsloth (2025.3.18)
使用 LoRA 模式執行模型微調。