跳至主要内容

版本：1.2.0

版本 1.1

GenAI Studio 版本 1.1 系列已經發行：

初始版 v1.1.0 於 2025/04/22 發行。
修訂版 v1.1.1 於 2025/04/23 發行。
最後修訂版 v1.1.2 於 2025/05/06 發行。

✨ 新增功能？

🔧 重新設計的管理介面與優化架構

完全重構的 GenAI Studio 管理介面
增強架構以更好地支援推理應用程式，如 Flux.1 Schnell（文字轉圖像）和 ScrapeGraphAI
更輕鬆的管理和簡化多樣化 GenAI 應用程式的部署

🔄 RAGOps 自動同步

從指定資料夾自動文件同步直接到您的向量資料庫
顯著改善 RAG（檢索增強生成）工作流程效率

📊 即時系統監控

整合 Grafana 和 Prometheus 進行即時系統性能追蹤
主動檢測並解決潛在問題，避免問題升級

🚀 模型轉換與推理執行時

已新增模型轉換功能，以及 EdgeAI SDK 在推理端的可用性
下載和部署。這使得將模型部署到邊緣設備變得更加容易。

🎯 使用 LORA 增強微調

透過 Unsloth 整合 LORA（低秩適應）微調支援
與推理模型如 DeepSeek 相容，進行精確的自定義調整

⚙️ 升級與維護

AnythingLLM 更新至 v1.7.5，提供最新功能和改善的安全性。
Phison 韌體 升級至 NXUN202.00，增強硬體性能和穩定性。

第三方套件更新

GenAI Studio 使用以下第三方套件：

node-exporter (1.8.2) 將所需的主機指標暴露給 Prometheus。
dcgm-exporter (4.0.0-4.0.1-ubuntu22.04)
將主機 GPU 指標暴露給 Prometheus。
Prometheus (3.1.0) 收集所需指標作為 Grafana 的資料來源。
Grafana (11.4.0) 作為資源監控儀表板。
Phison aiDAPTIVLink (NXUN202.00)
利用中間件進行全參數模型微調。
Ollama (0.6.2)
作為推理伺服器。
llama.cpp (full-cuda-b4897)
轉換 GGUF 模型檔案格式。
vsFTP (3.0.5)
提供模型檔案下載。
Qdrant (1.12.4)
作為向量資料庫。
Flowise (2.2.7-patch.1)
自動化 RAGOps 功能和工作流程。
PostgreSQL (16.4)
作為關聯式資料庫。
Unsloth (2025.3.18)
使用 LoRA 模式執行模型微調。

✨ 新增功能？
第三方套件更新