跳至主要内容
版本:1.2.0

版本 1.1

GenAI Studio 版本 1.1 系列已經發行:

  • 初始版 v1.1.0 於 2025/04/22 發行。
  • 修訂版 v1.1.1 於 2025/04/23 發行。
  • 最後修訂版 v1.1.2 於 2025/05/06 發行。

✨ 新增功能?

🔧 重新設計的管理介面與優化架構

  • 完全重構的 GenAI Studio 管理介面
  • 增強架構以更好地支援推理應用程式,如 Flux.1 Schnell(文字轉圖像)和 ScrapeGraphAI 重新設計的管理介面
  • 更輕鬆的管理和簡化多樣化 GenAI 應用程式的部署

🔄 RAGOps 自動同步

  • 從指定資料夾自動文件同步直接到您的向量資料庫
  • 顯著改善 RAG(檢索增強生成)工作流程效率

📊 即時系統監控

  • 整合 Grafana 和 Prometheus 進行即時系統性能追蹤
  • 主動檢測並解決潛在問題,避免問題升級 即時系統監控

🚀 模型轉換與推理執行時

  • 已新增模型轉換功能,以及 EdgeAI SDK 在推理端的可用性
  • 下載和部署。這使得將模型部署到邊緣設備變得更加容易。

🎯 使用 LORA 增強微調

  • 透過 Unsloth 整合 LORA(低秩適應)微調支援
  • 與推理模型如 DeepSeek 相容,進行精確的自定義調整 使用 LORA 增強微調

⚙️ 升級與維護

  • AnythingLLM 更新至 v1.7.5,提供最新功能和改善的安全性。
  • Phison 韌體 升級至 NXUN202.00,增強硬體性能和穩定性。

第三方套件更新

GenAI Studio 使用以下第三方套件:

  • node-exporter (1.8.2) 將所需的主機指標暴露給 Prometheus。
  • dcgm-exporter (4.0.0-4.0.1-ubuntu22.04)
    將主機 GPU 指標暴露給 Prometheus。
  • Prometheus (3.1.0) 收集所需指標作為 Grafana 的資料來源。
  • Grafana (11.4.0) 作為資源監控儀表板。
  • Phison aiDAPTIVLink (NXUN202.00)
    利用中間件進行全參數模型微調。
  • Ollama (0.6.2)
    作為推理伺服器。
  • llama.cpp (full-cuda-b4897)
    轉換 GGUF 模型檔案格式。
  • vsFTP (3.0.5)
    提供模型檔案下載。
  • Qdrant (1.12.4)
    作為向量資料庫。
  • Flowise (2.2.7-patch.1)
    自動化 RAGOps 功能和工作流程。
  • PostgreSQL (16.4)
    作為關聯式資料庫。
  • Unsloth (2025.3.18)
    使用 LoRA 模式執行模型微調。