推理聊天
在 GenAI Studio 中,工作區是一個核心的組織概念,旨在以分隔和特定上下文的方式來結構化和管理文件、對話以及與語言模型的互動。

GenAI Studio 中的工作區概念
GenAI Studio 中的工作區是一個邏輯分區,作為專門環境來群組相關文件、聊天和配置。它使用戶能夠通過隔離上下文來組織與 AI 模型的互動, 確保對話和檢索的資訊與特定主題、專案或用例相關。將工作區視為一個「容器」或「思考空間」,其中文件及其相關的嵌入(向量化表示) 被獨立於其他工作區進行儲存和存取。
工作區的主要特性
- 文件容器化:
- 每個工作區可以容納一組獨特的文件(例如 PDF、TXT、DOCX 等)。當文件上傳到 GenAI Studio 後並未與工作區有所關連, 必須明確的將文件移動或嵌入到需要的工作區才能供工作區使用。
- 此特性確保 AI 僅會從工作區關聯的文件中檢索資訊,防止不相關或跨情境的資料影響回應。
- 上下文清晰度:
- 工作區維護其自己的對話上下文。當您在工作區內與 AI 互動時,模型僅參考與該工作區相關的文件和聊天歷史。
- 此隔離消除了重疊或無關資訊造成的混淆,使回應更加準確和聚焦。
- 隱私和隔離:
- 工作區之間不會「交談」。嵌入在一個工作區中的文件對另一個工作區是不可存取的,確保資料隱私和隔離。
- 此功能對於管理多個專案的團隊或個人特別有用,因為它保持敏感或專案特定資訊的分隔。
- 可自定義配置:
- 每個工作區可以配置自己的設置,如特定的語言模型 (LLM)、嵌入模型、系統提示、回應溫度或文件相似度閾值。
- 例如,用於技術研究的工作區可能使用精確的低溫度模型,而創意寫作工作區可能使用更開放的高溫度模型。
- 持久儲存:
- 工作區及其文件、嵌入和聊天歷史都儲存在配置的儲存系統中。
- 此持久性確保關閉和重新啟動 GenAI Studio 不會導致資料遺失,允許用戶無縫地恢復工作。
工作區在實務中的運作方式
當用戶與 GenAI Studio 互動時,涉及工作區的工作流程通常遵循以下步驟:
- 工作區建立:
- 用戶建立工作區,為其命名(例如「Alpha 專案」、「食譜收集」或「法律研究」)。
- 此工作區成為所有相關文件和互動的專用空間。
- 文件嵌入:
- 文件上傳到 GenAI Studio,然後移動到特定工作區。在此過程中,文件被分塊為較小的文字段落,使用嵌入模型轉換為數值向量。
- 這些向量儲存在向量資料庫 (Qdrant) 中,並與工作區相關聯。
- 使用檢索增強生成 (RAG) 的查詢處理:
- 當用戶在工作區中提問時,GenAI Studio 使用 RAG 處理查詢:
- 查詢與向量資料庫匹配,從工作區的文件中檢索最相關的文字段落。
- 通常選擇 4 至 6 個相關段落,並與工作區的系統提示和聊天歷史一起傳遞給 LLM 作為上下文。
- LLM 然後基於此上下文生成回應,確保答案以工作區的文件為基礎。
- 當用戶在工作區中提問時,GenAI Studio 使用 RAG 處理查詢:
- 聊天和代理互動:
- 工作區支援對話和基於查詢的互動。在對話模式中,AI 保留工作區內先前訊息的上下文。在查詢模式中,它基於文件內容提供直接答案。
- AI 代理在被調用時(例如通過
@agent),會在工作區的上下文內運行,且可以執行如總結文件、抓取網站或生成圖表等任務, 同時遵守工作區的邊界。
工作區概念的優勢
- 組織:工作區提供了一種結構化的方式來管理文件和對話,使處理多個專案或主題時變得更容易,且不會重疊。
- 效率:向量快取和文件共享減少了計算開銷,因為嵌入被重複使用而不是重新計算。
- 靈活性:用戶可以根據特定需求量身訂製每個工作區,從模型選擇到提示設計,在單一應用程式內實現多樣化用例。
- 可擴展性:工作區透過多用戶權限支援協作,允許團隊在共享專案上工作,同時維持存取控制。
- 隱私:工作區的分離確保敏感資料保持在其預期上下文內,增強安全性。
用例範例
- 學術研究:研究員為每篇論文或主題建立工作區,嵌入相關文章和筆記。工作區內的查詢基於這些材料產生精確答案。
- 團隊協作:行銷團隊使用一個工作區進行活動規劃,另一個進行競爭對手分析,每個工作區包含相關文件和自定義提示。
- 個人知識管理:個人為食譜、旅行計劃和工作筆記建立工作區,為清晰度保持每個領域分離。