newsence
來源篩選

Show HN: Omni – Open-source workplace search and chat, built on Postgres

Hacker News

Omni is an open-source AI assistant and search platform that connects workplace apps using a unified Postgres architecture for full-text and semantic search. It features a secure AI agent capable of executing code in sandboxed environments and supports self-hosted deployment.

newsence

Show HN: Omni – 基於 Postgres 構建的開源辦公室搜尋與對話平台

Hacker News
大約 9 小時前

AI 生成摘要

Omni 是一個開源的辦公室 AI 助手與搜尋平台,它連接您的工作應用程式並使用統一的 Postgres 架構進行全文與語義搜尋。它具備能在沙盒環境中執行程式碼的安全 AI 代理,並支援完全在地化部署。

背景

Omni 是一款開源的企業級 AI 助手與搜尋平台,旨在成為 Glean 的自託管替代方案。它能整合 Google Drive、Slack、Confluence 等多種辦公軟體,並完全基於 Postgres 資料庫(結合 ParadeDB 與 pgvector)構建,實現混合搜尋與 AI 代理功能。開發者希望透過簡化架構,讓中小企業能以更低的成本在自有基礎設施上部署強大的企業內部搜尋系統。

社群觀點

在 Hacker News 的討論中,社群對於「全 Postgres」的架構選擇展現出高度共識。多位資深開發者指出,對於絕大多數組織而言,Postgres 的效能與擴展性已綽綽有餘。有留言者分享其營運六年的經驗,即便擁有數千名付費客戶與高併發流量,Postgres 依然能穩健支撐,並建議初創項目應專注於驗證商業模式,而非過早引入 Elasticsearch 等複雜組件。此外,也有觀點提到現代硬體規格的提升,如 AWS 提供的超大記憶體實例,使得多數企業的資料量根本不足以觸及 Postgres 的物理極限。

然而,技術實作上的細節仍是討論焦點,特別是企業搜尋中最棘手的「權限隔離」問題。有開發者詢問 Omni 如何確保使用者只能搜尋到其擁有權限的 Slack 頻道或 Jira 票卷。對此,作者坦言目前主要在應用層透過篩選器處理,但未來計畫升級至 Postgres 的資料列級安全性(RLS)機制。針對 Slack 私人頻道的權限繼承,由於成員名單會隨時間動態變動,如何即時同步權限仍是一大挑戰。

關於效能表現,社群對 Postgres 處理向量搜尋與全文檢索的實際數據感到好奇。作者透露在五十萬筆資料規模的測試中,P95 延遲仍能維持在一秒以下,雖然尚未與專門的向量資料庫進行基準測試對比,但初步結果令人滿意。部分使用者也提醒,雖然 Postgres 簡化了運維,但在大規模擴展時,仍需考慮如何以水平分片的方式重新建構資料模型。此外,討論中也出現了一些關於文件連結失效的小插曲,反映出該專案目前仍處於早期開發階段,部分 API 參考資料尚在完善中。

延伸閱讀

  • ParadeDB:專為搜尋設計的 Postgres 擴充套件,整合了 Tantivy 搜尋引擎。
  • pgvector:Postgres 的向量相似度搜尋擴充套件。
  • Omni 基準測試工具:專案內建的效能測試框架,可用於評估不同資料規模下的檢索表現。