随着大模型的普及,企业对内部数据安全和私有化问答的需求急剧上升。这个项目是我利用业余时间独立完成的一套 RAG (Retrieval-Augmented Generation) 架构的知识库 SaaS。
核心技术难点突破:
- 文档解析与切块 (Chunking): 后端采用 Go 并发处理 PDF/Word 文档,运用滑动窗口策略进行文本切块,保证了上下文语义的连贯性。
- 向量检索: 弃用了早期的 PGVector,改用专业的 Milvus 向量数据库,在百万级 Chunk 数据下,检索耗时稳定在 50ms 以内。
- 前端状态管理: 借助于 AI 工具,快速攻克了 Vue3 复杂的打字机效果(SSE 流式输出)和长对话状态管理。
"这个项目让我彻底打通了从后端 API 开发到前端交互、再到大模型调用的完整闭环,证明了现代全栈开发的极大可行性。"