刘晓枫 | 2025-8-15
将算法代码助手的知识库修改为了RAGFlow,已能连接并进行简单的检索操作。
但对于RAGFlow知识库中文档的部分修改、追加等可能采用的手段,缺少相关工具,当时正在开发中。
完成了RAGFlow相关的MCP工具开发与Debug,支持对知识库文档的解析、修改、追加内容等操作。
最终实践中,主要采用将高质量QA直接上传为txt文件的方式来扩充知识库。
核心流程:引入“检索 → 评估筛选 → 自省”的循环机制。
工作原理:当检索信息不足时,工作流会生成新的检索语句进行多轮探索,直到信息充足再进行回答。
优点:显著提升了对复杂代码(如包含多个内部方法调用)的理解能力和意图分析准确性。
原模式:React Agent同时负责工具调用决策和答案总结,逻辑耦合度高。
优化后:将工作流拆分为两个独立节点:
问题:旧版工作流会将所有问答对(包括因知识库不全而产生的无效回答,如 "No conclusion available")都上传至RAGFlow。
优化:在存储至知识库前,增加了一层回答质量判断机制。
效果:确保只有高质量、有价值的QA才会被记录,有效避免了知识库被低质内容污染。
与贺洋协作,对算法代码助手的各迭代优化版本进行了系统的功能与性能测试。
通过构建对照实验,量化了不同版本间的表现差异,并将详细结果记录在江蓝制作的评分记录表上。
刘晓枫 | 2025-8-15