实习三周报 (9-11)

刘晓枫 | 2025-8-15

之前的工作进度

将算法代码助手的知识库修改为了RAGFlow,已能连接并进行简单的检索操作。

但对于RAGFlow知识库中文档的部分修改、追加等可能采用的手段,缺少相关工具,当时正在开发中。

工作总结 (1): RAGFlow 工具开发

完成了RAGFlow相关的MCP工具开发与Debug,支持对知识库文档的解析、修改、追加内容等操作。

最终实践中,主要采用将高质量QA直接上传为txt文件的方式来扩充知识库。

工作总结 (2): 算法代码助手

算法代码助手工作流示意图

工作总结 (2.1): 升级为自省式RAG

核心流程:引入“检索 → 评估筛选 → 自省”的循环机制。

工作原理:当检索信息不足时,工作流会生成新的检索语句进行多轮探索,直到信息充足再进行回答。

优点:显著提升了对复杂代码(如包含多个内部方法调用)的理解能力和意图分析准确性。

工作总结 (2.2): 分离决策与总结节点

原模式:React Agent同时负责工具调用决策和答案总结,逻辑耦合度高。

优化后:将工作流拆分为两个独立节点:

  • React Agent 节点:仅负责选择并执行最合适的工具。
  • 答案生成节点:在工具执行完毕后,独立负责整合信息并生成最终答案。

工作总结 (2.3): 增加QA质量判断

问题:旧版工作流会将所有问答对(包括因知识库不全而产生的无效回答,如 "No conclusion available")都上传至RAGFlow。

优化:在存储至知识库前,增加了一层回答质量判断机制。

效果:确保只有高质量、有价值的QA才会被记录,有效避免了知识库被低质内容污染。

工作总结 (3): 系统化测试与评价

与贺洋协作,对算法代码助手的各迭代优化版本进行了系统的功能与性能测试。

通过构建对照实验,量化了不同版本间的表现差异,并将详细结果记录在江蓝制作的评分记录表上。

未来工作计划

  1. 完成“分离决策执行与总结输出”的收尾工作(主要为提示词部分)。
  2. 进行更多测试与评价,探索工作流的能力边界与适用场景。
  3. 修改React Agent,接入Nacos MCP工具并增加黑名单。
    • 探索Dify工作流在调用已部署Nacos MCP后跑不通的原因。
  4. 下周的会议准备。
  5. 团建。

感谢观看

刘晓枫 | 2025-8-15

1 / 9