实习三周报 (9-11)

刘晓枫 | 2025-8-15

之前的工作进度

将算法代码助手的知识库修改为了RAGFlow，已能连接并进行简单的检索操作。

但对于RAGFlow知识库中文档的部分修改、追加等可能采用的手段，缺少相关工具，当时正在开发中。

完成了RAGFlow相关的MCP工具开发与Debug，支持对知识库文档的解析、修改、追加内容等操作。

最终实践中，主要采用将高质量QA直接上传为txt文件的方式来扩充知识库。

核心流程：引入“检索 → 评估筛选 → 自省”的循环机制。

工作原理：当检索信息不足时，工作流会生成新的检索语句进行多轮探索，直到信息充足再进行回答。

优点：显著提升了对复杂代码（如包含多个内部方法调用）的理解能力和意图分析准确性。

原模式：React Agent同时负责工具调用决策和答案总结，逻辑耦合度高。

优化后：将工作流拆分为两个独立节点：

问题：旧版工作流会将所有问答对（包括因知识库不全而产生的无效回答，如 "No conclusion available"）都上传至RAGFlow。

优化：在存储至知识库前，增加了一层回答质量判断机制。

效果：确保只有高质量、有价值的QA才会被记录，有效避免了知识库被低质内容污染。

与贺洋协作，对算法代码助手的各迭代优化版本进行了系统的功能与性能测试。

通过构建对照实验，量化了不同版本间的表现差异，并将详细结果记录在江蓝制作的评分记录表上。

刘晓枫 | 2025-8-15