当时为什么决定选用 RAG 这个技术框架?你最终选择的是哪个 RAG / 哪个向量库?为什么选它?你们做了哪些评测对比?你为什么要用向量检索(RAG)?为什么不用其他方式?为什么不用全文索引(类似百度/谷歌那种关键词检索)?你说大模型有幻觉,那为什么不用更“权威”的全文检索来避免胡编?如果用开源全文检索在本地部署、自己喂私有数据,也能搜——那你们当时为什么没选这条路?你选的向量维度是多少维?这个维度为什么重要?你有没有显示配置/修改过维度?你用的切分策略是什么?你说按段落/按语义切,那段落有的 100 字、有的 1 万字怎么办?你的 chunk size 为什么定 1000 token?这是拍脑袋还是有依据?overlap 设多少?为什么这样设?你怎么评价/评测 RAG 效果的好坏?你怎么做定量评估(召回率、准确率、相关性)?如果效果不好,你会怎么回到前面去改(维度、切分、索引/检索策略)?