下面用提问的方式分别从加载,切割,嵌入,储存,检索,评估几个角度连环问,感觉可以判断掌握RAG的程度,博主也在学习,轻点喷1.加载1.1加载纯文本如何加载?1.2加载doc怎么加载? 要是想强调结构呢1.3加载pdf怎么加载?1.4要是pdf里面有图片呢?1.5要是pdf的一页里面有图片,文字,图片里面还有文字呢?2.切割2.1怎么切割?重叠程度怎么设置,分片大了会怎么样,小了会怎么样?3.嵌入3.1常见的嵌入模型有哪些?3.2对于稀疏向量的嵌入,了解过吗?4储存4.1常见的向量数据库了解过吗4.2企业级一般用哪个向量数据库4.3了解过索引吗?图索引,倒排索引了解过吗4.4第二范式,余弦相似度,向量内积,了解过吗,是干嘛的?5检索5.1多路召回,索引增强重排了解过吗?5.2粗排,精排了解过吗,用什么模型?6.评估6.1常见的评估框架有哪些?6.2评估一般看哪几个指标?忠诚度,相对性,精确性?7其他7.1图RAG了解过吗?为什么要用它?7.2多模态RAG怎么实现??了解过吗7.3llamaindex专注于该领域,有了解过吗?