RAG???? 你只停留在写RAG的demo吗?

下面用提问的方式分别从加载,切割,嵌入,储存,检索,评估几个角度连环问,感觉可以判断掌握RAG的程度,博主也在学习,轻点喷
1.加载
1.1加载纯文本如何加载?
1.2加载doc怎么加载? 要是想强调结构呢
1.3加载pdf怎么加载?
1.4要是pdf里面有图片呢?
1.5要是pdf的一页里面有图片,文字,图片里面还有文字呢?
2.切割
2.1怎么切割?重叠程度怎么设置,分片大了会怎么样,小了会怎么样?
3.嵌入
3.1常见的嵌入模型有哪些?
3.2对于稀疏向量的嵌入,了解过吗?
4储存
4.1常见的向量数据库了解过吗
4.2企业级一般用哪个向量数据库
4.3了解过索引吗?图索引,倒排索引了解过吗
4.4第二范式,余弦相似度,向量内积,了解过吗,是干嘛的?
5检索
5.1多路召回,索引增强重排了解过吗?
5.2粗排,精排了解过吗,用什么模型?
6.评估
6.1常见的评估框架有哪些?
6.2评估一般看哪几个指标?忠诚度,相对性,精确性?
7其他
7.1图RAG了解过吗?为什么要用它?
7.2多模态RAG怎么实现??了解过吗
7.3llamaindex专注于该领域,有了解过吗?
全部评论
重叠程度怎么设置,分片大了会怎么样,小了会怎么样,这个咋回答的呢
点赞 回复 分享
发布于 昨天 20:28 云南

相关推荐

昨天 22:13
门头沟学院 Java
一面: 1. threadlocal有什么作用? 能解决什么问题?2. 为什么缓存词条要使用redis哈希数据结构存储?存的是什么数据? QPS 大概会有多少?属于热点数据吗?3. 缓存雪崩在这个场景下出现的可能不高,为什么选择对雪崩进行处理?  随机时间是怎么确定的?4. 缓存雪崩有什么解决方案?5. cache-aside先更新数据库再删除缓存, 万一删除缓存操作失败了,那么就有可能读到错误的数据?有考虑使用重试或者告警机制吗?6. 多级缓存要怎么保证数据之间的一致性?7. aigc业务场景是什么?  线程池参数怎么配的?8. 批量预加载和内存映射策略是怎么进行优化的?9. sql优化的过程说一下10. 从底层数据结构角度说一下,为什么有这个最左前缀索引法则?11. SpringCloud用过哪些组件?12. 说说自己对限流,熔断,降级的理解。13. 为什么要有注册中心这个概念? 比如用nacos作为配置中心,读取配置要加什么样的注解?14. nacos作为配置中心,如果更改了一个配置,能立即生效吗15. 消息队列的可靠性是怎么保证的(说了rabbitmq)16. kafka是怎么保证消息的可靠性的?生产端,kafka自身,消费端17. 有一个集合装着1-100里的数,顺序排列,但是缺了一个数。怎么找出这个数?18. 二叉树的层序遍历二面:1. 如何保证 Redis 缓存与 MySQL 数据库的数据一致性?2. 刚刚提到在写操作时加锁,是加什么样的锁?3. 加锁时,如果有读操作怎么办?锁的粒度是怎样的?4. 除了加锁,还有哪些技术手段可以保证缓存数据的一致性?5. 使用 binlog 结合消息队列的方案,在写操作频繁时可能有什么问题?6. 什么是“延迟双删”?为什么要 sleep?这样做有什么潜在问题?7. 如果采用“先更新数据库,事务提交成功后再删除缓存”的方案,会有什么问题?8. 你如何理解分布式事务?9. 在同一个微服务系统内,什么情况下也会出现分布式事务?10. 你在本地学习时,是如何安装和搭建分布式环境所需的组件的(如数据库、Redis)?除了本地直接安装,你认为还有哪些更好的方式?11. 你使用过 Docker 吗?常见的命令有什么?12. 你写完一个接口后,如何进行自测?13. 你们的开发流程中有要求写单元测试吗?你认为编写单元测试有哪些好处?14. 如果你的单元测试需要依赖另一个服务的接口,你应该怎么写?15. 你了解 Mock 吗?它有什么用?16. 你写的单元测试会使用断言(Assert)吗?为什么断言很重要?17. 当你需要排查代码缺陷或 Bug 时,具体的排查流程是怎样的?18. 在服务器上排查问题时,你会使用哪些 Linux 指令?
发面经攒人品
点赞 评论 收藏
分享
评论
点赞
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务