深势科技一面 ℓ 孩子们,面试坠机了,一个都答不上来,手撕简单题也不会

1.自我介绍

(拷打实习项目)
1.RAG的流程了解吗,比如向量化采用哪个模型来做的,怎么存的文件?
2.文件分块怎么做的,基于怎么原则/规范?
3.如果基于段落来分块,为什么不选用一个比较大的段落或者一个比较小的句子来分呢,有考虑过过大/过小会造成什么影响吗?
4.调用向量化模型的时候,是调的实时的接口还是其他的方法来做的?
5.这个接口是自己写的还是直接调用的豆包的SDK?
6.豆包有没有提供批量处理的向量化的接口?
7.向量化处理时,是每个文本分块分别进行向量化,还是把所有的文本都切分好之后,调一次接口就好了?
8.ES检索完之后有没有对检索结果做质量评估呢,有没有通用的测试方法,比如标准数据集?
9.你简历提到接口响应时间从800ms到200ms,有关注过影响耗时的核心点是在哪吗?
10.在传入的文档数量是固定的情况下,返回的top结果的值不同,对接口耗时有没有影响,影响大不大?
11.采用的什么策略来减少RAG的幻觉?
12.Kafka 解耦文件上传、处理这块怎么做的?
13.Kafka 的分区策略有哪些?默认分区、粘性分区、自定义分区分别是什么?
14.有了解过kafka分区的概念吗?
15.正常来说,一个topic下是一个分区还是多个分区呢?
16.多个分区的好处是什么?
17.kafka消费的策略有了解吗?

(拷打练手项目)
18.你在项目里使用了RabbitMq,有对比过RabbitMq和Kafka的区别和使用场景吗?
19.如果要防止数据丢失的话,一般采用的标准方案是什么?
20.项目里用到的两级缓存,Redis和Caffeine,缓存一致性怎么做的?
21.Canal做MySQL到ES的增量同步的时候,监听的是MySQL的哪个日志?
22.除了binlog,还有哪两种日志类型比较常见,分别的使用场景?

(拷打轮子)
23.为什么WAL这一块要先写日志呢?
24.2PL的规则有了解吗?
25.2PL加锁和解锁的阶段有没有交叉?
26.有了解2PL可能造成哪些问题吗?
27.2PL造成的死锁问题怎么解决?
28.你用到了LRU策略,它是用来解决什么问题的,有什么优势?

(其他)
29.了解Linux和shell吗?
30.实习的时候的开发环境是基于win还是Linux呢?

(场景题)
31.公司可能用到第三方的SDK,SDK只提供了静态的方法,要求在注入的时候,用的成员是静态的,但是Spring中@Autowired是用来注入非静态成员的,那我想注入一个静态的变量该怎么做呢?

(八股)
32.怎么创建一个线程?
33.Callable和Runnable的区别是什么?
34.使用synchronized时,加在方法上和加在代码块上的区别是什么?
35.在synchronized的同步块里,该怎么判断是使用this对象还是使用class对象呢?
36.在 Spring Boot 的容器里,一个 Service Bean 是否是单例的,或者说同一个类会不会有多个实例?
37.你接触到的数据结构都有哪些?
38.有了解过动态规划和分支限界的算法逻辑是什么吗?

(手撕)
225. 用队列实现栈
全部评论
面完秒发邮件光速挂
点赞 回复 分享
发布于 12-25 20:01 重庆

相关推荐

评论
1
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务