美团秋招大模型算法凉经...

Q1:介绍transformer的位置编码,为什么这么设计,为什么可以达到位置编码的效果,编码了相对位置还是绝对位置;介绍RoPE
Q2:transformer的normalization,为什么用layernorm不用其他的;介绍RMSnorm
Q3:介绍self-attention;self-attention的改进;介绍encoder-decoder-attention;encoder中的self-attention和decoder中的self-attention有什么区别
Q4:训练过程中的梯度爆炸和梯度消失,怎么改进;softmax是否会遇到梯度爆炸和消失;transformer怎么处理梯度爆炸和梯度消失;后续新方法
Q5:介绍lora;为什么lora是有效的,只需要训练更少的参数而不是训练全参数
算法题:300. 最长递增子序列
全部评论
这都啥啊,,,
点赞 回复 分享
发布于 11-30 23:17 北京
哈人
点赞 回复 分享
发布于 11-21 17:50 广东

相关推荐

一面 1.自我介绍,为什么学习前端,平时用哪些AI,怎么用,感觉用ai有什么好处,了解ai幻觉吗,平时有没有遇到过,如何解决。了解prompt吗,如果ai表现不好会怎么做2.实现两栏布局 答了flex grid 和绝对定位,问flex具体如何实现3.浏览器访问网页的过程4.普通函数中在定时器里输出this指向5.关于项目的提问,如何实现弹幕滚动,动画什么实现(rAF),和定时器比较优势在哪,ts使用有什么好处,如果不符合ts类型会在哪里发生错误(编译时还是运行时)前后端字段不统一会在哪里发生错误6.包管理工具哪个用的多(pnmp),有什么优势package.lock有什么作用,为什么会发生包安装了不可用或冲突7.使用哪个框架多,为什么组合式api和options比较有什么优势什么时候需要使用ref使用框架实现一个功能点的流程,组合式api如何使用?(记不太清了)8.如何实现路由鉴权token前端有加密吗(没)http和HTTPS区别,详细解释非对称加密9.手撕 买卖股票的最佳时机③ 有效的括号 手写eventEmitter(选做)二面:拷打项目,如何通过token辨别是哪个用户,jwt原理,反转对象键值对,如何区分对象和数组,辨别数组方法,遍历二叉树最大值非递归,promise的输出new promise(resolve,reject)=>{log(1)resolve(true)log(2)throw new err(‘err’)log(3)reject(false)}.catch(err=>log(err)).then(res=>log(res))二面太紧张了,简单题没打上来😭还是基础不够扎实,感觉准备充分点还是有机会的
发面经攒人品
点赞 评论 收藏
分享
评论
3
7
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务