1. 未登录词会通过词根词缀分割之后再转成embedding吧,在论文embedding部分有引用一个前人的工作 2. 残差网络是在transformer的(add&;layer norm)层吧,把经过attention前后的embedding做加法
点赞 评论

相关推荐

链接
海梨花:我说话难听,你这简历跟没写没啥区别,搜搜别人的简历,用心写,不要随随便便就结束了
点赞 评论 收藏
分享
牛客网
牛客网在线编程
牛客网题解
牛客企业服务