首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
搜索
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
首页 /
模仿学习
#
模仿学习
#
5898次浏览
57人互动
收藏话题
分享
此刻你想和大家分享什么
热门
最新
2024-11-28 21:04
已编辑
仙台白百合女子大学 嵌入式工程师
小米具身智能算法岗实习一面
第一个帖子给第一次面试,攒攒人品。课题:强化学习和模仿学习怎么在任务里结合的,为什么要用这两个。模仿学习收集数据怎么收集。强化学习奖励函数的设置,以及需要多少次迭代。末端力如果有噪声怎么办。实体的强化学习效果怎么样。对大模型有没有了解。对Serl有没有了解。竞赛:在竞赛中承担什么样的角色做了什么工作。八股:model-base和model-free的区别,马尔可夫性解释,为什么最优值函数就是最优策略,策略迭代和值迭代区别。代码:合并区间。感受:虽然迟到了但是面试官非常温柔,而且问的也很对口,就是我很容易说别的废话呜呜呜,第一次面试函数名用了拼音,写的时候感觉就不太好但是突然脑子里没有英文名。hr建议:多跟进最新进展成果,不要专注于两三年前的东西。如果有会大模型的也建议投一下,面试官说那边比较缺人。#
查看13道真题和解析
点赞
评论
收藏
分享
2023-06-29 11:46
阿里巴巴_算法工程师
强化学习面试必知必答[10]:模仿学习、行为克隆、逆强化学习
强化学习从基础到进阶--案例与实践含面试必知必答[10]:模仿学习、行为克隆、逆强化学习、第三人称视角模仿学习、序列生成和聊天机器人 模仿学习(imitation learning,IL) 讨论的问题是,假设我们连奖励都没有,要怎么进行更新以及让智能体与环境交互呢?模仿学习又被称为示范学习(learning from demonstration),学徒学习(apprenticeship learning),观察学习(learning by watching)。在模仿学习中,有一些专家的示范,智能体也可以与环境交互,但它无法从环境里得到任何的奖励,它只能通过专家的示范来学习什么是好的,什么是不好...
强化学习(原理+项目)
点赞
评论
收藏
分享
玩命加载中
创作者周榜
更多
热议话题
更多
1
...
什么是优秀的实习经历
0
2
...
担心入职之后被发现很菜怎么办
0
3
...
被上班搭子“传染”了哪些习惯
0
4
...
投格力的你,拿到offer了吗?
0
5
...
工作后,你落下了哪些病根
0
6
...
作业帮求职进展汇总
0
7
...
京东美团大战,你怎么看?
0
8
...
实习简历求拷打
0
9
...
如果今天是你的last day,你会怎么度过?
0
10
...
秋招被挂春招仍然能投的公司
0
牛客网
牛客网在线编程
牛客网题解
牛客企业服务