首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
搜索
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
拖拉机的拖拉
University of Saskatchewan 算法工程师
关注
已关注
取消关注
m
@林小白zii:
机器学习面经-评估方法与评价指标
一、简介 在机器学习中,评价方法和评价指标用于衡量模型在给定数据上的性能和预测能力。不同的任务和问题可能会选择不同的评价方法和评价指标。如准确率、召回率、均方误差、AUC等。 二、面经 1、请问模型常用的评估方法有哪些? 2、请问常用的评价指标有哪些? 3、你知道准确率(Accuracy)、精确率(Precision)、召回率(Recall)是怎么算的吗? 4、讲讲F1-score是怎么算的? 5、针对上面提到的一些指标,当训练集中类别不均衡,哪个最不准确? 6、ROC、AUC、PR曲线是什么关系? 7、AUC为什么比其他指标好? 8、AUC高是否一定说明auc高的模型排序能力更强?AUC对均匀正负样本采样不敏感? 9、AUC 值本身的理论上限是1吗? 10、AUC 与线上业务指标的宏观关系? 11、ROC曲线和PR曲线的区别?各自的适用场景? 三、面经参考回答 1、请问模型常用的评估方法有哪些? 参考回答:常用的评估方法包括以下几种: 训练集和测试集划分:将数据集划分为训练集和测试集,通常按照一定比例(如70%训练集,30%测试集)划分数据。训练集用于训练模型,测试集用于评估模型的性能和泛化能力。 交叉验证:K折交叉验证:将数据集划分为K个子集,依次选取其中一个子集作为验证集,剩余K-1个子集作为训练集,进行K次训练和测试,最后将K次评估结果取平均值。K折交叉验证可以更充分地利用数据集,得到更稳定的性能评估结果。留一交叉验证:特殊情况下,K折交叉验证中K等于数据集大小,即每次只留一个样本作为验证集。 自助法(Bootstrap):自助法是一种有放回的采样方法,从原始数据集中随机采样得到一个新的训练集,然后使用剩余样本作为测试集。由于自助法采样可能会产生多个相似的数据集,因此可以得到多个模型性能评估结果,通过取平均值来得到最终评估结果。 留出集法(Hold-out):将数据集划分为训练集、验证集和测试集三部分。训练集用于模型训练,验证集用于调参和模型选择,测试集用于评估模型在未知数据上的泛化能力。 时间序列交叉验证:对于时间序列数据,为了避免训练集包含未来的信息,常用的交叉验证方法有滚动交叉验证和时间序列分割交叉验证。 2、请问常用的评价指标有哪些? 参考回答:当评估机器学习模型的性能时,常用的评价指标根据任务类型可以分为以下几类: 分类任务评价指标: 准确率(Accuracy):分类正确的样本数占总样本数的比例。 精确度(Precision):真阳性样本数占所有被模型预测为正样本的样本数的比例。 召回率(Recall):真阳性样本数占所有真实正样本的样本数的比例。 F1分数(F1 Score):精确度和召回率的调和平均,用于综合考虑模型的准确性和召回性能。 ROC曲线和AUC:ROC曲线绘制了灵敏度(召回率)和特异度之间的关系,AUC用于度量ROC曲线的性能,越接近1表示模型性能越好。 回归任务评价指标: 均方误差(Mean Squared Error,MSE):预测值与真实值之间的平方差的均值。 平均绝对误差(Mean Absolute Error,MAE):预测值与真实值之间的绝对值差的均值。 R2分数(R-squared):模型预测值的方差占总方差的比例,越接近1表示模型拟合效果越好。 聚类任务评价指标: 轮廓系数(Silhouette Coefficient):衡量聚类的紧密性和分离性,越接近1表示聚类效果越好。 互信息(Mutual Information):衡量聚类结果与真实标签之间的信息量,越大表示聚类效果越好。 排序任务评价指标: 平均精确率(Mean Average Precision,MAP):对多个查询的平均精确率的平均值。 多标签分类任务评价指标: Hamming Loss:平均每个样本上错误的标签比例。 Jaccard Similarity Score:真实标签和预测标签的交集与并集之间的比例。 不同的评价指标适用于不同的任务和场景,根据具体的问题选择合适的评价指标是非常重要的。在实际应用中,通常需要综合考虑多个评价指标,并根据业务需求来选择最适合的评价指标。 3、你知道准确率(Accuracy)、精确率(Precision)、召回率(Recall)是怎么算的吗? 参考回答:先说一下含义:TP、FP、FN、TN分别为真阳性、假阳性和假阴性、真阴性。简单来说,就是: 真阳性(TP):标签为正类,预测为正类; 假阳性(FP):标签为负类,预测为正类; 真阴性(TN):标签为负类,预测为负类; 假阴性(FN):标签为正类,预测为负类; 准确率(Accuracy):T
点赞 5
评论 4
全部评论
推荐
最新
楼层
暂无评论,快来抢首评~
相关推荐
02-10 14:54
TCL科技集团股份有限公司_AI算法工程师(准入职员工)
智元机器人内推,智元机器人内推码
C++面经摘自优秀牛油先介绍了大概八分钟的科研项目然后开始拷打(有一些记不清了2333)C++部分:C++ 编译过程链接过程做了些什么智能指针介绍shared_ptr实现原理shared_ptr引用计数是原子性的吗怎么保证原子性的垃圾回收机制内存泄漏怎么排查内存泄漏排查工具的原理垃圾回收机制内存泄漏排查工具、垃圾回收机制、共享指针三个之间有什么关系stl map可以多线程同时写入吗stl里有容器是线程安全的吗int a,vector<int> b,同时作为函数参数,b存储在栈上还是堆上;操系统部分:协程和线程的区别协程切换的C++底层实现epoll\select\poll的区别为什...
点赞
评论
收藏
分享
02-10 13:41
西南大学 Java
28届小登找实习,简历求拷打
点赞
评论
收藏
分享
01-23 17:10
门头沟学院 后端工程师
我一般不怎么吐槽别人代码的,除非忍不住
啥意思大哥
AI coding的好用...
点赞
评论
收藏
分享
01-19 17:11
北京城市学院 测试工程师
27双非本打算投暑期
各位佬想问一下 测试测开 运维 网络 云等方向 暑期实习想三月份投递 想问问26届差不多水平能拿到什么样的实习offer以及校招大概什么水平 #
你的秋招简历被谁挂了?
点赞
评论
收藏
分享
02-11 16:19
三一重能_机械工程师(准入职员工)
格力电器内推,格力电器内推码
格力电器硬件面经1. 个人背景介绍;2. 单片机最小构成;3. 项目底板有哪些功能;4. 复位原理;5. 电源有哪几种;6. LDO工作原理;7. LDO效率多大;8. 反激变换器;9. 研究生阶段学过哪些硬件课程;10. 工作地点在珠海怎么看;11. 有接触过电机相关的吗;12. MOS导通条件;13. 反问。格力电器26届春招2月6日正式启动啦!企业简介:作为世界500强企业,格力电器现已发展成为多元化、科技型的全球工业制造集团,产业覆盖家用消费品和工业装备两大领域。【福利待遇】人才公寓及家属过渡房、免费通勤班车、无限流量免费电话卡、科技进步奖、周末双休、健康体检、年休假、五险一金及丰富津...
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
点赞
收藏
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
有实习后,面试备战核心指南(精准避坑+高效提分)
4045
2
...
面试官视角聊聊:如何通过Agent面试
3064
3
...
明天回家过年!
2351
4
...
携程前端一面(无八股)
1689
5
...
字节后端三面面经
1491
6
...
春节放假最惨的还是实习生
1380
7
...
三月中才开始投实习,五月上岸大厂,我是怎么准备的
1136
8
...
27字节agent开发实习一面
985
9
...
前端应届生春招经验分享
823
10
...
距离春招还有一个月,你是什么开局
822
创作者周榜
更多
正在热议
更多
#
春招什么时候投?
#
9527次浏览
160人参与
#
今年秋招你收到了多少封邮件?
#
37320次浏览
273人参与
#
春节前,你还在投简历吗?
#
12948次浏览
150人参与
#
牛友的春节生活
#
6513次浏览
139人参与
#
牛客AI体验站
#
14588次浏览
266人参与
#
春节提前走,你用什么理由请假?
#
9234次浏览
217人参与
#
从夯到拉,锐评职场mentor
#
4419次浏览
64人参与
#
备战春招/暑实,现在应该做什么?
#
4291次浏览
141人参与
#
实习到现在,你最困惑的一个问题
#
4085次浏览
117人参与
#
距离春招还有一个月,你现在是什么开局?
#
6215次浏览
109人参与
#
AI“智障”时刻
#
25880次浏览
129人参与
#
聊聊Agent开发
#
23404次浏览
575人参与
#
机械人的offer怎么选
#
250320次浏览
1186人参与
#
暑期实习什么时候投?
#
6548次浏览
153人参与
#
推荐一个值得做的AI项目
#
6373次浏览
168人参与
#
投格力的你,拿到offer了吗?
#
171483次浏览
875人参与
#
非技术2024笔面经
#
465971次浏览
4940人参与
#
实习生应该准时下班吗
#
335708次浏览
1737人参与
#
通信硬件薪资爆料
#
1226498次浏览
7207人参与
#
大家实习每天都在干啥
#
121686次浏览
633人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务