题解 | #对试卷得分做min-max归一化#

对试卷得分做min-max归一化

http://www.nowcoder.com/practice/2b7acdc7d1b9435bac377c1dcb3085d6

法一：

SELECT uid, exam_id, ROUND(AVG(norm_score),0) avg_new_score
FROM 
(SELECT uid, exam_record.exam_id,
 IF(num=1, score, (score-min_score)/(max_score-min_score)*100) norm_score
 FROM (SELECT exam_id, MIN(score) min_score, MAX(score) max_score, COUNT(score) num FROM exam_record
       WHERE exam_id IN (SELECT exam_id FROM examination_info WHERE difficulty='hard')
       AND score IS NOT NULL#过滤掉NULL值，COUNT(score)才能算对。而mysql中 MIN、MAX、AVG函数会忽略NULL值
       GROUP BY exam_id) t1, exam_record
 WHERE exam_record.exam_id=t1.exam_id AND score IS NOT NULL) t2 #过滤掉NULL值，不考虑没有score的
GROUP BY uid, exam_id
ORDER BY exam_id, avg_new_score DESC;

一开始的想法是如下，错在t1表那里。SELECT uid, exam_id....GROUP BY exam_id这样是没有办法通过执行的，GROUP BY exam_id后，数据最后是每个exam_id只有一行的，不能说出现有1001,9001（uid，exam_id）一行，1003,9001另一行这样的情况。但是要算COUNT,MIN,MAX又必须得用上GROUP BY。因此，做法修改为先算出num,min_score,max_score，然后把算出来的结果和exam_record连表，这样就能得到1001,9001一行，1003,9001另一行这样的情况。

SELECT uid, exam_id, ROUND(AVG(norm_score),0) avg_new_score
FROM 

(SELECT uid, exam_id, 
 IF(COUNT(score)=1, score, (score-MIN(score))/(MAX(score)-MIN(score))*100) norm_score
 FROM exam_record
 WHERE exam_id IN (SELECT exam_id FROM examination_info WHERE difficulty='hard') AND score IS NOT NULL
 GROUP BY exam_id) t1
 
GROUP BY uid, exam_id
ORDER BY exam_id, avg_new_score DESC;

法二：这个做法是用了窗口函数。与法一差别就在于，刚刚说的，GROUP BY exam_id后算最大最小值，数据最后是每个exam_id只有一行的，不能说出现有1001,9001一行，1003,9001另一行这样的情况。但是用窗口函数的话就可以实现。

SELECT uid, exam_id, ROUND(AVG(norm_score),0) avg_new_score
FROM 
(SELECT uid, exam_id,
 IF(num=1, score, (score-min_score)/(max_score-min_score)*100) norm_score
 FROM (SELECT uid,exam_id, score, MAX(score) over (partition by exam_id) as max_score,
        MIN(score) over (partition by exam_id) as min_score,
       COUNT(score) over (partition by exam_id) as num
       FROM exam_record
       WHERE exam_id IN (SELECT exam_id FROM examination_info WHERE difficulty='hard')
       AND score IS NOT NULL) t1) t2
GROUP BY uid, exam_id
ORDER BY exam_id, avg_new_score DESC;

下面附上t1表的结构直观看： alt

这就体现了窗口函数不减少原表行数的特点。

全部评论

推荐最新楼层

12-19 20:11

饿了么_后端研发工程师(准入职员工)

春秋航空内推，春秋航空内推码

春秋✈️ 综合管理类培训生 初试面经搜遍全网没有面经，趁着下午刚面完出一波攒攒秋招人品，希望对uu们有帮助在上海线下面的，半小时左右一波人，是群面哦～记得打印两份简历带上流程：1、自我介绍2、对春秋航空成本管控方面的理解（同组uu答的都好全面，完全没有什么补充hhhh）3、有关财务方面的实习经历介绍，谈谈自己参与的工作、对岗位的理解、对工作提效的想法之类的4、什么渠道投递的简历5、自己的实习投递的渠道是什么6、横向多岗位实习较垂直实习的优劣势（本人实习岗位比较杂hhh）7、对未来的规划，是否想好要做财务方面8、例行反问总体而言，面试官们都非常好，超级温柔～春秋航空2026届秋招启动~ 【我们是...

点赞评论收藏

12-19 11:50

浙江大学 Java

UDP 和 TCP 的应用场景

图解TCP/UDP牛客面...

点赞评论收藏

12-17 16:45

已编辑

湖南大学安卓

拼多多26校招开奖——给的实在是太多了

总得来说pdd今年给的比小红书给的还多（变现），而且pdd给的是实实在在的，很稳定。前端：32k*18薪算法：40k*18薪研发：30k*18薪后端：41k*18薪pdd给的实在是太多了，有几个能做到18薪的，但是pdd的强度确实很大，基本上是11,11,6。不过也是真香，拿多少钱干多少事！

edge~0523：一年顶别人两年，这谁顶得住啊

点赞评论收藏

11-04 21:22

天津理工大学 Java

27届尝试实习

佬们给提点意见，12月份想找个日常实习

想干测开的tomca...：让我来压力你！！！：这份简历看着“技术词堆得满”，实则是“虚胖没干货”，槽点一抓一大把： 1. **项目描述是“技术名词报菜名”，没半分自己的实际价值** 不管是IntelliDoc还是人人探店，全是堆Redis、Elasticsearch、RAG这些时髦词，但你到底干了啥？“基于Redis Bitmap管理分片”是你写了核心逻辑还是只调用了API？“QPS提升至1500”是你独立压测优化的，还是团队成果你蹭着写？全程没“我负责XX模块”“解决了XX具体问题”，纯把技术文档里的术语扒下来凑字数，看着像“知道名词但没实际动手”的实习生抄的。 2. **短项目塞满超纲技术点，可信度直接***** IntelliDoc就干了5个月，又是RAG又是大模型流式响应又是RBAC权限，这堆活儿正经团队分工干都得小半年，你一个后端开发5个月能吃透这么多？明显是把能想到的技术全往里面塞，生怕别人知道你实际只做了个文件上传——这种“技术堆砌式造假”，面试官一眼就能看出水分。 3. **技能栏是“模糊词混子集合”，没半点硬核度** “熟悉HashMap底层”“了解JVM内存模型”——“熟悉”是能手写扩容逻辑？“了解”是能排查GC问题？全是模棱两可的词，既没对应项目里的实践，也没体现深度，等于白写；项目里用了Elasticsearch的KNN检索，技能栏里提都没提具体掌握程度，明显是“用过但不懂”的硬凑。 4. **教育背景和自我评价全是“无效信息垃圾”** GPA前10%这么好的牌，只列“Java程序设计”这种基础课，分布式、微服务这些后端核心课提都不提，白瞎了专业优势；自我评价那堆“积极认真、细心负责”，是从招聘网站抄的模板吧？没有任何和项目挂钩的具体事例，比如“解决过XX bug”“优化过XX性能”，纯废话，看完等于没看。总结：这简历是“技术名词缝合怪+自我感动式凑数”，看着像“背了后端技术栈名词的应届生”，实则没干货、没重点、没可信度——面试官扫30秒就会丢一边，因为连“你能干嘛”都没说清楚。

点赞评论收藏