排序问题

1.有一个10G大小的无序文件,文件里是32位无符号数(0~42亿,即:0 ~ 2^32 - 1),给你5G的内存空间,请对这个10G大小的文件进行排序?

        一般的归并排序、快速排序等都需要将所有数据全都读到内存中,而本题有10G的数据,5G的内存显然放不下。
【解决方案】
        利用堆和TopK的思想。
  • 先准备一个有容量限制的小顶堆(为方便描述,容量暂定为10)和一个map。map的key是文件中的数字,value是数字对应出现的次数
  • 通过遍历这个文件,考虑将数字放到堆中:
    • 先看遍历到的数字在不在map中,如果在,说明堆中有这个数,直接将对应的value+1;
    • 如果不在map中,再看堆满没满,如果没满,直接把这个数放到堆和map中;
    • 如果堆满了,比较这个数字和堆顶元素(10个数中最小的)的大小:
      • 如果数字 < 堆顶元素,直接跳过;
      • 如果数字 > 堆顶元素,就把堆顶元素剔除掉,同时删除对应的k-v,将遍历到的数加到堆和map里。
  • 一次遍历后,堆里的这10个数就是本轮最大的10个数,将堆中的10个数按顺序输出到一个文件中,同时记录这10个数中的最小值,下次遍历时只遍历小于这个最小值的数。
  • 这样经过几轮遍历之后,就能给这个文件排好序了。
    【tips】堆越大,遍历的轮次越少。
2.























全部评论

相关推荐

12-14 22:54
武汉大学 Java
点赞 评论 收藏
分享
从小父母离异家里没人管,靠着心里的不安和学校的环境也算是坚持到了学有所成的地步。到了大学环境开始松散不知道该做什么,只觉得在不挂科的基础上能往上考多少就考多少,等到秋招来临才发现自己有多么幼稚无能,今年九月份初才发现自己原来连一个求职的方向都没有。因为之前做过前后端一体的课设,算是有过了解,而对于其他岗位连做什么都不知道,因此这一个半个月在越来越焦虑的同时埋头苦学,事到如今想要活下去我似乎只能走前端这条路了,9月初先是靠着虚假夸大能力的简历得到一些笔试来确定了考察的方向,有一个大厂的无笔试面试最终是拒绝了没有勇气去面对。然后在这个基础上埋头苦学,如今也算是搭好了自己前端学习的框架和思考的瞄,可以逐渐给自己扩展新的知识和能力了,但这并不是一件多好的事儿,因为我发现学的越多越焦虑,学的越多便越无力。因为我感觉我如今努力学习的知识都是竞争对手们早就掌握了的东西,我如今困惑追求答案的难题早就被别人解决。别人早就能得心应手地做出项目而我连思考都会卡壳,看着别人的笔试和面经上那些闻所未闻的题目,我才知道别人到底有多强而我有多幼稚,我什么时候才能达到别人那种堪称熟练的能力呢?而且网上的焦虑越多越多,即便是真有这么高的能力最后也大概落得一个低薪打工人的下场,我真的感到迷茫。秋招都快结束了,而我还在继续痛苦的学习之旅,这些天找前端面试发现似乎问的有些简单跟网上搜到的内容不符(可能因为并不是大厂),我是不是本来就没打算被招所以别人懒得细问呢?我不知道,我只能继续总结下去学习下去,不管如何我都要活下去,如果我能早一些准备就好了,如果暑假能意识到现在这个情况就好了,可惜没有如果。种下一棵树的最好时间是十年前,其次是现在,虽然我相信自己的学习能力,但已经错过了最好的时机,只能在焦虑与痛苦中每天坚持学下去。目前的路还有很长很长,先去把typescript看了,再去巩固vue3的基础,再去练习elementui的使用,如果这能找到实习的话就好了。接下来呢?去学uniapp和小程序,不管如何我都要对得起曾经努力的自己。即便我们都感到痛苦,但我心中还是希望我们都能靠自己的努力来获取自己想要的幸福。
紧张的牛牛等一个of...:在担心什么呢,有一手985的学历在,就算是小厂别人都会要的,咱们双非的人更多,多少还在沉沦的,怕什么了
一句话证明你在找工作
点赞 评论 收藏
分享
评论
点赞
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务