1.一个文件中去重后的ip地址数目? 如果问的是linux命令:就(sort后uniq -c,前提是内容只有ip,否则要先grep -oE筛选出ip) ------------------------- ~/Desktop  cat ip.txt 127.0.0.1 128.0.0.1 128.0.0.1 129.0.0.1 129.0.0.1 129.0.0.1 129.0.0.1 126.0.0.1 ~/Desktop  sort ip.txt | uniq -c 1 126.0.0.1 1 127.0.0.1 2 128.0.0.1 4 129.0.0.1 ----------------------- 如果问的是大文件统计ip次数,那就要考虑内存 分而治之一开始各位1000个文件,然后用hash去统计子文件里的 ip=>次数(如果重复率低,所有内容的hash可能也会塞满内存,然后hash内容写入到新的文件里)。最后合并子文件(记得合并相同ip)

相关推荐

12-13 20:26
浙江大学 Java
淬月星辉:把浙大的校名加大加粗,把校徽再贴出来,就OK了
点赞 评论 收藏
分享
10-29 18:20
济南大学 Java
用微笑面对困难:他不是人事吗,怎么净特么不干人事
点赞 评论 收藏
分享
牛客网
牛客网在线编程
牛客网题解
牛客企业服务