首页
题库
面试
求职
学习
竞赛
More+
所有博客
搜索面经/职位/试题/公司
搜索
我要招人
去企业版
登录 / 注册
首页
>
试题广场
>
一个文件记录中有50M个URL, 另一个有 500URL个,
[问答题]
一个文件记录中有50M个URL, 另一个有 500URL个,找出相同的记录
添加笔记
求解答(2)
邀请回答
收藏(3)
分享
纠错
2个回答
添加回答
0
duanhua
首先使用包含500个url的文件创建一个hash_set;然后遍历50M的url记录,如果url在hash_set中,则输出此url并从hash_set中删除这个url。所有输出的url就是两个记录里相同的url。
import java.util.HashSet;
public class Url {
static String[] large=new String []{"1111","4444","3333","1111","5555","6666"};
public static void main(String args[])
{
HashSet<String> small=new HashSet<String>();
small.add("1111");
small.add("2222");
small.add("3333");
small.add("1111");
for(String str:large)
{
if(small.contains(str))
{
System.out.println(str);
small.remove(str);
}
}
}
}
发表于 2015-09-19 15:08:54
回复(0)
0
得得小泽
将50M的URL的每一数据匹配500个URL,当有匹配上的时候,存储url,在500个url中删除匹配上的,同时建立一个链表记录这个url,下一次匹配时,现将50M的url匹配链表,匹配上则进行下一次匹配,否则匹配500个的url
发表于 2015-06-17 11:32:26
回复(0)
这道题你会答吗?花几分钟告诉大家答案吧!
提交观点
问题信息
海量数据
查找
上传者:
马特殊
难度:
2条回答
3收藏
11565浏览
热门推荐
相关试题
给40亿个不重复的unsigned...
腾讯
海量数据
评论
(1)
有10个文件,每个文件1G,每个文...
美团
排序
海量数据
评论
(4)
请问以下有关 Promise 内置...
Javascript
评论
(1)
宏定义是C语言中非常实用的一种计算...
C语言
评论
(1)
扫描二维码,关注牛客网
意见反馈
下载牛客APP,随时随地刷题