POJ1743 Musical Theme【二分】【后缀数组】

题意

有N(1 <= N <=20000)个音符的序列来表示一首乐曲,每个音符都是1…88范围内的整数,现在要找一个重复的主题。
“主题”是整个音符序列的一个子串,它需要满足如下条件:
1.长度至少为5个音符
2.在乐曲中重复出现(可能经过转调,“转调”的意思是主题序列中每个音符都被加上或减去了同一个整数值。)
3.重复出现的同一主题不能有公共部分。

思路

后缀数组入门题目
先转化成相邻两项的差值,然后就是找不可重叠重复子串。
来自论文的思路
先二分答案,把题目变成判定性问题:判断是否存在两个长度为k的子串是相同的,且不重叠。解决这个问题的关键还是利用height数组。把排序后的后缀分成若干组,其中每组的后缀之间的height值都不小于k。例如,字符串为“aabaaaab”,当 k=2时,后缀分成了4组,如图5所示。

容易看出,有希望成为最长公共前缀不小于k的两个后缀一定在同一组。然后对于每组后缀,只须判断每个后缀的sa值的最大值和最小值之差是否不小于k。如果有一组满足,则说明存在,否则不存在。整个做法的时间复杂度为O(nlogn)。

AC_code:

#include<iostream>
#include<algorithm>
#include<cstring>
#include<cstdio>
using namespace std;
#define maxn 20005
int ss[maxn];
int sa[maxn],c[maxn];
int rank[maxn],height[maxn];
int t1[maxn], t2[maxn];
void build_sa(int s[],int n,int m) {// 字符串 字符串长度+1 最大字符+1
	int i,j,p,*x=t1,*y=t2;
	for(i=0; i<m; i++)c[i]=0;
	for(i=0; i<n; i++)c[x[i]=s[i]]++;
	for(i=1; i<m; i++)c[i]+=c[i-1];
	for(i=n-1; i>=0; i--)sa[--c[x[i]]]=i;
	for(j=1; j<=n; j<<=1) {
		p=0;
		for(i=n-j; i<n; i++)y[p++]=i;
		for(i=0; i<n; i++)if(sa[i]>=j)y[p++]=sa[i]-j;
		for(i=0; i<m; i++)c[i]=0;
		for(i=0; i<n; i++)c[x[y[i]]]++;
		for(i=1; i<m; i++)c[i]+=c[i-1];
		for(i=n-1; i>=0; i--)sa[--c[x[y[i]]]]=y[i];
		swap(x,y);
		p=1;
		x[sa[0]]=0;
		for(i=1; i<n; i++)
			x[sa[i]]=y[sa[i-1]]==y[sa[i]] && y[sa[i-1]+j]==y[sa[i]+j]?p-1:p++;
		if(p>=n)break;
		m=p;
	}
}
void getHeight(int s[],int n) {
	int i,j,k=0;
	for(i=0; i<=n; i++)rank[sa[i]]=i;
	for(i=0; i<n; i++) {
		if(k)k--;
		j=sa[rank[i]-1];
		while(s[i+k]==s[j+k])k++;
		height[rank[i]]=k;
	}
}
bool check(int k, int n){
	int maxx = sa[1];
	int minn = sa[1];
	for(int i = 2; i <= n; i++){
		if(height[i] < k){
			maxx = minn = sa[i];
		}else{
			minn = min(minn, sa[i]);
			maxx = max(maxx, sa[i]);
			if(maxx - minn > k) {
				return true;
			}
		}
	}
	return false;
}

int main() {
	int n;
	while(~scanf("%d", &n)) {
		if(n == 0) break;
		int maxx = -1;
		for(int i = 0; i < n; i++) {
			scanf("%d", &ss[i]);
		}
		for(int i = n - 1; i > 0; i--) {
			ss[i] = ss[i] - ss[i-1] + 90;
		}
		n--;
		for(int i = 0; i < n; i++) {
			ss[i] =ss[i+1];
		}
		ss[n] = 0;
		build_sa(ss, n+1, 200);
		getHeight(ss, n);
		int ans = -1;
		int l = 1, r = n/2;
		while(l <= r) {
			int mid = (l+r) / 2;
			if(check(mid, n)) {
				ans = mid;
				l = mid + 1;
			} else {
				r = mid - 1;
			}
		}
		if(ans < 4) puts("0");
		else {
			printf("%d\n", ans+1);
		}
	}
	return 0;
}
全部评论

相关推荐

想干测开的tomca...:让我来压力你!!!: 这份简历看着“技术词堆得满”,实则是“虚胖没干货”,槽点一抓一大把: 1. **项目描述是“技术名词报菜名”,没半分自己的实际价值** 不管是IntelliDoc还是人人探店,全是堆Redis、Elasticsearch、RAG这些时髦词,但你到底干了啥?“基于Redis Bitmap管理分片”是你写了核心逻辑还是只调用了API?“QPS提升至1500”是你独立压测优化的,还是团队成果你蹭着写?全程没“我负责XX模块”“解决了XX具体问题”,纯把技术文档里的术语扒下来凑字数,看着像“知道名词但没实际动手”的实习生抄的。 2. **短项目塞满超纲技术点,可信度直接***** IntelliDoc就干了5个月,又是RAG又是大模型流式响应又是RBAC权限,这堆活儿正经团队分工干都得小半年,你一个后端开发5个月能吃透这么多?明显是把能想到的技术全往里面塞,生怕别人知道你实际只做了个文件上传——这种“技术堆砌式造假”,面试官一眼就能看出水分。 3. **技能栏是“模糊词混子集合”,没半点硬核度** “熟悉HashMap底层”“了解JVM内存模型”——“熟悉”是能手写扩容逻辑?“了解”是能排查GC问题?全是模棱两可的词,既没对应项目里的实践,也没体现深度,等于白写;项目里用了Elasticsearch的KNN检索,技能栏里提都没提具体掌握程度,明显是“用过但不懂”的硬凑。 4. **教育背景和自我评价全是“无效信息垃圾”** GPA前10%这么好的牌,只列“Java程序设计”这种基础课,分布式、微服务这些后端核心课提都不提,白瞎了专业优势;自我评价那堆“积极认真、细心负责”,是从招聘网站抄的模板吧?没有任何和项目挂钩的具体事例,比如“解决过XX bug”“优化过XX性能”,纯废话,看完等于没看。 总结:这简历是“技术名词缝合怪+自我感动式凑数”,看着像“背了后端技术栈名词的应届生”,实则没干货、没重点、没可信度——面试官扫30秒就会丢一边,因为连“你能干嘛”都没说清楚。
点赞 评论 收藏
分享
专业嗎喽:个人信息名字太大,合到电话邮箱那一栏就行,有党员写过党,剩下其他全删,站空太大了 把实习经历丰富,放最前面,然后是个人评价,技能之类的,然后是学校信息。项目经历最后面,可以就选一个自己擅长的。 现在是学校不是92就扣分的,没必要放前面。 然后现在看重实习经历>竞赛经历(校园经历)>课程项目经历
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务