139I-Substring
知识点: 后缀数组
题目大意:
同构 := 对于两个长度相同的字符串 A 和 B,如果能通过一个映射函数 f() 使得 A 中的每一个字符 c 对应的 f(c) 等于 B 中相应位置的字符。而且映射函数要满足对于 a ≠ b,f(a) ≠ f(b).
给定一个串 S,问最多可以选出多少个子串使得选出的子串两两不同构。
解题思路:
由于字符串的字符集只有 {a,b,c} 三个,所以映射方案数为 3! = 6。
对于所有的映射方案下对应的 S,找出其中所有的不同子串,然后发现:所有单一字符的子串都会与三种不同的子串同构,而其他子串则会与六种不同的子串同构。那么问题就变成找字符串的不同子串数。
首先,单一字符的总子串数可以通过找最长单一字符子串得到,暂且即为 T1;
然后,将字符串 S 通过所有映射方案映射后,末尾加上一个“独特”的字符拼接起来,用后缀数组找出拼接后的字符串的不同子串数 T2,再减去我们加上的“独特”字符对T2的贡献 T3。
最终的答案即为 .
几个细节可以看一下代码。
AC代码:
#include <bits/stdc++.h>
using namespace std;
typedef long long LL;
const int MAXN=50000*6+5;
int len;
int S[MAXN];
int wa[MAXN],wb[MAXN],wsf[MAXN],wv[MAXN],sa[MAXN];
int ranks[MAXN],height[MAXN],s[MAXN];
char str[MAXN];
bool cmp(int *r,int a,int b,int k){
return r[a]==r[b]&&r[a+k]==r[b+k];
}
void get_sa(int *r,int *sa,int n,int m){
int i,j,p,*x=wa,*y=wb,*t;
for(i=0; i<m; i++)
wsf[i]=0;
for(i=0; i<n; i++)
wsf[x[i]=r[i]]++;
for(i=1; i<m; i++)
wsf[i]+=wsf[i-1];
for(i=n-1; i>=0; i--)
sa[--wsf[x[i]]]=i;
for(p=1,j=1; p<n; j*=2,m=p){
for(p=0,i=n-j; i<n; i++)
y[p++]=i;
for(i=0; i<n; i++)
if(sa[i]>=j)
y[p++]=sa[i]-j;
for(i=0; i<n; i++)
wv[i]=x[y[i]];
for(i=0; i<m; i++)
wsf[i]=0;
for(i=0; i<n; i++)
wsf[wv[i]]++;
for(i=1; i<m; i++)
wsf[i]+=wsf[i-1];
for(i=n-1; i>=0; i--)
sa[--wsf[wv[i]]]=y[i];
t=x;
x=y;
y=t;
x[sa[0]]=0;
for(p=1,i=1; i<n; i++)
x[sa[i]]=cmp(y,sa[i-1],sa[i],j)? p-1:p++;
}
}
void get_height(int *r,int n)
{
int i,j,k=0;
for(i=0; i<n; i++)
ranks[sa[i]]=i;
for(i=0; i<n; i++){
if(k)
k--;
j=sa[ranks[i]-1];
while(r[i+k]==r[j+k])
k++;
height[ranks[i]]=k;
}
}
int f[8][4];
int temp[4]={1,2,3};
int main(){
// freopen("in.txt","r",stdin);
int ind=0;
do{//枚举所有的映射方案
for(int i=0;i<3;i++)
f[ind][i]=temp[i];
ind++;
}while(next_permutation(temp,temp+3));
int n;
while(~scanf("%d",&n)){
LL ans=0;
scanf("%s",str);
int longest=0,temp=1;
for(int i=1;i<n;i++){
if(str[i]==str[i-1]) temp++;
else{
longest=max(longest,temp);
temp=1;
}
}
longest=max(longest,temp);
ans=longest*3;//单一字符的总子串数等于最长单一字符子串的长度乘 3
len=0;
for(int i=0;i<6;i++){
for(int j=0;j<n;j++)
S[len++]=f[i][str[j]-'a'];
S[len++]=i+4;//在末尾加上“独特”的字符
}
S[len-1]=0;
get_sa(S,sa,len,10);
get_height(S,len);//后缀数组模板
for(int i=0;i<len;i++)
ans+=len-sa[i]-height[i];//计算不同子串个数,详见罗穗骞论文《后缀数组——处理字符串的有力工具》
ans-=1ll*(n+1)*(6*(len+1)-21*(n+1));//减去独特子串对答案的影响
printf("%lld\n",ans/6);
}
return 0;
} 