[THUPC 2024 初赛] 二进制 (树状数组单点删除+单点查询)(双堆模拟set)

发布时间:2023年12月23日

题解

题目本身不难想

首先注意到所有查询的序列长度都是小于logn级别的

我们可以枚举序列长度len,然后用类似滑动窗口的方法,一次性预处理出每种字串的所有出现位置,也就是开N个set去维护所有的位置。预处理会进行O(logn)轮,每次需要O(n*logn)的时间复杂度初始化set并计算位置。总共复杂度O(nlog^2n),看一下时间限制6s,感觉可以过23333。

删除操作可以直接暴力,直接从每种字串的位置集合中删除所有被影响到的位置,然后再把删除后字符串合并产生的新的子串加入到set中,过程中需要支持O(logn)的单点删除和单点查询。

在set中,删除起始点在L~R之间子串信息,再插入起始点在L到x-1的新构成的子串的信息

删除操作最多O(n/logn)次,每次直接暴力就是O(log^2n),总共复杂度O(nlogn)

接下来就是一些小问题,如何维护单点删除、单点查询的序列呢?

首先我们肯定不会去真正的移动序列,保留原始的输入01序列

可以想到用set去维护当前存在的每个坐标,但是支持查询第k个坐标的话得手写平衡树

也可以想到用线段树或者树状数组维护每个位置的存在信息,在线段树或者树状数组上二分来查询删除后的序列中的第k个坐标的真实位置。

这里使用树状数组

树状数组二分类似于倍增查询LCA的思想,十分易懂。

然后我们迅速写完整个内容,交一发,发现TLE了

看一下复杂度,发现瓶颈在于预处理,于是我们把初始化中对每个位置都进行树状数组二分,替换为直接使用当前位置存在信息数组进行处理,这样预处理中计算坐标的部分就变成O(n)了

但是仍然TLE了

现在瓶颈仍然是预处理,如果C++支持对有序序列O(n)建立set就好了

后来看了洛谷上题解的方法,才知道可以用两个优先队列来模拟set

由于我们只需要维护集合中的最小值以及集合的元素个数

使用两个堆,一个维护插入的内容,另一个维护删除的内容

当查询个数时,两个堆的大小相减即可。当查询最小值时,如果“删除堆”中的最小值与“插入堆”中的最小值相等,就两个一起pop掉,直到找到第一个“插入堆”中存在,但“删除堆”中不存在的元素即可。

(其实也可以用两个vector来模拟,因为对于每种子串,查询的次数只有一次,所以可以大胆排序再查询,这样初始化时间复杂度也是O(nlogn),查询删除子串的总时间复杂度是最坏O(nlog^2n)不过似乎也能过,因为sort在大部分都有序的情况下还是很快的)

改完之后,从6.18s变成了1.17s,发生了质的飞跃23333

有人可能会问,优先队列插入不也是O(logn)的吗,为什么会比set快这么多,因为预处理的过程中插入集合的内容是顺序的,根据小根堆的实现,只有当自己比父亲值小时,才会发生交换,所以在预处理建立小根堆的过程中是O(n)的,这样预处理的总复杂度就变成了O(nlogn),删除方面在理论上最坏时间复杂度也是O(nlog^2n)(假设所有的位置都集中在一种子串上,并且“删除堆”和“插入堆”差不多大)

代码:

#include<cstdio>
#include<cstring>
#include<algorithm>
#include<set>
#include<queue>
using namespace std;
#define N 1000005
#define LOG 20
int n, n_real, now;
char ss[N];
// 树状数组维护单点删除与单点查询的序列
// 实际坐标->逻辑坐标(删除后的坐标) getsum
// 逻辑坐标->实际坐标  query   树状数组二分
int tra[N];
int getsum(int x)
{
	int ret=0;
	for(;x;x-=x&-x) ret+=tra[x];
	return ret;
}
void update(int x,int k)
{
	for(;x<=n;x+=x&-x)
		tra[x]+=k;
}
int query(int k)// 查询删除后序列的第k位置的实际坐标
{
	int ans=0,sum=0;
	for(int i=LOG;i>=0;i--){
		if(ans+(1<<i)<=n && sum+tra[ans+(1<<i)]<k){
			sum+=tra[ans+(1<<i)];
			ans+=(1<<i);
		}
	}
	return ans+1;
}
// a是原始数据,tmp是删除后的数组,b表示当前位是否存在(树状数组建立在b上)
bool a[N],tmp[N],b[N];
int pos[N];
void cal_tmp_all()
{
	int cnt=0;
	for(int i=1;i<=n;i++){
		if(b[i]){
			pos[++cnt]=i;
			tmp[cnt]=a[i];
		}
	}
}
void cal_tmp(int l,int r)
{
	l=max(1,l);r=min(r,n_real);
	for(int i=l;i<=r;i++){
		pos[i]=query(i);
		tmp[i]=a[pos[i]];
	}
}
priority_queue<int,vector<int>,greater<int> > S[N],D[N];
//set<int> S[N];
//set<int>::iterator it;
// 将起始点在l r之间,长度为len的数据加入到set或者从set中删除
void update_set(int l,int r,int len,bool flg)
{
	r=min(n_real,r+len-1);
	int lim_l= max(now,1<<(len-1)), lim_r= min(n,(1<<len)-1);
	int mask=(1<<len)-1;
	int tmp_value=0;
	for(int i=l;i<=r;i++){
		tmp_value=((tmp_value<<1)&mask)|tmp[i];
		if(i-l+1 >= len && tmp_value>=lim_l && tmp_value<=lim_r){
			if(flg)
				S[tmp_value].push(pos[i-len+1]);
			else
				D[tmp_value].push(pos[i-len+1]);
		}
	}
}
int main()
{
	scanf("%d",&n);n_real=n;
	scanf("%s",ss+1);
	for(int i=1;i<=n;i++){
		a[i]=int(ss[i]-'0');
		update(i,1);
		b[i]=1;
	}
	now=1;
	for(int len=1;n>>(len-1);len++){
		cal_tmp_all();
		update_set(1,n_real,len,1);
		//printf("start len:%d\n",len);
		for(;now<(1<<len);now++){
			//printf("now:%d\n",now);
			if(now>n)return 0;
			int siz = (int)S[now].size()-(int)D[now].size();
			if(!siz){
				printf("-1 0\n");
				continue;
			}
			while(!S[now].empty()&&!D[now].empty() && S[now].top()==D[now].top()){
				S[now].pop();
				D[now].pop();
			}
			int x=getsum(S[now].top());
			printf("%d %d\n",x,siz);
			int l=max(1,x-len+1),r=min(n_real,x+len-1);
			// 删除受影响的结果
			cal_tmp(l,r+len-1);
			update_set(l,r,len,0);
			// 删除对应的01序列
			for(int i=x;i<=r;i++){
				update(pos[i],-1);
				b[pos[i]]=0;
			}
			n_real-=len;
			// 添加新产生的序列结果
			cal_tmp(l,x-1+len-1);
			update_set(l,x-1,len,1);
			while(!S[now].empty())S[now].pop();
			while(!D[now].empty())D[now].pop();
		}
	}
}

文章来源:https://blog.csdn.net/C20180602_csq/article/details/135175159
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。