news 2026/1/14 8:16:08

区间不同数的个数-树状数组/线段树/莫队/主席树

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
区间不同数的个数-树状数组/线段树/莫队/主席树

引言

本问题将使用如下数据结构

数据结构时间复杂度实现难度
树状数组(Fenwick-Tree)O ( m log ⁡ n ) O(m \log n)O(mlogn)⭐ (简单)
线段树(Segment-Tree)O ( m log ⁡ n ) O(m \log n)O(mlogn)⭐⭐ (中等)
莫队(Mo)O ( n n ) O(n \sqrt n)O(nn)⭐⭐ (中等)
主席树(可持久化线段树)O ( ( n + m ) log ⁡ n ) O((n + m)\log n)O((n+m)logn)⭐⭐⭐ (困难)

题目-HH的项链

离线-树状数组解法

树状数组维护当前数组出现的位置信息, 具体的来说

因为j jj指针只会走一次, 算法时间复杂度O ( m log ⁡ n ) O(m \log n)O(mlogn)

核心代码

sort(q+1,q+m+1);intj=1;for(inti=1;i<=m;++i){intl=q[i].l,r=q[i].r,id=q[i].id;while(j<=r){if(last[w[j]])add(last[w[j]],-1);add(j,1);last[w[j]]=j;j++;}ans[id]=get(r)-get(l-1);}

代码实现

#include<bits/stdc++.h>usingnamespacestd;constintN=50010,M=2e5+10,S=1e6+10;intn,m;intw[N];structAsk{intl,r,id;booloperator<(constAsk&a)const{returnr<a.r;}}q[M];inttr[S],last[S],ans[M];inlineintlowbit(intx){returnx&-x;}voidadd(intu,intx){for(inti=u;i<S;i+=lowbit(i))tr[i]+=x;}intget(intu){intans=0;for(inti=u;i;i-=lowbit(i))ans+=tr[i];returnans;}intmain(){ios::sync_with_stdio(false);cin.tie(0);cin>>n;for(inti=1;i<=n;++i)cin>>w[i];cin>>m;for(inti=1;i<=m;++i){intl,r;cin>>l>>r;q[i]={l,r,i};}sort(q+1,q+m+1);intj=1;for(inti=1;i<=m;++i){intl=q[i].l,r=q[i].r,id=q[i].id;while(j<=r){if(last[w[j]])add(last[w[j]],-1);add(j,1);last[w[j]]=j;j++;}ans[id]=get(r)-get(l-1);}for(inti=1;i<=m;++i)cout<<ans[i]<<'\n';return0;}

离线-线段树解法

因为树状数组维护的是位置的前缀和,线段树也可以解决

代码实现

#include<bits/stdc++.h>usingnamespacestd;constintN=50010,M=2e5+10,S=1e6+10;intn,m;intw[N];structAsk{intl,r,id;booloperator<(constAsk&a)const{returnr<a.r;}}q[M];intlast[S],ans[M];structNode{intl,r;intsum;}tr[N<<2];voidpushup(intu){tr[u].sum=tr[u<<1].sum+tr[u<<1|1].sum;}voidbuild(intu,intl,intr){tr[u]={l,r,0};if(l==r)return;intmid=l+r>>1;build(u<<1,l,mid);build(u<<1|1,mid+1,r);pushup(u);}voidmodify(intu,intpos,intx){if(tr[u].l==tr[u].r){tr[u].sum+=x;return;}intmid=tr[u].l+tr[u].r>>1;if(pos<=mid)modify(u<<1,pos,x);if(pos>mid)modify(u<<1|1,pos,x);pushup(u);}intquery(intu,intql,intqr){if(tr[u].l>=ql&&tr[u].r<=qr)returntr[u].sum;intans=0;intmid=tr[u].l+tr[u].r>>1;if(ql<=mid)ans+=query(u<<1,ql,qr);if(qr>mid)ans+=query(u<<1|1,ql,qr);returnans;}inlineintlowbit(intx){returnx&-x;}intmain(){ios::sync_with_stdio(false);cin.tie(0);cin>>n;for(inti=1;i<=n;++i)cin>>w[i];cin>>m;for(inti=1;i<=m;++i){intl,r;cin>>l>>r;q[i]={l,r,i};}build(1,1,n);sort(q+1,q+m+1);intj=1;for(inti=1;i<=m;++i){auto[l,r,id]=q[i];while(j<=r){if(last[w[j]])modify(1,last[w[j]],-1);modify(1,j,1);last[w[j]]=j;j++;}ans[id]=query(1,l,r);}for(inti=1;i<=m;++i)cout<<ans[i]<<'\n';return0;}

离线-莫队算法

假设最坏情况下, 每次查询一个区间n nn, 开一个数组用于记录每个数字出现的次数, 算法时间复杂度O ( q n ) O(qn)O(qn), 无法通过

莫队优化

开一个c n t cntcnt数组用来记录每个数字出现的次数

( 1 ) (1)(1)对查询区间进行排序


假设当前查询区间是[ i , j ] [i, j][i,j]


蓝色部分是下一段查询的区间

( 2 ) (2)(2)对于每个区间

  1. 首先移动j jj指针, 移动到下一次查询的右端点上, 同时对于当前数字x xx, 如果未出现过那么不同数字的数量+ 1 +1+1, 否则不同数字的出现次数不发生变化, 同时累计c n t cntcnt数组的值

  2. 再将指针i ii移动到下一次查询的左端点, 对于当前需要删除的数字x xx, 如果出现次数大于1 11, 那么c n t ( x ) − 1 cnt(x) - 1cnt(x)1, 不对答案产生影响, 否则答案− 1 -11

因为每次移动指针最坏情况下是O ( n ) O(n)O(n)次, 算法时间复杂度最坏O ( q n ) O(qn)O(qn), 还是没办法通过

算法核心优化:因为算法瓶颈在指针会移动O ( n q ) O(nq)O(nq)次数, 尝试使得右指针是单调的(不会向回移动),左指针分块, 具体的来说

区间左端点按照分块的编号排序,双关键字排序

将所有查询分为n \sqrt nn块, 每一块长度是也是n \sqrt nn,块内部区间的右端点是递增的

对于右指针来说,块内走的次数不会超过n nn, 一共n \sqrt nn块, 最多移动n n n \sqrt nnn

左指针分为两种情况

因此左指针的最差时间复杂度是O ( q n ) O(q \sqrt n)O(qn)

左右时间取最大值, 因此优化后的算法时间复杂度最坏情况下是O ( q n ) O(q \sqrt n)O(qn)

假设块的大小是a aa, 右指针的移动次数是n 2 a \frac{n ^ 2}{a}an2, 左指针的最大移动次数是m a mama, 也就是
a = n 2 m a = \sqrt {\frac{n ^ 2}{m}}a=mn2
左右指针移动的次数相当

如果a = n a = \sqrt na=n比较慢, 尝试将a aa变为n 2 m \sqrt {\frac{n ^ 2}{m}}mn2

核心代码

// i表示左端点, j表示右端点for(intk=0,i=1,j=0,res=0;k<m;++k){// l, r分别代表当前区间的左右端点auto[l,r,id]=q[k];while(j<r)add(w[++j],res);while(j>r)del(w[j--],res);while(i<l)del(w[i++],res);while(i>l)add(w[--i],res);ans[id]=res;}

示例代码

#include<bits/stdc++.h>usingnamespacestd;constintN=50010,M=2e5+10,S=1e6+10;intn,m,len;intw[N],cnt[S],ans[M];structAsk{intl,r,id;}q[M];intget(inti){returni/len;}boolcmp(constAsk&a,constAsk&b){intba=get(a.l),bb=get(b.l);if(ba==bb)returna.r<b.r;returnba<bb;}voidadd(intx,int&ans){if(!cnt[x])ans++;cnt[x]++;}voiddel(intx,int&ans){cnt[x]--;if(!cnt[x])ans--;}intmain(){ios::sync_with_stdio(false);cin.tie(0);cin>>n;for(inti=1;i<=n;++i)cin>>w[i];cin>>m;// 计算块长len=sqrt(n*n/m+1);for(inti=0;i<m;++i){intl,r;cin>>l>>r;q[i]={l,r,i};}sort(q,q+m,cmp);for(intk=0,i=1,j=0,res=0;k<m;++k){auto[l,r,id]=q[k];while(j<r)add(w[++j],res);while(j>r)del(w[j--],res);while(i<l)del(w[i++],res);while(i>l)add(w[--i],res);ans[id]=res;}for(inti=0;i<m;++i)cout<<ans[i]<<'\n';return0;}

在线-主席树(持久化线段树)

假设对于当前数字上一次出现的位置是l a s t i last_ilasti

那么当前区间[ l , r ] [l, r][l,r]内是第一次出现该数字等价于l a s t i < l last_i < llasti<l, 为了方便统计定义g ( i ) g(i)g(i)表示l a s t i + 1 last_i + 1lasti+1

那么答案就是统计在区间[ l , r ] [l, r][l,r]g ( i ) ≤ l g(i) \le lg(i)l的数字的个数, 可以使用主席树维护g ( i ) g(i)g(i)的取值

查询的时候直接查询≤ l \le ll的所有g ( i ) g(i)g(i)就是答案

算法时间复杂度O ( m log ⁡ n ) O(m \log n)O(mlogn)

代码实现

#include<bits/stdc++.h>usingnamespacestd;constintN=50010,M=2e5+10,S=1e6+10;intn,m;intw[N];structNode{intls,rs;ints;}tr[4*N+17*N];intlast[S],g[N];introot[M],idx;intbuild(intl,intr){intu=++idx;tr[u]={0,0,0};if(l==r)returnu;intmid=l+r>>1;tr[u].ls=build(l,mid);tr[u].rs=build(mid+1,r);returnu;}intinsert(intp,intl,intr,intx){intu=++idx;tr[u]=tr[p];tr[u].s=tr[p].s+1;if(l==r)returnu;intmid=l+r>>1;if(x<=mid)tr[u].ls=insert(tr[p].ls,l,mid,x);if(x>mid)tr[u].rs=insert(tr[p].rs,mid+1,r,x);returnu;}intquery(intp,intq,intl,intr,intql,intqr){if(l>=ql&&r<=qr)returntr[q].s-tr[p].s;intans=0;intmid=l+r>>1;if(ql<=mid)ans+=query(tr[p].ls,tr[q].ls,l,mid,ql,qr);if(qr>mid)ans+=query(tr[p].rs,tr[q].rs,mid+1,r,ql,qr);returnans;}intmain(){ios::sync_with_stdio(false);cin.tie(0);cin>>n;root[0]=build(1,n);for(inti=1;i<=n;++i){cin>>w[i];g[i]=last[w[i]]+1;last[w[i]]=i;root[i]=insert(root[i-1],1,n,g[i]);}cin>>m;while(m--){intl,r;cin>>l>>r;// 注意这里查询的是 <= l的g[i]的数量intans=query(root[l-1],root[r],1,n,1,l);cout<<ans<<'\n';}return0;}
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/1/11 11:10:55

Profiling 专项

Profiling 工具 https://github.com/iovisor/bcc

作者头像 李华
网站建设 2026/1/7 13:50:18

如何完成一个方便简单的Arduino共阳极数码管实验(从0~9依次循环亮起)

文章目录 实验演示共阴极数码管和共阳极数码管的区别所需器材连接草图程序代码代码说明代码功能概述核心数据结构关键函数逻辑 小结 实验演示 共阴极数码管和共阳极数码管的区别 在开始实验之前&#xff0c;请让我简单解释一下共阴极数码管和共阳极数码管的区别&#xff0c;这…

作者头像 李华
网站建设 2026/1/11 17:34:21

Sniffnet容器化部署终极指南:3步搞定网络流量监控

还在为复杂的网络分析工具配置头疼吗&#xff1f;Sniffnet容器化部署让你在5分钟内拥有专业级网络流量分析能力&#xff01;告别环境依赖冲突&#xff0c;开启零基础网络分析新时代 &#x1f680; 【免费下载链接】sniffnet Sniffnet 是一个能让你轻松监测网络流量的应用。你可…

作者头像 李华
网站建设 2026/1/9 16:46:40

基于Python+Django的毕业设计选题系统(源码+lw+部署文档+讲解等)

课题介绍本课题聚焦高校毕业设计选题环节的管理痛点&#xff0c;设计实现一套基于 PythonDjango 框架的毕业设计选题系统。传统毕业设计选题多依赖线下提交、人工统计&#xff0c;易出现选题冲突、信息不对称、流程效率低等问题&#xff0c;难以适配高校规模化教学管理需求。系…

作者头像 李华
网站建设 2026/1/11 15:56:12

IO相关函数多种类型的拷贝

一&#xff1a;将1.txt一半拷贝给2.txt&#xff0c;一半拷贝给3.txt 使用多个.c 使用makefile完成。main.c#include "fun.h"int main(int argc, const char *argv[]){cope1();return 0;}fan.c#include "fun.h"void cope1(){FILE *fp1fopen("1.txt&quo…

作者头像 李华