今天介绍一种非常特殊的数据结构——线段树
首先提出一个问题: 给你n个数,有两种操作: 1:给第i个数的值增加X2:询问区间[a,b]的总和是什么? 输入描述
输入文件第一行为一个整数n,接下来是n行n个整数,表示格子中原来的整数。接下一个正整数q,再接 下来有q行,表示q个询问,第一个整数表示询问代号,询问代号1表示增加,后面的两个数x和A表示给 位置X上的数值增加A,询问代号2表示区间求和,后面两个整数表示a和b,表示要求[a,b]之间的区间和。 样例输入 4 7 6 3 5 2 1 1 4 2 1 2 样例输出
17
数据范围 1 <= n,q <= 100000 看到这个问题,最朴素的想法是用一个数组模拟,求和时 [ a , b ]中逐个累加 , 最后输出 。但是,由于数据量比较大,时间复杂度太高,时间上无法承受。 这时我们可以用线段树( Segment Tree ),这种特殊的数据结构解决这个问题。 那么什么是线段树呢?这就是一棵典型的线段树
一 般的线段树上的每一个节点T[a , b],代表该节点维护了原数列[ a , b ]区间的信息。对于每一个节点他至少有
三个信息:左端点,右端点,我们需要维护的信息(在本题中我们维护区间和)。由于线段树是一个二叉树,而且是一个平衡二叉树,如果当前结点的编号是i,左端点为L ,右端点为 R , 那么左儿子的 编号为 i*2 ,左端点为 L ,右端点为 (L + R)/2 ; 同理右儿子的 编号为 i*2+1,左端点为(L+R)/2 ,右端点为 R。如果当前结点的左端点等于右端点,那么该节点就是叶子节点,直接在该节点赋值即可。显然线段树是递归定义的。
线段树就是这样一种数据结构,讲一个大区间分为若干个不相交的区间,每次维护都在小区间上处理,并且查
询也在这些被分解的区间中信息合并出我们需要的结果,这就是线段树高效的原因。
线段树的存储:
线段树的存储可用链表和数组模拟。(本文采用数组写法,便于理解)
1.链表存储:
1 struct node2 {3 int Left, Right;4 node *Leftchild , *Rightchild;5 };
2.数组模拟
1 struct Tree2 {3 4 int l, r;5 long long sum;6 7 } tr[maxN << 2];
注意:数组的空间要开四倍大小,防止访问越界,(理论上大于maxN的最小2x的两倍)
建树:
线段树的构建是自顶点而下,即从根节点开始递归构建,根据线段树定义,当左端点等于右端点时(达到递归边界),直接赋值即可,回溯时也要维护区间,代码如下:
1 void Build_Tree ( int x , int y , int i ) 2 { 3 4 tr[i].l = x; 5 tr[i].r = y; 6 7 if( x == y )tr[i].sum = a[x] ; //找到叶子节点,赋值 8 9 else10 {11 ll mid = (tr[i].l tr[i].r ) >> 1 ;12 13 Build_Tree ( x , mid , i << 1); //左子树14 15 Build_Tree ( mid + 1 , y , i << 1 | 1); //右子树16 17 tr[i].sum = tr[i << 1].sum + tr[i << 1 | 1].sum; //回溯维护区间和18 19 }20 }
维护树:
维护树的方法也很好理解,如果目标更新节点在左儿子里,去左儿子中查找;反之,在右儿子中。不断递归,知道找到需要维护的节点,更新它,回溯是一路更新回来。这就是维护的过程,代码如下:1 void Update_Tree ( int q , int val , int i ) 2 { 3 if(tr[i].l == q && tr[i].r == q) //找到需要修改的叶子节点 4 { 5 tr[i].sum = val ; //更新当前结点 6 } 7 else //当前结点是非叶子结点 8 { 9 long long mid = (tr[i].l tr[i].r ) >> 1 ; //取中间10 11 if ( q <= mid ) //目标节点在左儿子中12 {13 Update_Tree ( q , val , i << 1 );14 }15 else if( q > mid ) //目标节点在右儿子中16 {17 Update_Tree ( q , val , i << 1 | 1 );18 }19 tr[i].sum = tr[i << 1].sum + tr[i << 1 | 1].sum; //回溯20 }21 }
查询树:
题目中让我们查询区间求和,不难想到如果当前结点的区间完全被目标区间包含,直接返回当前结点的sum值,否则分类讨论。具体过程通过以下代码理解:
1 long long Query_Tree ( int q , int w , int i ) 2 { 3 if ( q <= tr[i].l && w >= tr[i].r ) return tr[i].sum; //当前结点的区间完全被目标区间包含 4 else 5 { 6 long long mid = (tr[i].l tr[i].r) >> 1; 7 if( q > mid ) //完全在右儿子 8 { 9 return Query_Tree ( q , w , i << 1 | 1);10 }11 else if (w <= mid ) //完全在左儿子12 {13 return Query_Tree ( q , w , i << 1);14 }15 else //目标区间在左右都有分布16 {17 return Query_Tree ( q , w , i << 1) + Query_Tree ( q , w , i << 1 | 1 );18 }19 }20 }
主程序:
1 int main ( ) 2 { 3 4 int N, M, q, val, l, r; 5 scanf("%d", &N); 6 for ( int i = 1 ; i <= N ; i++ )scanf("%d", &a[i]); 7 Build_Tree ( 1 , N , 1); 8 cin >> M ; 9 while (M--)10 {11 int op ;12 cin >> op ;13 if ( op == 1 )14 {15 scanf("%d%d", &q, &val);16 Update_Tree ( q , val , 1);17 }18 else19 {20 scanf("%d%d", &l, &r);21 printf("%lld\n", Query_Tree ( l , r, 1 ));22 }23 }24 return 0 ;25 }
线段树的性质:
假设线段树处理的数列长度为N,那么总结点数不超过2*N(满二叉树是最大情况);线段分解数量级:线段树能把任意一条长度为M的线段分为不超过2Log2(M)条线段(我们知道一个很大的数,Log一下就变小了),这条性质使线段树的查询与修改复杂度都在O(Log2(n))的范围内解决。
由于线段树是一颗二叉树,深度约为Log2(N)左右。 综上,线段树空间消耗O(n),由于它深度性质,使它在解决问题上有较高的效率。(本期完)
To Be Continued ;