Sparse Tableを知ったので、忘れないように。

codeforces.com
この問題の想定解法がSparse Tableを使ったもので、ちゃんと理解したいなと思ったので忘備録的な感じで書きます。
色々調べながら書いているので、間違っているところがあったら指摘して頂けるとありがたいです。

Sparse Tableとは

まず、Sparse Tableがどういうものなのかを簡単に説明。

・ある区間に対する最小値、最大値を求められる。

・区間内のインデックス $i$ $(0 \leq i < N)$ から長さが $2^k$ ごとの区間内の最小値または最大値を持つインデックスを保持するデーブルを持つ

・区間内のインデックス $i$ ごとに最小値または最大値を持つインデックスを見つけるので、テーブルの生成で $O(NlogN)$

・クエリの処理を行う前にテーブルが出来ているので、 $O(1)$

テーブルの生成

まず、 $O(NlogN)$ でテーブルを生成していく。

$table[N][log(N)]$

区間の長さ $N = 12$ として、配列を用意する。

A[0]	A[1]	A[2]	A[3]	A[4]	A[5]	A[6]	A[7]	A[8]	A[9]	A[10]	A[11]
2	5	3	9	8	2	10	1	7	2	1	6

ここで、 $2^k$ ごとの区間のというのは以下のようなもの。

開始インデックス $i$
区間の長さ $2^k$

として最小値のインデックスを求める時、
$i = 2$ , $k = 0$ の場合、 $table[i][k] = 2$

A[0]	A[1]	A[2]	A[3]	A[4]	A[5]	A[6]	A[7]	A[8]	A[9]	A[10]	A[11]
2	5	3	9	8	2	10	1	7	2	1	6

$i = 2$ , $k = 1$ の場合、 $table[i][k] = 2$

A[0]	A[1]	A[2]	A[3]	A[4]	A[5]	A[6]	A[7]	A[8]	A[9]	A[10]	A[11]
2	5	3	9	8	2	10	1	7	2	1	6

$i = 2$ , $k = 2$ の場合、 $table[i][k] = 5$

A[0]	A[1]	A[2]	A[3]	A[4]	A[5]	A[6]	A[7]	A[8]	A[9]	A[10]	A[11]
2	5	3	9	8	2	10	1	7	2	1	6

$i = 2$ , $k = 3$ の場合、 $table[i][k] = 7$

A[0]	A[1]	A[2]	A[3]	A[4]	A[5]	A[6]	A[7]	A[8]	A[9]	A[10]	A[11]
2	5	3	9	8	2	10	1	7	2	1	6

ここで、 $table[i][k]$ を求める場合、 $table[i][k - 1]$ が分かっていれば調べる区間の半分を既に調べていることになるので、残りの調べていない部分だけを調べれば良い。

A[0]	A[1]	A[2]	A[3]	A[4]	A[5]	A[6]	A[7]	A[8]	A[9]	A[10]	A[11]
2	5	3	9	8	2	10	1	7	2	1	6

$table[i][k] = \left\{ \begin{array}{ll} table[i][k - 1] & (A [ table [ i ] [ k - 1 ] ] \leq A [ table [i + 2^{k - 1} - 1] [k - 1] ]) \\ table[i + 2^{k - 1} - 1][k - 1] & (otherwise) \end{array} \right.$

$table[i][k] =$ 開始インデックスが $i$ ,長さが $2^k$ の場合の最小値を指すインデックス。
これをDPで求め、デーブルを生成する。

import java.util.Arrays;

public class RMQ_SparseTable {
	int[] A, log_table;
	int[][] table;
	int N;

	public RMQ_SparseTable(int[] A) {
		N = A.length;
		this.A = Arrays.copyOf(A, N);


		//log_tableを前処理で作っておくことでクエリ処理時にO(1)でlogを計算できる
		log_table = new int[N + 1];
		for(int i = 2;i < N + 1;i++){
			log_table[i] = log_table[i >> 1] + 1;
		}


		table = new int[N][log_table[N] + 1];


		//table[i][2^0] = i番目の要素から長さ1の区間の最小値はA[i](A[i]自身か含まないので)
		for (int i = 0; i < N; i++) {
			table[i][0] = i;
		}
		for (int k = 1;(1 << k) <= N; k++) {
			for (int i = 0; i + (1 << k)<=  N; i++) {
				int first = table[i][k - 1];//前部分
				int second = table[i + (1 << (k - 1))][k - 1];//後部分

				//前部分の最小値と後部分の最小値を比較して、より小さいものを採用する
				if (A[first] < A[second]) {
					table[i][k] = first;
				} else {
					table[i][k] = second;
				}

			}
		}
	}
}

クエリの処理

$query(s,t) = A[s,t]$ の最小値のインデックス
とする。
クエリの処理は $A[s,s + 2^k - 1]$ , $A[t - 2^{k} + 1,t]$ の2つの区間の最小値を求めることで最小値のインデックスを求める。

つまり、 $query(s,t) = min(A[s,s + 2^k - 1],A[t - 2^{k} + 1,t])を持つインデックス$

$k$ は $t - s + 1$ 、つまりクエリの引数で指定された区間の長さを $log(t - s + 1)$ にしたもの。
こうすることで、 $A[s,s + 2^{log(t - s + 1)} - 1]$ は区間の半分以上を覆うことができ、 $A[t - 2^{log(t - s + 1)} + 1,t]$ もまた区間の半分以上を覆うことができるので、
区間全体を覆うことができる。

例： $query(0,11) = 7$ の場合

$s = 0$ , $t = 11$ , $k = 3$

$A[i,i + 2^k - 1] = A[0,0 + 2^3 - 1] = A[0,7]$

A[0]	A[1]	A[2]	A[3]	A[4]	A[5]	A[6]	A[7]	A[8]	A[9]	A[10]	A[11]
2	5	3	9	8	2	10	1	7	2	1	6

$A[t - 2^{k} + 1,t] = A[11 - 2^3 + 1,11] = A[4,11]$

A[0]	A[1]	A[2]	A[3]	A[4]	A[5]	A[6]	A[7]	A[8]	A[9]	A[10]	A[11]
2	5	3	9	8	2	10	1	7	2	1	6

例： $query(2,4) = 2$ の場合

$s = 2$ , $t = 4$ , $k = 1$

$A[s,s + 2^k - 1] = A[2,2 + 2^1 - 1] = A[2,3]$

A[0]	A[1]	A[2]	A[3]	A[4]	A[5]	A[6]	A[7]	A[8]	A[9]	A[10]	A[11]
2	5	3	9	8	2	10	1	7	2	1	6

$A[t - 2^{k} + 1,t] = A[4 - 2^1 + 1,4] = A[3,4]$

A[0]	A[1]	A[2]	A[3]	A[4]	A[5]	A[6]	A[7]	A[8]	A[9]	A[10]	A[11]
2	5	3	9	8	2	10	1	7	2	1	6

SparseTableの実装(Java)

import java.util.Arrays;

public class RMQ_SparseTable {
	int[] A, log_table;
	int[][] table;
	int N;

	public RMQ_SparseTable(int[] A) {
		N = A.length;
		this.A = Arrays.copyOf(A, N);


		//log_tableを前処理で作っておくことでクエリ処理時にO(1)でlogを計算できる
		log_table = new int[N + 1];
		for(int i = 2;i < N + 1;i++){
			log_table[i] = log_table[i >> 1] + 1;
		}


		table = new int[N][log_table[N] + 1];


		//table[i][2^0] = i番目の要素から長さ1の区間の最小値はA[i](A[i]自身か含まないので)
		for (int i = 0; i < N; i++) {
			table[i][0] = i;
		}
		for (int k = 1;(1 << k) <= N; k++) {
			for (int i = 0; i + (1 << k)<=  N; i++) {
				int first = table[i][k - 1];//前部分
				int second = table[i + (1 << (k - 1))][k - 1];//後部分

				//前部分の最小値と後部分の最小値を比較して、より小さいものを採用する
				if (A[first] < A[second]) {
					table[i][k] = first;
				} else {
					table[i][k] = second;
				}

			}
		}
	}

	public int query(int s, int t) {
		//区間の長さ
		int d = t - s + 1;
		//logの計算
		int k = log_table[d];

		if (A[table[s][k]] < A[table[t - (1 << k) + 1][k]]) {
			return table[s][k];
		} else {
			return table[t - (1 << k) + 1][k];
		}
	}
}

参考:
Range Minimum Query and Lowest Common Ancestor – topcoder
RMQ: Sparse Table - Algorithms and Data Structures

まとめ

写経をしているはずなのに、なぜかバグが生まれるのがだいぶ辛かった。

tookunn’s diary

主に競技プログラミング関係

Sparse Tableを知ったので、忘れないように。

Sparse Tableとは

・ある区間に対する最小値、最大値を求められる。

・区間内のインデックス $i$ $(0 \leq i < N)$ から長さが $2^k$ ごとの区間内の最小値または最大値を持つインデックスを保持するデーブルを持つ

・区間内のインデックス $i$ ごとに最小値または最大値を持つインデックスを見つけるので、テーブルの生成で $O(NlogN)$

・クエリの処理を行う前にテーブルが出来ているので、 $O(1)$

テーブルの生成

クエリの処理

例： $query(0,11) = 7$ の場合

例： $query(2,4) = 2$ の場合

SparseTableの実装(Java)

まとめ

Sparse Tableとは

・ある区間に対する最小値、最大値を求められる。

・区間内のインデックスから長さがごとの区間内の最小値または最大値を持つインデックスを保持するデーブルを持つ

・区間内のインデックスごとに最小値または最大値を持つインデックスを見つけるので、テーブルの生成で

・クエリの処理を行う前にテーブルが出来ているので、

テーブルの生成

クエリの処理

例：の場合

例：の場合

SparseTableの実装(Java)

まとめ

・区間内のインデックス $i$ $(0 \leq i < N)$ から長さが $2^k$ ごとの区間内の最小値または最大値を持つインデックスを保持するデーブルを持つ

・区間内のインデックス $i$ ごとに最小値または最大値を持つインデックスを見つけるので、テーブルの生成で $O(NlogN)$

・クエリの処理を行う前にテーブルが出来ているので、 $O(1)$

例： $query(0,11) = 7$ の場合

例： $query(2,4) = 2$ の場合