2017-12-06

Finding Distance Between Two Nodes of a Binary Tree

! Algorithm

yambe2002さんの記事に面白い問題が掲載されていたことをふと思い出して、考えてみました。

バイナリツリーの2ノード間の距離を求めるメソッドを作成せよ

こちらは所謂「ホワイトボードコーディング」で出題された問題だそうです。つまり、面接の問題です。

木が二分木ではない場合、ダブリングを伴ったLCAを答えることが選択肢の一つではないか、と考えました。計算量は$O(Q\log{}N)$です。しかし二分木であること、また電話面接だったとのことですので¹、おそらく20分以内で簡潔な解法を説明することを要求されているのではないかと感じました。解法はおそらくとてもシンプルなものなのでしょう。

根の番号を1とした二分木では、頂点の番号をiとした場合に

$\lfloor{}i / 2\rfloor$として親の頂点の番号を取得することができる

という性質があります。この性質をうまく使う問題ではないかと思い、考えてみました。

f:id:agw:20171206082249p:plain

まず$O(Q\log{}N)$の解法をすぐ思いつきました。頂点数をN、クエリ数をQとしています。二分木なので想定して、頂点数Nはたかだか$2^d - 1$です(dは1以上の整数で、木の深さ)。例えば木の深さが60までだとすると、取りうるNは高々1、3、7、...、1,152,921,504,606,846,975となります。木の深さは$\log{}N$です。

さて、一般的な木での$O(QN)$の解法は以下のようなものになると思います。

2つの頂点の深さを合わせる(この回数を$c_1$回とします)
共通の頂点にたどり着くまで、親をたどる(この回数を$c_2$回とします。両方の頂点の移動量は$2c_2$となります)

図示すると以下のようになるでしょうか。黒い矢印が深さを合わせるフェーズで、灰色の矢印が共通の親を探すフェーズを表します。

f:id:agw:20171206082406p:plain

$c_1$と$c_2$から二つの頂点の距離は$c_1 + 2c_2$と計算することができます。

頂点の深さを求めるにはどうしたらよいでしょう? 一般的な木の場合はDFS等で事前に記録しなければならなさそうですが、こちらも完全二分木ならではの求め方がありそうです。これは各頂点の番号を二進数として表すことで規則性が見えてきました。

f:id:agw:20171206082442p:plain

つまり、同じ深さの頂点は高位の1のビットが現れる位置が同じであるわけです。これを行うには何らかのビット演算を行う必要があるように思いました。おそらく効率のよろしくないであろう実装を書き始めることも出来そうですが、後に回すことにしました。

深さが合っていれば、共通の頂点にたどり着くまで親をさかのぼればよいです。この回数を$c_2$として数えます。

f:id:agw:20171206082549p:plain

実装はおそらく以下のようなものになるのではないでしょうか(ここから全編を通して$x \le y$であるものとしています)。

  // ゴニョゴニョした結果、xとyの深さは揃っているものとする

  int c2 = 0;

  for ( ; x != y; c2 ++, x /= 2, y /= 2)
    ;

  return c1 + c2 * 2;

これで$O(Q\log{}N)$の実装は完成です。

こう考えると、予め深さの調整をせずとも単純に深い方の頂点を上に持ってきてもいい気がします。

  int c = 0;

  for ( ; x != y; c ++)
    (x > y ? x : y) /= 2;

  return c;

より簡潔に書けました。追いかけっこをしているようなので、そのように名付けます(追いかけ)。深さを合わせる実装も必要なくなってしまいました。めでたしめでたし。

...さて、時間が余ってしまいました。ここで面接官が世間話をしてくることはおそらくないでしょう。次の問題を出題するかもしれません。また、計算量を$O(Q\log{}N)$から下げる方法はないか検討することを求めてくるかもしれません。

ここで先ほどの図をよく眺めてみます。親の親の頂点番号は場号を右側に2つシフトしたものとなっていますね。これは利用できないでしょうか?

同様に、n個上の親の頂点の番号はx >> nで算出することができそうです。二つの頂点の深さが等しければ、ビットシフトを利用して二分探索をすることができそうです。

f:id:agw:20171206082629p:plain

  // ゴニョゴニョした結果、xとyの深さは揃っているものとする

  int l = -1, u = 66;

  while (u - l > 1) {
    int m = (l + u) / 2;

    ((x >> m) == (y >> m) ? u : l) = m;
  }

  return c1 + 2 * u;

この実装の計算量は$O(Q\log\log{}N)$となります。計測してみると、確かに速い。$O(Q\log{}N)$のものに比べて10倍速い結果となりました。

さて、おざなりにしていた深さを揃える実装を考えてみます。以下のように頂点の高さを揃えたいのです。

f:id:agw:20171206082536p:plain

試しに書いてみたのですが、どうもどんくさい。

  int c1 = 0, c2 = 0;

  long long s = (xのビットをゴニョゴニョする), t = (yのビットをゴニョゴニョする);

  for ( ; s != t; t /= 2, y /= 2, c1 ++)    // 深さを揃える
    ;
                     :

どうもうまく書けない。そこでnaoya_t氏にご登場願いました。この話の背景、$O(Q\log{}N)$、$O(Q\log\log{}N)$の実装アイデア、深さを揃えるところをうまく書けていない...10分ほど会話をしたでしょうか。

1時間ほど経ってnaoya_t氏から一報が届きました。実装含め、完了したとのこと。内容は目を疑うようなものでした²。

  int c = __builtin_clzll(x) - __builtin_clzll(y);

  return c + (64 - __builtin_clzll(x ^ (y >> c))) * 2;

結局のところ、二分探索も必要なく³先頭からの0のビットの数を数えること(clz / Count Leading Zero)とビット演算だけで求めることができる、とのことでした。びっくり⁴。

まず双方の番号のclzを取得して、大きい方の番号をclzの差の分だけ右側にシフトします。これで深さが揃います。以下の例の場合、$5 - 4 = 1$ビットだけ右側にずらしてやります。

f:id:agw:20171207100732p:plain

さらに、排他的論理和を取って二つの数のビットが異なる初めてのビットまでの位置をclzで取得します。このビット以降をなくしてしまえば、それは共通の祖先の頂点であると言えそうです。またその距離は右側からこのビットまでのビット数(bsr / Bit Scan Reverse)です。つまり総ビット長(実装では64、図では8)からclzを引いた分が共通の頂点までの距離となります。この距離は2倍しなければならないことに注意してください。

f:id:agw:20171207100716p:plain

さて、計測です。$O(Q\log\log{}N)$のものに比べてさらに10倍速い。clzは大抵CPUで用意されているので当然と言えば当然です。clzの計算量を$O(1)$とすると、全体の計算量は$O(Q)$です。

ちょっとしたあとがき

このブログはnico_shindanninさんが主宰するCompetitive Programming Advent Calendar 2017 - Adventarの飛び込みエントリとして書いてみました。氏は多忙であるにも関わらずコミュニティのアクティビティに貢献し続けています。いつも本当にありがとうございます(就寝するときはシンガポールに足を向けないようにしています :))。遅筆なところ急ぎ書き起こしたため、読み辛い部分が多いと思います。ごめんなさい。

最近ありがたいことに人付き合いに恵まれ、コンテスト以外でのアクティビティが充実しています。と言っても、解けた問題のレビューをしたり、解けなかった問題を教わったり。競技プログラミングのみならず、オンラインコースでの勉強、英会話などなど。大変充実した時間を過ごしています。

アルゴリズムの勉強方法にも少しずつ工夫を取り入れています。あまり派手ではありませんが、レートもジワジワ上がってきていて効果を実感してきています(Codeforcesで100くらい、ですかね)。

コンテスト終了時に取り組んでいた問題をコンテスト終了直後にリマインダーに突っ込み、復習する
自分が実現したい不明なテクニックがあった場合、コンテスト中でもリマインダーに突っ込む
コンテストに参加できなかった知人に良問だと思った問題をリコメンドする(また、知人のレベルではやらなくてよい問題も伝える)
良問についてダラダラ語る

問題について議論することが相当効いているようです。本文にご登場いただいたnaoya_t氏の発想は自力ではなかなかたどり着けませんし、また氏曰く、自分が考えていた追いかけや二分探索の発想はまずしなかったそうです(ビット演算系がうまく行かなかった後の選択肢なんでしょう)。もちろんコンテスト終了後のTLによる感想戦でもこのような知見に出会えるのですが。コンテストからしばらく経ったあとでも議論したりしているとことがいいんでしょうか。

さて、面接で求められていたのはどの程度なんでしょうかね。気になるところではあります。題材として引用することを快諾くださったyambe2002さん、どうもありがとうございました。

ちょっとした追記

「ビットをゴニョゴニョする」のに、最高位のビットだけ残すことを考えていました。つまり、2の冪での床関数です。分岐なしで$O(log{}N)$の実装なので、これはこれで大変高速です(これだけ命令があってclzの倍程度)。

inline long long bfloor(long long x)
{
  x |= x >> 1;
  x |= x >> 2;
  x |= x >> 4;
  x |= x >> 8;
  x |= x >> 16;
  x |= x >> 32;
  return x - (x >> 1);
}

例えば$0010\ 1011$を渡すと$0010\ 0000$を返します。

コラボレート可能なエディタにコーディングするよう指示されたそうです↩
naoya_t氏の実装を元に筆者の好みで改訂しています(スンマセン)↩
おそらくclzのCPU内での実装は$O(\log{}N)$のビット演算です。分岐不要な二分探索として実装されているものも多いようです↩
実際のところ、__builtin_clzは引数に0を取った場合の返り値が未定義となりますので、long long z = x ^ (y >> c); return z ? c + (64 - __builtin_clzll(z)) * 2 : c;等としなければなりません↩

2017-11-04

Idiom: Cumulative Summation Summary

Algorithm !

累積和を実装するとき、いつもインデックスの扱いに悩んでしまいます。これが結構時間を喰うので、しっかりイディオムとしてまとめようと思いました。

例えば0-indexの配列、$a_i$があるとします。

$$ \begin{array}{c|ccccc} i & 0 & 1 & 2 & 3 & 4 & 5\\\hline a_i & 1 & 2 & 3 & -4 & -2 & 1 \end{array} $$

目的はO(1)で$s_{[i,j)}$を求めることです(準備にはO(N)かかります)。例えば、$s_{[0,1)}$は1、$s_{[0,3)}$は6、$s_{[1,3)}$は5といった具合です。

これを行うには累積和をテーブルとして用意するのが常套手段です。これを$\mathit{acc}_i$とします。$\mathit{acc}_{i+1} = a_i + \mathit{acc}_i$とします。また、$\mathit{acc}_0$は0です。つまり、

$$ \begin{cases} \mathit{acc}_0 = 0\\ \mathit{acc}_{i+1} = a_i + \mathit{acc}_i\ \text{where}\ 0 \leq i < \mathit{size}\\ \end{cases} $$

作成された累積和テーブルは以下のようになります。

$$ \begin{array}{c|cccccc} i & 0 & 1 & 2 & 3 & 4 & 5 & 6\\\hline \mathit{acc}_i & 0 & 1 & 3 & 6 & 2 & 0 & 1 \end{array} $$

ここで添字がずれるのが混乱の元なんですね。しっかり式を立てておきましょう。

$$ s_{[i, j)} = \mathit{acc}_j - \mathit{acc}_i $$

ポイントは、

半開区間とすること($s_{[i,i)}$は空集合なので0)
i、jは配列$a_i$のものをそのまま使う

となります。結果は以下のようになります。

$$ \begin{array}{c|c} s_{[0,1)} = \mathit{acc}_1 - \mathit{acc}_0 = 1 - 0 = 1\\ s_{[0,3)} = \mathit{acc}_3 - \mathit{acc}_0 = 6 - 0 = 6\\ s_{[1,3)} = \mathit{acc}_3 - \mathit{acc}_1 = 6 - 1 = 5\\ \end{array} $$

さて、1-indexの配列の場合にはどうしたらよいでしょう?

$$ \begin{array}{c|ccccc} i & 1 & 2 & 3 & 4 & 5 & 6\\\hline a_i & 1 & 2 & 3 & -4 & -2 & 1 \end{array} $$

$a_0$を0とおけば-0indexの場合と同様に扱うことができそうです。

$$ \begin{array}{c|ccccc} i & 0 & 1 & 2 & 3 & 4 & 5 & 6\\\hline a_i & 0 & 1 & 2 & 3 & -4 & -2 & 1 \end{array} $$

累積和テーブルは一つずれますが、0-indexと同じ考え方で扱うことができそうです。累積和テーブルの先頭の2つの要素を0で初期化しておかなければならないので注意が必要です。

$$ \begin{cases} \mathit{acc}_0 = 0\\ \mathit{acc}_1 = 0\\ \mathit{acc}_{i+1} = a_i + \mathit{acc}_i\ \text{where}\ 1 \leq i \leq \mathit{size}\\ \end{cases} $$

作成された累積和テーブルは以下のようになります。

$$ \begin{array}{c|cccccc} i & 0 & 1 & 2 & 3 & 4 & 5 & 6 & 7\\\hline \mathit{acc}_i & 0 & 0 & 1 & 3 & 6 & 2 & 0 & 1 \end{array} $$

$s_{[i,j)}$は以下のように算出することができます。

$$ s_{[i, j)} = \mathit{acc}_j - \mathit{acc}_i $$

もう一つ気になることといえば、配列は要素数 + 1、また累積和は要素数 + 2分確保しなければならないことでしょうか。

では累積和を一つずらすことを考えてみましょう。この場合の累積和は要素数 + 1分確保すればよいです。

$$ \begin{cases} \mathit{acc}_0 = 0\\ \mathit{acc}_{i} = a_i + \mathit{acc}_{i-1}\ \text{where}\ 1 \leq i \leq \mathit{size}\\ \end{cases} $$

作成された累積和テーブルは0-indexのときと変わりません。

$$ \begin{array}{c|cccccc} i & 0 & 1 & 2 & 3 & 4 & 5 & 6\\\hline \mathit{acc}_i & 0 & 1 & 3 & 6 & 2 & 0 & 1 \end{array} $$

これは0-indexのときの累積和と全く同じです。$s_{[i, j)}$を計算するときは、以下とします。

$$ s_{[i,j)} = \mathit{acc}_{j-1} - \mathit{acc}_{i-1} $$

書き出したことで頭がスッキリしてきました。特に、0-indexのときの悩みはなくなりそうです。1-indexのときはどうしたらいいんでしょうか。もう少し経験を積んでから考えたほうがよさそうです。

2017-11-01

Idiom: Check if given string starts with some string

Algorithm !

std::stringとして与えられた文字列がある特定の文字列から始まるかどうかを記述するのは簡単なことのように思えます。これが自分にとっては意外に難しく、いつも時間を割いてしまうのです。先日、コードリーディングをしていた際にうまい方法を見つけたため、イディオムとして記載しておこうと思います。

先日(またもや)やってしまった実装は以下のようなものでした。

  const std::string s("abc");   // abcから始まる文字を探したい

  const int size = s.size();

  const std::string a[] = {
    "abcdef",
    "defabc",
    "abcabc",
    "a"
  };

  for (const auto& i : a)
    if (i.size() >= size)               // 文字列の長さが十分かどうかチェックする
      if (i.substr(0, size) == s)       // 先頭の文字列を切り出して比較する
        // 文字列iはsから始まっている!
};

この実装は色々と無駄があるだけではなく、自分にとっては注意すべき点が多く手早く書けないのです。

文字列iのサイズを検証する -> この際等号を入れるべきだろうか?
文字列iの先頭size文字をstd::stringとして生成する -> この際使うべきsubstrメソッドには引数を1つ与えるべきか。それとも2つ与えるべきか?

そもそもsubstrメソッドは末尾のサイズを適切にチェックしてくれるはずです。

  for (const auto& i : a)
    // if (i.size() >= size)            // サイズのチェックはしなくてよい
      if (i.substr(0, size) == s)
        // 文字列iはsから始まっている!

これでも悪くはないのですが、やはりsubstrの引数の数は悩んでしまいそうです。どうもあれだなあ、とコードリーディングをしていた際に、以下のイディオムを見つけました。

  for (const auto& i : a)
    if (i.find(s) == 0)
      // 文字列iはsから始まっている!

なるほど簡潔で覚えやすそうです。次回からはこのイディオムを使おうと思います。

もう少しだけ

findメソッドを使ったこのイディオムは簡潔でよいのですが、先頭から指定して文字列で始まっていない場合、無駄に探索を行ってしまいます(例えば文字列が"xyzxyzxyzxyzxyzxyzxyz"の場合)。これが無駄に思える場合はstrncmpを使った方がいいかもしれません。

  for (const auto& i : a)
    if (strncmp(i.c_str(), s.c_str(), size) == 0)
      // 文字列iはsから始まっている!

2017-10-27

Redirecting Contents of File to Standard Input

Shell !

1行シェルスクリプトとEmacsで極力物事を済ます方針になって久しいのですが、コンテスト中は時間がないので多少のスクリプトを用意しています。先日コンテスト中にこんなスクリプトがあったらいいなあ、と考えついたので早速作成しました。

Emacsでテキストを加工する。具体的には「入力」「空行」「出力」「空行」...という形式とする
コマンドを適用すると、「入力」「出力」がsample1.txt、answer1.txt、...と出力される

例えば以下のようなファイルを用意します。

これにコマンドを適用すると、以下のようにファイルに格納されるようにしたいのです。

sample1.txt:
3 2
1 2 3
1 2
3 2

answer1.txt:
5

sample2.txt:
4 3
1 2 3 4
1 2
3 4
3 4

answer2.txt:
8

こういう処理はシェルスクリプトでさっさと書いてしまいましょう。

unpack.sh:

#!/bin/sh

i=1

bodyname="sample"

test -f "$bodyname$i.txt" && rm -f "$bodyname$i.txt"

while read l; do
  if ! echo "$l" | grep '^ *$' > /dev/null; then
    echo $l >> "$bodyname$i.txt"
  else
    if [ "$bodyname" == "sample" ]; then
      bodyname="answer"
    else
      bodyname="sample"

      i=`expr $i + 1`
    fi

    test -f "$bodyname$i.txt" && rm -f "$bodyname$i.txt"
  fi
done

早速テストして...いい感じですね。内容もよいようです。

> ls
a.txt
> unpack.sh < a.txt
> ls
a.txt       answer2.txt sample1.txt sample3.txt
answer1.txt answer3.txt sample2.txt

さて、これを自分の環境にリリースしたのですが、どうも自分の操作と相性が合わないのです。どうしてだろう? と観察してみたのですが、Emacs diredから!でファイル操作ができないのが原因でした。Emacs diredから!とするにはシェルスクリプトがファイル名を引数として得て処理できなければなりません。

これを解決するのは簡単で、以下の1行を代入するだけでした。

           :
test -f "$bodyname$i.txt" && rm -f "$bodyname$i.txt"

test -f "$1" && exec <"$1"   # この行を挿入

while read l; do
           :

つまるところ、引数としてファイルが与えられていた場合、ファイルの内容を標準入力にリダイレクトしてしまえばよいのです。

さて、これでEmacs diredから快適にコマンドを使うことができるようになりました。今から使う機会が楽しみです。

少しばかりの続き

さて、このスクリプトであると空行が2つ以上続くとよくない結果となります。

> ls
a.txt
> cat a.txt
1  # sample1.txtに書き込まれるはず

2  # answer1.txtに書き込まれるはず


3  # sample2.txtに書き込まれるはず

4  # answer2.txtに書き込まれるはず
> unpack < a.txt
> ls # sample2.txtがない? sample3.txtがある??
a.txt       answer1.txt answer2.txt sample1.txt sample3.txt

空白毎に出力するファイルを更新しているのが原因です。これを防ぐために、予めsedを適用して調整しています。

           :
test -f "$1" && exec <"$1"

sed -ne '
s/^  *$//
H
$ {
  g
  s/^\n*//g
  s/\n*$//g
  s/\(\n\n\)\n*/\1/g
  p
}
' | while read l; do
           :

このsed スクリプトも面白いので興味があれば是非処理を追ってみてください。具体的には、「全て読み込んでから連続する改行を取り除く。ただし、各行が空白を含む空行であればこれも処理する」といったことをしています。また、最新のスクリプトはこのGistで管理しています。

2017-10-13

Idiom: Calculating Power of 10 using pow Function in Integer Arithmetic

Algorithm !

今日参加したコンテストで有効な電話番号の組み合わせ数を求める問題が出題されました。実装ではlong longの大きな値、例えば$10^{17}$から小さな値、例えば10や1を引く演算を行う必要がありました。

powを使って10の冪乗を計算する解法も少なくなかったのですが、おそらくそのほとんどはテスト時に落ちてしまいました。どうやら計算誤差が原因のようです。

これは自分にとっても大きな驚きでした。xが整数である場合、pow(10, x)がきっちりと10の冪乗を返すことを知っていたからです。

  long long x = 1;
  
  for (int i = 0; i < 18; i ++, x *= 10)
    assert(pow(10, i) == x);            // pow(10, i)は問題なし

どこで計算誤差が出ているかを考えるために以下のような実装を用意しました。$10^{17} - (10^0 + 10^1 + 10^2)$を計算する実装です。期待している答えは末尾が...,999,889となるはずです。

long long c = pow(10, 17);

assert(c == 100000000000000000LL); // ここは問題なし

std::vector<int> a = {0, 1, 2};

for (const auto& i : a)
  c -= pow(10, i);

assert(c == 99999999999999889LL);  // ここでアサーションエラー!

変数cの内容をチェックしました。期待とは異なり、99,999,999,999,999,888でした。

さて、以下は期待通り...,999,889を返します。

long long c = pow(10, 17);

assert(c == 100000000000000000LL);      // ここは問題なし

astd::vector<int> a = {0, 1, 2};

for (const auto& i : a)
  c -= static_cast<long long>(pow(10, i));

assert(c == 99999999999999889LL);       // ここも問題なし!

どうも自分はこれまで、-=演算子は左側の変数の型で演算される、と思い込んでいたようです。つまり右辺の値がまずlong longにキャストされると考えていました。実際には二項の加減算演算子の振る舞いと同様に、doubleにキャストされてから計算され、改めてlong longにキャストされるようです。

これまで挙動を正確に把握していなかったこともあり、pow関数を使って10の冪乗を計算しないようにしていましたが、次のようなイディオムとして今後積極的に使っていきたいな、と考えています。またこの知見を大好きなハックにも役立てたいです。

long long y = static_cast<long long>(pow(10, x));

最後になりますが、TLで気さくに質問に答えてくださった@n_vipさん、ありがとうございました。

追記

これは実装依存の挙動だそうです。一般的に、pow(x, y)のyが整数のときはpowを使うべきではないとのこと。naoya_tさんにご指摘いただきました。どうもありがとうございます)。

参考: c++ - Definitions of sqrt, sin, cos, pow etc. in cmath - Stack Overflow

2017-10-04

Series of Xor Arithmetics

Algorithm !

先日参加したコンテストにこんな問題が出題されました。排他的論理和を使う問題です。

nとxが与えられる。n個の異なる整数のビットごとに排他的論理和を取ってxとなるようにしたい。n個の非負整数を出力せよ

ただし、1 ≦ n ≦ 10⁵、0 ≦ x ≦ 10⁵とし、出力する非負整数は10⁶までとする

排他的論理和は融通が効く印象がありました。n - 1個の0から始まる連続した整数を用意してそのビットごとの排他的論理和を取り、最後の一個で辻褄を合わせられるんじゃないか? と考えました(その方針の元で実装した解法は無事、システムテストを通過しました!)

排他的論理和の計算は色々なアルゴリズムに登場します。例えばZobrist HashingやRolling Hashを考えるとき、排他的論理和は欠かせません。今回のエントリでは連続した排他的論理和の計算方法について紹介したいと思います。

さて、{1, 0, 0, 1, 0, 1, 0, 1}という数列の排他的論理和を計算することを考えてみましょう。左から演算を行っていくと以下のように計算することができます。

f:id:agw:20171004051714p:plain

なかなか時間がかかりますね。工夫をしてもっと速く計算できるようにならないでしょうか? 排他的論理和の演算は順序を入れ替えても結果が変わりません。これは利用できないでしょうか?

f:id:agw:20171004051700p:plain

試しに、先ほどの数列の隣り合った数を入れ替えてみましょう。

f:id:agw:20171004051719p:plain

先ほどと同様、左から計算します。

f:id:agw:20171004051722p:plain

無事同じ結果になりました(まあ答えは0か1にしかならないので、あまり説得力がないようにも思えますが...)。

もっと入れ替えれば数列を整列できそうです。具体的には0の数字の集まりと1の数字の集まりにできそうです。

f:id:agw:20171004051728p:plain

さて、0と0の排他的論理和は0なのでした。つまり、0 xor 0 = 0。また、0 xor 0 xor 0は(0 xor 0) xor 0と計算すればいいので、0 xor 0となります。この結果も0。つまり、0同士の排他的論理和のグループは0と置き換えることができます。

f:id:agw:20171004051733p:plain

1のかたまりについても同じように工夫ができるでしょうか? 1と1の排他的論理和は0であることを利用すると先ほどの式は以下のようにまとめることができそうです。1の個数が偶数個であれば、0となることが分かります。

f:id:agw:20171004051741p:plain

1の個数が奇数個である場合も考えてみましょう。

f:id:agw:20171004051746p:plain

連続した排他的論理和の計算結果は1が偶数個あれば0、1が奇数個あれば1となることが分かります。1の数を数えるだけで演算結果が分かってしまうのです。

もしこれまで、検算などをする場合に最初の図のように左から計算していたのであれば是非この方法も試してみてください。計算の速さはもちろん、正確さが格段に上がるはずです。

2017-09-29

Idiom: Getting the largest number that is less than x

Algorithm !

Idiom: Getting the largest number that is less than x

プログラムを書いているとき、思ったことが思った計算量でできることは分かっているのに細かい処理がパッと書けないことってありますよね。今日はこの問題を解いているときに、「std::mapのキーがx未満で最大のものを得たい!」と考え至ったのですが、すぐに繰り出すことができず、悔しい思いをしました。

コンテスト中にこういうことが起こるのはよくあります。よくあることなのであればイディオムとしてまとめられるのではないかな、と思いました。

今回のイディオムは以下です。ただし、要素は整列されているものとします。

x未満の最大の値を得る

これはO(logN)で行うことができます。具体的には以下のようにします。

std::lower_boundでxの下限を探す。反復子が示す要素の一つ前の値が求める値である

これを図で表せば以下となります。例では4未満の最大の値を探索しています。

要素群にx未満の値がない場合、std::lower_boundは先頭を指し示す反復子を返します。このとき、一つ前の要素にアクセスすることはできないので注意が必要です。

コンテナ独自のlower_boundメソッドを持つstd::setを使って観察してみましょう。std::setの内容は2、3、5、9、15とします。

std::set<int> set = {2, 3, 5, 9, 15};

さて、STLの反復子は要素の間を指し示すものとするとすっきりと考えることができるものも多いです。ここからは以下の図の左の表現方法を取りたいと思います。

3未満の最大の値を探してみましょう。lower_boundの結果は以下のようになるため、反復子を一つ戻したものが求める値、2になります。

auto it = set.lower_bound(3);

//  set: 2 3 5 9 15
//        ^
//        `-- it

*(-- it);	// 3未満の最大の値は2

次に9未満の値を探してみましょう。

auto it = set.lower_bound(9);

//  set: 2 3 5 9 15
//            ^
//            `-- it

*(-- it);	// 9未満の最大の値は5

7のように要素として存在しない数値の場合はどうでしょうか? その場合も問題なく動作します。

auto it = set.lower_bound(7);

//  set: 2 3 5 9 15
//            ^
//            `-- it

*(-- it);	// 7未満の最大の値は5

もちろん、21のように大きな値を入れてもきちんと動作します。この場合、itはstd::end(set)を指しますが特に問題はありません。

auto it = set.lower_bound(21);

//  set: 2 3 5 9 15
//                 ^
//                 `-- it

*(-- it);	// 21未満の最大の値は15

最後に先頭の値、例えば、2未満の最大の値を探す場合ですが、これは注意が必要です。itの一つ手間の要素にアクセスすることはできないからです。

auto it = set.lower_bound(2);

//  set: 2 3 5 9 15
//      ^
//      `-- it (= std::begin(set))

*(-- it);	// これはアクセス違反!

そのため、lower_boundを試したあとに反復子が先頭にあるかどうか調べる必要があります。

auto it = set.lower_bound(x);

if (it == std::begin(set)) {
  // x未満の値は存在しない
}
else {
  *(-- it);	// x未満の最大の値
}

イディオムがはっきり見えてきました。aをコンテナとすると以下のように書くことができそうです。

auto it = std::lower_bound(std::begin(a), std::end(a), x);

// または、auto it = a.lower_bound(x)

if (it == std::begin(a)) {
  // x未満の値は存在しない
}
else {
  *(-- it);	// x未満の最大の値
}