Rust で map を使いたいとき、選択肢として

のいずれかがあります。このうち前者の BTreeMap は、キーによってソートされた状態で値が格納されるので、いろいろ操作したあとに最小値がほしいとか、ある区間の中にある値たちがほしい、みたいな場面で役立ちます。

「最大値がほしい」という場合にも当然役立つのですが、どのように最大値を取得するのが効率が良いか、考えたことはあるでしょうか。調べてみたので、まとめておこうと思います。

TL;DR (2020/09/08 更新)

BTreeMap / BTreeSet で最大値を取りたいときには、イテレータに対して max か last か next_back を呼び出せば OK。どれを使っても効率は変わらない！！

ただし Rust のバージョンが 1.46.0 より前の場合には max は遅い。さらに、1.38.0 より前の場合は、next_back 以外は遅い。

AtCoder のジャッジ環境は 1.42.0 となっているため、last か next_back を使いましょう。

BTreeMap / BTreeSet で最大値を取る方法

BTreeMap / BTreeSet は、キーについて昇順でデータが格納されます。つまり、以下のようなコードを書いたら「一番小さい値」が得られます。

use std::collections::BTreeSet;

let mut set = BTreeSet::new();
set.insert(42);
set.insert(1);
set.insert(3);
let first = set.iter().next(); // 最初の要素を取得

assert_eq!(first, Some(&1)); // 最初の要素は 1

これの類推で「一番大きい値」が得られるような気がしますよね？イテレータの最後の要素は last で取ることができるので、以下のようなコードでうまく動きそうな予感がします。

use std::collections::BTreeSet;

let mut set = BTreeSet::new();
set.insert(42);
set.insert(1);
set.insert(3);
let last = set.iter().last(); // 「最後」の要素を取得

assert_eq!(last, Some(&42)); // 「最後」の要素は 42

このコードは期待通りに動き、最大値である 42 を取得することができます。

めでたし、めでたし…………………

last を使って最大値を取得するのはイケてない？

ちょっと落ち着いて考えてみると、上のように Iterator::last を使用して BTreeMap / BTreeSet の最大値を取得するのは、効率が悪いような気がします。なぜなら、Iterator::last は そのイテレータを最初から最後までなめる ことによって、イテレータの最後の値を取得するからです。

実際、std::iter::Iterator::last のドキュメントをチェックしてみても、

Consumes the iterator, returning the last element.

とあり、last を実行することでイテレータがなめつくされるということが読み取れます。つまり、最大値がほしいだけなのに、「最小値から順番に 1 つずつ値を見ていったときの、最後の値」という極めて回りくどいやり方をしているのではないか、と考えることができます。これでは、 BTreeMap / BTreeSet に入っている要素数 \(N\) に応じて時間がかかるようになってしまって、普通に Vec を線形時間で探索するのと変わらない、それどころかむしろ悪い性能になってしまいます。

ここで朗報です。 BTreeMap / BTreeSet は、通常のイテレータの他に、DoubleEndedIterator というトレイトを実装しています。

このトレイトを実装している場合は、前からだけではなく後ろ側からイテレータを走査することができることになります。後ろ側から見ていくためのメソッド next_back が用意されています。これを使うことで、上で last を使って書いていたコードは、以下のように書き直すことができます。

use std::collections::BTreeSet;

let mut set = BTreeSet::new();
set.insert(42);
set.insert(1);
set.insert(3);
let last = set.iter().next_back(); // next_back を使う

assert_eq!(last, Some(&42));

この書き方であれば、さきほどの last で懸念していた「イテレータを最初から最後までなめることによる無駄」を省くことができ、\(O(\log N)\) で最大値を取得することができます。

今度こそ、めでたし、めでたし…………………

ベンチマークをとってみると、衝撃の事実が発覚

next_back を使おうねということでこの話は終わろうかと思ったのですが、念の為ベンチマークをとって確認しようと思います。

ベンチマークに使ったコードは以下のような感じで、1 から 1000 万までの数字を入れた BTreeSet / HashSet を用意した上で、

最後の要素を last や next_back によって取得するのにかかる時間

を測定しています。

#![feature(test)]

extern crate test;

use std::collections::{BTreeSet, HashSet};
use test::Bencher;

fn get_maximum_by_last(set: &BTreeSet<i32>) -> i32 {
    *set.iter().last().unwrap_or(&0)
}

fn get_maximum_of_hashset_by_last(set: &HashSet<i32>) -> i32 {
    *set.iter().last().unwrap_or(&0)
}

fn get_maximum_by_next_back(set: &BTreeSet<i32>) -> i32 {
    *set.iter().next_back().unwrap_or(&0)
}

#[bench]
fn last(b: &mut Bencher) {
    let set = {
        let mut s = BTreeSet::new();
        for i in 1..10_000_000 {
            s.insert(i);
        }
        s
    };

    b.iter(|| get_maximum_by_last(&set));
}

#[bench]
fn next_back(b: &mut Bencher) {
    let set = {
        let mut s = BTreeSet::new();
        for i in 1..10_000_000 {
            s.insert(i);
        }
        s
    };

    b.iter(|| get_maximum_by_next_back(&set));
}

#[bench]
fn last_hash(b: &mut Bencher) {
    let set = {
        let mut s = HashSet::new();
        for i in 1..10_000_000 {
            s.insert(i);
        }
        s
    };

    b.iter(|| get_maximum_of_hashset_by_last(&set));
}

このベンチマークを cargo bench で実行すると以下のような結果となりました。

blog-test is 📦 v0.1.0 via 🦀 v1.45.0-nightly took 1m57s ❯ cargo bench
   Compiling blog-test v0.1.0 (/private/tmp/blog-test)
    Finished bench [optimized] target(s) in 0.68s
     Running target/release/deps/blog_test-0aef6b7d2f434fa2

running 3 tests
test last      ... bench:          10 ns/iter (+/- 2)
test last_hash ... bench:  25,960,936 ns/iter (+/- 1,593,353)
test next_back ... bench:          10 ns/iter (+/- 2)

test result: ok. 0 passed; 0 failed; 0 ignored; 3 measured; 0 filtered out

えー…………… HashSet が遅いのは良いとして、BTreeSetのlastとnext_backは、どちらも同じ早さで処理が終わっていることが読み取れます。

衝撃の事実発覚です。last は前から順番になめていくから遅い、という考えは間違っていたのでしょうか。

BTreeMap / BTreeSet に実装されている Iterator の真実

このエントリを書こうと思っていろいろ調べてみるまでは自分も

「BTreeMap / BTreeSet の最大値を取りたければ next_back を使え。 last は罠。」

と思い込んでいたので、このベンチマーク結果にはとても驚きました。ベンチマークの書き方や実行方法が間違っているのではないかと疑ってみたりもしました。

BTreeMap の Iterator 実装を見に行くと、そこに答えがありました。（https://doc.rust-lang.org/src/alloc/collections/btree/map.rs.html#1656-1658 より引用）

impl<'a, K, V> Iterator for Keys<'a, K, V> {
    type Item = &'a K;

    fn next(&mut self) -> Option<&'a K> {
        self.inner.next().map(|(k, _)| k)
    }

    fn size_hint(&self) -> (usize, Option<usize>) {
        self.inner.size_hint()
    }

    fn last(mut self) -> Option<&'a K> {
        self.next_back() // <- 衝撃の事実！！！！！！！！
    }
}

last は内部で next_back を呼び出しているのです！！！！！

この修正が入ったのがいつなのか？が気になったので調べてみたところ、When possible without changing semantics, implement Iterator::last in… · rust-lang/rust@db16e17 を見つけました。これが master にマージされたのが 2019 年 7 月 4 日とのことなので、バージョンでいうと v1.37.0 とか辺りに入った感じでしょうか？

思い込みは怖いものです。「推測するな、計測せよ」とよく言われますが、実際に計測してみなければこのエントリも「lastは遅いから、next_back を使おうね！！」で終わってしまうところでした。

結論

BTreeMap / BTreeSet で最大値を取りたいときには、イテレータに対して last か next_back を呼び出せば OK。どっちでも効率は変わらない！！ただし Rust のバージョンが古い場合には next_back を使っておいたほうが良さそう

2020/06/21 追記1

具体的にどのバージョンから last = next_back となったのか調べてみました。

nightly ではなく stable で cargo bench をするために Criterion.rs を使用します。ベンチマークのコードは以下のようにしました。ベンチマークをとる対象となっている get_maximum_by_last などの関数は上で使ったものと同じです。

use criterion::{criterion_group, criterion_main, Criterion};
use std::collections::{BTreeSet, HashSet};

use lazy_static::lazy_static;

lazy_static! {
    static ref BTREE_SET: BTreeSet<i32> = {
        let mut s = BTreeSet::new();
        for i in 0..10_000_000 {
            s.insert(i);
        }
        s
    };
    static ref HASHSET: HashSet<i32> = {
        let mut s = HashSet::new();
        for i in 0..10_000_000 {
            s.insert(i);
        }
        s
    };
}

pub fn btree_last(c: &mut Criterion) {
    let s = &*BTREE_SET;
    c.bench_function("btree_last", |b| b.iter(|| get_maximum_by_last(s)));
}

pub fn btree_next_back(c: &mut Criterion) {
    let s = &*BTREE_SET;
    c.bench_function("btree_next_back", |b| {
        b.iter(|| get_maximum_by_next_back(s))
    });
}

pub fn hash_last(c: &mut Criterion) {
    let s = &*HASHSET;
    c.bench_function("hash_last", |b| {
        b.iter(|| get_maximum_of_hashset_by_last(s))
    });
}

criterion_group!(benches, btree_last, btree_next_back, hash_last);
criterion_main!(benches);

2020/06/21 現在の最新バージョンである 1.44.1 と、2019/08/15 リリースの 1.37.0、2019/09/26 リリースの 1.38.0 でベンチマークをとりました。結果は以下です。

（なお、criterion によるベンチマークは btree_last time: [10.518 ns 10.583 ns 10.659 ns] のように結果が出力されます。このうち真ん中の数値を採用しています。数値の意味について気になる方はこちらの記述をご覧ください）

version	btree_last	btree_next_back	hash_last
1.44.1	13.343 ns	13.398 ns	14.302 ms
1.38.0	10.583 ns	10.741 ns	15.188 ms
1.37.0	35.317 ms	10.353 ns	18.264 ms

ns と ms が混じっていて分かりにくいですが、1.37.0 のbtree_lastだけ、文字通り桁違いに遅いことが読み取れます。

追記1 おわり

2020/09/08 追記2

Twitter にて、max も内部実装的には next_back と同じだった、という情報を入手しました。

これ実際に見に行ったら min, max も next, next_back になっているっぽい、すごhttps://t.co/c4OpuWei3M
— cunitac (@CUteNeuron) September 7, 2020

これを確認しました。上記と同じく criterion を使い、 iter().max() によって最大値を取得するというベンチマークを追加して検証しました。

複数のバージョンでベンチマークを回した結果が以下の通りです。

version	btree_last	btree_next_back	btree_max
1.46.0	10.480 ns	10.257 ns	10.017 ns
1.45.1	10.201 ns	10.380 ns	55.821 ms
1.45.0	10.170 ns	10.413 ns	56.541 ms
1.44.0	15.072 ns	14.826 ns	55.423 ms
1.42.0	10.045 ns	9.6864 ns	31.503 ms

1.46.0 から max で最大値をとるのが爆速になっていることが分かります。

2020/09/08 現在の正確な結論