BigQueryとRedshift、どっちが速いのか
Randall Munroeという方の「Comics that ask "what if?"」というTED Talkがあります。
投稿されたあらゆる質問に数学や科学を使いながら答えている人で、あるときこんな質問が来たそうです。
「もし世界中のデータが全部パンチカードに記録されていたら、グーグルが保有するデータの量はどの位?」
彼なりの答えをサイトにアップしたら、その後グーグルからメッセージが来たそうで、、、続きはユーモラスなので是非TEDを見てみてください。
じじ(お義父さま)は、もう還暦を迎え引退しておりますが、かつて会社にパンチカードのマシンがあったそうです。若かりし頃、とある処理をやらせたらそれはそれは遅いと。どのくらい遅いかと言うと、別の人がやってきて数値を方眼紙に鉛筆でポチポチプロットしていって、最後に最小二乗法っぽい感じにエイヤッと定規で線を引いて出来上がりとなったとき、一方まだパンチカードは計算中というくらい遅かったそうです。
BigQueryとRedshift、どっちが速いのかという話が議論になることがあります。そんなとき私は、心の中ではどっちもパンチカードより断然優れているぜと思っております。