created: 2022-02-01T14:19:06.000Z

BigQuery でランダムサンプリングしたテーブルを作る

大きいテーブルに色々クエリをかけるとお金がかかっちゃうので、ランダムで抽出したテーブルを作成するときのもの。

1%にサンプリングしたテーブルはこのように作成できる。

CREATE TABLE
  sample.logs
AS
  SELECT * FROM lake.logs_* WHERE RAND() < 0.01

無事に1%くらいになった。

SELECT COUNT(1) FROM t_lake.sales_* UNION ALL
SELECT COUNT(1) FROM sample.sales
f0_
2,090,888
20,969
縁の下のUIデザイン──小さな工夫で大きな効果をもたらす実践TIPS&テクニック (WEB+DB PRESS plus)
[ad] 縁の下のUIデザイン──小さな工夫で大きな効果をもたらす実践TIPS&テクニック (WEB+DB PRESS plus)
池田 拓司 (単行本(ソフトカバー))