BigQuery

BigQueryにbqコマンドでテーブル作成・スキーマ変更する

BigQueryにbqコマンドでテーブル作成・データ投入・スキーマ変更する。 ネストされたデータも扱いたいので、今回はjsonファイルを読み込むようにする

embulkでBigQueryの分割テーブル(partitioned table)へデータ投入

BigQueryでクエリスキャンを行うと、いくらwhereで絞ったとしてもテーブル内の指定したカラムは全行読み、それに応じて課金される。BigQueryに分割テーブル(partitioned table)を作成することにより、時間や日付を絞り膨大なスキャンならびに課金を限定的にすることが可能だ。

BigQueryでテーブルまたぎのSelectについて

BigQueryではFROMに複数のテーブルを指定することができるのでその方法を紹介

BigQueryのテーブルをコマンドで作成&スキーマ変更する

embulkでtable作成オプションを有効にすれば、わざわざテーブルを作るコマンドを打つ必要すらないけど、とはいえbqコマンドでいろいろできたら楽。ということでテーブル作成と変更の手順をまとめた。

BigQueryのunnest関数が便利

BigQueryの「大容量のデータを高速でスキャンできる」「従量課金の料金形態」という性質から、テーブル設計をはじめるとRDBMSといろいろ違いがでてくる。 今回は配列をカラムに格納する上で便利なunnest(アンネスト)関数を紹介。