GCP

音声から日本語の文字起こしを行う

日本語の音声ファイルを文字起こししたい場合がある。真っ先に思い浮かんだのがAmazon transcribeだが、まだ日本語には対応していなかった。 調べたところ、Google Speech APIが日本語に対応していたのでこちらを使って文字起こしをしてみた。

BigQueryのpartitioned-tables(分割テーブル)について

BigQueryは従量課金のモデルのため、スキャン量に応じて課金される。いかにスキャン対象を減らすかが非常に重要になる。通常のwhereで絞ったとしても、スキャンはされてしまうため課金を回避することができない。そこで、partitioned-tables(分割テーブル)である。

gcloud(gcpのコマンド)をzshで使えるようにする

gcloudコマンドしようとすると、デフォルトではbashへinstallすることが前提となってしまっている。zshでgcloudコマンドを設定する。

BigQueryのtimestampをUTCから日本時間JSTへ変更する

BigQueryのtimestampの戻り値はデフォルトでUTCである。クエリを修正することでJSTを表示できる。

CloudStorageへAPI経由でファイルをuploadする

Google Cloud StorageへAPI経由でファイルをuploadする。 Introduction to APIs in Google を受講して、基本的な使い方を覚えたのでメモを残す

Kubernetesでスケールアップ・ローリングアップデートを行う

Kubernetesはバズワードになりつつあるが、スケールアップ・ローリングアップデートを含む運用のノウハウはまだまだそれほど多くないのでまとめる。

GAE(Google App Engine)を試した

GAE(Google App Engine)を使い始めたので、一度ここで整理をした。

Google App Engineをコマンドで起動停止する

コマンドでGoogle App Engineを停止する。 

Cloud Storageをコマンドで操作する

はじめにawsであればファイル置き場にS3を使うことも多いだろう。s3への転送したい場合はaws s3 cpコマンドを使うことが多い。似たようなことをGCPでCloud Storageに対して行いたいことがある。コマンドローカルからファイルをコピーする場合gsutilコマンドを利用する

BigQueryにbqコマンドでテーブル作成・スキーマ変更する

BigQueryにbqコマンドでテーブル作成・データ投入・スキーマ変更する。 ネストされたデータも扱いたいので、今回はjsonファイルを読み込むようにする