Vertex AI Batch Predictionでバッチ単位での予測

Vertex AI Batch Predictionとは?

Vertex AI Batch Predictionは、Vertex AIの一部で、大規模なデータセットに対してバッチ予測を行う機能です。これは、訓練済みのMLモデルを使用して、多数のインスタンスに対する予測を一括して処理するためのツールです。リアルタイムではなくバッチ単位での予測が必要なタスクに特に適しています。

今回は以前にBigQueryで作成した販売価格を予測するモデルを利用してこのバッチ予測を試してみたいと思います。既にVertex AIのModel Registoryにモデルを登録されていることを前提としています。

 バッチを作る

バッチ予測のページに行き、作成をクリックします。

作成をクリックすると作成画面が表示されます。バッチ予測名を入力してバージョンを選択します。

また入力データに関しては以下の形式から指定が可能です。

  • BigQuery テーブル

  • Cloud Storage 

今回は、Cloud StorageにJSONLファイルを置いて、それに対してバッチ予測を行うように設定をしたいと思います。
ソースの選択で、Cloud Storage 上のファイル(JSONL、CSV、TFRecord、TFRecord(GZIP))にチェックを入れて、CloudStorageに置いたJSONLを選択します。

またバッチ予測の出力についても設定を行います。
形式はJSONLか、BigQueryテーブルを選択できます。

ここでも出力先のCloudStorageのパスを指定します。
あとは、ノードの数や、マシンタイプを選び、作成で完了です。

作成後はバッチ予測ジョブが作成されます。完了までしばらく待ちます。

予測されたデータはCloudStorageに出力されていますので、出力先に指定したパスに出力されたファイルを確認してみます。

JSONL形式のファイルで各インスタンスに予測(prediction)の値が出力されていることが確認出来ました。