見出し画像

日本酒の銘柄をChatGPTに爆速でローマ字変換してもらった

海外の日本酒人気が高まっていることもあり、SakeDoko も英語対応に力を入れ始めました。

実は、部分的に英語対応は済んでいるのですが、データベースから取得する銘柄データなどはまだ取り組んでいませんでした。
SakeDoko に登録されている銘柄は1,100を超えており、一つひとつ手作業で対応するのは時間がかかってしまいます。 そこで、ChatGPTに頼んで一気にやってもらえないか考えてみました。

有料にはなりますが、ChatGPT の Advanced data analysis でできそうな感じがしたので、以下の手順で試してみることにしました。

  1. データベースから銘柄データをCSVファイルに出力する。

  2. CSVファイルを 「ローマ字変換して」と ChatGPT にお願いする。

  3. ローマ字変換したCSVファイルをもとにデータベースに登録する命令(SQL)を ChatGPT に作ってもらう。

データベースから銘柄データをCSVファイルに出力する

SakeDoko にある銘柄データはふりがなのデータも入っています。
ChatGPT に漢字を読ませるのは難しいようなので、ふりがなからローマ字変換できるよう、ふりがなデータを出力しました。

出力したデータの一部

CSVファイルを「ローマ字変換して」と ChatGPT にお願いする

出力したCSVファイルを添付して、「添付のスプレッドシートの`name_kana`列の値をローマ字変換して、新しく`name_en`カラムを`name_kana`列の左に追加してください。」と指示します。

ChatGPT にローマ字変換してもらっているところ

出力してもらったファイルの一部がこちら👇

ChatGPT にローマ字変換してもらったデータの一部

長音や促音がうまく変換できていません。
これも、適切に指示すれば修正してもらえると思いますが、今回はデータチェックも兼ねて自分で置換作業をしました。

SQL を ChatGPT に作ってもらう

置換作業が済んだらCSVファイルに出力して、ChatGPT に 「添付のスプレッドシートをもとに、`sake_brands`テーブルの`name_en`カラムのみをアップデートするSQLファイルを生成してください。」と指示します。

SQL を ChatGPT に作ってもらう

出力された SQL ファイルの中身がこちら👇

ChatGPT が生成した SQL

無事に SQL を生成してくれました!

投入したデータは近日中に英語版のサイトに反映する予定です。
今後とも SakeDoko をよろしくお願いいたします。

私のnoteでは「スキ」や「フォロー」いただくと、お礼におすすめの日本酒の銘柄が表示されます。
お気軽にポチッとしてみてください👋

いただいたサポートはSakeDoko開発・運営費に使わせていただき、サービスの質向上に貢献します!