【プログラミング】音声翻訳アプリ・プロジェクト：振り返り＃1日目：枠組みを設計

2024年1月26日 05:05

皆さんこんばんは。タカダイです。

本日から、新しいアプリの制作を始めました。
いわゆる、「音声翻訳アプリ」です。

このアプリを選んだ理由は、２つあります。まず、
１）ポートフォリオに、人工知能を使ったプロジェクトも含めて、
２）Pythonをバックエンドで使うプロジェクトを含めることで、
ポートフォリオを充実させたいという意図があります。

以下が、「音声翻訳アプリ」プロジェクトの枠組みです。

１．英語で音声入力
２．入力された音声を文字に起こす
３．出力は、３種類の言語（Hindi, French, Spanish ）から選べる
４．英語テキストを選んだ言語に翻訳
５．翻訳されたテキストを発話する
６．UIは、利用者が言語を選べるシンプルな設計とする
７．発話関連は、Google社の「Text-to-Speech」と「Speech-to-Text」APIを使う
８．フロントエンドはJavaScript、バックエンドはPythonを使う

プロジェクトの枠組み

本日、JavaScriptとPythonのコードを作成し、Flaskを使ったテストは成功しました。ここまでの作業では、コードを書くよりも環境構築に時間を費やすことになるような印象を受けています。

例えば、

●　Postmanを使ったテスト環境の整備、
●　APIの取得、
●　Flask等のウェブフレームワークのインストール、
●　ffmpeg等のツールの設定など

例：環境構築の作業内容

にかなりの時間が掛かりました。

なかなか重たい作業でしたが、一日目にしては、かなり前進しました。

まだテスト段階ですが、投げた音声データが文字に起こされるのを見た際は、かなりの充実感を味わうことができまいｓた。

目安として、８日ぐらいでGithubに公開できればと考えています。

前回と同様に、こちらで進捗をご報告します。

それでは、本日の振り返りです。

本日の行動は、４．５時間をアプリ制作に充てました。

結果として、
１）プロジェクト枠組みを設計
２）工程案の作成
３）Pythonコードの作成
４）JavaScriptコードの作成
５）FlaskサーバーがPOSTリクエストを受信しているかテスト
６）バックエンドとフロントエンドの連携確認テスト
７）Pythonに音声ファイルを受けるルートを追加
８）Google Speech-to-Text APIで音声ファイルを処理
９）英語テキストとして戻す

と、かなり重たいタスクを達成することができました。

JaveScriptでは、ドロップダウンで出力言語を選べるシンプルなコードを作成しました。

振り返り後の新たな行動としては、

その日に使用した「Pythonライブラリ」や「ツール」を深く理解する

を実行する予定です

それでは皆さん、本日も良い一日をお過ごしください！

この記事が参加している募集

#やってみた

38,218件

#仕事について話そう

112,598件

この記事が気に入ったらサポートをしてみませんか？