【プログラミング】ピンボケ補正アプリ：振り返り：「超解像処理」モデルを決める

TaKadai

2024年2月27日 01:21

皆さんこんばんは。タカダイです。

本日は、「ピンボケ補正アプリ」の開発を始めました。

「超解像」という機械学習の技術で、低解像度の（いわゆるピンボケした）画像を高解像にするというアプリです。

アプリは、ブラウザ上で動かしたいのと、最小限の機能を実装したいので、「Flask」というWebフレームワークを使うことにしました。

今日が１日目で、３時間をアプリ開発に費やしました。

このアプリでは、以下の３つのスクリプトを使用しています。

１．app.py
２．script.js
３．style.css

超解像処理は、「ESRGAN」という機械学習モデルを使うことにしました。

画像を超解像処理することに特化しているモデルであることと、他のアプリにも応用されているモデルで、ある程度信用できるモデルだと判断したからです。

フロント・バックエンドともに、円滑に実装することができましたが、テスト結果は、超改造処理がうまくいきませんでした。

ですので、明日は、原因の解明とコード修正にあたります。

それでは、本日の振り返りです。

本日の行動は、３時間をアプリ開発に充てました。

結果として、
１）プロジェクト範囲を定める
２）TensorFlowを使うことを決定
３）超解像処理は、「ESRGAN」モデルを使うことを決定
４）このアプリ用に仮想環境を構築
５）Pythonコードを作成し、バックエンドの機能を実装
６）JavaScriptコードを作成し、フロントエンドの機能追加
７）HtmlとCSSのコードを作成し、フロントエンド完成
８）テストの実施
９）出力画像の質改善のためのデバグを実施

を達成することができました。

振り返り後の新たな行動は、
●　ESRGANモデルの資料でインプット用画像の要件を確認
●　代替モデルを適用することも検討
●　新たな技術を使ったアプリ開発をつづける

を実行する予定です。

それでは皆さん、本日も良い一日をお過ごしください！

この記事が参加している募集

#仕事について話そう

111,416件

この記事が気に入ったらサポートをしてみませんか？