見出し画像

【プログラミング】ピンボケ補正アプリ:振り返り:「超解像処理」モデルを決める

皆さんこんばんは。タカダイです。

本日は、「ピンボケ補正アプリ」の開発を始めました。

「超解像」という機械学習の技術で、低解像度の(いわゆるピンボケした)画像を高解像にするというアプリです。

アプリは、ブラウザ上で動かしたいのと、最小限の機能を実装したいので、「Flask」というWebフレームワークを使うことにしました。

今日が1日目で、3時間をアプリ開発に費やしました。

このアプリでは、以下の3つのスクリプトを使用しています。

1.app.py
2.script.js
3.style.css

超解像処理は、「ESRGAN」という機械学習モデルを使うことにしました。

画像を超解像処理することに特化しているモデルであることと、他のアプリにも応用されているモデルで、ある程度信用できるモデルだと判断したからです。

フロント・バックエンドともに、円滑に実装することができましたが、テスト結果は、超改造処理がうまくいきませんでした。

ですので、明日は、原因の解明とコード修正にあたります。

処理後の表示


それでは、本日の振り返りです。

2月2月26日の振り返り

本日の行動は、3時間をアプリ開発に充てました。

結果として、
1)プロジェクト範囲を定める
2)TensorFlowを使うことを決定
3)超解像処理は、「ESRGAN」モデルを使うことを決定
4)このアプリ用に仮想環境を構築
5)Pythonコードを作成し、バックエンドの機能を実装
6)JavaScriptコードを作成し、フロントエンドの機能追加
7)HtmlとCSSのコードを作成し、フロントエンド完成
8)テストの実施
9)出力画像の質改善のためのデバグを実施

を達成することができました。

振り返り後の新たな行動は、
● ESRGANモデルの資料でインプット用画像の要件を確認
● 代替モデルを適用することも検討
● 新たな技術を使ったアプリ開発をつづける

を実行する予定です。

それでは皆さん、本日も良い一日をお過ごしください!

この記事が参加している募集

この記事が気に入ったらサポートをしてみませんか?