見出し画像

こっそりディープフェイク開発しています

こんにちは、谷智栄(たに ともひろ)です。
数ヶ月前からXやInstagramのストーリーにはディープフェイク開発についてそれらしい動きを投稿していたのですが、詳しい内容を書いていなかったのでnoteで公開していきます。
3月末から大言語モデルの代表的サービスであるchatGPTとClaude3の両方を使いながら、悪戦苦闘しながらディープフェイクのコードを生成していました。
Pythonで書いているのですが、僕自身エンジニアでもなんでも無いのでほとんど、、、というか全てのコードをテキスト生成AIで出力しています。
以前、Ruby on Railsというフレームワークを使用してスクーターレンタルアプリを開発したのですが、フレームワーク自体にコード作成のルールがあり、それが功を奏してうまく開発できました。
しかし、今回のディープフェイクは全てPythonで開発しなければいけません。
「前回うまくいったから、今回も生成AIがあればできるだろう」という軽いノリでやり始めました。
まずchatGPTに概念を伝えるところからスタート。
僕の目的は自分のクローンに最新のニュースを話してほしいので、テキスト情報だけで動画を生成させる必要があります。
さらには、運用コストを抑える内容やオープンソースサービスを活用するように伝えてざっくり概要を決定しました。
ある程度整ってきたところでディレクトリ構造を生成したのですが、200以上のファイル作成を求められました。
中にはデータファイルがあるので、中身が空の物も結構多いのですが、それにしても大規模な開発になってしまいました。
ここからプロジェクトの概要とディレクトリ構造を毎回入力しながら指定のファイルを生成していきます。
全てのコードを手書きするのは骨が折れますが、生成AIがあれば2日で全て出力できました。
早速GitHubのワークフローでテストしましたがインストールに15分以上かかる事態に。
そこからが地獄の始まりでした。
15分待ちの後にやってくるテストでモジュールのインポートミスが発生。
生成AIに読み込ませてエラーを解除するも同じようなエラーが次々に起こります。
その作業を何日も繰り返していますが一向に良くなる気配がありません。
「誰かに頼るしかない!」
その思いで無料講習を行なっている企業や行政機関を探したら「岐阜県技術総合センター」という工業系の研究開発機関を見つけて早速話に行きました。
最先端技術部長の工学博士に話を聞いてもらいましたが、ディープフェイクの専門では無いので技術的な指導は受けられませんでした。
しかし、ソフトピアジャパンのIAMASなら対応してくれるかもしれないと紹介を受け、翌日伺うことにしました。
IAMASは情報科学芸術大学院大学で、ホームページを見る限り画像処理や3D技術に精通したPh.Dが在籍している教育機関だったので期待に胸を膨らませて駆け込みました。
洗い物をしている30代後半?くらいの若めな男性がいたのですかさず「洗い物中にすみません、ディープフェイクを開発しているんですがご相談に乗っていただけますか?」と声をかけて詳細を説明したら「それでしたら対応できるかもしれません。メールでコードを送ってください。」とのお返事をいただけました。
学生でもない部外者に親切な対応をしていただいた博士に感謝です。
それから2回のやり取りをして現在に至ります。
まだエラー修正の段階ですが、博士に相談できるのはかなり心強い限りです。
諦めなければいつかは成せる!の精神で明日からも進んでまいります。


この記事が気に入ったらサポートをしてみませんか?