Anno Takahiro

技術と物語について書きます。開成→東大松尾研→BCG→未踏スーパークリエイター(201…

Anno Takahiro

技術と物語について書きます。開成→東大松尾研→BCG→未踏スーパークリエイター(2015)→PKSHA→BEDORE→MNTSQ→RCA。ハヤカワSFコンテスト優秀賞の「サーキット・スイッチャー」でデビュー/星新一賞(第6回)/エンジェル投資/M-1グランプリ(2回戦)

最近の記事

  • 固定された記事

漫画未経験のエンジニアが今のAIで漫画制作にトライしてみた記録2023年夏時点版

画像生成AIの躍進が目覚ましい。エンジニア兼SF作家の筆者としては、AIが絵を描けるようになるのなら、絵が描けない自分でも漫画制作ができるようになるのではという期待があった。実際に2022年の末頃にはstable diffusionを使った漫画制作UIのプロトタイプを作ってみたこともある。 それから半年以上の月日が経ち、世の中でもMulti ControlNetやLoRAなどの画像生成AIを制御する手法が登場してきた。そろそろ技術も熟してきたということで、漫画の実作に取り組

    • 小説家が自作の予告編動画を動画生成AIで作ってみた

      2年前に発売した自作「サーキット・スイッチャー」がこの度文庫化されることになった。そこで、動画生成AIの力を借りて予告編を作ることにした。出来上がった映像はこちら。 ウィル・スミスが素手でスパゲッティを食っていた時代と比べると、動画生成AIもかなり使い勝手が上がっていた。画像生成AIがControlNetで飼い慣らせはじめた1年前を思い出す感じがする。 備忘として何のAIをどう使って作ったかの現時点のワークフローを紹介する。動画生成の分野はOpenAIがSoraを発表して

      • とあるエンジニア兼SF作家の2023年振り返り

        23年のはじめに自分が書いたブログを読むと、2023年はゆるふわに迷走するぞという決意をしていたらしい。過剰最適化ではなく新規探索をしなければという問題意識があったようだ。 実際、23年は自分が未経験のことも、得意じゃないことも積極的に受けるポリシーで一年を過ごしてみた。結果、個人からスタートアップ、大企業、果ては内閣総理大臣まで、幅広い方々とご一緒することが出来た。 やったことも多岐に渡る。コードを書き、テキストを書き、スライドを作り、現地を訪ね、展示を作り、話を聞き、

        有料
        100
        • 進化するディープフェイクボイスチェンジ攻撃とその見抜き方4つ

          ボイスチェンジャー技術の発展が目覚ましい。昨年にはMMVCと呼ばれるソフトウェアがリリースされ、音声の録音データがあれば「誰かの声」を一定のクオリティで再現することができるようになった。更に、先月出現したRVCというボイスチェンジャーではトレーニングが飛躍的に簡単になり、より手軽に高クオリティなフェイク音声をリアルタイムで作り出すことができるようになった。あまりの凄まじさに一部では「パンドラの筺が開いた」とか「神の逆鱗に触れるレベル」と言われている。 どんな感じかと言うと、

        • 固定された記事

        漫画未経験のエンジニアが今のAIで漫画制作にトライしてみた記録2023年夏時点版

          エンジニア兼SF作家がGPT-4執筆支援を実戦投入できないか実験してわかったこと

          絶賛から全否定、果ては人類滅亡論まで、色んな人がさまざまな評価をGPT4に下している。しかし、物書き目線とエンジニア目線が両方入っている評価はあまりない。非エンジニアの評価には「そのプロンプトやその使い方じゃGPTの良さは出ないだろ」とツッコミたくなる時がある。逆にエンジニアの評価は、なまじ今までの自然言語処理を知っているからか、GPTが凄く見えてしまってアウトプットの冷静な評価ができていないとこがある。エンジニア的には凄く見えても、作家として見るとまだ全然使えないなと思う部

          エンジニア兼SF作家がGPT-4執筆支援を実戦投入できないか実験してわかったこと

          30代男性の早口はどこまでMMVC1.5で変換できるのか検証してみた

          MMVCというリアルタイムボイスチェンジャーの実験をしてみたので記録を放流する。個人的にボイチェンの進化にはすごく興味がある。今後、AIの進化によってディープフェイクが溢れるのは間違いないと思うが、音声変換は一つの重要なモーダルを担っている認識だ。ひと昔前のボイチェンはピッチとフォルマントをうまく変換するだけという印象だった(VT-4など)が、最近はなんとニューラルネットベースのボイチェンもほぼほぼリアルタイムで動くようになってきたらしい。 MMVCはIsletennos

          30代男性の早口はどこまでMMVC1.5で変換できるのか検証してみた

          2023年はゆるふわに迷走

          振り返ってみると2022年は変化の年だった。なんとなくいろんなことに過剰最適化気味だと感じていた中で、全く異なる環境に無理やり自分を突っ込みながらアンラーンをしようとしていた年だった。 1月には初単行本の「サーキット・スイッチャー」を刊行することができ、早川書房からデビューさせていただいた。本屋に行くと自分の本が平置きになっているのは嬉しかった。マキシマムリスペクトしていた小島秀夫監督にも感想ツイートをして頂けて感謝感激。続けて5月に発売されたアンソロジー「2084年のSF

          2023年はゆるふわに迷走

          Lean AI 開発論: コードを書く前に機械学習プロジェクトを評価する方法

           10年前に提唱された「リーンスタートアップ」と呼ばれる事業立ち上げの手法がある。リーン(=無駄がない)であること、仮説検証の速度を最大化する(=学びの量に最適化する)ことを重要視する考え方だ。フィードバックサイクルを早め、コストをなるべくかけず、必要最低限の要素にフォーカスし、素早くスタートアップを立ち上げることで、成功確率が上がるのだと言われている。  裏を返せばこれは、仮説検証に必要ない一切は削ぎ落とすべきだ、と言っている。リーンスタートアップ的やり方の有名な例として

          Lean AI 開発論: コードを書く前に機械学習プロジェクトを評価する方法

          Enterprise SaaS企業はどうバランスをとりながらProfessional Serviceを活用するべきか?

           大企業をターゲットにしているEnterprise SaaS企業と中小企業向けのSMB SaaSは戦略が変わってくる。違いの一例がProfessional Service(略してPS)の活用だろう。Professional Serviceとは、プロダクト「以外」からもたらされる売上のことで、Enterprise SaaSの場合はPSをうまく活用することが重要であると言われている。  具体的にPSで何をするかというと、プロダクトと直接関係する「導入支援」「既存システムとのデー

          Enterprise SaaS企業はどうバランスをとりながらProfessional Serviceを活用するべきか?

          2021年の予想(AI、スタートアップ、ソフトウェア、エンタープライズ周り)

          2020年の年始に予想した「2020年」と実際の「2020年」は別物だったと言える。ぜんぶコロナのせいだ。予測の土台は崩れてしまった。「変わらないだろう」と無意識に思っている仮定が多いということを思い知らされた一年であった。 だからと言って予測に意味がないとは思わない。2021年にどんな変化があるかを予想していきたいと思う。堅い予想からちょっと攻めた予想まで、思いついたものをいろいろ列挙してみた。 見出しマクロ環境 ・コロナ禍はまだまだ続く ・投資環境に破壊的な影響はなく

          2021年の予想(AI、スタートアップ、ソフトウェア、エンタープライズ周り)

          B2Bスタートアップの印象に残った採用スライド7選+1

           採用のために、スタートアップが自社について説明する「採用スライド」を公開する流れは、かなり一般的になってきた感覚があります。  とくにB2Bのスタートアップでは、どういう業務をしているのかB2Cの事業と比べるとどうしても想像がしにくいところがあります。なので、こういった採用スライドのようなメディアとは、特に相性が良いと言えます。  最近、私の会社でも採用スライドを作る機会があり、さまざまなB2B企業の採用スライドをみていたのですが、新しく作る時の参考になりそうなスライドがた

          B2Bスタートアップの印象に残った採用スライド7選+1

          “依存ライブラリ更新めんどい問題”を解決するRenovateを試してみた

          依存ライブラリのバージョン管理は既に人間には無理ゲーになっている リポジトリが依存しているライブラリのバージョン管理は大変である。比較的シンプルなプロジェクトであっても、pipやらgemやらDockerfileのベースイメージのバージョンやらnpmやらMavenやらGradleやらで複雑な依存関係を整理することになる。当然、多種多様なライブラリはそれぞれのペースでこちらの事情などお構いなしに開発を進めていく。関係する全てのupdateをきちんと見極めて、タイムリーに自分のリポ

          “依存ライブラリ更新めんどい問題”を解決するRenovateを試してみた

          良い"空気"のスタートアップを作る技術

           手前味噌だが、弊社のオフィスではそれなりに良い”空気”が漂っているのではないかと自負している。やはり働くにあたってどういう”空気”で働くかは重要だと考えている。”空気”といっても、「人々の気持ちを支配するようなその場の雰囲気」のことではない。文字通り「オフィスに充填された気体」のことを指して言っている。  なぜか弊社のCareers Deck(採用候補者向けのプレゼン資料)にも、空気に関する記載が多い。「採用候補者向けの資料に占める空気関連の記述領域の割合」は数あるスター

          良い"空気"のスタートアップを作る技術

          [DevSecOps] コンテナ時代のアンチウィルス対策はどうすればいいのか調べてみた

           エンタープライズ企業が新しいクラウドサービスを導入する時には、自社のセキュリティ基準を満たせていることを確認するのが通例である。「セキュリティチェックシート」と呼ばれるエクセルシートを利用して一点一点チェックしていくことが多い。(この質問票で聞かれる内容が個社ごとにばらばらで、システム導入時に双方の負担になってしまっているのを標準化してなんとかできないかと思うことはあるが、この記事ではそこには触れない。)  よくあるのが、「アンチウィルスソフトウェアをサーバーにインストー

          [DevSecOps] コンテナ時代のアンチウィルス対策はどうすればいいのか調べてみた

          GitLab的ドキュメント文化を組織にインストールする(実践編:スタートアップMNTSQの事例)

           会社組織にドキュメント文化をインストールすることの有用性や、GitLabのような企業がどのようにドキュメントを運用しているかを、前回記事で書いた(スケールする組織を支えるドキュメンテーションの技術を”GitLab Handbook”から学ぶ)。今回は、私のいるスタートアップのMNTSQ(モンテスキュー、と読みます)でどのようにそれを実践しているか、実際のところどのような成果が出ているのかについて書いてみたい。  MNTSQでは、当初からドキュメンテーションの重要性を経営メ

          GitLab的ドキュメント文化を組織にインストールする(実践編:スタートアップMNTSQの事例)

          スケールする組織を支えるドキュメンテーションの技術を”GitLab Handbook”から学ぶ

          ドキュメント文化は健全な組織のスケールのために必要 組織の中でドキュメント/文章を残し活用していくことはとても重要だ。クオリティの高いドキュメントがあることで、組織に情報が流通し、透明性を確保できるようになる。情報を流通させるためにいちいち口頭の説明がいらないから、メンバーの数が増えた時でもスケールしやすくなる。過去の結論にアクセス可能になるので、議論を積み上げていき、意思決定のクオリティを高めることにもつながる。そもそも何かを読むということは何かを聞いて教わるよりも時間あた

          スケールする組織を支えるドキュメンテーションの技術を”GitLab Handbook”から学ぶ