マガジンのカバー画像

コンピュータの技術

92
運営しているクリエイター

#音声

音声から顔画像を作成

音声から顔画像を作成

レブコムは、人の音声データを基に、その声でしゃべりそうな人の顔を画像データとして生成する技術を開発した。

多数の人の顔画像と音声のデータからそれぞれの特徴や関係をAIに学習させる。その後、入力された音声の特徴に対応するような顔画像を生成するという仕組みだ。

コールセンターのオペレーターなど、実際の顔を相手に見せずに「顔出し」したい場面で使われるという。

『参考資料』
https://www.

もっとみる
コロナ禍の技術応用

コロナ禍の技術応用

コロナ禍マスクで会話が聞こえにくいことから、マイクで拾った音声をスマホで文字化し、アクリル板にプロジェクターで投映する技術が広がった。

この技術が今、日本語を外国語に変換して表示したり、視覚障害者の支援に用いられるなど、広い範囲で応用されようとしている。

今世の中は急速に元の世界に戻ろうとしているが、コロナ騒ぎがあったからこそ得られたもの、これはこれで大切にしていくべきだ。

『参考資料』

もっとみる