皆さん、お元気ですか?
しろのは時々落ち込んだりもするけれ(以下略)
さて、最近はDefectedが好きすぎてみんなに紹介したいという思いから文字起こし+翻訳のパイプライン設計をしているのですが、本家はもう74まで上がってますし今は75のライブ予告も見えます。
一回の放送で3時間とか4時間あったりもする重厚な番組だし1分の間にこの二人のしゃべる量が半端ないので全部DeepL翻訳したらすごい課金されそうです。でも素晴らしい情報と見解が満載なのでネット検索できるようにされるべきなので書き起こししています。
この量x74ですから、どのサービス使ってもお値段がすごそうなので最近のAIの発展を活かして自宅サーバーで翻訳サービスを走らせたらいんでない?ということで試して一番よかったのがfuguMTでございます。あとm2m100というFacebookのやつも使えそうです。
ただで使えて大手ネット企業に何を翻訳しているか見られないという利点があるかわり、やっぱり翻訳精度が落ちるというデメリットがあるわけですが、どのくらい落ちるのでしょうか?
今回はこれを検証していく記事です。
トランプのスピーチの例
この46秒の短いスピーチをwhisperxで書き起こししたのがこちらの英文です。
DuckDuckGoの翻訳(中身マイクロソフト)
DeepLの翻訳
グーグル翻訳
fuguMT + Ginza
m2m100
各種の翻訳はかなり行けてますね。違いが生じたのが二点。
翻訳、サービス名、10満点でのしろの採点という感じで比べてみましたが、グーグルがなんと一番まともでした。DeepLも流石。マイクロソフトも悪くないです。全部使えそうです。ちょい昔はDeepLがはっきりとグーグルより上に感じましたが今は差が少ないかもですね。
そして無料で自宅で使えるfuguMTですが、この2部分に関しては意味が違ってしまって誤訳と言えるでしょう。その他の部分はfuguMT結構頑張っていて、惜しい感じです。
この量のテキストをCPUで計算するのにfuguMTは5秒くらいかかります。使える速度ですね。
そして驚きなのが英語ー日本語に特化しているfuguMTを超えてしまった100言語の双方向の翻訳が可能なm2m100でございます。句読点の使い方がおかしくて「。」の代わりに「.」を使いやがるのが玉に瑕ですが、翻訳内容の精度はグーグル並に良いですね。m2m100はCPUで65秒かかりました。
fuguMTの方はGinzaで句読点処理をしているのですがm2m100はまだしてません。なのでGinzaをこっちにも使って句読点キレイにして改行欲しいところに入れてあげたら見やすくなりそうです。
というわけで遅いしたまに誤訳があるというのを踏まえつつも、個人情報が含まれる英語なので自宅で訳したい!みたいな事情があれば自宅のfuguMTやm2m100で十分有用だと思います。
私は英語の翻訳はいらないんですが、ヨーロッパの各種の言語を英語に翻訳することが多いので自宅サーバーに色々な言語モデルで100言語くらい翻訳できるサービスを立てて遊んでいます。
Facebookのm2m100というモデルがすごくて、これのお陰で100言語一気にカバーできます。
前にテストしたときはfuguMTの方がm2m100よりいいと感じましたが、この例文だとm2m100の方がいいですね。速度的にはfuguMTの方が早いです。
扉絵をみんなのフォトギャラリーから選ぼうと思ってAIで検索したら愛ちゃんかなんか知らんけど女の子ばっかり出たの草。欲しいロボットがあるの2つしか無いやん。