ローカルLLMで無料、海外データセットを機械翻訳
かねてより課題である、日本語LLM学習データ不足の問題
APIを使った機械翻訳では、特に大量データを扱う場合費用面が大変です
昨年から、ローカルLLMを使用した翻訳特化調整に取り組んできました
今回HuggingFaceがApache2.0ライセンスで公開しているデータセットの翻訳を試してみました
現在作成中の翻訳モデルの出力結果です
<english>: When you've been involved in an auto accident, particul