見出し画像

Flittoの著作権フリー言語データで製品をパワーアップ

画像1

Flitto保有データ

Flittoは、コーパス、音声、画像データに対応する最大級の多言語データ企業です。
1,000万人以上のバイリンガルユーザーと100万人以上の認定翻訳者により、25言語のデータを生成しています。
機械翻訳、音声認識、AIベースのチャットボット、NLP(自然言語処理)、OCR(光学式文字認識)など、AIに使用される膨大な量の言語データを日々収集しています。

弊社が生成するデータは、クリエイターとのライセンス契約に基づいています。
お客様は著作権の制限を受けることなく、このデータを利用することができます。
また、性別、年齢、場所などのメタデータの分類により、シームレスなデータ処理を実現しています。
Flittoから言語データを購入することでどのようなメリットがあるのかをご紹介していきます。

どのようにして言語データを収集しているのでしょうか? 

Flittoでは、ユーザーが言語関連のタスクを実行してポイントを獲得できるサイト上の「Flitto Arcade」を通じて、著作権フリーの言語データを収集しています。

アーケードは、1,000万人以上のFlittoユーザーが、25カ国語のテキスト、画像、音声、ビデオ形式の情報を翻訳、編集、校正、書き写すことができるサービスです。
参加して獲得したポイントは、ギフトカードに交換することができます!

ユーザーは、データが営利目的のために使用されることを承知の上で、データを提供します。
アーケードに蓄積されたデータは、100%著作権フリーで世界中のクライアントに提供する権利を持っています。

それぞれのデータタイプを見てみましょう。

3つの言語データタイプ:コーパス、音声、画像

多言語並列コーパス

多言語並列コーパスは、Arcadeで収集された多言語コーパスデータの徹底的なレビュープロセスを経て、機械翻訳やAIベースのチャットボットなどのNLP(自然言語処理)エンジンやアルゴリズムのトレーニングに使用できるようになっています。

多言語音声データ

Flittoの音声データは、テープ起こしや翻訳が可能です。
NLP(自然言語処理)、STT(Speech-to-Text)、TTS(Text-to-Speech)エンジンに適用できるように、音声データとそのメタデータ情報に細心の注意を払っています。

画像データ

レストランのメニューや手書きの文字など、画像に印刷された文字や書かれた文字を収集しています。
ソーシャルタグ付けシステムを通じて、収集した画像には豊富なメタデータが含まれています。

言語データの分類について

3つのデータタイプ(テキスト、音声、画像)すべてに対して、Flittoはメタデータとアノテーションを提供しています。

お客様のニーズに応じてデータセットをカスタマイズすることも可能です。
メタデータの分類には、言語ペア、性別、年齢、場所、業種、状況などがあります。

データアノテーションには、MTPE(機械翻訳後編集)、文の区分け、品詞、名前付きエンティティの言及などがあります。


例えば、20代女性の買い物客と販売代理店の間での1対1の会話データセットを作成することができます。
Flitto言語データは、校正者、翻訳者による厳格なレビュープロセスを経ています。

現在では、英語、アラビア語、中国語(簡体字)、フランス語、ドイツ語、インドネシア語、日本語、韓国語、マレー語、ロシア語、スペイン語、タイ語、ベトナム語、フィンランド語を含む25の言語で利用できます。

言語データはAI開発に欠かせない

チャットボットをトレーニングする場合でも、消費者調査を行う場合でも、言語データはAIの最新の進歩に欠かせないものになってきています。
Flittoは、高品質のコーパス、音声、画像データを競争力のある価格で提供します。

言語データに加えて、クラウドソーシング翻訳、プロ翻訳、YouTube動画翻訳サービスを提供しています。

Flittoの翻訳サービスは、ウェブとアプリで利用できます。

■アプリ                              Google play                             Appstore

■Flitto翻訳
Flitto.com 

ビジネスに関するお問い合わせは、Flittoに直接ご連絡ください。

この記事が気に入ったらサポートをしてみませんか?