見出し画像

CO-Fun: A German Dataset on Company Outsourcing in Fund Prospectuses for Named Entity Recognition and Relation Extraction

下記の文章は論文のアブストラクトをChatGPTに解釈させたものであり、正確性は保証しません。

  1. 先行研究と比較して、本研究では企業の受託サービスに関するデータセットを作成し、新たな手法やモデルを使用しています。先行研究では、企業の受託サービスに関するデータセットが限られた範囲でしか作成されていない可能性がありますが、本研究では多岐にわたるデータセットを使用しました。

  2. 本研究の目的は、企業の受託サービスに関する情報を抽出し、関連するエンティティや関係性を特定することです。具体的には、名前付きエンティティの認識と関係抽出の2つのタスクを行い、それによって企業の受託サービスに関する情報を自動的に抽出します。

  3. 本研究で使用したデータは、CO-Funというデータセットです。これはドイツ語のファンドプロスペクトから抽出した948の文章を含んでいます。また、このデータセットには5,969個の名前付きエンティティと4,102個の関係のアノテーションが付けられています。

  4. 本研究では、名前付きエンティティの認識にはCRFとBERTという2つの手法を使用しました。CRFではトークンの特徴を利用して名前付きエンティティを認識し、BERTではドイツ語のBERTモデルを使用して名前付きエンティティの予測を行いました。また、関係抽出には他の手法やモデルも使用されました。

  5. 本研究によって明らかになったことは、企業の受託サービスに関する情報を抽出するためのデータセットが作成され、それに基づいて名前付きエンティティの認識と関係抽出のタスクが行われることが可能であることです。これにより、企業の受託サービスに関する情報を効率的に抽出し、関連する情報を分析や監査に活用することができます。また、本研究で使用した手法やモデルの性能も評価され、高い精度が示されました。

この記事が気に入ったらサポートをしてみませんか?