![見出し画像](https://assets.st-note.com/production/uploads/images/120253048/rectangle_large_type_2_514d91d15fc6157ad6df159d2b8985fb.jpeg?width=1200)
【Nougat】PDF上の画像や数式をOCRしてくれる神ツールが登場
皆さん、Nougatという論文読み込みツールをご存知ですか?
画像からテキストに変換するOCR技術を使い、LaTeXという論文を記述する言語に変換するんですが……
え、ご存知ないんですか!!??まさかぁ(茶番)
Nougatは、FacebookのMeta社が開発しました。論文をChatGPTなどの生成AIに読み込ませるのは一苦労ですが、それがめちゃくちゃ楽になるんですよ!!
ということで、今回の記事ではNougatの概要、導入、実際に使ってみた感想についてまとめています。
この記事を最後まで読むと、論文読み込みツールのNougatを理解できるようになります。
ぜひ最後までご覧ください!
Nougatの概要
NougatはFacebook Researchによって開発された学術文書のPDFパーサーです。パーサーとは、文書やデータを解析して構造を抽出するプロセスのこと。
このツールでは、OCRという画像読み込みの技術が使われているみたいです。
Nougatの最大の特徴は、数式や文章がぐにゃぐにゃでも読み込むことができ、Latex形式で出力してくれること。
ChatGPTに論文の内容を読み込ませるときなど重宝しそうですね。一般的なChatGPTユーザーだけでなく、研究者、データサイエンティスト、エンジニアなど多岐にわたり利用できます。
Nougatの料金体系
Nougatはオープンソースのため、無料で使用できます。
それでは導入方法をみていきましょう。
Nougatの導入方法
Hugging Faceで公開されているURLをクリックするだけで簡単に使えます。
https://huggingface.co/spaces/ysharma/nougat
![](https://assets.st-note.com/img/1698589850788-XB3nqEEDDB.png?width=1200)
Nougatを実際に使ってみた
これ以降は、以下の記事からご確認ください。
他の記事もご覧になりたい方は、こちらをご覧ください。
この記事が気に入ったらサポートをしてみませんか?