マガジンのカバー画像

自然言語処理入門

773
自然言語処理関係のノートをまとめました。
運営しているクリエイター

2021年7月の記事一覧

Huggingface Transformers 入門 (36) -AutoNLP

「AutoNLP」について、軽くまとめました。 前回1. AutoNLP「AutoNLP」は、最先端のNLPモデル…

npaka
3年前
3

Huggingface Transformers 入門 (35) -Huggingface Accelerated Inference API

以下の記事を参考にして書いてます。 ・Huggingface Accelerated Inference API 前回1. Hug…

npaka
3年前
7

spaCy 入門 (3) - spaCy v3.0の新機能

以下の記事を参考にして書いてます。 ・What’s New in v3.0 前回1. Transfomerベースのパイ…

npaka
3年前
5

音声合成・歌声合成のコーパス まとめ

音声合成・歌声合成のコーパスをまとめました。 1. 音声合成のコーパス主に「テキスト → 音…

npaka
3年前
25

GiNZA入門 (7) - spaCyとGiNZAのバージョンと日本語対応

「spaCy」と「GiNZA」のバージョンと日本語対応をまとめました。 前回【2020年1月】 GiNZA v3…

npaka
3年前
7

GiNZA入門 (6) - Universal Dependencies

「GiNZA」の「Universal Dependencies」についてまとめました。 前回1. Universal Dependenci…

npaka
3年前
7

Huggingface Transformers 入門 (34) -東北大学の乾研究室の日本語BERTモデルのv1とv2の比較

東北大学の乾研究室の日本語BERTモデルのv2がでていたので、v1と比較してみました。 前回1. 日本語BERTモデルのv1とv2の比較主な変更点は、次の2つです。 (1) トークン化で利用する日本語辞書の変更 IPA辞書 ↓ Unidic辞書 単語「国家公務員」をトークン化した際の、各辞書のトークン粒度は次のとおりです。 ・NEologd : 国家公務員 ・IPA辞書 : 国家 / 公務員 ・Unidic辞書 : 国家 / 公務 / 員 (2) 学習デー

Huggingface Transformers 入門 (33) -Sentence Transformers

以下の記事を参考にして書いてます。 ・Sentence Transformers in the Hugging Face Hub 前…

npaka
3年前
1

Huggingface Transformers 入門 (32) -Few-shot Learning

以下の記事を参考にして書いてます。 ・Few-shot learning in practice: GPT-Neo and the 🤗…

npaka
3年前
2

GitHub Copilot - あなたのAIペアプログラマー

以下の記事を参考にして書いてます。 ・GitHub Copilot · Your AI pair programmer 1. あな…

npaka
3年前
25