マガジンのカバー画像

自然言語処理入門

773
自然言語処理関係のノートをまとめました。
運営しているクリエイター

2021年3月の記事一覧

Huggingface Transformers 入門 (19) - Seq2Seqの学習スクリプト

以下の記事を参考にして書いてます。 ・seq2seq examples - huggingface/transformers 前回1…

npaka
3年前
6

Huggingface Transformers 入門 (18) - 日本語のGPT-2を試す

「Huggingface Transformers」で日本語の「GPT-2」モデルが公開されたので試してみます。 前…

npaka
3年前
5

OpenAI Jukeboxの使い方

「OpenAI Jukebox」の使い方をまとめました。 1. OpenAI Jukebox「OpenAI Jukebox」は、「ア…

npaka
3年前
80

GiNZA入門 (5) - フィラーの削除

GiNZAでフィラー削除する方法をまとめました。 ・GiNZA 4.2.4 前回1. フィラーの削除 「フィ…

npaka
3年前
3

CLIPを試す - OpenAIのZero-shot画像分類器

以下の記事を参考にして書いてます。 ・How to Try CLIP: OpenAI's Zero-Shot Image Classifi…

npaka
3年前
6

GiNZA入門 (4) - ルールベースマッチング

「GiNZA」の「ルールベースマッチング」の使い方をまとめました。 ・GiNZA 4.0.5 前回1. GiN…

npaka
3年前
7

SudachiPy による自然言語処理の正規化

「SudachiPy」による自然言語処理の「正規化」についてまとめました。 1. SudachiPy「SudachiPy」はワークス徳島人工知能NLP研究所が開発している形態素解析器「Sudachi」のPython版です。 2. 正規化「正規化」とは、同じ意味の単語を統一的な内部表現に変換することで、テキストの比較を容易にする処理です。これによって、全角の「ネコ」や半角の「ネコ」やひらがなの「ねこ」を同じ単語として処理できるようになります。 「Sudachi」では、この

pyopenjtalkのインストール

「pyopenjtalk」をインストールする方法をまとめました。 1. pyopenjtalk「pyopenjtalk」は日…

npaka
3年前
5

gpt2-japaneseの使い方 (3) - largeモデルによる日本語テキスト生成

「gpt2-japanese」の「largeモデル」が公開されたので、AIによる日本語テキスト生成を試してみ…

npaka
3年前
8

NVIDIA/tacotron2 で日本語の音声合成を試す (3) - つくよみちゃんコーパスで学習

前回、「JSUT」を使って英語から日本語に転移学習しました。今回はついに、「つくよみちゃんコ…

npaka
3年前
39

NVIDIA/tacotron2 で日本語の音声合成を試す (2) - JSUTで学習

前回、「Japanese Single Speaker Speech Dataset」を使った音声合成を行いました。次は「つく…

npaka
3年前
12

深層学習による自然言語処理のコーパス まとめ

深層学習による自然言語処理のコーパスをまとめました。 1. テキスト分類◎ livedoor ニュー…

npaka
3年前
11

NVIDIA/tacotron2 で日本語の音声合成を試す (1) - 事始め

1. はじめに先週、「つくよみちゃんコーパス」がリリースされました。 そこで、「NVIDIA/taco…

npaka
3年前
39