マガジンのカバー画像

自然言語処理入門

777
自然言語処理関係のノートをまとめました。
運営しているクリエイター

2020年12月の記事一覧

gpt2-japaneseの使い方 (2) - GPT-2のファインチューニング

「gpt2-japanese」の「smallモデル」と「ファインチューニングのコード」が公開されたので、日…

npaka
3年前
32

MeCabの使い方

「MeCab」の使い方を備忘録的にまとめました。 1. MeCab「MeCab」 はオープンソースの形態素…

npaka
3年前
6

spaCy入門 (2) - ルールベースマッチング

以下の記事を参考に書いてます。 ・Rule-based matching · spaCy Usage Documentation 前回…

npaka
3年前
12

GiNZA入門 (2) - 固有表現抽出

「GiNZA」の固有表現抽出の使い方をまとめました。 ・GiNZA 4.0.5 前回1. GiNZA のインスト…

npaka
3年前
17

AIML2.0リファレンス

以下の記事を参考に書いてます。 ・AIML 2.0 Reference 1. AIML2.0リファレンスこのページで…

npaka
3年前
1

AIML - チャットボットのマークアップ言語の元祖

チャットボットのマークアップ言語の元祖である「AIML」についてまとめました。 1. AIML「AIM…

npaka
3年前
3

WordNet を使ってPythonで類義語を調べる

「WordNet」の使い方を軽くまとめました。 ・macOS 10.15.7 ・Python 3.6 1. WordNet「WordNet」は意味に基いて作成された巨大な概念辞書です。 「類義語」「上位概念」「下位概念」などがまとめられているDBになります。 ・類義語 : 意味が似ている語。 【例】猫の類義語 → ねんねこ, にゃんにゃん, 猫, キャット, ネコ ・上位概念・下位概念 : 下位概念は上位概念の概念関係を承継。 【例】猫の上位概念 → 動物    動

GCP 入門 (3) - Natural Language

「GCP」(Google Cloud Platform)の「Natural Language」で自然言語処理を行う方法をまとめま…

npaka
3年前
5