人気の記事一覧

400GB程度の清掃済み日本語コーパスを作るまでのメモ書き

2か月前

ウェブの日本語テキストをクリーニングするための基本的な処理コードと課題

4か月前

無料で使える英語辞書まとめ

日本語の事前学習データセット(OSCAR,mc4)を機械学習でクリーニングしてみる練習

4か月前

ルールベースでWebページから日本語のテキストを清掃する

4か月前

教師なし学習で事前学習用のWebテキストを分類する

4か月前

「半分ずっこ」は誰が使っているのか?

0.1bのtransformerのperplexityで文章フィルタリングができるかどうかの検証

3か月前

CommonCrawlから有益な日本語の記事と文章を機械学習で抽出するスクリプトのプロトタイプ

4か月前

日本語教師にも使える!現代日本語書き言葉コーパス

「肌感覚」って何よ。―コーパスや医学部図書館を使って言葉を再構築した話―

5か月前

ドイツ語コーパス10/もっとも頻繁に使われる動詞の意味を列挙

sweet water

【日記】何味噌?

1か月前

MYCOEIROINKで声優さんに依頼するときの収録方法の説明について

動画・生放送文化が「初見」という言葉の用法に与えた影響について推測する

4か月前

〜ぽい・〜がち・〜気味 意味・使い方【例文付き】 <忘れっぽい? 忘れがち? 忘れ気味?>

3週間前

この単語ってみんなどうやって使っている?

合成音声を作ってみよう!〜その2〜

6か月前

1月19日#963コーパスとは何か?今後のために整理してみた。

5か月前