マガジンのカバー画像

機械学習、プログラム関連のまとめ

68
プログラム、機械学習などについてまとめています。
運営しているクリエイター

記事一覧

Fasttext ライブラリで文書分類が出来る

Fasttext ライブラリで文書分類が出来る

Fasttext ライブラリで文書分類が出来るのまとめFacebook research がFasttextを使った文書分類ライブラリを公開している

Fasttext のpython 環境でのinstall 方法は簡単

実行時間が早い

前振り文書分類のタスクに取り組むことになり、当初は、NeuralClassifier: An Open-source Neural Hierarchical

もっとみる
日本語Wikipediaで学習済みのBERTが公開されているので使い方メモ

日本語Wikipediaで学習済みのBERTが公開されているので使い方メモ

噂のBERT、使ってみたくはありませんか?huggingface がBERTの日本語モデルを公開しました。BERTについては以下の記事が参考になります。

https://ai-scholar.tech/articles/text-mining/bert-ai-93

BERTの日本語モデルはtransformersに含まれています。そのため、従来のtransformersの利用方法と同じ操作感で

もっとみる
技術書典7に参加するに当たって技術書とプログラムを作成したメモ 経緯と売り上げ、あと感想

技術書典7に参加するに当たって技術書とプログラムを作成したメモ 経緯と売り上げ、あと感想

経緯学位を取るための論文執筆が死ぬほど辛かった私は執筆の経験が浅いから苦しんだのだと仮説を置いた。

この仮説を検証するために論文よりレベルを落として薄い本を書くことを思い立った。

とりあえず知識を整理してブログにまとめようかと考えていたところに技術書典というイベントの存在を友人から教えられた。

技術書典というイベント技術書典とは技術書の書き手を増やし、技術書の流通を増やすという目的があるらし

もっとみる
Natural Language Inference Sentence BERT データ作成

Natural Language Inference Sentence BERT データ作成

NLIを因果関係の情報抽出に使えないか?

NLI二つの文章の 前後関係を推測する



無関係
の三つの関係

因果関係に当てはめる原因、結果のペア
結果、原因のペア
原因もしくは結果とそれ以外のペア
事例の報告書の件数×3以上はデータを作成できる。

疑問学習のエポックはどうするか? そこはハイパーパラメータなんかな?

分散表現の利用法 バギングによるクラス分類や汎化性能についてのメモ

分散表現の利用法 バギングによるクラス分類や汎化性能についてのメモ

分散表現が得られた後、 機械学習によってクラス分類を行うことができる。

使えるモデルとして

決定木
SVM サポートベクターマシン
NN ニューラルネット
などがある。

SVMは広義のNNに含まれる。

ここでは決定木を用いた方法にする。

バギング複数の決定木による多数決的なイメージ
シンプルな理論
決定木は説明可能性が高く、古典的な機械学習モデル
計算負荷も深層学習に比較して軽い
モデル

もっとみる
Sentence BERT 日本語モデルの学習 メモ

Sentence BERT 日本語モデルの学習 メモ

BERTは自然言語処理タスクに強力に応用できるモデルである。

しかし、文章単位の特徴量をうまく取得できない。

[CLS] に文の特徴量が現れるという主張もあるが、 それほどタスクに対して有益な情報は含まれていないとこの論文は主張する。

文単位の特徴量を取得できるようにBERTを拡張するモデルがSentence BERTである。

以下はSentence BERT を日本語で作成する際の手順に

もっとみる
tensorflow GPUメモリを一気に確保しない設定

tensorflow GPUメモリを一気に確保しない設定

tensorflow 1系は使える全てのGPUリソースを確保する。

メモリオーバーを観測できないので、 逐次的にGPUメモリを確保するように設定を変更する。

これによってGPU使用量の観測ができる。

ただし実行速度は劣化する。

記述例config = tf.ConfigProto( gpu_options=tf.GPUOptions( allow_growth=True

もっとみる
hugging face でBARTの利用 メモ

hugging face でBARTの利用 メモ

BARTは文書要約のためのモデル
BERTと同じtransformerの派生
BERTとは異なり、encoder-decoderの構造
これは文生成を目的とするため
このページではBARTのチュートリアルを実行する手順を示す。

手順transformersのインストール

pip install transformers

要約の実行

もっとみる
hugo での作業手順メモ

hugo での作業手順メモ

hugoを導入するにあたってのメモ

環境Mac OS Big Sur

ローカルの作業hugoのインストール

brew install hugo

hugoでプロジェクトの作成hugoで任意の名前のプロジェクトを作成する。 今回は"quickstart"とした。

この名前はなんでもいい。

hugo new site quickstartcd quickstartgit init

hugo

もっとみる
vue でモーダルウィンドウに複数の種類のコメントを表示する

vue でモーダルウィンドウに複数の種類のコメントを表示する

vue でモーダルウィンドウに複数の種類のコメントを表示するpostItem変数を介して、親から子へと情報をやり取りする。

コードサンプル親js new Vue({ data:{postItem}, methods:{ openModal: function (item) { console.log("openModal "+item) this.showCon

もっとみる
Macの iMovieで動画の音量調整、オーディオ抽出

Macの iMovieで動画の音量調整、オーディオ抽出

楽器の練習、私の場合はソロギターの練習のために動画の撮影を行うことにした。

撮影はフォームや自分の演奏を客観的に聴くために有効だ。

ただ撮影に手間がかかるのでは、 練習から手が遠のいてしまう。

手持ちの環境(iPhone、MacBook)で動画とオーディオの作成を行う手順をメモする。

撮影機材:三脚とiPhone

iPhone は優れたカメラとマイクを搭載しており、 個人練習用のレベルで

もっとみる
vue.jsでtodoリスト作成

vue.jsでtodoリスト作成

開発環境macOS

firebase cli のインストールnpm install -g firebase-tools

多分yarn add でも可

todo list の作成vueとjavascriptについてはまだあんまり理解していない。

firebase でローカルでテストfirebase init firebase login firebase serve --only hos

もっとみる
blogger にGoogle AdSense のコードを追加する手順

blogger にGoogle AdSense のコードを追加する手順

テーマ→その他(:のマーク)→htmlを編集

からhtml編集用のページに移動する。

収益のページから案内されるコードをコピペする。

bloggerでもhtmlをいじらないといけないということに気がつかなかった…。まあええわ。

python でmlflow使うメモ

python でmlflow使うメモ

実験結果を比較するために便利っぽいので使ってみた。使う際の手順をメモしておく。

mlflow のインストールpip install mlflow

クイックスタートpythonで以下のような記述を用いる。

with mlflow.start_run(): mlflow.log_param("a", 1) mlflow.log_metric("b", 2) mlflow.log_artif

もっとみる