記事一覧
見ている論文を東大図書館の学外アクセスを利用してTREEとかを経由せずシュッと表示するブックマークレット
わたしがちゃんと検索の方法をわかっていないだけなのかもしれないのですが、東大のみなさん、学外から論文読むときこういうフローをたどっていませんか?
ジャーナルのページを開く
タイトルをコピーする
TREEを開く
「学外で使う」を押す
EZProxyでログインする
題名をTREEで検索する
検索結果を開く
(=> たまにわけわからんページが出るのでがんばって探しに行く)
ジャーナルの
機械学習プロダクト開発の「2年目」とこれから
自然言語処理・機械学習を用いて、企業に眠っている契約書を資産として活用できるようにしていくサービスを作っているMNTSQの堅山です。
弊社の機械学習チームは、契約書データから様々な情報を抽出し、人が活用できるようにするのがの役割です。例えば、誰が相手の契約か?この条項と同じタイプの条項は他にあるか?などなど文書分類、NERなどなどのタスクを解いています。
弊社は現在3年目に突入したところで、無
Feature Importanceって結局何なの?
この記事の目的GBDT(Gradient Boosting Decesion Tree)のような、決定木をアンサンブルする手法において、特徴量の重要性を定量化し、特徴量選択などに用いられる”Feature Importance”という値があります。
本記事では、この値が実際にはどういう計算で出力されているのかについて、コードと手計算を通じて納得することを目指します。
なお、この記事は3回シリー
catboostの推論の仕組みを理解する (1/2)
この記事の目的catboostというライブラリがあります。GBDT(Gradient Boosting Decesion Tree )という決定木をアンサンブルする方式の識別モデルを学習するものです。同様のライブラリは他にはXGBoostやLightGBMなどが有名です。
GBDTって何やっているの?というのは以下のXGBoostのドキュメントの画像がわかりやすいです。要は、複数の決定木が存在
機械学習プロダクトで「スクラム」的開発をやってみてわかったこと
こんにちは、MNTSQというリーガルテックの役員をしている堅山といいます。
今回のエントリでは、機械学習プロダクトにおけるアルゴリズム開発の現場で、スクラム的な手法をとりいれたらうまく行ったよ、という話を紹介したいと思います。あくまで、「的」なので、完全にスクラムなんや、という感じではないのをご了承ください。
さて、MNTSQでは、大量の契約書をNLPや機械学習を用いて解析しているのですが、解
MNTSQの契約書解析を支える技術
こんにちは!リーガルテックベンチャーのMNTSQの取締役をしている堅山と申します。
面接等で、そもそもリーガルテックってどんなタスクを解いているの?という疑問をいただくことが多いです。今回は、前回の記事に続き、MNTSQでどのような問題に取り組んでいるかを書こうと思います。
MNTSQでは、法律事務所向けに「法務デューデリジェンス」という業務を効率化するプロダクトを作っています。法務デューデリジ
MNTSQの機械学習エンジニアの仕事の進め方
こんにちは、リーガルテックのスタートアップであるMNTSQ(モンテスキューと読みます)取締役をしています堅山です。
面談等で質問を頂く機会も多かったので、これから何回かに分けて、MNTSQで機械学習エンジニアがどのように仕事をしているのかについて話していきたいと思います。
今日はまず、MNTSQで心がけている仕事の進め方の話を紹介したいと思います。
もくじ(予定)
- (今回)MNTSQの機