正則化の件

正則化の件

正則化とは? 正則化とは、目的関数にチョコっと付ける可愛い存在です。 どんな時に正則化項を付けるかというと… ■過学習を防ぎたい時 ■特徴量選択したい時 とかが挙げられるかなと思います。 正規化項を付ける理由 線形回帰モデルの目的関数は、 𝐿̂ (β)=1/𝑛∑(𝑦–𝑦̂ )^2 です。(※βは回帰係数のことだと思ってください) つまりこれは、 「予測値 𝑦̂ が真値yと、平均してどれくらいずれているのか」を示します。したがって 1/𝑛∑(𝑦–𝑦̂ )^2=𝐸[(𝑦–𝑦̂

新コース「機械学習エンジニア/データサイエンティストの目指し方」の公開、関連コースを含む割引について

新コース「機械学習エンジニア/データサイエンティストの目指し方」の公開、関連コースを含む割引について

本日、Udemyで1時間24分ほどの短いコースをリリースしました。 機械学習エンジニア/データサイエンティストの目指し方 -人工知能(AI)を仕事にしよう!- これに伴い、本日から8/2の10:00まで、公開記念割引(最低価格)をこのコースおよび関連コースに適用します。 以下が割引クーポンです。 割引クーポン : https://www.udemy.com/course/mlds-career/?couponCode=E8D61034D97230147712 「機械学

1
中心極限定理の件

中心極限定理の件

中心極限定理とは… 「平均と分散が定義できる分布から得られた確率変数の和𝑋1+𝑋2+𝑋3+・・・+𝑋𝑛 の確率分布の形は、nが大きければ正規分布に従う。」という奇跡のような定理。 (ちなみにコーシー分布は平均と分散が定義できないので、中心極限定理は使えない。) 内容確認 𝐸(𝑋)=μ,𝑉(𝑋)=σ^2 の確率分布から、抽出したデータを 𝑋1,𝑋2,𝑋3,・・・,𝑋𝑛 とします。 𝑉(𝑋1+𝑋2+𝑋3+・・・+𝑋𝑛) =𝑉(𝑋1)+𝑉(𝑋2)+𝑉(𝑋3)+・・・+𝑉(𝑋𝑛

2
Seq2SeqからのAttentionの件

Seq2SeqからのAttentionの件

Attentionとは、名前の通り必要な情報に「注意」を払わせる技術です。 イメージでいうと、 「こんにちは。私の名前はJohn トラボルタです」を英語に翻訳するときは、特定の単語に注目して、適宜英語に脳内変換していると思います。 「こんにちは」は「Hi」、「私の名前」は「my name」という感じで、適宜特定の単語に注意していると思います。この特定の単語に注目しようという機構を実現するのが、Attentionです。 それでは以降 ・seq2seqと翻訳 ・seq2seq

1
事業やプロダクト開発を加速させるデータ分析

事業やプロダクト開発を加速させるデータ分析

ここ数年、様々な業界でデータサイエンティストの求人を目にします。一口にデータサイエンティストと言っても内容は様々で、画像解析やレコメンド開発など機械学習エンジニア系のものもあれば、ビジネスの意思決定を支援するようなデータアナリスト系のものもあります。(データサイエンティストの分類についてはTJOさんの記事が参考になります) この記事では、ビジネスの意思決定を支援するデータ分析に絞って、事業やプロダクト開発を加速させるのに必要なことについて、自分の思考の整理を兼ねて書きたいと

52
【合格体験記】Tableau認定資格 Desktop Certified Associate【試験中の注意事項編】

【合格体験記】Tableau認定資格 Desktop Certified Associate【試験中の注意事項編】

Tabelau認定資格の概要は↓のURLからご確認ください。 Tabelau認定資格の申し込みについては↓をご確認ください。 必要なモノ・試験で使用するツール・注意事項 ZOOM・・・試験監督と会話する際に使用します。事前にインストールしておくことをお薦めします。 VMware・・・試験で使用します。こちらのインストールは不要です。 試験監督がVMware(仮想PC)を起動してくれるので、そこで試験問題の確認やTableauの操作をします。 マイク・・・試験監督と会話

3
【データ分析に必要な統計】統計検定2級2018年11月問9解説。

【データ分析に必要な統計】統計検定2級2018年11月問9解説。

この問題超難しく、解説もどれも途中式がなく難解。 分かりやすいものがなかったので超解説!! まず、この問題は反復思考といいます。 そもそも、何を使って解かれているか分かりにくい^^; 反復施行を調べると解き方が出てきます! まず、1から6の目が等しい確率で出るサイコロを7回投げる時の2以下の目が出る回数をXとする。式の作成から これは、二項分布を使います。式の作成の例Xが実数3とすると。 です。ただ、7C3の組み合わせは別の書き方も出来ます。そして、出る回数をX

「BackNumberっぽい歌詞を…」の追加説明

「BackNumberっぽい歌詞を…」の追加説明

「PyTorchでBackNumberっぽい歌詞を生成してみた」の説明がすごい長くなったので、こちらのブログで追加の説明を行います。 前述のブログでは、シンプルなRNNについて説明しました。しかしPyTorchによる歌詞生成についてはLSTMを利用しました。 一部の読者(読者がいるかわからないが…)は、 「は?LSTMで歌詞生成してるじゃん。RNNと全く関係ないじゃん。」 と思われたでしょう。しかし一般的に「RNN」と言ったら、「LSTM(ゲート付きRNN)」を指すことが多

1