見出し画像

G検定

・リクルートホールディングスは、「ルールベース」と「機械学習ベース」の二つの手法を用いることで、校閲のAIを構築・開発した。

・リクルートホールディングスは二つのベース手法を用いることで校閲AIを構築・開発したアルゴリズムとして、Bidirectional RNN を用いることで、時系列データも扱うことができる。

・ネット広告関連事業を展開するソネット・メディア・ネットワークスは、バナーなどにおけるクリック数の割合を表すCTRを予測するディープラーニングモデルを開発した。この際に不当に高い精度が出るのを防ぐため、学習に用いて、バナー画像は同一構造のバナーを排除したり、対象バナーの形状を統一するなどして、データに偏りがないようにした。

・CTR=Click Through Rate
→表示された数(インプレッション数)のうち、クロックされた回数(クリック数)の割合

・ディープラーニングによる画像認識を応用したものとして、スピーディかつ人との接触を提言した無人レジのワンダーレジがある。
ワンダーレジにより、店舗の人手不足問題が解消される。

・オムロン:Okao Vision
→ディープラーニングによる画像センシング技術

・ソニーのコンピュータサイエンス研究所は、メロディとコード進行をもつリードシートと学習し、その音楽スタイルで自動的に作曲することを目標としたプロジェクト Flow Machines を発表した。

・レコメンドシステムに関して、インターネット通販サイトなどでは、AIを用いて、その顧客が購入する可能性が高い商品を予測し、推薦を行う。これには、商品の特徴ベクトルから推薦を行う内容ベースフィルタリングがある。

・産業への応用
・特にインパクトの強い分野として、教育がある。
・株の取引きなどのやりとりが広く行われるようになる。

AIを活用したプロダクトを開発する際に、注意するべきこと
→なぜ、AIを取り入れた製品を開発したいのか、関係者間、特に経営者と関係者でしっかりと議論する必要がある。

・透明性レポート
→ユーザーの個人情報について、政府機関などからの情報開示請求や削除請求の件数とその対応を統計として公表するもの

・2019年12月、公正取引委員会は、「プラットフォーマー型ビジネスの台頭に対応したルール整備の基本原則」を踏まえ、デジタル・プラットフォーム事業者が優越的地位の使用によって、サービスの対価として、消費者に無理やり、個人データを提供させることを規制する姿勢を示した。


<機械学習の具体的手法>
・機械学習において、問題となる過学習とはどのような状態か
→学習途中から検証データに対する精度だけが下がり始めてしまう。
※学習を進めるうちに、訓練データに適合しすぎて検証データに対する精度が下がり始めてしまう。すなわち、汎化性能が低下している状態を過学習という。学習データ数が少ない場合などに置きやすく、ドロップアウトや早期終了などの過学習を抑制する手法がよく使われる。

・複数の決定木を逐次的に作成し、1つ前のモデルで誤認識したデータを優先的に正しく予測するよう学習させる手法
→XGBoost
※一部のデータを繰り返し抽出し、複数のモデルを学習させるアプローチにおいて、モデルを一気に並列に作るバギングに対して、モデルを逐次的に作成する手法をブースティングという。この有名なものに、XgBoostや勾配ブースティングがある。

<ニューラルネットワークとディープラーニング>
・21世紀になり、PCの能力が格段に上がり、ディープラーニングの研究が活発になった。ディープラーニングとは、ディープニューラルネットワークを用いた機械学習の手法である。

・ニューラルネットワークが学習を行う際の計算規則について考えてみる。まず、データが入力層へ入力される。そして、入力層と次の層の結合部分の重みと掛け合わせ総和をとり、バイアスを足し合わせる。その後、次層の活性化関数による変換を行い、次の層へとデータが渡る。

・ディープラーニングでは、人間が苦労せずとも特徴表現を機械が自力で獲得する。

・機械学習の一つの手法にディープラーニングがあるが、これはニューラルネットワークの層を深くしたものである。

・ディープラーニングに関して、それまでの機械学習の手法に勝ってる点として従来より複雑な関数の近似が可能等が挙げられる。

・ディープラーニングは従来の機械学習の手法より優れた点もあるが、「この世の全ての問題に対して万能なアルゴリズムは存在しない」というノーフリーランチ定理の例に漏れない。

・機械学習を制御するパラメータにハイパーパラメータがあり、これは人手で事前に決める必要があるパラメータである。

・ディープニューラルネットワークにおけるハイパーパラメータとして隠れ層の数が挙げられる。

・最も単純なニューラルネットワークで、隠れ層を持たず入力層と出力層の二層からなるモデルを単純パーセプトロンという。

・ニューラルネットワークのパラメータ更新手法である誤差逆伝播法では、予測値と正解の誤差をネットワークの出力層から入力層に逆伝播していき、重みの値を更新する。

・ニューラルネットワークの学習とは、誤差関数に最小値を与える重みwを求めることだが、一般に誤差関数は凸関数ではないため、大域的な最小解を直接求めるのは通常不可能である。

・ニューラルネットワークの重みは勾配降下法によって更新される。学習係数は一度の更新量の大きさであり、学習係数が十分に小さければ、更新回数の増加に伴って誤差関数は確実に最小化する。



この記事が気に入ったらサポートをしてみませんか?