見出し画像

機械学習のLT会イベント参加した話のメモ

第36回 Machine Learning 15minutes!

機械学習(AI・人工知能)に関するカジュアルトークイベント

1年ぶりくらいに遊びに来ました
知り合いがこれ運営していて、2年前まで私もこの運営に入っていたが、このところ参加できず、今回は参加者として来ました。

門前さん登場!
今年2回目、そして今週2回目の門前さん
なにかいいことありそうなレアエンカウント

<登壇者 発表内容>

犬塚 眞太郎【無理をしない機械学習プロジェクト2】
 クックパッド株式会社

機械学習を信用してないけど、辞書つかえばいいじゃん
そんな内容だが、クックパッドを通してやった話
正解率50%程度て、なんやかんやとディープラーニングしてみてサービス投入した話

実サービスにまで行けるというのはさすがですね。
クックパッドすごい。
DockerにJenkinsにgithub連携してS3環境
実装部分も熱いな

92%でも許されないからさらにディープラーニングで95%まで上げちゃうところもすごい話

クックパッドの機械学習サイクルすごい
見習いたいサイクルだなー

中村 一翔【分析ベンダーが考える機械学習PJ】
 株式会社ALBERT

データサイエンティストの集団で社員数2倍
急成長してるらしい。この領域ほんと最近すごい

趣味、いろんな種をたくさんぶち巻いて、生き残りをみて楽しむと言う、これはおもしろい。収穫とかお花な目線ゼロ!

機械学習モデルの実装までのフロー
実用化に向けてのギャップを埋める、その先の運用含めて
ここはたぶんかなり技術としてもキーになるところですかね

ふわっとした営業からの相談を
各工数別に要件、分析、実用化に向けての施策
実用化したときに、人間ではなかったミスをどうするかを考えておくといい。
確かにそうだ、人とは違うトラブルはありそうだけど、予想はつかないよな。経験でカバーにも限界がありそう。

人材的には、足りない領域がみっつ、市場にもほとんどいない。
データサイエンティスト領域のコンサル、リサーチャー、あと

小池 優希【分散表現と検索】
 フューチャーアーキテクト株式会社

今度は、ITコンサルをしている会社の小池さん、なんと新卒3年目
自然言語処理のチームらしい。

類似チケット検索のお話、レッドマインにある類似チケットをドキュメント検索して保守運用を効率よくするというもの

検索するにも、用語のゆらぎ、キーワードが一致しない。自然言語で検索したいというオーダーを対応した話
例えば、ヨーロッパと欧州のようなもの、辞書登録やるのもいいが、人手とオペレーションが大変なので、分散表現を使う。単語をベクトル化する手法。

そうか、分散表現使えばいいのか。なるほどね
それを実現するのがSCDVらしい。

BM25 vs SCDVで負けちゃったのは何故か分析してみた
では、組み合わせてみればどうなのか!?
戦わせるのではなく、ハイブリッド化する
速度はどうなのか、速度向上も必要
NGTを使って爆速化する

結論、ハイブリッド化して、0.06%向上した!
複数の技法を共存ふるのはありですね!

榊 剛史【ソーシャルメディア分析におけるAI技術活用〜ハッシュタグ推薦とか〜】
 株式会社ホットリンク

ホットリンクの榊さん
ビックデータとAIを扱う会社。
口コミ係長、バズスプレーターが代表サービスらしい。

本日は、後者の、バズスプレーターでのお話
マネタイズとやっちまった話

SNSアカウントのプロフィール測定今回は、Twitterの話
投稿内容やプロフィールから、性別や年代など属性を測定する。

圧倒的男性、圧倒的都内
みたいな属性、特徴量が取れる。

女子高生と書く人は、男性であるw
なるほどねあるかもしれない。男の特徴なのでしょう。

特徴が分かることで、自社製品に興味ある人の属性や傾向が分かるというサービスらしい。目視では大変だもんだ。

ソーシャルメディアからのインサイト表現
ハッシュタグ推薦
画像からも勝手にハッシュタグ推薦してくれる。これは便利だな
SNS運用もここまで来たか

失敗談
ユーザーが増えない
更新されないモデル
モデルの更新も自動化しましょう


岩永 二郎【数理最適化を使って機械学習してみませんか?】
 Retty株式会社

後半戦一本目は、Rettyの岩永さん。
いつもお世話になってます。Rettyさん

数理最適化とは、ある関数に関する最もよい元を、利用可能な集合から選択すること。である。いずれ最適化する手法らしい。

数理最適化問題を解くPythonライブラリを使う。
例えば、ライブラリPuLP(パルプ)など

時系列予測について
日時の時系列予測をする際に、加重移動平均を求める

フィッティングについて
ロジスティクス曲線にフィッティングする場合にできるだけ特定の

予測値補正について

数理最適化の技術を利用することのメリット・デメリット

Asuka Kadowaki【美容ミラーで写真1枚5秒であなたに似合うおしゃれが見つかるAI顔診断】
 KINDLER, Inc.

なんかすごいキャリアな門脇さんのミラーの紹介
リリース1ヶ月で10万の利用があったそうです。

ポケットにあなたの専属のビューティーアドバイザー
がコンセプト。AI顔診断

ユニークなアルゴリズムと、パーソナルカルテモデルを作成してくれるそうで、5秒で診断してくれるらしい。男ばかりのセミナーだけど、やってるのは画像の検知、顔認識システムの応用なのですかね。

最近この手のアプリ増えてますよね。早くも応用化取り入れてるところはすごい。このミラーも第3世代とアップデートもすごいところ。

Twitterで顔を送ってで300
現在1万ダウンロードまで拡張
対象は、ほぼ10代、20代の地方の女性らしい。

男にはわからないが、ビューティーアドバイザーは1時間2万円くらいらしい。それがアプリなら0円、今後サプスクリプションを検討してる。

そうかここからマネタイズなのね!

セドリック・ヴァグレ【機械学習プロジェクトが失敗する5個の理由】
 株式会社Gengo

今度は、英語かと思いきや、日本語話してくるセドリックさん
AIのサービスを提供してるゲンゴーの方

失敗1:えは魔槍の杖ではない

ケーズデンキに行ったら、エアコンも扇風機も何でもAI内蔵
それほんとにAIなの?そんな事あるよね

AIは解決方法ではなく、手段であり
よしAIを使おう!
ではないよね?目的を決めて、それを解決する手段として、AIがあるのかないのか、手段の1つに過ぎない。

機械学習は妥当か?
データの量は十分か
アウトプットとインプットの関係

評価方法の問題
猫か犬の間違いと
信号の赤と青の間違い
それは同じか、いや違う。

データの品質
クッキングしてるエプロンしてるおじさんはAIを女性だと判断してしまう。データに偏りがち、偏りがあるとこのような評価ミスはある。

偏りの問題
採用をみんな男性にして、女性を不採用
データの偏りに気をつけること

アノテーション品質
適切なツール、適切なチーム、適切なガイドライン、主観的な作業

データ不足
そもそもデータがないと何もできない。
チャットボット、FAQ、サポートチケット

小澤 健祐【AIニュースサイト「AINOW」掲載記事でAIトレンド分析~5月~】
 dip AI. Lab

いよいろ最後は、オザケンさんこと、小澤さん
人間とAIが共存する社会を作る。をビジョンにもつディップさん
主にAIやRPAでも有名ですよね

本当の最後に、オザケンさんの後輩の清のさん
ディップさんのメディア、バイトルでのAI活用について
AIで職種の自動化、工数削減

バイトルとチョメチョメのw

バイトルと、他の同様メディアとの職種マッピングより
求人メディア事に単語の集合の重なり度合い

現時点での結論は
求人媒体ごとの最適化すること

第36回 Machine Learning 15minutes!
機械学習(AI・人工知能)に関するカジュアルトークイベント


この記事が参加している募集

イベントレポ

Webのお仕事、元phpプログラマ、今主にWebディレクタ、たまにエンジニア、UXディレクタ、LTのネタ探ししてます。