白金工業 Meetup Vol.7に行ってきました

ブレインパッドのデータサイエンティストの方々が主催する勉強会・交流会です。
超人気で毎回抽選倍率が3~4倍くらいなのですが、個人的には今回で3回目の参加になります。
https://brainpad-meetup.connpass.com/event/126945/

上記リンクで資料共有もされていますが、ちょっとしたレポを。

MLOps Yearning ~ 実運用システムを構築する前にデータサイエンティストが考えておきたいこと

三浦航さん(楽天株式会社 リサーチサイエンティスト)
ブレインパッドから楽天に移られたそう

◆楽天の機械学習活用
・楽天市場や楽天トラベルなどの大きなサービスはそれぞれに検証・改善セクションがあるが、比較的小規模のサービスをまとめて管轄して改善活動を行う部署もあるらしい
・独自の機械学習基盤を持っており、全体のワークフローをAirflowで管理

◆店舗カテゴリの予測モデル
・家計簿アプリの取引データに対して店舗カテゴリを予測(自然言語処理のバッチ予測)
・予測には前回学習時のモデルを使い、学習結果は次回実行時に活用
・ファッション系の店舗名カテゴリ予測は人力でも知識がないと困難
・トランザクションデータはカタカナ大文字表記が多く分かち書きが困難
・データは時系列で増加するが、評価指標がロバストでなく(外部の影響を受けやすく)、毎回精度が変化

◆モデル管理
学習のたびに毎回モデル更新が必要なため、
・データが必要なタイミングの管理
・ロジック自体の管理
・モニタリングする指標の管理

◆PoCに至るまでにデータサイエンティストが貢献できる部分
・タスク難易度の変化予測:ふるさと納税が増える時期は自治体名が増える、などのデータ傾向に影響しそうなトレンドを考慮
・カテゴリ自体の見直し
・タスク難易度変化への対応

◆ビジネス的な話:機械学習を導入する目的はコスト削減
 技術的な話とは別に、ビジネス目的に沿う形で実装・運用する必要がある

ーーーーーーーーーーーーーーーーーーーーーーーーーー

・one-shotのPoCという時間軸的な問題、運用状況の想定不足は、ヒストリカルデータを用いたバックテストで洗い出せるはず
・データサイエンス部分に閉じずに、機械学習エンジニア、ビジネスサイドとの連携が必要

といった考えは非常に重要だなと感じました。


ディープラーニングによるくずし字認識

カラーヌワット・タリンさん(人文学オープンデータ共同利用センター、国立情報学研究所)

◆古文書の崩し字はスキャンデータ(超高価)と研究者の判定例を基に解析

◆激ムズ要素
・文字同士のかぶり、絵画とのかぶりがある
・レイアウトの自由度が高い

◆使える要素
・濃い文字が文頭(墨ですからね)
・文字ごとにサイズ感が決まっている

◆画像→文字で直接変換するEnd-to-end文字認識のモデル
文字の切り出しには画像セグメンテーションに用いられるu-netアルゴリズムを使用

ーーーーーーーーーーーーーーーーーーーーーーーーーー

モチベーションもレベルもめちゃくちゃ高い...
久しぶりに人文系の研究内容を拝聴できて楽しかった。


AIチームのチームビルディングについて

西場正浩さん(エムスリー株式会社 AIチーム チームリーダー)

◆泣く子も黙る西場さん
・(Twitter上で)最も知名度の高いAI人材のひとり
・ご自身でイチから作ったAIチームを例に、チームビルディングの話
・状況に応じて必要なスキルや人数は異なるのに、案件ではなく組織論になると途端にこの思考が抜けてしまうことは多々ある(確かに!)

◆だってプロでしょ?
・西場さんが自チームのMLエンジニアに求めること
 年間60本の論文読み、うち6本を自分で実装して再現
・採用直後の1on1で、直近&半年後に希望する役割の範囲・裁量の範囲を聞くそう
・モチベーションは本人に任せる
 例えマネージャーであっても、他人のモチベーションを上げることに労力は使わない
・一般的な教育も、ROIに見合うかどうかで実施を判断
・オンボーディングのゴール=外部から認められる結果を出すこと。個人の成長ではない
・パフォーマンスが期待に見合わない人は容赦なく減給
 ライフステージ上の都合がある場合でも、なぁなぁにしては組織全体に悪影響

ーーーーーーーーーーーーーーーーーーーーーーーーーー

自分のプロ意識の低さが恥ずかしくなりました...
でも、給料はパフォーマンスへの対価という考え方は非常に共感できます。そういう会社に行かねばならない。

この記事が気に入ったら、サポートをしてみませんか?気軽にクリエイターを支援できます。

ありがとうございます!よい1日を!
9
広告代理店でデータ分析やってます。仕事にしてること、仕事にしたいこと、勉強してることについて。 あとは、音楽や映画にまつわるお呪いについて。東京在住。
コメントを投稿するには、 ログイン または 会員登録 をする必要があります。