見出し画像

KDD 2023 Workshopの概要をまとめてみた

分析屋の下滝です。

このAirbnb記事を見つけて、KDD (Knowledge and Data Mining) 2023の国際会議と同時開催されるワークショップがあることを思い出しました。Airbnbの人たちが論文を発表していたようです。

KDDの論文もワークショップの論文も普段読んでいるわけではないのですが、Airbnbのような企業も発表しているということでワークショップが面白そうなのがありそうな気がしたので、概要だけさくっと翻訳したのをまとめておきたいと思いました。

ワークショップ

ワークショップの一覧はこちらで見つかります。

では順番に概要を紹介していきます。

Workshop on Graph Learning Benchmarks (GLB 2023) グラフ学習ベンチマーク

GLB 2023は、グラフ学習ベンチマークワークショップの第3回目です。コンピュータビジョンや自然言語処理のコミュニティにおいて、新しいベンチマークデータセットやタスクの確立に特化した会議トラックがあることに触発され、我々は、(i) グラフ学習ベンチマークの多様性を増加させ、(ii) グラフ機械学習全般に対する新たな要求を特定し、(iii) 具体的な技術がこれらのベンチマーク上でどのように動作するかのより良い相乗効果を得る可能性を持つ、新しいグラフ構造データ上で新しいMLタスクを確立する投稿を募集する。また、グラフ構造データの収集、アノテーション、クリーニング、補強、合成などの新しいアプローチなど、データ中心のグラフ学習に関する投稿も歓迎する。

グラフ学習のためのベンチマークに関するワークショップのようです。

2nd ACM SIGKDD Workshop on Ethical Artificial Intelligence: Methods and Applications 倫理的人工知能 方法と応用

本ワークショップは、倫理的AIにおける機会、課題、最先端技術について、様々な背景を持つ研究者と産業界の両方が意見交換するためのプレミアムなプラットフォームを提供します。新しい成果、ビジョン、技術、革新的な応用論文、進捗報告など、様々な進捗度の投稿を歓迎します:
・ビッグデータの分類とクラスタリングにおけるアルゴリズムの公平性と偏り
・倫理を意識した機械学習のためのヒューマン・イン・ザ・ループ
・倫理的推薦システムと推薦における多様性
・異種データ領域における倫理的配慮表現の学習
・高次元データにおける因果性に基づく公平性
・因果性に基づくバイアス制御のための観測の統合
・グラフ埋め込みにおける公平性の保持
・データの偏りの問い合わせと分析を容易にする新しい可視化技術
・倫理的AIのためのプラクティスを作成した、または作成した企業での直接的な経験
また、これらの応用領域に限定されないが、特に焦点を当てていること:
・大規模データマイニングにおける倫理的AI手法の適用
・コンピュータビジョン(顔認識、物体関係における公正さ、画像処理とビデオにおけるデバイアス)
・自然言語処理(公正なテキスト生成、意味解析)
・強化学習(公平性を考慮したマルチエージェント学習、構成模倣学習)
・社会科学(人種プロファイリング、制度的人種差別)

AIにおける倫理に関するワークショップのようです。

From Innovation to Scale (I2S) イノベーションからスケールへ

近年、AIコミュニティでは、基礎モデル、ディープラーニング、多数の業種にまたがる新しいAIアプリケーションなど、革新がエキサイティングに加速している。さらに、アカデミックおよび産業界の研究所が推進するAIイノベーションは、差別化された価値ある製品やサービスを提供するために、大手ハイテク企業や新興企業に急速に採用されている。
研究成果の商業化を検討している多くの機械学習研究者にとって、よくある疑問のひとつは、「自分の研究イノベーションを商業化できるスタートアップを立ち上げるにはどうすればいいのか」というものだ。KDDコミュニティの多くのML実務家にとって、大手ハイテク企業や新興企業がAI研究やイノベーションをどのように取り込み、何百万人ものユーザーに利用されるまでにスケールアップするのか、常に好奇の目が向けられています。
この対話型ワークショップは、2つの目標を達成することを目的としている: 第一に、このワークショップでは、学界、大手ハイテク企業、スタートアップ企業で活躍するAIオピニオンリーダーを招き、世界を変え、インパクトをもたらす次の大きなAIのアイデアについて、それぞれの視点を共有する。第二に、このワークショップでは、(学界と産業界の両方から)スタートアップの創設者を招き、顧客獲得、チーム構築、初期資金調達のためのピッチ、そして研究を商業化し成功した企業への道のりを共有する。
イノベーションからスケールへ(I2S) -厳しい市場環境下でAIイノベーションの構築、商業化、スケーリングを成功させる方法について議論し、学ぶ 私たちは、厳しい市場環境下でAIイノベーションの構築、商業化、スケーリングを成功させるための知識とベストプラクティスを共有するためのプラットフォームを提供することを目的とした "イノベーションからスケールへ(I2S) "ワークショップを開催いたします。このワークショップは、米国カリフォルニア州ロングビーチで開催されるKDD 2023の一環として、2023年8月6日に開催されます。アカデミアやビッグテックから、世界を変え、インパクトをもたらす次の大きなAIのアイデアについて、またスタートアップから、顧客獲得、チーム作り、最初の資金調達のためのピッチ、そして研究を商業化し、成功する企業への道程について、それぞれの見識を共有するスピーカーを募集しています。
このワークショップでは、以下のようなトピックを取り上げますが、これらに限定されるものではありません:
・AI研究イノベーションの商業化
・AIスタートアップのスケールアップ
・厳しい市場環境での顧客獲得
・成功するチームの構築
・初期資金調達のためのピッチ
・市場参入戦略の策定と実行
・AIイノベーションのベストプラクティス
これらの分野で共有できる貴重な洞察や経験をお持ちの方は、I2Sワークショップでの講演をご提案ください。AIのオピニオンリーダー、スタートアップの創業者、その他専門知識をお持ちの方からのご応募をお待ちしております。

研究でのイノベーションからスタートアップをたちあげて、何百人にも使ってくれるようなサービスにスケールするのはどうすればいいか?みたいなワークショップでしょうか。

The 12th International Workshop on Urban Computing 都市コンピューティング

あまり興味がないので省略

2nd Workshop on Decision Intelligence and Analytics for Online Marketplaces オンライン・マーケットプレイスのための意思決定インテリジェンスと分析

オンライン・マーケットプレイスとは、買い手(需要)と売り手(供給)を結びつけ、個々の参加者が他の方法ではアクセスできないような露出の機会を提供するデジタル・プラットフォームである。例えば、ライドシェア(Lyft、DiDi、Uber)、オンライン小売(Amazon、Ebay)、ホスピタリティ(Airbnb)、求人検索(LinkedIn)、食品の注文と配達(Doordash、Meituan)などである。アカデミア以外にも、多くの企業や研究機関がそれぞれの領域に特化したテーマで研究を行っている。オンラインマーケットプレイスの基本的な仕組みは、サービスの質、参加者の経験、財務効率、運営効率を考慮した上で、需要と供給をマッチングさせて取引を生み出すことである。異なるアプリケーション・ドメインの研究者と実務者が一堂に会し、それぞれの経験、課題、そしてクロスドメインの知識を活用する機会について議論することは貴重である。このワークショップの目的は、アプリケーションの多様性を理解し、異なる産業間の意思決定の最適化に役立つ関連性を導き出し、異なるドメインの市場にとって基本的な新しい問題を発見する機会を提供することである。
KDD-2022で開催されたこのワークショップの前バージョンは、参加者、技術的貢献、コミュニティの関心という点で大成功を収めました。このワークショップの更新版は、一般的なオンラインマーケットプレイスに関連する問題やアルゴリズム、それらの多様な領域から生じる特定の問題やアプリケーション、さらには競争や市場環境の変化に対するレジリエンスなどの新たなトピックをカバーする、特にタイムリーなものです。

よくわかりませんが、オンライン・マーケットプレイスのための意思決定インテリジェンスと分析、というテーマのようです。

airbnbの人は「ザ・プライス・イズ・ライト 望ましい商品の市場におけるA/Bテストのバイアスを取り除く」というタイトルの論文を出したそうです。

Airbnbの価格設定ガイダンスツールは、ホストが各宿泊日の収益を最大化することを目的としています。あるリスティングの場合、1泊の収益最大化価格ポイントはリードデイ(宿泊日までの日数)によって大きく変化します。これは、2つの価格戦略のパフォーマンスを比較するマーケットプレイスA/Bテストを実行する際に、系統的なバイアスをもたらします。リードデイバイアスは、短期的な実験結果を長期的な影響とは逆の方向に動かす可能性があり、場合によっては最適でないビジネス上の決定や顧客の不満足につながる可能性がある。本論文は、バイアスの大きさを示す実例とともに理論的枠組みを示した初めてのものである。この論文は、バケーションの宿泊、レンタカー、航空券、コンサート・パス、ライドヘイリングなど、望ましい商品の他の市場にも存在すると思われる、このような陰湿なタイプの実験バイアスについての会話のきっかけとなるものである。

2nd Workshop on End-End Customer Journey Optimization エンド・エンド・カスタマージャーニー最適化

現在、カスタマージャーニー最適化に関する機械学習の研究のほとんどは、クリックスルー率や最適な広告配置といった短期的な成功指標に焦点を当てているが、エンドツーエンドのカスタマージャーニー最適化のための首尾一貫したシステムの開発についてはほとんど検討されていない。このようなシステムは、適切なユーザーに適切な製品価値を提示することから、ユーザーのコンバージョンの可能性やプラットフォームに対する長期的な価値、さらにはクロスセルの傾向や解約リスクの理解まで、カスタマーエクスペリエンスのあらゆる側面を包含する。
現在、カスタマージャーニー最適化のためのモデルやアルゴリズムは単独で開発されることが多く、モデリングやデータパイプラインの非効率につながっている。さらに、顧客は(マーケティング、営業、財務などの)異なる組織部門によって異なるエンティティの集合体として見られることが多く、顧客体験にさらなる摩擦をもたらす可能性があります。このワークショップは、エンド・ツー・エンドのカスタマージャーニー最適化のための総合的なソリューションの構築に関心を持つ学術研究者と産業界の実務家の間のギャップを埋めることを目的としています。コラボレーションと分野横断的な議論を促進することで、このワークショップは、急速に発展するこの分野の進歩を加速させることを目的としています。
プラットフォーム(Linkedin、NVidia、Noom、Tencentなど)における顧客の全体的かつ長期的な成功のために重要なのは、顧客の成長・維持パターン、生涯価値、新製品購入への関心、解約傾向などを推定することによって、顧客がプラットフォームで長期的により成功するためのレバーを理解することである。また、成功/好感度/寿命を予測するだけでなく、顧客をプラットフォーム上でより成功する道へと導くことができるようにすることも重要である。
ユーザージャーニーとライフサイクルを通じて、顧客最適化のための興味深い機会がある。
幅広いオーディエンスへのブランドと製品の認知:
・ブランド認知のために投資すべき最適なチャネルは?
・ブランド戦術の長期的効果は?
・ブランドと製品の認知がプラットフォームにもたらす価値とは?
初回ユーザーの獲得:
・どのユーザーグループをマーケティングでターゲット化し、購入フローに誘導する価値があるか?
・どの広告クリエイティブと配信チャネルが、複数の商品において最もコンバージョンと顧客価値を生み出す可能性が高いか?
・LTV/CACのような効率的なガードレールでスケールを最大化するために、入札戦略をどのように最適化するか?収益性を最大化するために入札戦略を最適化するには?
新規ユーザーのオンボーディング:
・どのようにオンボーディング体験をパーソナライズするか?
・新規ユーザーが製品価値に苦しんでいるとき、どのように特定するか?
・ユーザーを収益化ファネルに導くために、通知やプロモーションなどの有料手段をどのように賢く活用するか?
成熟したユーザーエクスペリエンス:
・レコメンデーション・アルゴリズム、検索アルゴリズム、価格戦略、インセンティブ、セグメンテーションを通じて、ユーザーのニーズに応える最高の製品体験をどのように提供するか?
・顧客とコミュニケーションをとり、顧客の関心を維持する最善の方法とは?
解約防止とウィンバック:
・どのようにして解約リスクのあるユーザーを特定し、そのユーザーを引き留めるプロモーションを提供するか?
・適切なオファーで解約ユーザーを取り戻すには?
このワークショップの目的は、産業界の実務家が実践的な経験や現実の課題を共有する場を提供し、学術研究者が最先端の研究を普及させることです。学術界と産業界との協力的な議論や知識の共有が促進され、KDDはこの議論の場として最適である。
機械学習のアプローチは、様々な独立した問題を解決するために、組織全体で広く実験され、採用されてきたが、これらの最適化を全体的に見渡し、冗長性を取り除き、顧客を前面に出して、中心に置くべき時が来た。

これはカスタマージャーニーに関するもので興味があります。カスタマージャーにの最初から最後までを対象とした最適化を機械学習でアプローチするには?みたいな内容でしょうか。

Airbnbの人は「在庫の少ない状態: Airbnb検索におけるサービス不足クエリの特定」という論文を発表していたようです。

Airbnbは、伝統的な宿泊施設だけでなく、ユニークな宿泊施設も予約できる。伝統的な宿泊施設を予約することができる。ゲストは主に、検索を実行し 検索を実行し、様々なフィルターを活用することで 様々なフィルターを使って好みを表現します。時には 検索結果がほとんど表示されないことがあります。その結果、ユーザーエクスペリエンスが低下し、最終的に予約せずにプラットフォームを放棄してしまうこともあります。 予約することなくプラットフォームを放棄することにつながります。ユーザーエクスペリエンスとビジネス の観点から、そのような検索クエリを特定することは価値があります。 を特定することが重要である。の機会を逃すことにつながる。しかし、Airbnbのユーザー検索セッションの長さと複雑さは しかし、Airbnbにおけるユーザーの検索セッションの長さと複雑さは、この問題にさらなる課題をもたらします。問題である。ユーザーの意図と永続性は、私たちの能力を混乱させる。検索結果の数 とユーザーの最終的な予約結果との関連性を理解する能力に干渉します。我々は このハードルは、因果推論アプローチと予測モデリングを組み合わせることで 予測モデリングである。本論文では、因果関係のフレームワークと方法論を提示する。本論文では、検索結果の数が不十分であることが予約コンバージョンを妨げている検索を特定するための因果関係のフレームワークと方法論を提示する。この論文では、返された検索結果の数が不十分であることが予約コンバージョンを妨げている検索を特定するための因果関係のフレームワークと手法を示す。我々の能力 このような検索を特定する能力は、分析的洞察に応用できる、 実験分析、リアルタイム製品介入、供給管理 管理に応用できる。我々のアプローチの有効性を シミュレートされたデータ実験と実際のユーザー検索クエリによって、その有効性を実証する。


2023 International Workshop on Talent and Management Computing タレント・マネジメント・コンピューティング

あまり興味がないので省略します。

the Second Workshop on Knowledge Augmented Methods for NLP NLPのための知識増強法

言語モデルは、小規模、大規模、汎用、特殊、テキストのみ、マルチモーダルなど、多くのアプリケーションで開発、導入されている。その一方で、重要な知識の欠落が限界と安全性の課題を引き起こしている。知識には、常識、世界の事実、ドメインの専門知識、パーソナライゼーション、そして特にビッグデータアプリケーションから発見される必要のある独自のパターンが含まれる。言語モデルの訓練と推論プロセスは、知識で補強することができ、また補強すべきである。AAAI 2023で開催された第1回KnowledgeNLPワークショップは、より高度な言語知能に向けた知識増強手法に関する科学者やエンジニアの注目を集めることに成功しました。KDD 2023における本ワークショップは、(1)知識と言語モデルの相乗効果、(2)知識グラフ、時系列、シーケンスに関するNLPと様々な学習技術を統合した効果的かつ効率的なアーキテクチャ、(3)電子商取引、教育、ヘルスケアなどのためのKnowledgeNLP、(4)KnowledgeNLPにおけるヒューマンファクターとソーシャルグッドなど、様々なトピックについてアイデアを共有し、議論するための幅広いプラットフォームを提供します。

よくわかりませんが、「言語モデルの訓練と推論プロセスは、知識で補強することができ、また補強すべきである」という内容のようです。

The 3rd International Workshop on ONLINE AND ADAPTIVE RECOMMENDER SYSTEMS オンラインおよび適応型推薦システム

KDD workshop on online and adaptive recommender systems (OARS) は、OARSに関する発表と議論の場となる。このワークショップでは、学術界と産業界の実務家と研究者が集まり、OARSアルゴリズムとシステムを実装するための課題とアプローチについて議論し、より良いモデリングとユーザーの意図への応答によってユーザー体験を改善します。
実世界で展開されている多くのレコメンデーションシステムは、カテゴリ化されたユーザプロファイルや、ユーザセッション中に静的なままである事前計算されたレコメンデーションアクションに依存しています。最近の傾向として、レコメンデーションシステムはリアルタイムでユーザの意図をモデル化し、その時々のユーザのニーズに応えたり、ユーザの行動をその場で変化させたりするために常に適応する必要があることが示唆されている。さらに、レコメンダーシステムが新しいユーザーやアイテム、行動に適応するための様々なテクニックが提案されている。「適応型」レコメンダーを構築するための戦略には以下のようなものがある:
・オンライントレーニングのためのシステム、例えば新しいユーザーに対して事前にトレーニングされたモデルのパラメータを更新する。
・コールドスタートシナリオに対応し、コールドユーザーとウォームユーザー/アイテムの組み合わせに潔く適応できるフィーチャーベースのシステム。
・ユーザーをモデル化することを全く避けるシステム(例えば、ユーザー用語を必要とせずにアイテムのインタラクションから直接学習するセッションベースのレコメンダーなど)
・RLや他の適応学習アルゴリズムによって新しい行動に適応するシステム。

レコメンドシステムに関するもので、オンライン的で適応的なレコメンドシステムの構築に関する内容のようです。
・リアルタイムでユーザの意図をモデル化し、その時々のユーザのニーズに応えたり、ユーザの行動をその場で変化させたりするために常に適応できる。
・レコメンダーシステムが新しいユーザーやアイテム、行動に適応できる

KDD 2023 International Workshop on Data Science for Social Good (DSSG’23) 社会善のためのデータサイエンス

あまり興味がないので省略します。

The 6th International workshop on Epidemiology meets Data Mining and Knowledge discovery 疫学とデータマイニングおよび知識発見の出会い


あまり興味がないので省略します。

AdKDD 2023 広告

今日、平均的な消費者は、あらゆるデバイスを使って1日8時間以上をオンライン・コンテンツに費やし、そのほとんどが広告のスポンサーとなっている。2022年の世界市場規模は5,500億ドルを超え、2026年には8,000億ドルを超えると予想されており、デジタル広告はすでに世界的な支出額で従来の広告を上回り、経済的な逆風にもかかわらず成長を続けている。デジタル広告、特にコンピュテーショナル広告は、おそらく機械学習の最も目に見える、どこにでもあるアプリケーションであり、消費者と直接対話するものである。正しく行われた場合、広告は私たちの生活を豊かにする機会につながり、悪く行われた場合は私たちを気味悪がらせる。最近、政府、多国籍大企業、消費者間の政治的な戦いの最前線にあるデジタル広告は、依然としてダイナミックな業界であり研究分野である。
ここ数年に発表された文献を見ると、多くの研究者はコンピュテーショナル・アドバタイジングを成熟した分野だと考えているかもしれない。しかし、実際はその逆である。コンピュテーショナル広告は、モノリシックなパブリッシャーが制御する単純なルールベースの広告やランダムに回転するバナー広告から、モバイルデバイス、コネクテッドTV、オーディオのネイティブ、ビデオ、ディスプレイフォーマット内で高度にパーソナライズされたコンテンツ体験へと進化している。シーケンスモデルやジェネレーティブAIの台頭により、広告クリエイティブの自動生成や有料ショッピングアシスタントなど、新たな方向性が生まれつつある。広告はまだ終わっていない。
過去数年間(2017~2022年)、KDDカンファレンスに合わせて開催されたAdKDDワークショップは、広告研究に特化したトップレベルの場として、学術界や産業界からの関心を集め続けています。私たちは、デジタル広告の側面に関心を持つ人々が集まり、メモを交換し、特に業界における技術の現状を把握するためのユニークなフォーラムであると信じています。

よくわかりませんが、広告に関する内容のようです。

International Workshop on Federated Learning for Distributed Data Mining 分散データマイニングのための連合学習

過去10年間、犯罪検知、都市計画、創薬、健康モニタリングなど、意思決定のための様々な領域で機械学習が広く応用され、急増するデータリソースの恩恵を受けてきた。実世界のアプリケーションにおけるデータ収集は、しばしば異なる場所で行われるため、分散したデータソースから知識を掘り起こして発見できることは、強力な予測モデルを構築するために不可欠な要件である。しかし、すべてのデータソースを信頼できない集中型データサーバーに直接アップロードして学習することは、プライバシー漏洩の大きなリスクにつながる。Federated Learning (FL)は、分散されたデータから知識を集約する分散型学習フレームワークとして登場し、中央集権化することなく、プライバシーを保護した機械学習を促します。本ワークショップをSIGKDDで開催することで、FLの最新の進歩に関心を持つ学術界や産業界の研究者や実務家を含む幅広い聴衆を惹きつけることを目指します。本ワークショップでは、データマイニングにおけるFLの基礎的な発展を促進する取り組みとして、FLの信頼性、拡張性、頑健性、および幅広い応用に関する意見交換を奨励する。

連合学習(Federated Learning)と呼ばれるものの内容のようです。

Fragile Earth: AI for Climate Sustainability - from Wildfire Disaster Management to Public Health and Beyond 壊れやすい地球 気候持続可能性のためのAI - 山火事災害管理から公衆衛生、そしてその先へ

あまり興味がないので省略します。

Machine Learning in Finance 金融における機械学習

あまり興味がないので省略します。

The Tenth International Workshop on Deep Learning on Graphs グラフ上の深層学習

ディープラーニングモデルは、今日の人工知能研究の中核をなしている。画像のようなユークリッドデータやテキストのようなシーケンスデータでは破壊的だったディープラーニング技術が、グラフ構造データにはすぐには適用できないことはよく知られている。このギャップにより、グラフ表現学習、グラフ生成、グラフ分類など様々なタスクにおけるグラフ上の深層学習の研究が活発化している。グラフ構造データに関する新しいニューラルネットワークアーキテクチャは、ソーシャルネットワーク、バイオインフォマティクス、医療情報学などのドメインに適用された場合、これらのタスクで顕著な性能を達成している。
グラフ理論とディープラーニングが交差するこの研究の波は、コンピュータビジョン、自然言語処理、帰納論理プログラミング、プログラム合成と分析、自動計画、強化学習、金融安全保障など、他の科学分野にも影響を与えている。このような成功にもかかわらず、グラフ・ニューラル・ネットワーク(GNN)はまだ多くの課題に直面している、
・時間発展性、多関係性、多モーダル性を持つ高度に構造化されたデータのモデリング。このような課題は、社会的属性ネットワーク、自然言語処理、帰納的論理プログラミング、プログラム合成・解析などのアプリケーションで深く関わっている。テキストや画像コンテンツと、その根底にあるネットワーク構造との共同モデリングは、これらの領域にとって重要なトピックである。
・グラフベースの入力と、シーケンス、ツリー、欠損値を含むリレーショナルデータなどの高度に構造化された出力データとの間のマッピングを含む複雑なデータのモデリング。SQL-to-TextやText-to-AMRのような自然言語生成タスクは、このような課題の象徴です。
本ワークショップは、上記のような課題に対して、様々な背景や視点を持つ学術研究者と産業界の実務家が一堂に会することを目的としています。本ワークショップは、様々な手法やアプリケーションに関する寄稿講演、寄稿ポスター、招待講演で構成されます。ワークインプログレス論文、デモ、ビジョナリー論文も歓迎する。本ワークショップは、グラフニューラルネットワークと実世界のアプリケーションの交差点における新しいアプローチや手法を研究するビジョンを共有することを意図しています。

グラフ構造データに対するディープラーニングみたいな内容でしょうか。

19TH INTERNATIONAL WORKSHOP ON MINING AND LEARNING WITH GRAPHS グラフのマイニングと学習

グラフとして表現するのが最適なデータを分析することに、多くの関心が寄せられている。例えば、WWW、ソーシャルネットワーク、生物学的ネットワーク、通信ネットワーク、輸送ネットワーク、エネルギーグリッド、その他多くのものがある。これらのグラフは通常、マルチモーダル、マルチリレーショナル、ダイナミックである。ビッグデータの時代において、構造化されたデータや半構造化されたデータがより多く利用されるようになり、このようなデータを効果的にマイニングし、そこから学習できることの重要性が高まっている。本ワークショップは、グラフのマイニングと学習に取り組む様々な分野の研究者が、最新の研究成果を共有し、議論する場として機能する。
このようなデータから効果的にマイニングや学習を行うには、以下のような多くの課題がある:
・グラフマイニングアルゴリズム、ネットワーク埋め込み、グラフィカルモデル、潜在変数モデル、行列分解法などを含む、適用可能なさまざまなテクニックの理解。
・データの異質性への対応。
・情報の統合と調整に対する共通のニーズ。
・ダイナミックに変化するデータへの対応
・これらの各問題へのスケールでの対応。
伝統的に、グラフマイニング、構造化データからの学習、統計的関係学習、帰納的論理プログラミング、そしてコンピュータサイエンスのサブディシプリンを超えて、ソーシャルネットワーク分析、より広くはネットワークサイエンスなど、多くのサブ分野がこの分野に貢献してきた。

よくわかりませんが、グラフのマイニングと学習に関する内容のようです。

Workshop on Causal Discovery, Prediction and Decision 因果関係の発見、予測、決定

データマイニングと機械学習は、検索エンジンからeコマース、ソーシャルメディア・プラットフォームに至るまで、多種多様なデジタルサービスにおける意思決定や予測に取り入れられ、活況を呈するデジタル経済を育んでいる。これらのシナリオでは、予測と決定の精度と効率が最適化の目的であるが、誤った予測や決定による潜在的なリスクはそれほど重要ではない。
パフォーマンス重視の機械学習モデルは、通常、特徴量間の微妙な統計的関係(偽相関かもしれない)を説明、予測、決定のために利用する。スプリアス相関はデータ間や時間経過とともに変化するため、機械学習アルゴリズムによる誤りは、予測や意思決定における安定性、説明可能性、公平性の欠如といった甚大なリスクをもたらす可能性があり、ヘルスケア、工業製造、金融、司法行政といった高スタック分野での応用が制限される。
因果推論と因果発見は、最近データマイニングと機械学習のコミュニティで大きな注目を集めている。因果関係は、説明、予測、意思決定のための基本的かつ効果的なツールとして、ほとんどすべての分野で利用されている。伝統的に、因果関係は介入やランダム化比較実験を利用することによって特定される。しかし、そのような実験を実施することは、しばしば費用がかかるか、あるいは費用や倫理的な懸念のために不可能でさえある。そのため、因果推論や観察データに基づく因果関係の発見に対する関心が高まっており、過去数十年の間に、コンピュータ科学者によってこの分野に大きな貢献がなされてきた。さらに、因果関係は説明可能であり、データ間や時間間で不変であるため、予測モデリングや意思決定の安定性、説明可能性、公平性を向上させるために活用することができる。
このような成果に触発され、前回の因果発見ワークショップ(CD 2016 - CD 2022)の成功を受け、CDPD-2023は、データマイニングやその他の分野の研究者や実務家が、それぞれの分野における因果発見に関する最新の研究を共有し、因果性の研究における学際的な協力の可能性を探る場として引き続き機能します。本ワークショップでは、KDDのプラットフォームに基づき、特にデータマイニング/機械学習研究と因果関係発見を結びつける投稿、および大規模データセットにおける因果関係発見の解決策を募集します。

よくわかりませんが、因果推論と因果発見とデータマイニングと機械学習に関する内容のようです。

KDD 2023 Workshop on Data Science and AI for Sports スポーツのためのデータサイエンスとAI

あまり興味がないので省略します。


The Second Workshop on Applied Machine Learning Management 応用機械学習マネジメント

機械学習アプリケーションは、あらゆる分野の業界リーダーによって急速に採用されている。AI主導のソリューションへの投資の増加は、データサイエンスとMLのリソース、人材、プロジェクト全体を管理する新たな課題を生み出した。応用機械学習チームを管理する規律は、アジャイル製品開発ツールセットと長期的な研究指向の考え方の健全なミックスを必要とする。深い研究に投資すると同時に、その成果を重要なビジネス成果につなげる能力は、この分野における管理手法やベストプラクティスに基づく多くの知識を生み出します。応用機械学習マネジメントワークショップでは、様々な分野の応用研究マネージャーが集まり、MLチーム、製品、プロジェクトのマネジメントに関する方法論やケーススタディを共有し、先進的なAI手法でビジネスインパクトを達成します。

機械学習アプリケーションにおけるマネジメントの側面に関する内容のようです。

The 6th Workshop on e-Commerce and NLP (ECNLP 6) eコマースと自然言語処理

NLPとIRは、両分野の黎明期から電子商取引アプリケーションと密接に結びついてきた。この両者の密接な関係は、初期の出版物や、両分野が交差する最近の出版物の増加によって証明されている。
今日、NLPとIRは、商品検索、レコメンダーシステム、商品質問回答、センチメント分析、商品説明とレビュー要約、チャットボットとショッピングアシスタント、カスタマーレビュー処理など、電子商取引のタスクにおいて重要な役割を果たしており、この分野の研究者によって研究されている他の多くのタスクも含まれています。これらの手法は、今日のオンライン小売やショッピングの状況において重要な役割を果たしており、進化し続け、顧客体験をさらに向上させています。
ECNLPワークショップは、電子商取引とオンラインショッピングに関連するNLP/IR研究の普及の場を提供することを目的とし、学術界と産業界の研究者が一堂に会します。

eコマースでの自然言語処理と情報検索に関わる内容のようです。

Foundations and Applications in Large-scale AI Models: Pre-training, Fine-tuning, and Prompt-based Learning 大規模AIモデルの基礎と応用: 事前学習、微調整、プロンプトに基づく学習

ディープラーニング技術は近年急速に進歩しており、事前訓練され、微調整された大規模AIモデルにおいて大きな進歩を遂げている。例えば、自然言語処理領域では、従来の「事前学習、微調整」のパラダイムは、「事前学習、促し、予測」のパラダイムへと移行しつつあり、会話AIのChatGPT/BARDや統一推薦システムのP5など、様々な応用領域にわたる多くのタスクで大きな成功を収めている。さらに、視覚と言語モダリティを組み合わせたモデル(視覚言語モデル)への関心が高まっており、ビジュアルキャプション/生成などのタスクに適用されている。
最近の技術革命を考慮すると、このようなパラダイムシフトを強調し、異なるタスクを解決する可能性のあるパラダイムを強調するワークショップをKDDカンファレンスで開催することは不可欠である。本ワークショップは、学界および産業界の研究者が最新の研究成果を発表し、研究アイデアを共有し、様々な課題について議論し、大規模AIモデルの事前学習、微調整、プロンプト学習法においてさらなる研究が必要な分野を特定するためのプラットフォームを提供する。このワークショップはまた、大規模AIモデルに関する課題の解決に焦点を当てた強力な研究コミュニティの発展を促進し、将来の人々の生活を変えることができる優れたインパクトのある戦略を提供します。
原著論文、予備的な研究成果、学界または産業界における新たな研究の提案を示す長文論文(8編)および短文論文(4ページ)の投稿を募集する。投稿論文はすべてシングルブラインドで、研究者、産業界の専門家、エキスパートからなる国際プログラム委員会によって査読されます。採択された投稿は、ワークショップでの発表が義務付けられ、ワークショップ主催者によりワークショップ専用のプロシーディングとして出版される。
本ワークショップのテーマは以下の通りであるが、これに限定されるものではない:
事前学習
・ 事前学習の改善:教師あり事前学習、様々な補助タスクを用いた自己教師あり事前学習、メタ学習、プロンプトベース学習、マルチモーダル事前学習など。
・ 汎化を最大化するための新しい事前学習法
・ 事前学習モデルの選択
・ コンピュータビジョン、自然言語処理、ロボット工学など、様々な応用領域における事前学習
ファインチューニング
・ ドメイン/タスク適応型ファインチューニング
・ 中間タスク、マルチタスク、自己教師あり、MLMファインチューニング
・ パラメータ効率の良い微調整:スパースパラメータチューニング、プルーニング
・ テキスト対テキスト、テキスト対画像、画像対テキスト、マルチモーダルファインチューニング。
・ コンピュータビジョン、自然言語処理、ロボット工学など、様々な応用領域での微調整
プロンプト/指示ベース
・ 手動テンプレート工学
・ 自動テンプレート学習
・ マルチプロンプト学習、マルチタスク命令チューニング
・ HF/RLHFによる命令チューニング
・ 思考連鎖(CoT)プロンプティング
パフォーマンス
・ モデル圧縮技術
・ 大規模モデルの展開
・ 効率的かつ効果的なトレーニング/推論
・ 様々な事前学習・微調整手法の実証分析
・ 様々な事前学習法と微調整法の汎化境界
・ 安定性,スパース性,ロバスト性の戦略
大規模モデルの下流タスク
・ テキスト生成、テキスト要約、質問応答、その他の下流タスクのための自然言語処理モデル
・画像キャプション付け、セマンティックセグメンテーション、物体追跡、その他の下流タスクのためのCVモデル
大規模モデルによるアプリケーション
・会話AI、会話チャットボット
・ 拡張ウェブ検索、検索エンジン
・ 統合、パーソナライズされた次世代レコメンダーシステム

大規模AIモデルでの事前学習、ファインチューニング、プロンプトに基づく学習に関する内容のようです。

The 3rd Workshop on Artificial Intelligence-enabled Cybersecurity Analytics 人工知能を活用したサイバーセキュリティ分析

あまり興味がないので省略します。

2nd Workshop on Uncertainty Reasoning and Quantification in Decision Making 意思決定における不確実性の推論と定量化

ディープニューラルネットワーク(DNN)は、画像・映像解析、自然言語処理、レコメンデーションシステム、創薬など、さまざまなアプリケーションで大きな注目を集め、大きな成功を収めている。しかし、さまざまな根本原因に由来する固有の不確実性は、DNNが実世界の問題に対して頑健で信頼できる解を見出すための深刻なハードルとなっている。このような不確実性を考慮しないことは、不必要なリスクにつながる可能性がある。例えば、自動運転の自律走行車は、道路上の人間を誤分類する可能性がある。ディープラーニングベースの医療アシスタントは、がんを良性腫瘍と誤診するかもしれない。不確実性はますます重要性を増しており、不確実な懸念がある実世界のアプリケーションで人気が高まっているため、学界や産業界から注目されている。また、自律走行や診断システムなどの意思決定問題も重視されている。そのため、データマイニングや機械学習における不確実性の推論と定量化の交差点における研究の波は、コンピュータビジョン、自然言語処理、強化学習、社会科学など、他の科学分野にも影響を与えている。

データマイニングや機械学習における不確実性を扱う内容のようです。

Multi-Armed Bandits and Reinforcement Learning: Advancing Decision Making in E-Commerce and Beyond 多腕バンディットと強化学習: 電子商取引とその先の意思決定の進歩

本ワークショップでは、強化学習(RL)とマルチアームドバンディット(MAB)のビジョン、課題、新たな方向性、そして電子商取引やその他の分野での応用について、深い議論を行うことを目的としている。強化学習は、新しいアルゴリズムの設計、RL理論とその境界の理解の向上など、過去10年間でかつてない進歩を遂げてきた。一方、電子商取引は、産業界で最も急速に成長している分野の1つであり、推薦、広告、パーソナライゼーション、価格設定、予測、サプライチェーン最適化など、逐次意思決定アルゴリズムにとって多くの挑戦的な問題を提供している。電子商取引は20年以上前から存在しているが、RLとMABがそのモデリングとインフラストラクチャに影響を与え始めたのはごく最近のことである。
RLとMABの方法論の進歩は、多くの応用領域において顕著な経験的成果をもたらしているが、RLの中核的な研究コミュニティとこれらの応用に焦点を当てたコミュニティとの間にはギャップが存在する。今日、最も単純なマルチアームドバンディット手法のみが使用され、より高度なRL手法が実世界の問題に実装されることはほとんどない。電子商取引を含むこのような問題には、ビジネスメカニズム、システム/インフラ要件、顧客影響の考慮による特別な制約など、独特の特性がある傾向がある。例えば、探索-搾取のトレードオフは、もはや単純な決定ではなく、変化の頻度や大きさが顧客の信頼やショッピング体験に影響を与えることは避けられないからである。これらの制約の中には、基本的で回避が困難なものもあり、新たな課題を生み出し、理論的発展と実世界への影響の両方において興味深い方向性を切り開く。理論家、実証的研究者、実務家の間で知識の共有が進むことで、この分野の軌道が洗練され、焦点が絞られ、すべてのコミュニティに利益がもたらされると信じている。
このワークショップは、特にコンピュータサイエンス、マーケティングサイエンス、オペレーションズリサーチ、統計学、計量経済学の境界における議論を刺激し、アカデミアの研究者と第一線の実務家を結びつけることを目的としています。大学の教授や学生、研究所やハイテク企業の研究者、応用科学者、産業界の機械学習エンジニアなど、すべての聴衆や参加者がその可能性を持っています。このワークショップは綿密な議論のための媒体として機能するだけでなく、この分野以外の研究者が多腕バンディットと強化学習の現在の最先端と潜在的な方向性についてハイレベルな見解を得るのにも役立つだろう。

eコマースにおける強化学習とマルチアームドバンディットを扱う内容のようです。

EvalRS 2023: Well-Rounded Recommender Systems For Real-World Deployments 実世界での展開に適した推薦システム

パーソナライズされたレコメンデーションのユビキタス化により、レコメンダーシステム研究への関心が急上昇している。
EvalRS2022とReclistの成功に基づき、我々はより広いスコープと新しいインタラクティブなフォーマットで戻ってきました:我々のワークショップは、レコメンダーシステムのための多面的な評価に焦点を当て、伝統的な研究トラック(革新的な論文に賞あり)とハッカソンをミックスし、実際に動くコード(最も優れたプロジェクトに賞あり)を使って課題を実践します。

レコメンドシステムを扱う内容のようです。

Workshop on Applied Data Science for Healthcare: Applications and New Frontiers of Generative Models for Healthcare ヘルスケアのための応用データサイエンス: ヘルスケアのための生成モデルの応用と新展開

あまり興味がないので省略します。

Causal Inference and Machine Learning in Practice: Use cases for Product, Brand, Policy, and beyond 因果推論と機械学習の実際: 製品、ブランド、政策、そしてそれ以外の分野での使用例

データ主導の意思決定に対する要求の高まりにより、様々な業界で機械学習アプリケーションが急成長している。しかし、観測データから因果推論を導く能力は、依然として重要な課題である。近年、因果推論は、複雑なシステムにおける介入の効果を理解するための強力なツールとして浮上している。因果推論と機械学習を組み合わせることで、根底にあるメカニズムをより深く理解し、現実世界の問題に対してより効果的な解決策を開発できる可能性がある。
本ワークショップは、学術界と産業界の研究者と実務家が一堂に会し、因果推論と機械学習技術を、製品、ブランド、政策、およびそれ以外の分野における現実の問題に適用した経験と洞察を共有することを目的としている。このワークショップでは、機械学習理論、深層学習、因果推論、オンライン学習をカバーする独創的な研究を歓迎します。さらに、スケーラブルなシステム設計、アルゴリズムの偏り、解釈可能性を扱うトピックも奨励する。
基調講演、パネルディスカッション、寄稿講演やポスターを通じて、ワークショップは因果推論と機械学習を実世界の問題に適用する際の最新の進歩と課題について議論する場を提供する。また、本ワークショップは、産官学の研究者・実務者間のネットワーキングとコラボレーションの機会も提供する。

因果推論と機械学習の実践を扱う内容のようです。Amazon、Emory、Booking.com、リクルート、Shipt、Airbnbという企業から論文があります。

Airbnbでは、「観察的因果推論における悪名高い多重共線性の問題に対する新しい解決策としての階層的クラスタリング」という内容の論文を発表していたようです。

International Workshop on Multimodal Learning – 2023 Theme: Multimodal Learning with Foundation Models マルチモーダルな学習 - 2023年のテーマ: 基礎モデルによるマルチモーダルな学習

機械学習と人工知能(特にBERT、GPT-3、T5、ResNetなどの基礎モデル)における最近の進歩は、驚くべき能力を発揮し、複雑なデータから推論を行う方法に大きな革命的変化をもたらしている。これらのモデルは、データへのアプローチ方法の根本的な転換を意味し、マルチモーダル学習とデータ融合にエキサイティングな新しい研究の方向性と機会を提供します。
基礎モデルがマルチモーダル学習分野を変革する可能性を考慮すると、専門家や研究者が一堂に会してこの分野の最新動向を議論し、意見交換を行い、取り組むべき重要な研究課題や問題を特定する必要がある。このワークショップを開催することで、研究者がマルチモーダルデータの融合や基礎モデルを用いた学習に関する知見や専門知識を共有し、急速に発展するこの分野における新たな研究の方向性や応用の可能性を探る場を作ることを目的としています。言語、グラフ、時系列、視覚、表データ、センサーなどのモダリティ間の相互作用を研究し、モデル化する学際的な研究者からの貢献を期待しています。本ワークショップでは、学際的な研究を重視し、新しいタスク、データセット、モデルに関するチーム横断的なコラボレーションを促進することを目的としています。

マルチモーダル学習とデータ融合に関する内容のようです。

The 9th SIGKDD International Workshop on Mining and Learning from Time Series 時系列のマイニングと学習

時系列データはどこにでもある。金融、小売、エンターテイメント、交通、ヘルスケアなど多様な領域において、私たちは、簡略化された頻度の低い測定から、ほぼ継続的なモニタリングと記録への根本的なシフトを観察している。リモートセンサーからウェアラブル、ソーシャルセンシングに至るまで、多様なセンシング技術における最近の進歩は、時系列アーカイブのサイズと複雑さを急速に増大させている。このように、時系列分析は広く研究されてきたが、その重要性は増すばかりである。さらに、最新の時系列データは、既存の手法に大きな課題を突きつけている(例えば、病院記録における不規則なサンプリングや気候データにおける時空間構造)。最後に、時系列マイニング研究は、様々な分野の橋渡しをし、学際的な解決策を要求するため、挑戦的でやりがいのある研究である。今こそ、次世代の時系列マイニングアルゴリズムについて議論する時である。MiLeTSワークショップの焦点は、この分野の研究を相乗させ、時系列分析とマイニングにおける新しい問題と未解決の問題の両方について議論することである。これらの問題に対する解決策は、アルゴリズム的、理論的、統計的、あるいはシステムベースのものである。さらに、MiLeTSでは、生物学、健康・医学、気候・気象、道路交通、天文学、エネルギーなど、インパクトの大きい分野や比較的新しい分野への応用を重視しています。
MiLeTSワークショップでは、以下のような時系列に関する幅広いトピックについて議論する:
・時系列パターンマイニングと検出、表現、検索とインデックス作成、分類、クラスタリング、予測、ルールマイニング。
・特殊な構造を持つ時系列:時空間的(例:異なる場所での交通速度)、関係的(例:類似した疾患を持つ患者)、階層的など。
・疎または不規則なサンプリング、ランダムでない欠測値、特殊なタイプの測定ノイズまたはバイアスを伴う時系列。
・多変量、高次元、異種性などの時系列、またはその他の非典型的な特性を持つ時系列。
・ディープラーニングや部分空間クラスタリングなど、あまり伝統的でないアプローチを用いた時系列分析。
・プライバシーを保護した時系列マイニングと学習
・ストリーミング時系列からのオンライン高速学習とマイニング
・不確実な時系列マイニング
・健康・医療、道路交通、大気質など、影響度の高い、あるいは比較的新しい時系列領域への応用。
・時系列分析とマイニングにおける新しい問題,未解決の問題,あるいは未解決の問題.

時系列データのマイニングを扱う内容のようです。

Robust NLP for Finance (RobustFin) 金融のためのロバストNLP (RobustFin)

あまり興味がないので省略します。

RelKD 2023: International Workshop on Resource-Efficient Learning for Knowledge Discovery 知識発見のためのリソース効率学習

最新の機械学習技術、特にディープニューラルネットワークは、様々な知識発見やデータマイニングアプリケーションにおいて優れた性能を発揮している。しかし、これらの手法の多くは、限られたラベル付きデータ(データレベル)、実世界のコンピューティングプラットフォームにおける小さなモデルサイズ要件(モデルレベル)、異種ハードウェアへの計算の効率的なマッピング(システムレベル)など、多くのシナリオでリソース制約の課題に直面している。大規模ソーシャルネットワーク分析、大規模推薦システム、リアルタイム異常検知などの多種多様な実システムにおいて、開発したモデルを効果的かつ効率的に利用するためには、これらの指標すべてに対処することが重要である。そのため、データ、モデル/アルゴリズム、システム/ハードウェアの観点から、リソースの制限という課題に取り組む効率的な学習技術の開発が望まれている。今回提案する国際ワークショップ「Resource-Efficient Learning for Knowledge Discovery (RelKD 2023)」は、学術研究者と産業界の実務家が、リソース効率学習の課題、解決策、将来の可能性を共有する絶好の場を提供する。
本ワークショップの目的は、最新の機械学習技術(例えば、ディープニューラルネットワーク)がリソースの制限(例えば、乏しいラベル付きデータ、制約のあるコンピューティングデバイス、低電力/エネルギー予算)に遭遇したときに生じる課題に取り組む場を作ることである。本ワークショップでは、知識発見やデータサイエンスのアプリケーションに使用される機械学習技術に焦点を当て、データ、アルゴリズム/モデル、システム/ハードウェアの3つの角度から効率的な学習に焦点を当てる。関心のあるトピックは以下の通り:
データ効率学習: 教師あり/教師なし学習、半教師あり/弱教師あり学習、少数ショット学習、およびそれらの様々なデータモダリティ(グラフ、ユーザー行動、テキスト、ウェブ、画像、時系列など)やデータサイエンス問題(ソーシャルメディア、ヘルスケア、レコメンデーション、金融、マルチメディアなど)への応用。
アルゴリズム/モデル効率学習: ニューラルネットワークの刈り込み、量子化、高速化、スパース学習、ニューラルネットワーク圧縮、知識蒸留、ニューラルネットワークアーキテクチャ探索、および様々なデータサイエンス問題への応用。
システム/ハードウェア効率学習:ニューラルネットワークとハードウェアの協調設計、リアルタイムでエネルギー効率の高い学習システムの設計、機械学習のためのハードウェアアクセラレータ、および様々なデータサイエンス問題への応用。
共同効率学習: データ-モデル共同学習、アルゴリズム-ハードウェア共同学習など、あらゆる共同効率学習アルゴリズム・手法とその様々なデータサイエンス問題への応用。

リソースが制限された状況という課題に取り組む効率的な学習技術を扱う内容のようです

22nd International Workshop on Data Mining in Bioinformatics (BIOKDD 2023) バイオインフォマティクスにおけるデータマイニング (BIOKDD 2023)

あまり興味がないので省略します。

感想

個人的には、以下のワークショップが面白そうでした。ビジネスでの応用事例を知りたいという感じです。

・オンライン・マーケットプレイスのための意思決定インテリジェンスと分析
・エンド・エンド・カスタマージャーニー最適化
・AdKDD 2023 広告
・eコマースと自然言語処理
・多腕バンディットと強化学習: 電子商取引とその先の意思決定の進歩
・因果推論と機械学習の実際: 製品、ブランド、政策、そしてそれ以外の分野での使用例
・オンラインおよび適応型推薦システム
・実世界での展開に適した推薦システム

ちなみに、今年は、分析屋での勉強会の一つとして、KDDや今回紹介したワークショップでの論文紹介をする企画を考えているのですが、参加者は集まるでしょうか!?

株式会社分析屋について

ホームページはこちら。

noteでの会社紹介記事はこちら。

専用の採用サイトはこちら。

求人情報はこちら。

【データ分析で日本を豊かに】
分析屋はシステム分野・ライフサイエンス分野・マーケティング分野の知見を生かし、多種多様な分野の企業様のデータ分析のご支援をさせていただいております。 「あなたの問題解決をする」をモットーに、お客様の抱える課題にあわせた解析・分析手法を用いて、問題解決へのお手伝いをいたします!
【マーケティング】
マーケティング戦略上の目的に向けて、各種のデータ統合及び加工ならびにPDCAサイクル運用全般を支援や高度なデータ分析技術により複雑な課題解決に向けての分析サービスを提供いたします。
【システム】
アプリケーション開発やデータベース構築、WEBサイト構築、運用保守業務などお客様の問題やご要望に沿ってご支援いたします。
【ライフサイエンス】
機械学習や各種アルゴリズムなどの解析アルゴリズム開発サービスを提供いたします。過去には医療系のバイタルデータを扱った解析が主でしたが、今後はそれらで培った経験・技術を工業など他の分野の企業様の問題解決にも役立てていく方針です。
【SES】
SESサービスも行っております。