マガジンのカバー画像

D2C エンジニア&データサイエンティスト

49
株式会社D2Cのテックブログです。メンバーはNTTドコモの膨大なデータを活用し最適化された広告配信システムの開発をしています。
運営しているクリエイター

#機械学習

どこよりも早い人工知能学会2024参加レポート[Day1]

はじめに人工知能学会とは 人工知能学会全国大会[3]は日本を代表する人工知能関連の研究発表会で、論文・ポスターから各講演・セッションまで豊富な発表から産学の研究の最先端を垣間見ることができます。 第38回目(!)の今回は、事前登録者数3289名、スポンサー109件、発表件数946件(当日案内より)と過去最大の規模だそうで、静岡浜松では熱き発表が行われています! 筆者は広告関連領域の技術調査を主なモチベーションとして参加しました。 …この続きは、エンジニアのための情報共有

atmaCup #16 参加記録

D2Cデータサイエンティストの吉井&市川です。 今年も12月に入り、アドベントカレンダーの時期が到来しました。近年、多くのブログ記事がアドベントカレンダー形式で公開されるようになり、情報が溢れる季節となりました。 弊社の技術ブログ「m-tech」も例外ではなく、アドベントカレンダー形式での記事公開を予定しています。私たちも参加を表明しましたが、12月になっても準備が進まず話題に困っていました。 そんな時、atma株式会社主催のデータコンペティション「atmaCup」の開

生存時間分析を使ってみたのでざっくり説明

はじめにこんにちは、D2Cデータサイエンティストの内野です。 本記事では、自分が生存時間分析に初めて触れた際に欲しかった、噛み砕いた手法の説明と実際に使ってみた使用例をまとめていきたいと思います。 これから何かに生存時間分析を活用してみたい!イベント予測がしたくてどんな手法があるか気になる!というような方の参考になれば幸いです。 …この続きは、エンジニアのための情報共有コミュニティ「Zenn」に投稿しています。是非ご覧ください!

Locality Sensitive Hashingを用いた大規模コーパスの準重複文書排除

0. はじめにこんにちは、株式会社D2Cデータサイエンティストの董です。 D2Cでは、広告配信を効率よく効果よく行うために様々な機械学習モデルを活用しています。 今回の記事では、大規模テキストコーパスを用いた言語モデルの学習にあたり、学習データにある準重複文書の除外テクニックについてご紹介します。 …この続きは、エンジニアのための情報共有コミュニティ「Zenn」に投稿しています。是非ご覧ください!

AUCをちゃんと説明できないはずがない

正直なところ ずっと自信がありませんでした 今日までは。(独白) こんにちは、D2C[1] データソリューション部のYと申します。 機械学習を学び始めたら精度指標として最初に出てくるであろうAUCは、ライブラリさえ使えば数行で扱えますが原理は意外と丁寧に解説されないことが多いのではないでしょうか。 あえてこの時代に、わざわざ、その値の意味や意義を精緻に理解して他人にわかりやすく説明できるようにすることを目標とし、自戒を込めて本稿を上梓します。 …この続きは、エンジニアのた

DS部2023上期 勉強会まとめ

この記事についてD2Cデータサイエンティストの吉井です。 私はリサーチ関係の業務に携わっていて業務の一環として社内の勉強会を運営しております。先日上期の勉強会が終了し発表内容をまとめていたところ、せっかくならどんな社内勉強会を開いているのか社外の方にも紹介してほしいという依頼を受けて本記事を執筆する運びとなりました。 社内勉強会について 私が所属するデータソリューション部では各個人が最近調べたor学んだテーマについて共有を行う勉強会を行っています。発表するテーマは自由で

SPARF: 少ない画像、曖昧なカメラパラメータでも3次元シーンを学習可能なNeRFの紹介

はじめに初めましてD2Cデータサイエンティストの吉井です。 普段はリサーチ関係の業務に携わっておりますが、データ分析で得られた知見を社外の研究会等で発表したり、社内向けに勉強会を開いたりなど、最新の研究に追いつけるよう日々努めております。 今回の寄稿の機会を受けて、最新のトレンドであるNeRFに関連する記事を執筆することに決めました。 …この続きは、エンジニアのための情報共有コミュニティ「Zenn」に投稿しています。是非ご覧ください!