マガジンのカバー画像

D2C エンジニア&データサイエンティスト

46
株式会社D2Cのテックブログです。メンバーはNTTドコモの膨大なデータを活用し最適化された広告配信システムの開発をしています。
運営しているクリエイター

記事一覧

どこよりも早い人工知能学会2024参加レポート[Day4]

はじめに人工知能学会全国大会2024に参加中の株式会社D2CのYです。 本日は最終日4日目のレポートを現地静岡からお届けします! 記事まとめ Day1: URL Day2: URL Day3: URL Day4: 本稿 MLOpsを促進する予測モデルの運用時分類精度の推定誤差の改善[1] 運用中の予測モデルに対する既存の精度推定手法であるチェックモデルについて、交差エントロピーを使用することの問題と新しい誤差の提案をされた研究。 …この続きは、エンジニアのため

どこよりも早い人工知能学会2024参加レポート[Day3]

はじめに人工知能学会全国大会2024に参加中の株式会社D2CのYです。 過去2日間のレポート(下記)に続きまして、本日は3日目のレポートを現地静岡からお届けします! 記事まとめ Day1: URL Day2: URL Day3: 本稿 Day4: TBD Day3 参加レポートAI安全性のための日本語徳倫理データセットの作成[1] 言語モデル作成時からモデルの道徳的側面をケアできないかという問題意識から、高品質な日本語のデータセットを作成する研究。 既に関連デー

どこよりも早い人工知能学会2024参加レポート[Day2]

はじめに株式会社D2CのYです。昨日記事(こちら)に続き、本日も人工知能学会全国大会2024の会場からどこよりも早い速報レポートをお伝えします! Day2 参加レポートコンテンツの一覧はこちらからご確認いただけます。 本日ももりだくさん!会場で本稿筆者が聴講したセッションからいくつかのセッションをピックアップします。 金融分野における大規模言語モデルの活用[1] 表題について有識者の方々の事例・ご研究紹介及び対談でした …この続きは、エンジニアのための情報共有コミュ

どこよりも早い人工知能学会2024参加レポート[Day1]

はじめに人工知能学会とは 人工知能学会全国大会[3]は日本を代表する人工知能関連の研究発表会で、論文・ポスターから各講演・セッションまで豊富な発表から産学の研究の最先端を垣間見ることができます。 第38回目(!)の今回は、事前登録者数3289名、スポンサー109件、発表件数946件(当日案内より)と過去最大の規模だそうで、静岡浜松では熱き発表が行われています! 筆者は広告関連領域の技術調査を主なモチベーションとして参加しました。 …この続きは、エンジニアのための情報共有

(戒め)生成AIに頼りすぎてはいけないことを実感した出来事

はじめにこんにちは、D2Cのデータサイエンティスト(MLエンジニア)をやっている須田です。 最近、JupyterLabのJupyterAI機能が気に入っています。開発時のわからないことや知りたいことをよく聞いているのですが、これがきっかけで起きたある出来事を今日は共有していこうと思います。 怪談話生成AIバージョンのようなイメージで読み進めてもらえたら幸いです。(怪談ではないですがw) …この続きは、エンジニアのための情報共有コミュニティ「Zenn」に投稿しています。是非

Step CIを用いたAPI自動テストのすゝめ

はじめにこんにちは、D2Cのエンジニアの吉田です。 本日は私たちのチームが普段 Web API 開発で実際に利用している Step CI を用いたAPI自動テストの構築例を紹介しようと思います。 Step CI の簡単な使い方や利点をまとめ、CI/CDパイプラインとの統合についてまとめます。 Step CI とは…この続きは、エンジニアのための情報共有コミュニティ「Zenn」に投稿しています。是非ご覧ください!

[Next.js] Next.js14を使ってTodoリスト作ってみた

はじめにこんにちは。 D2Cのフロントエンドエンジニアをしています、廣瀬です。 今回は以前から個人的に気になっていた、Next.jsを勉強してみたく、手を動かしながらの方が身につくと考えたため、とりあえずTodoリストを作成してみましたので、その内容を記事にしたいと思います。 UIコンポーネントはshadcn/uiを使用したいと思います。 もしよろしければ、ハンズオン形式で当記事をご覧いただければと思います。 Next.jsとは?…この続きは、エンジニアのための情報共有コミ

GANと拡散モデルの調査

はじめにはじめまして、株式会社D2C(以下D2C)で内定者アルバイトをしている大橋です。 今年の4月から就職予定のD2Cで、現在生成AIの調査を行っています。 今回はその調査結果を記事としてまとめる機会を頂きました。 記事は3つに分け、以下の内容で執筆します。 GANと拡散モデルの調査 Flowモデルの紹介 画像生成モデルの比較 この記事は、"1. GANと拡散モデルの調査"についてです。 …この続きは、エンジニアのための情報共有コミュニティ「Zenn」に投稿し

JupyterLabのランチャーからVSCodeを起動できるようにする

はじめにD2Cには社内のデータサイエンティストのためのデータ分析基盤があります。 その分析基盤のサービスの一つにJupyterHubがあり、ユーザはJupyterLabのインスタンスを起動して利用することができます。 JupyterLab上でVSCodeを使用したいという需要があり、以前はユーザが自分でJupyterLabのインスタンス上にVSCode Serverをインストールして使用していました。 この方法だとユーザが自分でインストールする必要があったり、GitHub認証

atmaCup #16 参加記録

D2Cデータサイエンティストの吉井&市川です。 今年も12月に入り、アドベントカレンダーの時期が到来しました。近年、多くのブログ記事がアドベントカレンダー形式で公開されるようになり、情報が溢れる季節となりました。 弊社の技術ブログ「m-tech」も例外ではなく、アドベントカレンダー形式での記事公開を予定しています。私たちも参加を表明しましたが、12月になっても準備が進まず話題に困っていました。 そんな時、atma株式会社主催のデータコンペティション「atmaCup」の開

チーム・ジャーニーを読んでみた (前半)(Advent Calendar Day 15)

はじめに こんにちは、D2Cデータサイエンティストの小林です。 本日は、D2Cのデータサイエンティスト(MLエンジニア)をやっている須田さんとチーム・ジャーニーを読んでみた感想を記事にいたしました。 問題と解決編の要約 第1話 グループでしかないチーム 課題: システム立ち上げメンバーの1人が権力を持ってタスクをメンバーに振る、メンバーは事を荒立てないように発言を控えて言われた事をただやる、いわゆるチームになっていない状態になっている。 解決: チームになるための4

VARモデルの実装に挑戦

はじめにこんにちは、D2Cデータサイエンティストの郷原です。 本記事では、多変量時系列分析モデルの一種であるVARモデルについて、時系列分析初心者が自分なりの解釈と大まかなイメージを活用例をもとに紹介していきます。 もし、多変量での時系列分析を始める際に、本記事がお役に立てば幸いです。 VARモデルとはVARモデルってなに? VARモデルとは Vector Autoregression Model の略称であり、変数間の因果関係などを読み取ることができる多変量時系列分析手

GPT-3.5 TurboでFine-tuningして広告コピーを作ろう!

はじめに初めまして、D2Cのデータサイエンティストの髙橋と申します。 普段は、プロジェクトマネジメントやヒューマンマネジメントを行っています。 ちょうど先月、D2Cグループ史上初となる生成AIを活用した社内プロダクトをリリースしました。 その名も「キョウソウAI」というプロダクトで、広告コピーの自動生成を可能としました。 詳しくは、以下のプレスリリースをご覧いただけますと幸いです。 ・・・いやいや、ただの宣伝かよ。そう思った方もいらっしゃるでしょう。 ご安心ください。

Amazon QでチャットQ&Aアプリケーションを作る

こんにちは D2CエンジニアのYuki Suzukiです。 2023/11/27~2023/12/1に開催されたAWS re:Invent 2023では今年も様々な新サービスが発表されました。 中でもAmazon Qについては生成系AIサービスとして一番注目を浴びたのではないでしょうか。 Amazon QとはAWS re:Invent 2023で発表されたAWSの新サービスで、エンタープライズ向けに設計されたAIチャットアシスタントです。 (AWS版のChatGPTと考え