![見出し画像](https://assets.st-note.com/production/uploads/images/143344280/rectangle_large_type_2_93af484ea07d2f525ac8c7d3f9175bb1.jpeg?width=1200)
Snowflake DataCloudSummit2024 に参加してきました
ナウキャストでデータエンジニアをしている六車(X: @mt_musyu)です。
2024年6月3日~6日でサンフランシスコで開かれたSnowflakeのカンファレンス(DataCloudSummit2024)にナウキャストから4名参加してきました。
主にXでsummitの様子を実況していたので参加メンバーのポストを参照して感想を加えながらまとめたいと思います!(来年以降参加される方向けのTipsも書いていきます)
San Francisco! サミット中は情報発信して参ります!#datacloudsummit #snowflakesummit pic.twitter.com/a3nGHn4ENT
— Koki Osawa (@kkuv553) June 2, 2024
事前準備
Tips
ESTA関係
少なくとも72時間前に申し込む必要がある
直接ESTA取得すると$20くらいだが、代行サービスというのがありそれだと9000円近く取られてしまうこともあるので要注意
ESTAは有効期限2年間あるので早めにゆっくり取っておくのが吉
申請はESTAのモバイルアプリが便利です
名刺はエンジニアも100枚持っていくこと
名刺無くなります
SnowVillageに参加すると良い
Snowflakeのユーザ会のslackに参加しておくと良いです。皆さん優しいし、情報共有を積極的にやっていただけます。
サミット前観光
Tips
とにかく日差しがすごいのでサングラス、日焼け止め必須
乾燥しており、日中の温度差が激しい(昼間は暑いが夜は寒い)ので軽く羽織れるものを持ち歩いた方が良い
移動は複数人ならUberやlyftが便利
地下鉄は治安があまりよろしくない、かつ複数人ならUber頼む方が安いです
現金は最低限で良い
実際、私は現金全く使わなかったです。クレジットカード文化。というかタッチ決済文化(Apple Payしか僕は使わなかったです)
観光
ワイン好きならナパバレーは行った方が良いです。僕たちはオーパスワンとロバート・モンダビのワイナリーのテイスティングツアーに参加しました。どちらも予約必須です!まあまあお値段も張りますが、何故ナパバレーができたのかという話からワイン作りに適している理由、それぞれのワイナリーの思いなど聞けてとても勉強になります。そしてオーパスワンのガイドはなんと日本語で行ってくれました。
![](https://assets.st-note.com/img/1717812018854-NiLYNKfWFc.jpg?width=1200)
定番ですが、ゴールデンゲートブリッジもおすすめです。自転車で渡れます。ただ、まあまあの距離があるので体力は必要です。
![](https://assets.st-note.com/img/1717909047557-WMzVCWQ7ml.png?width=1200)
![](https://assets.st-note.com/img/1717925692571-AnL66JPwn8.jpg?width=1200)
あと何気に良かったのがWaymoに乗れたことです。
Waymoはサンフランシスコ市内限定で走っている完全自動運転タクシーです。
全然Uberとかより安心感あり、未来を感じました。
Waymo乗ってみたけど、かなりいい感じでした
— muguruma (@mt_musyu) June 5, 2024
急ブレーキみたいなのもないし、方向転換、車線変更、信号変更に伴う再出発もスムーズ pic.twitter.com/UDU2Vaix9o
サミット本体
Tips
ご飯は会場では細々出てきたり出てこなかったりする
今回は1日目の夜、2日の朝昼、3日目の朝昼夜、4日目の昼にご飯が提供されました。
セッションは予約してなくても参加できる
「Standby」という列に並べば良い
予約ができなかったセッションにどうしても行きたいから順番待ちしてる
— muguruma (@mt_musyu) June 6, 2024
こういうのStandbyっていうのね#SnowflakeSummit #DataCloudSummit pic.twitter.com/LibLeLqftW
セッションはほとんど後から動画が公開されるので、現地で無理に詰め込まなくてもいいかも
それよりブースを回ったりして交流した方が良さそう
セッションは随時追加・更新されるので定期的に確認すると良い
Keynoteを経てsummit期間中も更新されたりするのでこまめにチェックした方が良いです
セッション検索はとにかく大量なのでwebサイトや提供されるmobileアプリで時間ごとに探すと捗ります。
大学の授業のコマを埋めるように時間ごとにセッションを検索できるので、善良から探さず、時間ごとに検索する方がやりやすいかも?
ちなみに六車の最終的な全体のスケジュールは以下のような感じです。
![](https://assets.st-note.com/img/1717908737307-w8uwRuPBXN.png?width=1200)
Platform Peakという最新機能に特化したSnowflakeブースに行くとSnowflakeの人に最新機能について色々聞けることができる
気になる料金や裏側のアーキとか聞けます
Copilotのアーキテクチャが面白かった!
— Kevin (@Kevinrobot34) June 5, 2024
Snowflakeのデータ・ドキュメントで学習した一つ目のLLMでSnowflakeのコンテキスト踏まえた回答を生成し、汎用的に優秀なMistralを二つ目のLLMとして利用する2段階の構成。これにより回答の精度が高いとのこと。#SnowflakeSummit #DataCloudSummit pic.twitter.com/HUTbIMTTwJ
Snowpro Loungeという資格取得者だけが入れる特別なラウンジがあり、行くと色々もらえる
カンファレンス参加前に資格とっておくのおすすめ
SnowProグッズをいただきました!
— muguruma (@mt_musyu) June 3, 2024
at SnowPro Lounge pic.twitter.com/4fellBYAFx
同時翻訳をZOOMやmeetの機能を使ってやったら英語がわかりづらくても理解が進む
セッション中やブースを回る時にmeetを立ち上げていてリアルタイムの文字起こしを使って理解を深めているメンバーもいました
Day1 - Opening Keynote
CEO Sridharの話
NVIDIA Jensen氏との対談
ユーザー企業4社からCDOが集まってパネルディスカッション
がOpening Keynoteで実施されました。
【個人的にオープニングキーノートで気になったポイント】
— Ryohei Katayama (@fozzhey) June 4, 2024
・AIデータクラウドの構築のために何百人単位でエンジニアチームを組成
・GPT-4を超えるマルチモーダルモデルを実現。OSSにも貢献しており、LLM360のリーダーが所属。#DataCloudSummit #SnowflakeSummit
Opening keynote
— muguruma (@mt_musyu) June 4, 2024
生成AIについてかなり強調してたのと、パネルディスカッションがとても地味(地に足がついてる感)だったのが印象的#SnowflakeSummit #DataCloudSummit
CDOのパネルディスカッション、非常に勉強になるな。とても地道にデータをビジネスに活かすために組織の戦略を考えている。生成AIなどのテクノロジについて変に浮かれず、冷静に全体を見ている#SnowflakeSummit #DataCloudSummit
— muguruma (@mt_musyu) June 4, 2024
このOpening Keynote、ぶっちゃけ少し地味()だったのですが、僕は個人的にこの地味さに心打たれていました。無駄にキャッチーにせずにエンタープライズでデータ利活用が進むために地道な足回りをきちんと整備しないといけないと思っていて、その考えがこのOpening Keynoteから感じました。
Day2 - Platform Keynote
SridharとBenoitによるSnowflakeにおけるplatformの考え方を熱弁
"One Platform", "AI Data Cloud"
怒涛の新機能のアナウンス
Platform keynoteはSnowflakeのAI戦略が色濃く現れててとてもおもしろかった。
— Ryohei Katayama (@fozzhey) June 4, 2024
キーワードは「小型特化型LLM」「AI UI/UX」「バンドリング」「データ&AIプロダクト」あたりかなあ。AI戦略を軸にサミットのスキマ時間で感想を書いていきます。(1/n)#DataCloudSummit #SnowflakeSummit
2日目のPlatform Keynoteはとにかく怒涛の新機能のアナウンスでした。聞いて
最初のSridharとBenoitによるSnowflakeのプラットフォームとしての方向性、考え方のところで、One Platformという単語を多く発言されていたのが印象的でした。エンタープライズでデータ利活用を推進していくにはガバナンスであったり、セキュリティを考慮するのがとても大事。SnowflakeではOne PlatformとしてSnowflakeからデータを出さずにデータ利活用ができるように機能を追加している。とても地に足がついたロジカルな考え方と感じました。
新機能に関してはJapanのwrapup sessionでまとめていただいたものをシェアします。
今回のupdate日本語まとめ
— muguruma (@mt_musyu) June 6, 2024
足回りのデータ基盤、インフラをしっかりと機能追加した上で、アプリ側も進化しているのが素晴らしい。。#SnowflakeSummit #DataCloudSummit pic.twitter.com/t9AX0qOh3a
セッション(抜粋)
特に印象に残ったところを抜粋して紹介します。
What’s New with Orchestration in Snowflake
— muguruma (@mt_musyu) June 4, 2024
AirflowとかDagsterなど外部のオーケストレーション使わなくとも(ある程度は)いけそう。Snowflakeで完結するのは嬉しい
まだPrPrが多いので、ユースケースの見極めは大事そう#SnowflakeSummit #DataCloudSummit pic.twitter.com/KTZAGbX9eO
オーケストレーションの新機能については別途以下ブログにまとめました。なかなか地味ではあるのですが、データプラットフォームとしてオーケストレーション機能は必要不可欠であると個人的には思っており、それをSnowflakeネイティブでできるのは熱いです!!
ブラックロックの提供しているSnowflakeを使ったAladdin data cloudがデータシェアリング機能とStreamlitをフル活用し、それをソリューションとして外部公開してて強い #DataCloudSummit #SnowflakeSummit pic.twitter.com/Nu70rB11h0
— Koki Osawa (@kkuv553) June 4, 2024
金融機関それぞれがもう当たり前にデータと生成AI活用を紐づけて理解している印象。メタデータの調整やどんなモデルを使うか、事業者が判断。機械学習は単にセクシーな領域ではないという話が印象的。Capital One, JP Morgan Chase, DTCC, AWSによるパネル #DataCloudSummit #SnowflakeSummit pic.twitter.com/Dnj8OMDSnS
— Koki Osawa (@kkuv553) June 5, 2024
(カンファレンスに登壇している企業というバイアスはあるが)海外ではデータ利活用は当たり前で、今はガバナンス、ユーザビリティ、シェアリングに興味が向いている企業が多い印象を受けました。特にエンプラ領域、金融ドメイン。
データ利活用はエンプラでこそやると強力なのに日本じゃ全然進んでいないのがとてももったいない。今後我々も気合を入れてデータ利活用の推進に取り組んで、かつ情報発信したいと感じました。
Building Open Data Lakes And Lakehouses With Iceberg
— muguruma (@mt_musyu) June 5, 2024
SnowflakeのIceberg Tables
結構面白くて、Icebergテーブル使えるユースケース思った以上に多そう#SnowflakeSummit #DataCloudSummit pic.twitter.com/Tq49bHl7DM
Icebergテーブルに関してはKevinさんがsummit期間中にブログにまとめてくれました。Iceberg、ぼんやりしかキャッチアップできてませんでしたが、技術的にも面白いし、ユースケースも汎用的だと感じたので、これからどんどん使い倒していきたい気持ちです。
その他
日本ラップアップセッション
日本語でsummitのwrapupを実施していただく(ありがたい)
サプライズでSridhar, Benoit, Therryが登場!
日本からの参加者でグループディスカッション
![](https://assets.st-note.com/img/1717814601581-KCOYPbysMc.png?width=1200)
SnowflakeのTopからのディスカッションで特に印象的なのはBenoitの「SnowflakeはiPhoneのようなプラットフォームを目指していく」という話です。今回発表された堅牢なガバナンス、セキュリティを持ったプラットフォームにNative Appでアプリを各社が出して、それをシェアしていく。よりユーザは、ビジネスに向き合う。納得感のあるストーリーでした。Native Appの利活用は我々も実施していきたい。
日本からの参加者同士でのグループディスカッションでは今回発表された新機能をどのようにビジネスに活用させていくか、というところを話しました。みなさんやはり共通の課題を感じており、また目線感もお聞きする中で刺激を受けました。
![](https://assets.st-note.com/img/1717818706992-aUYUC5X8tX.png?width=1200)
コネクション、コネクション、コネクション
summit期間中多くの方とのコネクションを作ることができました。
ブースを出しているSnowflakeパートナー企業の方、Snowflakeユーザ(日本のユーザはもちろん、海外のユーザも)、Snowflakeのプロダクトを作っている社員さん。
このコネクションも怒涛で、本当に良い刺激を受けました。
ちなみに今回のsummitでは日本からは参加者250人+Snowflake社員40名の方が参加されていたようです。来年は目指せ日本からの参加者1000人!
気になっていたツールベンダーの方に直接話を聞けてデモしてもらうのも本当に貴重な経験です。早く我々のプラットフォームでも適応したい。
select のブースも行ってきました!
— Kevin (@Kevinrobot34) June 5, 2024
日本でも定期的にいいって話聞くけど、実際の画面見せてもらって使いやすそうだしコスト管理捗りそうだなと実感しました!
日本帰ったら無料トライアル試さないと#SnowflakeSummit #DataCloudSummit pic.twitter.com/d05vUScQfd
他レセプションや日本独自の飲み会などたくさんの方と美味しいお酒と食事を交えながら交流させていただきました!
![](https://assets.st-note.com/img/1717833085124-CEwzAEduY1.png?width=1200)
![](https://assets.st-note.com/img/1717832975380-5t9glh824T.png?width=1200)
![](https://assets.st-note.com/img/1717832929830-Nt7mjHBauV.png?width=1200)
全体を通して
各社データについて真剣に考え取り組んでいる方々とのコミュニケーション
海外の先進的な事例を肌で感じる
Snowflakeとその周りのエコシステムに対しての理解を深める
というところでモチベーションがかなり上がっております。データ利活用推進のためにSnowflakeというプラットフォームは有効であるということが実感できました。そして多くのデータ利活用推進に取り組む参加者の皆さんから良い刺激を受けることもできました。これから日本においてもデータ利活用をどんどん推進していきます。やっていくぞ。
We are Hiring!
この件についてもっと詳しく知りたい、議論したい、はたまたナウキャストという会社に興味を持ったという方は、カジュアル面談フォームから連絡ください。その際に「Snowflakeのsummit参加レポートを見た」と書いていただければ幸いです!
ナウキャストではエンジニアを募集中です。エントリーをお待ちしています!
Appendix
セッションの様子
セッションの様子をリアルタイムのXの投稿ベースで紹介します。
Day1
DataRobotとHometapのセッション、家の消費データを活用し、AIの複雑なデータモデルを作ってきた話をシェア。新しい金融商品やリスクモデルの開発、MLOpsの導入も進行中とのことでDataRobotで生成 AI と予測 AI の両方に対応するワークフローを作っているとのこと。#DataCloudSummit #SnowflakeSummit
— Koki Osawa (@kkuv553) June 3, 2024
セマンティックレイヤーのサービスを提供するHoneydewのセッション。
— Ryohei Katayama (@fozzhey) June 3, 2024
Honeydewにprofit marginの定義を入れておけば、複雑なSQLが一発で生成される。#DataCloudSummit #SnowflakeSummit pic.twitter.com/Ud7IK65f8t
BlackRockのデータガバナンス。マルチテナントなデータ基盤で如何にガバナンスを効かせるか。
— muguruma (@mt_musyu) June 3, 2024
層構造でデータを保護。モニタリングも大事。かなりしっかりやってる#SnowflakeSummit #DataCloudSummit pic.twitter.com/l2NagSiYL1
Altimetrikのセッション。Snowflakeをハブにして、Salesforceと他のデータを統合して、集計結果をSalesforceに戻す構成は今後増えていきそうだなと思った。#DataCloudSummit #SnowflakeSummit pic.twitter.com/p8yugbKEfv
— Ryohei Katayama (@fozzhey) June 3, 2024
トークンに分割して検索してくれる関数も今後出てくるらしい#SnowflakeSummit #DataCloudSummit pic.twitter.com/JtNlsQWCd6
— Kevin (@Kevinrobot34) June 3, 2024
Booking\.comのオンプレSparkからSnowpark(Snowflake)への移行の事例
— muguruma (@mt_musyu) June 3, 2024
Sparkからの移行はDatabricksからなのかなと思いきや、Snowflakeに移行して色々良かったらしい。#SnowflakeSummit #DataCloudSummit pic.twitter.com/Fb2zQPjAWZ
Day2
Cortex Playground
— muguruma (@mt_musyu) June 4, 2024
モデルの性能を比較するときに便利。
こういうユーザーが求めていることをええ感じのUIで出すのは流石です。#SnowflakeSummit #DataCloudSummit pic.twitter.com/E4DDccLPpI
膨大な顧客、データ、従業員を抱えるBookingのデータ基盤
— muguruma (@mt_musyu) June 4, 2024
ImmutaとSnowflakeを活用して改善した話
以前の状態が話聞いているだけでつらすぎだったが、Immutaを導入ですごいシンプルになっておりすごい。#SnowflakeSummit #DataCloudSummit pic.twitter.com/1a90Qwj3Oi
What’s New with Orchestration in Snowflake
— muguruma (@mt_musyu) June 4, 2024
AirflowとかDagsterなど外部のオーケストレーション使わなくとも(ある程度は)いけそう。Snowflakeで完結するのは嬉しい
まだPrPrが多いので、ユースケースの見極めは大事そう#SnowflakeSummit #DataCloudSummit pic.twitter.com/KTZAGbX9eO
"What's New: Observability in Snowflake" がとても良かった!Snowflake Trail は Pipeline/App/Data の Observability を高めるツールで、例えばUDFやProcの実行のログをTraceとSpanでいい感じに表示してくれデバッグが捗りそうな感じでした。早く使ってみたい!#SnowflakeSummit #DataCloudSummit pic.twitter.com/pHeTzTc8m2
— Kevin (@Kevinrobot34) June 4, 2024
ブラックロックの提供しているSnowflakeを使ったAladdin data cloudがデータシェアリング機能とStreamlitをフル活用し、それをソリューションとして外部公開してて強い #DataCloudSummit #SnowflakeSummit pic.twitter.com/Nu70rB11h0
— Koki Osawa (@kkuv553) June 4, 2024
State Streetのユースケースも進んでます。
— Koki Osawa (@kkuv553) June 4, 2024
・裏側でデータを読み、ファンドのリスク順に並べ、グラフにしたり表形式でダウンロードできるようなRAG chatシステムを開発
・今後PDF上のライティング機能やSnowflake Copilotを活用した機能を拡充していく#DataCloudSummit #SnowflakeSummit pic.twitter.com/YiRzz8JPvW
Day3
今回のサミットで感動したユースケースの1つ。大型の基盤モデルの出力結果を使って、小型モデルをファインチューニングして、コストを抑えて同等の結果を得てる。競合と比較しても今のところ一番使いやすいUIだと思う。https://t.co/wJNOtwSFlO#DataCloudSummit #SnowflakeSummit
— Ryohei Katayama (@fozzhey) June 6, 2024
Building Open Data Lakes And Lakehouses With Iceberg
— muguruma (@mt_musyu) June 5, 2024
SnowflakeのIceberg Tables
結構面白くて、Icebergテーブル使えるユースケース思った以上に多そう#SnowflakeSummit #DataCloudSummit pic.twitter.com/Tq49bHl7DM
Day4
最終日!まずはSnowflakeの差分プライバシー機能の説明へ。機密データを外部に連携していくにあたり、通常マスクされていってしまうデータがノイズはあるが全て分析できる。データマネタイゼーションの流れには必須となっていく技術がSnowflakeだけで完結。#DataCloudSummit #SnowflakeSummit pic.twitter.com/5ysyIJaWkE
— Koki Osawa (@kkuv553) June 6, 2024
AIアプリはデモとして作るのは楽だけどプロダクションに持っていくのは大変ってまさにそうだよなぁ
— Kevin (@Kevinrobot34) June 6, 2024
GenAI Opsなツールがもっと増えてほしいですね#SnowflakeSummit #DataCloudSummit pic.twitter.com/v5FrfYL8SA
GPTにデータセットを作らせて、MistralのモデルをFineTuningしたらめっちゃ精度良くなったと#SnowflakeSummit #DataCloudSummit pic.twitter.com/ZZIB0xtkZ4
— Kevin (@Kevinrobot34) June 6, 2024
4日目はDevDayが共同開催ということでSnowflakeに関わらず、Data&AIに関数セッションが多く開催されました。OpenAIやNVIDIAの方から直接話を聞けたのは感動です。
この記事が気に入ったらサポートをしてみませんか?