見出し画像

【第114回】 Salesforce 認定 AI アソシエイト 資格試験 合格体験記

Salesforce 認定 AI アソシエイト 資格試験とは

2023 年 11 月 28 日(火)より Salesforce 認定 AI アソシエイトの日本語版の試験が受験可能になりました。早速、試験会場にて受験をして来まして、無事合格となりましたので、合格体験記を書いてみたいと思います。

まずは、試験ガイドを参考に、この試験の試験概要、出題範囲と出題率などを見て行きましょう。

試験概要

認定 AI アソシエイト資格試験は、AI の基本と機能、そして CRM に適用されるデータに主眼を置いています。この試験は、あらゆるバックグラウンドを持つ個人を対象としており、AI の専門知識を持つビジネスリーダーや専門家も含め、初心者から経験者まで誰でも受験できます。この資格を取得することで、責任を持って AI とデータを使用するための基本的なスキルを備えていることが証明され、同じ分野でさらに高度な技術認定へ向かう道が拓かれます。

Salesforce 認定 AI アソシエイト試験の受験者は、Salesforce のコア機能に関する基礎的な知識を備え、Salesforce を操作できることが求められます。

Salesforce 認定 AI アソシエイト試験は、以下の分野の知識、スキル、経験を実証したい方を対象とします。

・AI の基礎とさまざまな種類 (予測分析、機械学習、自然言語処理、コンピュータービジョンなど)。

・特に Salesforce やその製品スイートなどの CRM システムにおける Salesforce の信頼済み AI の原則。

・データ品質、データの準備/整理、データガバナンスが AI モデルのトレーニングと微調整において果たす役割。

・プライバシー、バイアス、セキュリティ、コンプライアンスの考慮事項など、データの倫理的かつ責任ある取り扱い。

・AI を活用した改善の機会や潜在的な課題の特定など、ビジネスやさまざまなシナリオを改善するための AI の活用方法について関係者と有意義な話し合いを行える能力。

また、この認定試験の受験者には、次の条件は問われません。

・AI モデルを Salesforce ワークフローに統合する方法や、AI データおよびモデルに関連するセキュリティ上の考慮事項について理解している。

・AI の実装におけるコンプライアンス要件とデータ保護規制を認識している。

・AI モデルの調整、カスタム予測の作成、AI ソリューションへの追加データソースの組み込みなど、AI 機能をカスタマイズする方法について知っている。

・複雑な統計技法、高度な機械学習アルゴリズム、またはディープラーニングアーキテクチャの高度な知識を有している。

・高度なデータサイエンス、AI リサーチ、カスタムモデル開発、複雑な AI アーキテクチャ設計、または大規模 AI リリースの専門知識を有している。

・Salesforce 製品を設定または開発した経験がある。

このような感じになっています。認定アソシエイトの試験を受験したことがある人であれば分かると思いますが、アソシエイトが試験名に付く試験は、難易度はとても簡単で、専門的な知識は不要です。但し Salesforce が定義する AI の原則などを独特の定義で問われますので、Trailhead や各種 AI 関連のブログは確認しておいた方がよいかと思います。

また Salesforce の AI 機能である Einstein の各ツールの概要レベルが頭に入っていると良いとは思います。ただし、あまり勉強をしなくても、回答欄に並ぶ名称から推測して「何となくこれじゃないか?」という察しができる範囲のレベルだと思いますので、明らか違う選択肢を除外していけば正解に辿り着きます。

内容:多肢選択/複数選択方式の 40 問
(4 択ではなく 3 択)
試験時間:70 分
合格点:65 %(26 問以上で合格)
受験料:10,000 円(税抜)
再受験:無料
前提条件:なし

試験の終了後、試験結果のお知らせの前に、受験に関する 10 問の簡単なアンケートに回答する必要があるような記載がありましたが、オンサイトの受験の場合は表示されませんでした。あと不合格になったとしても、再受験が 1 回分無料です。このように再受験を無料にしていることからも「是非合格して下さい!」というエール(応援)をくれているように感じますね。

出題範囲と出題率

AI の基礎(17%)… 7 問
・AI の基本原理と Salesforce での AI の応用について説明します。
・各種 AI の違いとそれぞれの機能について説明します。

CRM での AI の働き(8%)… 3 問
・具体的な CRM AI 機能を特定します。
・AI を CRM に適用するメリットについて説明します。

AI の倫理上の考慮事項(39%)… 16 問
・AI の倫理的な課題(例:機械学習における人的バイアス、透明性の欠如) について説明します。
・与えられたシナリオに Salesforce の信頼済み AI の原則を適用します。

AI のデータ(36%)… 14 問
・データ品質の重要性について説明します。
・データ品質を決める要素/構成成分について説明します。

この内容を見て分かる通り、「倫理上の考慮事項」「データの品質」など Salesforce 社が何をユーザーに知っておいて欲しいかが、この問題数の分布に顕れていますね。ここを履き違えて、AI の基礎ばかりに時間をかけたりすると合格できない可能性もありますので注意が必要です。

私の試験結果

さて、下記が私の当時の試験結果になります。おそらくですが、この正答率のパーセンテージから計算しますと、40 問中、37 問正解(93%)できていると思います。残念ながら満点とは行きませんでした。惜しかったです。

試験対策

試験対策としては、まず下記の Trailmix から始めてください。これとは別に試験対策モジュールもあるのですが、解説などは無く、練習問題やフラッシュカードしか用意されていませんので、まずは Trailmix から開始することをオススメします。

その後に、下記の 試験対策モジュールで理解力を試しましょう。Trailmix をしっかりとやっていれば、練習問題は簡単にクリアできると思います。似たような問題が実際に本番でも出ましたので、繰り返し解いておくことをお勧めします。本番もこの練習問題と同じように 3 択式となります。

さて、この記事へ辿り着いた方は、AI アソシエイトの資格を取ろうと思っている人が多いと思いますので、私の方では合格するために必要なキーワードをまとめてみました。基本的な用語の定義を覚えると共に Salesforce 独特の原則やその定義中のフレーズも合わせて覚えておいて下さい。これらの定義には、様々なものがあることも承知していますので、Trailhead の説明や関連ブログの説明をコピーする形で記載してあります。一部、訳がおかしい箇所もありますががご容赦ください。

AI の基礎的な用語について

自然言語理解 (NLU、Natural language understanding)

人と機械の間のコミュニケーションを処理するシステムのことです。

自然言語処理 (NLP、Natural language processing)

NLU とは異なり、人間が他の人間に自然に話すように話したときに、機械がその意味を理解する能力のことです。

固有表現抽出 (NER、Named entity recognition)

一連の言葉にラベルを付け、名前、日付、時刻などの重要な内容を抽出することです。NER には、文をコンピューターが理解して迅速に応答できるセグメントに分割することが含まれます。

深層学習 (Deep learning)

大規模なデータベース内のデータポイント間に人工ニューラルネットワークが発達することです。人間が知性によって点と点をつなぎあわあせて洞察を得るように、深層学習ではアルゴリズムを使用してデータを選別し、結論を導き出し、パフォーマンスを向上させます。

Trusted AI の原則について

私たちは AI の利点がすべての人にアクセス可能であるべきだと信じています。しかし、AI の技術的な能力だけを提供することだけでは十分ではありません。また、AI が安全で包括的であることを確認するための重要な責任もあります。私たちはその責任を真剣に受け止め、従業員、顧客、およびパートナーに、AIを安全かつ正確かつ倫理的に開発および使用するためのツールを提供することにコミットしています。

責任ある行動(Responsible)

人権を保護し、私たちに委ねられたデータを守るために、私たちは人権の専門家と協力し、顧客やパートナーと研究を共有し、教育し、エンパワーメントを行っています。

包括的(Inclusive)

AI は、その創造者だけでなく、影響を受けるすべての人々の価値を尊重すべきです。これを実現するために、私たちはさまざまなデータセットでモデルをテストし、その影響を理解し、包括的なチームを構築しています。

説明責任(Accountable)

AI の説明責任を作り出すために、私たちはステークホルダーからのフィードバックを求め、倫理的な使用に関する助言を Ethical Use Advisory Council から受け入れ、独自のデータサイエンスレビューボードを実施しています。

透明性(Transparent)

私たちはモデルの説明可能性(関連情報やドキュメントにアクセスできる)明確な利用条件を追求し、顧客自身が自分のデータとモデルを制御できるようにします。

力を与える(Empowering)

アクセス可能な AI は成長と雇用の増加を促進し、社会全体に利益をもたらします。

信頼できる生成 AI の開発を導くために使用している 5 つのガイドライン

精度・正確性

生成 AI は他のモデルと同じように、トレーニングに使用されたデータに基づいて予測を行います。つまり、正確な結果を得るためには良質なデータが必要だということです。また、人々は AI の回答が、不正確で不確実である可能性を認識する必要があるということです。

安全性

バイアス、説明可能性、堅牢性を評価し、否定的な結果に対する意図的なストレステストを行うことで、有害性や誤解を招くデータによる危険からお客様を守ることができます。Salesforce は、トレーニングに使用されるデータ内に存在する個人識別情報 (PII) のプライバシーも保護します。さらに、その他の害悪を防ぐ対策も作成します。(コードを自動的に本番組織に転送するのではなく Sandbox に公開するなど)

誠実性

お客様のデータは Salesforce の製品ではありません。モデルのトレーニングと評価を行うためにデータを収集するときには、データの来歴を尊重し、データの使用に対する同意を得ていること(オープンソース、ユーザーからの提供など)を確認する必要があります。

エンパワーメント・能力強化

プロセスを完全に自動化するのが適している場合もありますが、人間をサポートする目的で AI を使用した方がよい場合や、人間の判断が必要な場合もあります。Salesforce では、人間の作業を強化または簡易化し、お客様が作成したコンテンツの真正性を理解するためのツールやリソースを提供する AI を開発することで人間の能力を強化することを目指しています

持続可能性

AI モデルに関しては、大きいほど良いとはかぎりません。場合によっては、より小さくて適切にトレーニングされたモデルの方が大きくてトレーニングが十分でないモデルよりもパフォーマンスが高くなります。アルゴリズムの能力と長期的な持続可能性の適切なバランスを取ることは、AI を私たちの未来に取り入れるための鍵となります。

覚えておくべきバイアスの種類

バイアスとは「先入観や偏見に基づく判断で、事実の公平な評価と対極にあるもの」と定義されます。多様なチームを編成し、価値をプロセスに反映させたり、顧客を理解することでバイアスを減らすことはできます。以下のようなバイアスが問われることがあるので、太文字にした箇所だけでも覚えておきましょう。

関連付けバイアス(Association Bias)

ステレオタイプに基づいてラベルが付けられたデータは、関連付けバイアスの例です。大半のオンライン小売業者で「女の子向けのおもちゃ」と検索すると、おままごと、人形、お姫様、ピンクのおもちゃなどが次々と表示されます。「男の子向けのおもちゃ」を検索した場合は、スーパーヒーローのアクションフィギュア、大工セット、ビデオゲームなどが表示されます。

確証バイアス(Confirmation Bias )

確証バイアスとは、先入観に基づいてデータにラベルが付けられることです。オンラインショッピング時に表示されるオススメには、各人の購買習慣が反映されていますが、こうした購入に影響を及ぼすデータ自体に、そもそも人々が表示して購入を選択したものが反映されています。つまり、オススメによってステレオタイプが増幅されます。Web サイトの「女の子向けのおもちゃ」セクションにスーパーヒーローが表示されなければ、買物客がサイトの他の場所にスーパーヒーローのおもちゃがあることを知る可能性は低く、購入する可能性はさらに低下します。

自動化バイアス(Automation Bias )

自動化バイアスは「あるシステムの価値」を他の人々に押し付けることです。2016 年に AI が審査した美人コンテストの例を見てみましょう。この目的は、客観性という概念に基づいて最も美しい女性を選び出すことでした。ところが、この AI のトレーニングには主に白人女性の画像が使用されたため、「美しい」として学習した定義には有色人種によくある特徴が含まれていませんでした。その結果、この AI が選んだ勝者のほとんどが白人となり、トレーニングデータのバイアスが実際の結果として表れることになりました。
自動化バイアスは AI だけに限りません。カラー写真の歴史を見てみましょう。1950 年代中ごろから、Kodak は写真現像室を提供していましたが、フィルムを現像する際には Shirley Page という白い肌の従業員の画像を使用して肌の色、影、光を調整していました。その後さまざまなモデルが使用されましたが、それらの画像は「Shirley カード」として知られるようになりました。Shirley が誰であっても (当初は常に白人でした)、Shirley の肌の色が標準とされました。カナダの Concordia 大学のメディア学教授である Lorna Roth はカードが最初に作成されたときについて次のように NPR に語っています。「カメラを購入する人の大半は白色人種でした。そのため、より幅広い肌の色へと市場を拡大する必要性を感じなかったのでしょう。」1970 年代には、Kodak はさまざまな肌の色でのテストを開始し、多民族の Shirley カードを作成しました。

社会的バイアス(Societal Bias )

社会的バイアスによって、歴史的にマイノリティとされてきた集団に対する過去の偏見の結果が再現されます。赤線引きについて考えてみましょう。1930 年代、連邦住宅政策では望ましさの観点で特定の地域が色分けされていました。赤でマークされた地域は危険とみなされていました。銀行では、このような赤でマークされた地域に住むマイノリティ集団への低コストの住宅融資を拒否することがよくありました。今日に至るまで、赤線引きは特定の郵便番号地域での人種や経済的な構成に影響を与えており、郵便番号と人種の相関関係が高い場合があります。モデルのデータポイントに郵便番号を含めれば、ユースケースによってはアルゴリズムの判断要因に意図せず人種を含めてしまう可能性があります。米国では、金融業務のさまざまな判断において、年齢、人種、性別など保護対象のカテゴリを使用することが違法であることを忘れないようにします。

勝ち抜きバイアス(Survival or Survivorship Bias)

時として、アルゴリズムが選抜された人々や、特定のプロセスを勝ち抜いた人々のみに着目し、除外された人々には目を向けないことがあります。採用の実務を見てみましょう。たとえば、あなたが会社の採用責任者で、特定の大学の卒業生の中から採用すべきかどうか判断したいとします。そこで、その大学出身の現在の従業員の業績を検討します。けれども、その大学の出身者で採用されなかった人々や、採用後に解雇された人々の業績は検討されません。「勝ち残った」人々の業績のみに目を向けることになります。
大学別の採用における勝ち抜きバイアスを表すインフォグラフィック。3 校の大学を卒業した応募者のみが 1 つ目の関門を通過し、採用された応募者のうち退職しなかった人々のみが 2 つ目の関門を通過します。最後の集団は、この 3 校出身の採用者を表すものではありません。

操作バイアス(Interaction Bias)

人間が AI システムを操作するときや、AI システムに意図的に影響を及ぼそうとするときに、操作バイアスが生み出され、バイアスのかかった結果が生成されます。この一例が、人々がチャットボットに意図的に下品な言葉を覚えさせようとする場合です。

AI データの品質

データ品質は、AI システムの結果と信頼性を形成する上で重要な役割を果たします。AI を使用する場合、データ品質が低いとシステムのパフォーマンスが損なわれ、バイアスのかかった結果や脆弱性、さらには倫理的、社会的な影響につながることがあります。データはサイズが大きければ良いわけではありません。場合によっては、より小さくて適切にトレーニングされたモデルの方が大きくてトレーニングが十分でないモデルよりもパフォーマンスが高くなります。ここで言うデータ品質の側面には、以下のようなものがあります。

古さ・新しさ

データは高級ワインのように年を重ねるわけではありません。各レコードが最後に更新されたのはいつでしょうか?
レコードの最終更新日に関するレポートを実行します。最近更新されたレコードの割合はどれくらいですか?

完全性

肝心なデータが抜けていたりしませんか? 思わないですよね! 同様に、完全な会社階層と業界情報がなければアップセル商談を見つけることはできません。レコードの主要なビジネス項目にはすべてデータが入力されていますか?
ビジネス用途ごとに必須項目のリストを作成します。次に、それらの項目について空白の割合を表示するレポートを実行します。AppExchange のデータ品質アプリケーションを使用することもできます。

正確さ

的を外したらオリンピックの金メダルは獲れません。データは可能な限り高精度になっていますか? 信頼できるソースと一致していますか?
AppExchange からデータ品質アプリケーションをインストールします。データ品質アプリケーションは、レコードを、信頼できるソースと照合して、データをどの程度改善できるかを示します。

一貫性

すべてのレコードで同じ形式、スペル、および言語が使用されていますか?
日付、通貨、都道府県、国、地域、および言語項目に使用されている値を表示するレポートを実行します。1 つの値に使用されているバリエーションがいくつありましたか?

重複

数が多ければ良いとは限りません。ほとんどの場合、重複データは非効率を意味します。組織のレコードとデータは重複していませんか?
Salesforce の重複管理機能を使用して、AppExchange から重複検出アプリケーションをインストールします。

使用方法

使わないなら除去しましょう。データはレポート、ダッシュボード、アプリケーションで使用されていますか?
ビジネスで使用している利用可能なツールやリソースを確認します。データの使用は最適化されていますか?

いかがでしたでしょうか?一部翻訳ツールを使用していますので、日本語としておかしいところがありますが、全部を覚えるというよりは定義名とキーワードを覚えるようにした方が良いと思います。

最後に SFMC の専門家らしく Einstein Engagement と呼ばれる Salesforce Marketing Cloud に関する AI 機能のうち、特に代表的なものについてまとめておきます。参考にしてください。

■ Einstein エンゲージメントスコアリング
顧客のメールエンゲージメントデータを機械学習して、顧客にスコアを割り当て、顧客をいくつかのセグメントに分類します。

■ Einstein エンゲージメント頻度
顧客のメールエンゲージメントデータを機械学習して、送信の頻度を調整すします。つまりメッセージの送り過ぎ、送らな過ぎを判別します。

■ Einstein 送信時間最適化
顧客のメールエンゲージメントデータを機械学習して、連絡先へメッセージを送信するのに最適な時間を決定します。

■ Einstein レコメンデーション
顧客の WEB サイト上での行動を機械学習して、顧客ごとに最も関連性の高いコンテンツで決定し、メールや WEB サイトへ表示します。

大事なことは、ここでもバイアスが入りこまないようにすることであって、各文章を読んで頂ければ分かりますが、あくまで使用するのはエンゲージメントデータ、つまり、開封・クリック・購読取り消しなど顧客が何らかメッセージ送信に対して行ったアクションのデータを使用するというところであり、その人のデモグラ(年齢や性別など)は使用されないということです。そもそもすべての企業が年齢や性別データを持っているわけではないというところも考えれば、当然のことですね。上で説明した社会的バイアスと絡めて覚えておきましょう。

さて、今回の記事が、皆さんの参考になっていれば幸いです。これから試験を受ける方もいると思いますので、ぜひ頑張って下さい!

今回は以上です。


次の記事はこちら

前回の記事はこちら

私の note のトップページはこちら

この記事が気に入ったらサポートをしてみませんか?