見出し画像

【動画レポ】SAP HANA PALの新機能「FAIR ML」を使ってみた~SAP Inside Track Tokyo 2024 Week2 | Digital Tranformation with Cloud ERP & AIから #sitTokyo​​ #chillSAP​​ #SAPCommunity​​

今回は2024年2月に開催されたSAPのユーザーグループChillSAPの年次イベント「SAP Inside Track Tokyo 2024」から抜き出したセッションをレポートします。

はじめに

スピーカー
伊藤 遼太さん
SAP L Vocational Traning Japan (学生)

SAPにおける製品領域
・データアナリティクス
・人工知能

本セッションの目的
・SAP HANA のPythonライブラリである「hana-ml」について紹介
・「FAIR ML」の機能を使用した場合の変化について紹介

AIの公平性にかかわる問題

・AIの活用にあたっては公平性や透明性といった問題が顕在化
 差別的な推測をしてしまう例、バイアスがかかる

AIの活用にあたっての課題

FAIR MLとは?
公平性を重視した機械学習を実現する

実現するには?
・公平性を考慮するための情報を加味したうえで学習を進める

公正性の基準

SAP HANA PAL

SAP HANAにおける機械学習
・多様なアルゴリズムからなる機械学習ライブラリが組込まれている
・SAP HANA内にあるデータを直接処理することで高速な学習を実現
・一般的にSQLを使用、Pythonを使って操作することも可能

Predictive Analysis Library

SAP HANA PAL

Automated Predictive Library (APL)
・自動予測ライブラリ
・データサイエンティストでなくても予測ができる
Predictive Analysis Library(PAL)

PALの機能一覧

SAP HANA PALの新機能にFAIR MLが追加

「FAIR ML」を使ってみた

シナリオ:積読に困っている・・・・(独自のシナリオ)
・ユーザの特徴、読書履歴、本の情報を用いる
・次に読みやすい本を推薦する

シナリオ概要

データの準備
・FAKER :ユーザーデータの作成
・HUGGING FACE:LLMを用いて書籍データを生成
・人力によるラベル付け

データの準備

Pythonの実行環境つくる→Google Colabを使用
・SAP HANA Cloudへの接続

特徴量エンジニアリングしたデータをnotebookに読み込む
・データの読み込み

用意したデータからHANAテーブルを作成
・テーブルの定義とデータのアップロード
・データの分割(モデルが学習する部分と検証する部分)
・通常の回帰モデルによる学習
・FAIR MLを適用した回帰モデルによる学習(user、genderバージョン)

FAIR MLを適用したものとの比較

ユーザの性別ごとの誤差
・男性と女性では制度が異なる

性別による誤差

好みのジャンルによる誤差
・ミステリーやヘルス&ウェルネスは全体平均に寄る
・ほかのジャンルもその影響を受けている
・それぞれの誤差のばらつきは抑えられている

好みのジャンル

まとめ

・PALを使ったデータ分析使ってみよう
・Pythonの実行環境はGoogle Colabでできます
・SAP HANA PALはトライアル環境のSAP HANAでは利用できない

メッセージ

この記事が気に入ったらサポートをしてみませんか?