【動画レポ】SAP HANA PALの新機能「FAIR ML」を使ってみた～SAP Inside Track Tokyo 2024 Week2 | Digital Tranformation with Cloud ERP & AIから　#sitTokyo #chillSAP #SAPCommunity

2024年5月5日 10:12

今回は2024年2月に開催されたSAPのユーザーグループChillSAPの年次イベント「SAP Inside Track Tokyo 2024」から抜き出したセッションをレポートします。

はじめに

スピーカー
伊藤遼太さん
SAP L Vocational Traning Japan （学生）

SAPにおける製品領域
・データアナリティクス
・人工知能

本セッションの目的
・SAP HANA のPythonライブラリである「hana-ml」について紹介
・「FAIR ML」の機能を使用した場合の変化について紹介

・AIの活用にあたっては公平性や透明性といった問題が顕在化
　差別的な推測をしてしまう例、バイアスがかかる

FAIR MLとは？
公平性を重視した機械学習を実現する

実現するには？
・公平性を考慮するための情報を加味したうえで学習を進める

SAP HANAにおける機械学習
・多様なアルゴリズムからなる機械学習ライブラリが組込まれている
・SAP HANA内にあるデータを直接処理することで高速な学習を実現
・一般的にSQLを使用、Pythonを使って操作することも可能

Predictive Analysis Library

Automated Predictive Library （APL）
・自動予測ライブラリ
・データサイエンティストでなくても予測ができる
Predictive Analysis Library（PAL）

SAP HANA PALの新機能にFAIR MLが追加

シナリオ：積読に困っている・・・・（独自のシナリオ）
・ユーザの特徴、読書履歴、本の情報を用いる
・次に読みやすい本を推薦する

データの準備
・FAKER ：ユーザーデータの作成
・HUGGING FACE：LLMを用いて書籍データを生成
・人力によるラベル付け

Pythonの実行環境つくる→Google Colabを使用
・SAP HANA Cloudへの接続

特徴量エンジニアリングしたデータをnotebookに読み込む
・データの読み込み

用意したデータからHANAテーブルを作成
・テーブルの定義とデータのアップロード
・データの分割（モデルが学習する部分と検証する部分）
・通常の回帰モデルによる学習
・FAIR MLを適用した回帰モデルによる学習（user、genderバージョン）

ユーザの性別ごとの誤差
・男性と女性では制度が異なる

好みのジャンルによる誤差
・ミステリーやヘルス&ウェルネスは全体平均に寄る
・ほかのジャンルもその影響を受けている
・それぞれの誤差のばらつきは抑えられている

・PALを使ったデータ分析使ってみよう
・Pythonの実行環境はGoogle Colabでできます
・SAP HANA PALはトライアル環境のSAP HANAでは利用できない

この記事が気に入ったらサポートをしてみませんか？