見出し画像

AIモデルの構築とライフサイクル管理のための統合基盤 IBM Watson Studio

データ活用の動向

「Watson」と聞くと、何を思い浮かべるでしょうか。チャットボットやテキスト分析といった「⾮構造化データ」を対象にしたWatson APIの代表的なサービスがありますが、数値データである「構造化データ」も扱っています。その代表的なサービスが、Watson Studioです。

部門データの全社的な活用に関しては、ETLに代表される「効率化」から始まって、そこからデータレイクやデータカタログを活用して社内の誰もが簡単にデータを利用できるような「民主化」に変わりつつあります。さらにAIによるビジネルモデルの構築といったマネタイズを志向した「ビジネス化」に進むことが想定されています。

AIモデルの問題点とライフサイクル管理

企業では、AIを適用すべきビジネス・業務に適したアルゴリズムを選択しデータを学習させる取り組みが進んでいる一方で、AIモデルの構築・実装・運用において、精度と時間にかかる問題点を多く抱えています。

  • エグエクティブ
    AIを適用可能なユースケースかどうか判断できない、なぜその出力になるのか理解できない

  • データサイエンティスト
    AIモデル構築時に手当たり次第に試している、モデルの精度が上がらない、なぜこのモデルは精度が落ちるのか分からない、特徴量を抽出できる専門的な人材が少ない

  • ユーザーやAI管理担当者
    実業務で活用に至らず目的・成果につながらない、特定の用途に特化したAIしか作れず展開できない

これらの問題点を解決するためには、企業は、収集・構築・活用・評価というAIモデルのライフサイクルを管理していくことが求められています。そして、AIモデルのパフォーマンスを継続的にモニタリングし、パフォーマンスが悪化した場合には、再学習し、改善が見込めない場合はAIモデルをリプレースすることが必要です。

統合AI分析基盤 Watson Studio

Watson Studioは、統合AI分析基盤です。AIの活用・分析を行う上で必要な機能を一つにまとめ、各サービスと連携することにより、社内チームの生産性を向上しコラボレーションする「場」を提供します。

Watson Studioの特長は、次の3つで表現できます。

  1. チームで協働できる分析環境であること
    各担当者が使いやすいツールを使用、プロジェクト管理、アセット管理もできます。

  2. AI Readyな分析基盤へ進化していること
    Watson API連携や、機械学習・深層学習環境、画像認識のモデル開発に優れています。

  3. データ基盤とのシームレスな連携ができること
    データの準備・加工、データの品質確認・可視化に優れています。

Watson Studioには、「つなぐ」ために、データへのアクセスとデータ蓄積機能を持っています。「整える」ために、データ加工と品質確認(プレパレーション)機能を持っています。「分析・活用する」ために、データ可視化、ダッシュボード、AI・マシンラーニング、データ分析機能を持っています。そして、チームで協働するために、メタデータや分析資産を共有し、だれもが使える状態にするエンタープライズ・カタログを備えています。

機械学習スキルの自動化 AutoAI

Watson Studioの一機能であるAutoAIは、このようなデータサイエンティスト不足の課題に応えるためのソリューションです。機械学習に詳しくないユーザーでも、学習データをCSV形式で与え、2から3回の指示をマウスクリックで行うだけで、あとは全自動で実用に耐えうる精度の機械学習モデルを構築することが可能となります。

Watson Studioの個別機能

Watson StudioはAutoAI以外にも、協働するチームメンバーの権限管理機能、データ資産を活用するための機能、データ資産を分析するためのツールなど様々な機能を提供しています。したがって、役割に応じて必要な機能を選択しながら利用できるため、生産性を高めることができます。

  • Refinery
    データ整形機能によって、データ分析を開始する前のデータの加工処理タスクについてプログラミングなしに効率よく行うことができます。

  • Cognos Dashboard
    協働するメンバー向けに分析結果を共有するためのダッシュボードを、コーディングすることなく作成できます。

  • SPSS Modeler Flow
    データ分析の定番SPSSの簡易版です。GUIでデータ前処理や機械学習モデリングの設計を行う機能です。

  • R Studio
    統計解析用のプログラミング言語であるRを使うための開発環境も提供されています。R言語でデータ分析をするのに必要な主要パッケージは事前導入済みです。また、Watson Studio上で定義されたデータソースを利用することが可能です。

  • Jupyter Notebook
    メジャーなPyhtonの開発環境です。TensorflowやKerasなど多くのライブラリが事前導入済みですぐに使える状態です。事前導入されていないライブラリもコマンドで追加導入して利用可能となります。

  • Decision Optimization
    CPLEXと呼ばれた最適化ツールのクラウド版です。人員配置の最適化、機器の保守計画の最適化といったユースケースに使われています。

  • モデル管理機能
    Watson Studioではいろいろな方法で機械学習モデルを作ることができますが、どの形で作ったモデルも、リポジトリに登録すると一元的にオブジェクトとして扱われ、再利用することが可能です。

  • Webサービス化
    リポジトリーに登録した機械学習モデルは簡単にWebサービス化することが可能で、機械学習モデルを使ったオンラインシステム構築の際に便利です。

AIポートフォリオ製品

Watsonは、AIポートフォリオ全体、すなわちデータ・ガバナンス、構築、デプロイと実行、AI管理の全てにわたって解決策を提供します。

Watson Knowledge Catalogは最初のデータ・ガバナンス領域の製品です。単純なデータカタログに加え、Watson NLU(言語理解)APIを活用したスマートタギング、推奨データの提示、AIのためのデータ管理&ナレッジ管理を実現します。

Watson Machine Learningは、モデルの構築と実行、およびモニター・フィードバックをスムーズに行える環境を用意し、AIを業務に組み込むために不可欠な最初のモデル作成から継続的な学習の繰り返し実現までを支援します。

Watson OpenScale は、AIモデルから得られた結果を追跡および測定し、それらの結果が公平かつ説明可能になるようにするとともに、基準に準拠するようにします。また、AI モデルを実稼働環境で使用する場合に、正確度のドリフトを検出して修正することができます。

Watson StudioのIBM Webサイトはこちらです↓

AIモデルの構築・実行・管理には、Watson Studioの利用をご検討ください。

内容に関するお問い合わせは、お気軽に日本IBM小川浩一までどうぞ。
e28364@jp.ibm.com


この記事が気に入ったらサポートをしてみませんか?