ML Kitによるオンデバイス機械学習の新機能
以下の記事を参考にして書いてます。
・On-device machine learning solutions with ML Kit, now even easier to use
1. はじめに
「ML Kit」は、Googleの機械学習の機能を Androidアプリや iOSアプリで利用するためのフレームワークです。2年前の Google I/O 2018で、発表されました。現在、AndroidとiOSの25,000以上のアプリが「ML Kit」を利用しています。
今回は、「ML Kit」の新機能を紹介します。
2. オンデバイス機械学習に特化したML Kit
「ML Kit」のAPIは、一般的なユースケースに対応する「Vision」と「Natural Language」で構成されています。「テキスト認識」「画像分類」「オブジェクト検出・追跡」「顔検出・輪郭追跡」「バーコードスキャン」「翻訳」などを、簡単に実行できます。
「ML Kit」の元のバージョンは「Firebase」と統合されてましたが、アプリ実装時の柔軟性を高めたいとの声があり、スタンドアロンな「ML Kit」として分離しました。必要に応じて、「ML Kit」と「Firebase」を使い分けることで、両方製品を最大限に活かすことができます。
3. ML Kitの特徴
「ML Kit」はオンデバイス機械学習に特化することで、次のようなメリットを享受します。
・高速でリアルタイムな推論
推論はデバイス上で行われるため、ネットワークの遅延はありません。これによって、1秒間に数回、リアルタムに推論を行うことができます。
・オフラインでの動作
ネットワークが不安定な場合や、接続できない場所にいる場合でも、推論を行うことができます。
・プライバシーの保持
処理はすべてローカルで実行されるため、機密性の高いユーザーデータを外部に送信する必要はありません。
4. ML Kitの新しいWebサイト
「ML Kit」の新しいWebサイトができました。「ML Kit」の全てのリソースはここに集約され、サンプル、APIリファレンス、およびコミュニティチャネルにアクセスしやすくなりました。
5. 現在、FirebaseのオンデバイスAPI用のML Kitを使用している場合、どうすれば良いか
現在、FirebaseのオンデバイスAPI用の「ML Kit」を使用している場合は、新しいスタンドアロンの「ML Kit」に移行することをお勧めします。アプリの更新手順については、「移行ガイド」を参照してください。クラウドベースのAPI、モデルのデプロイ、AutoML Vision Edgeは、「Firebase Machine Learning」で引き続き利用できます。
6. Google Play 開発者サービス 経由によるMLKitの利用
「Google Play 開発者サービス」経由で「ML Kit」を利用することで、アプリサイズを小さくすることができます。「テキスト認識」「顔検出・輪郭追跡」「バーコードスキャン」のモデルを利用できます。
// 顔検出・輪郭追跡モデルを Google Play 開発者サービス経由で利用
implementation 'com.google.android.gms:play-services-mlkit-face-detection:16.0.0'
// 顔検出・輪郭追跡モデルを アプリに含めて利用
implementation 'com.google.mlkit:face-detection:16.0.0'
7. Jetpack Lifecycle / CameraX のサポート
全てのAPIでの「Android Jetpack Lifecycle」のサポートが追加されました。開発者は、addObserverを使用して、アプリの画面回転または終了時に、リソースの破棄を自動的に管理できます。これにより、「CameraX」の統合が容易になります。利用の容易さと、幅広いデバイスで画質向上する(Camera1に比べて)ことから、「CameraX」を採用することをお勧めします。
// ML Kit now supports Lifecycle
val recognizer = TextRecognizer.newInstance()
lifecycle.addObserver(recognizer)
// ...
// Just like CameraX
val camera = cameraProvider.bindToLifecycle( /* lifecycleOwner= */this,
cameraSelector, previewUseCase, analysisUseCase)
詳しくは、リリースノートを参照してください。
8. ML Kit と CameraX のサンプル
「ML Kit」と「CameraX」のサンプルを用意しました。「テキスト認識」「言語識別」「翻訳」を行います。
7. 早期アクセスプログラム
「早期アクセスプログラム」を通じて、「ML Kit」チームと提携することにより、、開発者は「ML Kit」の新機能を利用することができます。
このプログラムの一部として、2つの新しいAPIが利用可能になりました。
・Entity Extraction
テキスト内のエンティティを検出します。電話番号、住所、支払い番号、追跡番号、日付/時刻などをサポートしています。
・Pose Detection
手と足のトラッキングを含む人間の姿勢を検出します。
興味がある方は、早期アクセスプログラムを参照してください。
この記事が気に入ったらサポートをしてみませんか?