Visionフレームワークのドキュメントまとめ

今年の目標はiOSのフレームワークのVisionを学ぶことです。
VisionフレームワークはAppleが提供するコンピュータビジョンのフレームワークで、これを使えば画像や動画を解析して人や物体を判別したり、免許証の文字を認識したり、その人の表情がなんなのかを分析できるものです。

本業でも個人としてもiOSエンジニアの幅を広げるためにマスターしたいと思っています。

新しい分野を学ぶためにはどんな教材があるか、インプットをあつめるのが効率的です。
ということでVisionが学べるサイトをまとめます。

といってもAppleの公式ドキュメントがかなり充実しているのでまずはそのコードをみていくのがいいかと考えています。

公式ドキュメント

Vision 
https://developer.apple.com/documentation/vision

Visionフレームワークの公式ドキュメント。使用されるクラスはもちろんサンプルコードのリンクもあります。

サンプルコード

Visionのドキュメントでは3つサンプルコードが公開されているようです。

Detecting Objects in Still Images
 ・画像をもとにVisionに検知のリクエストを送る方法とそれの結果を処理する方法を解説しているサンプルコード。
Classifying Images for Categorization and Search
 ・検知したオブジェクトを分類する方法が学べるようです
Analyzing Image Similarity with Feature Print
 ・画像間の距離を計算できるようになるようです。まだどんなものなのかがわからないのでなんとも言えません

WWDC

VisionのフレームワークはWWDCでも解説されています。
概要を知るにはまずWWDCのVideoをみるほうが早いかもしれません。

Understanding Images in Vision Framework
Text Recognition in Vision Framework
Object Tracking in Vision
Vision with Core ML
Vision Framework: Building on Core ML

GitHub

GitHubでもよさそうなサンプルコードがあるのでみてみる予定です。

atomic14/VisionCoreMLSample: Sample application using Vision Framework and Core ML
DroidsOnRoids/VisionFaceDetection: An example of use a Vision framework for face landmarks detection in iOS 11

最後に

なにか成果があれば個人ブログで記載する予定です。

この記事が気に入ったらサポートをしてみませんか?