顔やオブジェクトの分析に。画像分析API まとめ

昨今は内部・外部ストレージ、クラウドストレージも格安サービスが増え利用が手軽になり、気軽に大容量データを扱えるようになりました。
サイト内でも画像を手軽にアップロードしたりするサービスは、必須条件といっても過言では無いくらい要求が高まっていますが、それに伴ってデータを整理、分類して、次のサービスアップに繋げることが肝心となっています。

そこで今回は、画像解析を行ってくれるAPIをまとめました。

※ なお、API仕様や利用料金などは、2016-05-26現在のデータとなっています。

AlchemyVision (IBM Watson)

IBM Watsonの画像解析APIです。年齢範囲、男女、テキストなどを取得できます。
複数の人数にも対応していて、かなりの精度で解析が可能です。
しかし、あまりフレーム内に顔が接近していると判別が難しい様子で、これからの精度アップが期待されるところでしょう。
同サービスのVisual Recognitionにマージされたとアナウンスがありましたが、今後このサービスが継続されるかどうかまでは現在の所は説明がありませんので、利用にあたっては注意する必要があるでしょう。

サイトページ:
AlchemyVision | IBM Watson Developer Cloud

デモページ:
Alchemy Vision

Visual Insights (IBM Watson)

IBM Watsonの画像コレクション解析APIです。
写真のコレクション(Zipアーカイブ)から、人や動物、物、場所等を含め、アクティビティの内容や関心事項の値を解析できるAPIです。
写真1枚を解析するのではなく、コレクション全体の中での占める割合を算出してくれます。
出力内容は、画像イメージの階層構造とスコアリングが中心となっています。

サイトページ:
Visual Insights | IBM Watson Developer Cloud

デモページ:
Visual Insights

Visual Recognition (IBM Watson)

IBM Watsonの画像解析APIです。
同サービスのAlchemy Visionは、2016年05月20日に、こちらのサービスにマージされたようです。
クラス分類、taxonomy分類、顔検出(性別、年齢範囲、有名人など)の解析が可能です。
Bluemixの1アカウントで、一日あたり250のイベント(画像)まで無料ですが、それ以上は解析内容ごとに料金が変わるので注意が必要です。

サイトページ:
Visual Recognition | IBM Watson Developer Cloud

デモページ:
Visual Recognition Demo

Google Cloud Vision API

Google Cloud の機械学習による画像APIです。
OCR機能、属性、ランドマーク、顔、ロゴ、有害コンテンツの検知、ラベル(物体)検知などが可能です。

チュートリアルはGoogle Storageを利用する方法になっていますが、バイトデータを直接送信することもできるAPIとなっています。

課金方法は、機能ユニット単位となっており、例えば顔検知とラベル(物体)検知をした場合、両方の機能の利用分が月額で請求されます。 最大で20Mユニット/月 となっていますが、申請をすれば追加で拡張できるようです。

Google Cloud Vision API

Computer Vision (Cognitive Services)

Microsoft製の画像解析APIです。
状況説明、タグ付け、アダルトコンテンツ、カテゴリ、カラーなどが解析できます。
有名人などを認識可能であり、世界中のビジネス、政治、スポーツ、エンターテイメントから200000人もの有名人を認識できるそうです。
また、テキスト解析、変わったところではサムネイル生成も可能となっています。
利用料金は5,000トランザクション/月まで無料となっていますので、いろいろと試すことが出来そうです。

サイトページ:
Microsoft Cognitive Services - Computer Vision API

Emotion (Cognitive Services)

Microsoftが提供する画像解析APIで、「怒り」「軽蔑」「嫌悪感」「恐怖」「幸福」「中立」「悲しみ」「驚き」のスコアリングするAPIです。
複数人の解析もカバーしており、それぞれの顔の位置情報も取得できます。
かなり隣接した顔位置でも解析ができるようで、精度も安定しているようです。 利用料金は30,000トランザクション/月まで無料となっています。

サイトページ:
Microsoft Cognitive Services - Emotion API

Microsoft CaptionBot

最後にAPIではありませんが、Microsoftの画像解析サービスサイトを紹介します。
これは、上記のMicrosoft Cognitive Servicesを組み合わせて作成されているようです。
画像をアップロード、URLなどで指定すると、それについて解析してコメントを返却するサービスとなっています。
このように、APIの組み合わせ次第で面白いサービスができるという一例でしょう。

サイトページ: CaptionBot

最後に

画像解析APIは、各サービスで趣向をこらしているようです。
BigDataを扱うことで、非常に優れたサービスが、大変多く出てきている印象をうけます。
画像解析APIは、アイデア次第でいろいろなサービスに組み込むことができそうです。
ぜひ皆さんのサービスに役立ててください。

© NTT Communications Corporation All Rights Reserved.