Realtime Multi-Person 2D Pose Estimationを試してみた!

Realtime Multi-Person 2D Pose Estimationを試してみた!

画像から人の姿勢が分析できるOpenPose

こんにちは。

AI coordinatorの清水秀樹です。

DeepLearning系の参考書を読む度によく目にするRealtime Multi-Person 2D Pose Estimationを試してみたので、その内容の紹介になります。

別名OpenPoseとも言うようです。

 

簡単にどんなものかと言うと、人の姿勢を推論できるソフトウェアです。

上の動画のように、大変精度の高い推論が試せるようになっています。

はっきり言って、凄すぎです。

 

姿勢だけでなく、顔の輪郭や手の形の推論までできました。

Realtime Multi-Person 2D Pose Estim

かなり不気味なホラー画像となっていますが、そこはご容赦ください。

そして、画像からも分かるように、顔の輪郭や目の形、眉毛や口の位置まで推論できます。

かなり高性能ですね。

 

と言うわけで、参考サイトを元にここで紹介している通りに実行して頂ければ、簡単にOpenPoseを試すことができますので、興味がある方はぜひチャレンジしてみてください。

 

参考元サイトの紹介

GitHubリポジトリに紹介されています。

日本語での説明があるところが嬉しですね。

 

開発環境

iMac (27-inch, Late 2012)

プロセッサ 2.9 GHz intel Core i5

macOS Sierra バージョン 10.12.4

Anaconda3-4.2.0-MacOSX-x86_64

python 3.5.2

chainer 3.1.0

 

ソースコードの紹介

caffemodel使用しますので、訓練済みcaffemodelのダウンロードが必要です。

上記はGitHubで紹介されているまま掲載していますが、wgetはmacのターミナルでは使用できません。

そのため、直接URLにアクセスしてダウンロードしました。

wgetをmacでも使えるようにして欲しいですね。

それとも簡単に使える方法があるのでしょうか?

誰かご存知の方がいらっしゃったら、教えてください。

 

さて、基本的にGitHubに紹介されているソースコードそのままでも試せますが、人と顔と手の全てを動画で推論できるソースコードがなかったので、適当に作ってみました。

その代わりCPUですと、相当遅いです。

やっぱり高性能GPU搭載マシーンが欲しいところですね。

 

最近では物体検出や画像認識だけでなく、Realtime Multi-Person 2D Pose Estimationのように人の姿勢まで簡単に推論できるようになってきているようです。

また、ARと言った技術も出てきていますので、そのうち物体までの距離を測って人のサイズを推論するような学習モデルも出てきそうですね。

そんなモデルが出てきたら、色々なことに使えそうです。

 

それではまた。

この記事の内容について、相談したい方へ

技術選定・実装の進め方・組織での導入など、AI/IoT全般のご相談を受け付けています。

無料相談会(30分・オンライン)

About The Author

Hideki
東京大学発AIスタートアップでロボット開発室室長・画像解析室室長・動画解析室室長を務め、画像認識関連のAI特許を在籍中に3件取得。その後、KDDIグループでプロダクトリーダーとして自然言語処理パッケージの自社開発を経て、現在はAGRIST株式会社の執行役員CTO 兼 VPoEとして、農業の人手不足解決に向けた収穫ロボットの開発組織を統括しています。AI・ハード・エレキ・通信・クラウド・IoTまでを一気通貫で設計できる視点を強みに、性能だけでなく「感動やワクワク体験」までデザインできるロボットの研究を進めています。並行して、AI coordinatorとして企業のAI導入・教育機関のAI授業・地域の技術相談を月額契約で継続伴走しています。

LEAVE A REPLY

*
*
* (公開されません)