PoseNet

PoseNetは、Googleが開発した静止画や動画から人物の姿勢（骨格構造）を推定する「姿勢推定（Pose Estimation）」するための深層学習モデルです。

PoseNetはオープンソースかつApacheライセンスを採用しています。姿勢推定モデルで自由に使える唯一のものではないかと思われます。

PoseNetは、畳み込みニューラルネットワーク（Convolutional Neural Network, CNN）を基にしています。モデルは画像内の関節ポイントを予測し、各関節を繋いで人体の姿勢を形成します。PoseNetのモデルは、様々な姿勢の変化やポーズの検出に対して高い精度を持っています。

PoseNetは、リアルタイムの姿勢推定に向けて最適化されており、モバイルデバイスやWebブラウザなどのクライアントサイドでの使用に適しています。これにより、スマートフォンやタブレットなどのデバイス上でリアルタイムに姿勢推定を行うアプリケーションを開発することができます。

PoseNetは、姿勢推定に関するさまざまなバリエーションが存在します。例えば、シングルポーズ（1人の人物の姿勢推定）、マルチポーズ（複数の人物の姿勢推定）、3D姿勢推定などがあります。また、TensorFlow.jsやTensorFlow Liteなどのフレームワークやライブラリで使用できる形式も提供されています。

PoseNetは、人体のモーションキャプチャ、ジェスチャ認識、フィットネスアプリ、AR（拡張現実）アプリなど、さまざまな領域で活用されています。

PoseNet

案内メニュー

個人用ツール

名前空間

変種

表示

その他

検索

案内

ツール