【実践】画像認識オープンソース：画像分類、物体検出、セマンティック・セグメンテーションなど

はじめに

　近年、AI（Artificial Intelligence：人工知能）の急速な発展に伴い、それらを用いた技術が活用され始めています。例えば、AIによる画像認識技術として画像分類、物体検出、セマンティック・セグメンテーションなどがあります。物体検出は「画像の中から特定の物体の位置、種類、個数などの情報を認識する技術」であり、AIを用いて比較的高速に画像内の物体情報を取得することができます。この技術を用いて製造業では品質評価、外観検査、異常検知などに活用されています。

　本記事では、画像分類、物体検出、セマンティック・セグメンテーションなどの画像認識技術でオープンソースになっている技術を簡単にまとめていきます。新しく発表されたり、見つけた場合には、随時その内容を追加していきます。

はじめに
1. 画像分類
2. 物体検出
3. 物体追跡
4. インスタンス・セグメンテーション
5. 姿勢推定
オススメ書籍
スキル修得＆転職
おわりに

1. 画像分類

1.1 Vision Transofrmer

【github】

github.com

【解説等記事】

recruit.gmo.jp

qiita.com

1.2 DeiT

【github】

github.com

【解説等記事】

deepsquare.jp

qiita.com

1.3 Pytorchによる学習済みモデルを用いた画像分類モデル作成

1.3.1 学習済みモデル

Torchvisionで提供されている画像分類モデルは以下のページで確認できます。

pytorch.org

1.3.2 EfficientNet

EfficientNetでの事例が以下の記事です。

debuggercafe.com

1.3.3 Vgg16

Vgg16での事例が以下の記事です。

www.tetsumag.com

www.think-self.com

qiita.com

1.3.4 Resnet18

Resnet18での事例が以下の記事です。

qiita.com

pystyle.info

1.3.5 Alexnet

Alexnetでの事例が以下の記事です。

shibayama-masaki.com

1.3.6 Vision Transformer

wonderfuru.com

2. 物体検出

2.1 YOLOX

【Github】

github.com

【解説等記事】

chantastu.hatenablog.com

youtu.be

2.2 YOLOv7

【github】

github.com

【解説等記事】

chantastu.hatenablog.com

youtu.be

2.3 YOLOv8

【github】

github.com

【解説記事】

chantastu.hatenablog.com

youtu.be

2.4 DAMO-YOLO

【github】

github.com

【解説等記事】

随時記載。

2.5 YOLO-NAS

【github】

github.com

【解説記事】

chantastu.hatenablog.com

youtu.be

2.6 Detectron2

【github】

【解説等記事】

2.7 mmdetection

【github】

github.com

【解説等記事】

dev.classmethod.jp

cedro3.com

3. 物体追跡

3.1 YOLOX + motpy

【github】

【解説等記事】

3.2 Bytetrack

【github】

github.com

【解説等記事】

medium.com

chantastu.hatenablog.com

youtu.be

3.3 DeepSort

【github】

github.com

【解説等記事】

farml1.com

4. インスタンス・セグメンテーション

4.1 Yolov7

【github】

github.com

【解説等記事】

tt-tsukumochi.com

4.2 YOLACT

【github】

github.com

【解説等記事】

farml1.com

youtu.be

4.3 YOLOv8

【Github】

github.com

【解説記事】

chantastu.hatenablog.com

youtu.be

4.4 Mask RCNN

【github】

github.com

【解説等記事】

4.5 Detectron2

【github】

【解説等記事】

4.6 Transfiner

【github】

github.com

【解説等記事】

www.12-technology.com

4.7 mmdetection

【github】

github.com

【解説等記事】

dev.classmethod.jp

cedro3.com

5. 姿勢推定

5.1 Detectron2

【github】

【解説等記事】

5.2 OpenPose

【github】

【解説等記事】

5.3 Yolov7

【github】

github.com

【解説等記事】

tt-tsukumochi.com

youtu.be

5.4 HRNet

【github】

github.com

【解説等記事】

mathematical-free.com

5.5 E2Pose

【github】

github.com

【解説等記事】

cedro3.com

オススメ書籍

物体・画像認識と時系列データ処理入門

リンク

現場で使える！PyTorch開発入門深層学習モデルの作成とアプリケーションへの実装

リンク

PyTorchで作る!深層学習モデル・AIアプリ開発入門

リンク

スキル修得＆転職

　近年、DXの進展に伴うデジタル人材の需要の高まりに追いついていない状況が続いていると経済産業省がホームページで記載している通り、DX人材、IT人材が不足しているのが現状です。さらにコンピュータの性能向上やAI技術の発展により、よりDX人材、IT人材の需要が高まってきます。さらには、今後の長期間安定して職がある業種とも考えられます。

以下の求人では、IT業界の転職や、IT未経験だけどIT人材を志望する就活を支援してくれます。無料で会員登録もできるので、まずは登録だけでもして様子を見てみてはいかがでしょうか？

▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼