Pythonによるデータ分析・機械学習ブログ

Pythonによるデータの前処理・グラフ化、機械学習、統計解析、画像処理、Webスクレイピング、自然言語処理の基礎について紹介していきます。

MENU

【実践】画像認識オープンソース:画像分類、物体検出、セマンティック・セグメンテーションなど

はじめに

 近年、AI(Artificial Intelligence:人工知能)の急速な発展に伴い、それらを用いた技術が活用され始めています。例えば、AIによる画像認識技術として画像分類、物体検出、セマンティック・セグメンテーションなどがあります。物体検出は「画像の中から特定の物体の位置、種類、個数などの情報を認識する技術」であり、AIを用いて比較的高速に画像内の物体情報を取得することができます。この技術を用いて製造業では品質評価、外観検査、異常検知などに活用されています。

 本記事では、画像分類、物体検出、セマンティック・セグメンテーションなどの画像認識技術でオープンソースになっている技術を簡単にまとめていきます。新しく発表されたり、見つけた場合には、随時その内容を追加していきます。

SAMURAI ENGINEER Plus+

 

1. 画像分類

1.1 Vision Transofrmer

github

github.com

github.com

【解説等記事】

recruit.gmo.jp

qiita.com

1.2 DeiT

github

github.com

【解説等記事】

deepsquare.jp

qiita.com

 

1.3 Pytorchによる学習済みモデルを用いた画像分類モデル作成

1.3.1 学習済みモデル

Torchvisionで提供されている画像分類モデルは以下のページで確認できます。

pytorch.org

1.3.2 EfficientNet

EfficientNetでの事例が以下の記事です。

debuggercafe.com

1.3.3 Vgg16

Vgg16での事例が以下の記事です。

www.tetsumag.com

www.think-self.com

qiita.com

1.3.4 Resnet18

Resnet18での事例が以下の記事です。

qiita.com

pystyle.info

1.3.5 Alexnet

Alexnetでの事例が以下の記事です。

shibayama-masaki.com

1.3.6 Vision Transformer

wonderfuru.com

2. 物体検出

2.1 YOLOX

Github

github.com

【解説等記事】

chantastu.hatenablog.com

chantastu.hatenablog.com

chantastu.hatenablog.com

youtu.be

youtu.be

 

2.2 YOLOv7

github

github.com

【解説等記事】

chantastu.hatenablog.com

youtu.be

 

2.3 YOLOv8

github

github.com

【解説記事】

chantastu.hatenablog.com

chantastu.hatenablog.com

youtu.be

 

2.4 DAMO-YOLO

github

github.com

【解説等記事】

随時記載。

 

2.5 YOLO-NAS

github

github.com

【解説記事】

chantastu.hatenablog.com

youtu.be

 

2.6 Detectron2

github

github.com

【解説等記事】

miyashinblog.com

zenn.dev

www.ushiji.online

www.kkaneko.jp

2.7 mmdetection

github

github.com

【解説等記事】

dev.classmethod.jp

cedro3.com

 

3. 物体追跡

3.1 YOLOX + motpy

github

github.com

【解説等記事】

qiita.com

tt-tsukumochi.com

youtu.be

 

3.2 Bytetrack

github

github.com

【解説等記事】

medium.com

chantastu.hatenablog.com

youtu.be

youtu.be

3.3 DeepSort

github

github.com

github.com

github.com

【解説等記事】

farml1.com

 

4. インスタンス・セグメンテーション

4.1 Yolov7

github

github.com

【解説等記事】

tt-tsukumochi.com

4.2 YOLACT

github

github.com

【解説等記事】

farml1.com

youtu.be

youtu.be

 

4.3 YOLOv8

Github

github.com

【解説記事】

chantastu.hatenablog.com

youtu.be

 

4.4 Mask RCNN

github

github.com

【解説等記事】

 

4.5 Detectron2

github

github.com

【解説等記事】

miyashinblog.com

zenn.dev

www.ushiji.online

www.kkaneko.jp

4.6 Transfiner 

github

github.com

【解説等記事】

www.12-technology.com

4.7 mmdetection

github

github.com

【解説等記事】

dev.classmethod.jp

cedro3.com

 

5. 姿勢推定

5.1 Detectron2

github

github.com

【解説等記事】

miyashinblog.com

zenn.dev

www.ushiji.online

www.kkaneko.jp

 

5.2 OpenPose

github

github.com

【解説等記事】

www.learning-nao.com

qiita.com

cedro3.com

 

5.3 Yolov7

github

github.com

【解説等記事】

tt-tsukumochi.com

youtu.be

 

5.4 HRNet

github

github.com

【解説等記事】

mathematical-free.com

 

5.5 E2Pose

github

github.com

【解説等記事】

cedro3.com

 

オススメ書籍

物体・画像認識と時系列データ処理入門

現場で使える!PyTorch開発入門 深層学習モデルの作成とアプリケーションへの実装

PyTorchで作る!深層学習モデル・AIアプリ開発入門

 

スキル修得&転職

 近年、DXの進展に伴うデジタル人材の需要の高まりに追いついていない状況が続いていると経済産業省がホームページで記載している通り、DX人材、IT人材が不足しているのが現状です。さらにコンピュータの性能向上やAI技術の発展により、よりDX人材、IT人材の需要が高まってきます。さらには、今後の長期間安定して職がある業種とも考えられます。

以下の求人では、IT業界の転職や、IT未経験だけどIT人材を志望する就活を支援してくれます。無料で会員登録もできるので、まずは登録だけでもして様子を見てみてはいかがでしょうか?

▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼

▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲

 

おわりに

本記事では、画像分類、物体検出、セマンティック・セグメンテーションなどの画像認識技術でオープンソースになっている技術を簡単にまとめてみました。短期間で新たな技術が誕生する業界ですので、これまでの一般的な手法と新たな手法を把握してより目的に合ったソースを活用できるようにしていきましょう!