はじめに
近年、AI(Artificial Intelligence:人工知能)の急速な発展に伴い、それらを用いた技術が活用され始めています。例えば、AIによる画像認識技術として画像分類、物体検出、セマンティック・セグメンテーションなどがあります。物体検出は「画像の中から特定の物体の位置、種類、個数などの情報を認識する技術」であり、AIを用いて比較的高速に画像内の物体情報を取得することができます。この技術を用いて製造業では品質評価、外観検査、異常検知などに活用されています。
本記事では、画像分類、物体検出、セマンティック・セグメンテーションなどの画像認識技術でオープンソースになっている技術を簡単にまとめていきます。新しく発表されたり、見つけた場合には、随時その内容を追加していきます。
1. 画像分類
1.1 Vision Transofrmer
【github】
【解説等記事】
1.2 DeiT
【github】
【解説等記事】
1.3 Pytorchによる学習済みモデルを用いた画像分類モデル作成
1.3.1 学習済みモデル
Torchvisionで提供されている画像分類モデルは以下のページで確認できます。
1.3.2 EfficientNet
EfficientNetでの事例が以下の記事です。
1.3.3 Vgg16
Vgg16での事例が以下の記事です。
1.3.4 Resnet18
Resnet18での事例が以下の記事です。
1.3.5 Alexnet
Alexnetでの事例が以下の記事です。
1.3.6 Vision Transformer
2. 物体検出
2.1 YOLOX
【Github】
【解説等記事】
2.2 YOLOv7
【github】
【解説等記事】
2.3 YOLOv8
【github】
【解説記事】
2.4 DAMO-YOLO
【github】
【解説等記事】
随時記載。
2.5 YOLO-NAS
【github】
【解説記事】
2.6 Detectron2
【github】
【解説等記事】
2.7 mmdetection
【github】
【解説等記事】
3. 物体追跡
3.1 YOLOX + motpy
【github】
【解説等記事】
3.2 Bytetrack
【github】
【解説等記事】
3.3 DeepSort
【github】
【解説等記事】
4. インスタンス・セグメンテーション
4.1 Yolov7
【github】
【解説等記事】
4.2 YOLACT
【github】
【解説等記事】
4.3 YOLOv8
【Github】
【解説記事】
4.4 Mask RCNN
【github】
【解説等記事】
4.5 Detectron2
【github】
【解説等記事】
4.6 Transfiner
【github】
【解説等記事】
4.7 mmdetection
【github】
【解説等記事】
5. 姿勢推定
5.1 Detectron2
【github】
【解説等記事】
5.2 OpenPose
【github】
【解説等記事】
5.3 Yolov7
【github】
【解説等記事】
5.4 HRNet
【github】
【解説等記事】
5.5 E2Pose
【github】
【解説等記事】
オススメ書籍
物体・画像認識と時系列データ処理入門
現場で使える!PyTorch開発入門 深層学習モデルの作成とアプリケーションへの実装
PyTorchで作る!深層学習モデル・AIアプリ開発入門
スキル修得&転職
近年、DXの進展に伴うデジタル人材の需要の高まりに追いついていない状況が続いていると経済産業省がホームページで記載している通り、DX人材、IT人材が不足しているのが現状です。さらにコンピュータの性能向上やAI技術の発展により、よりDX人材、IT人材の需要が高まってきます。さらには、今後の長期間安定して職がある業種とも考えられます。
以下の求人では、IT業界の転職や、IT未経験だけどIT人材を志望する就活を支援してくれます。無料で会員登録もできるので、まずは登録だけでもして様子を見てみてはいかがでしょうか?
▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼
▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲
おわりに
本記事では、画像分類、物体検出、セマンティック・セグメンテーションなどの画像認識技術でオープンソースになっている技術を簡単にまとめてみました。短期間で新たな技術が誕生する業界ですので、これまでの一般的な手法と新たな手法を把握してより目的に合ったソースを活用できるようにしていきましょう!