近年AIやVRの企業導入が進むにつれて、「コンピュータビジョン」への注目が集まっています。画像や動画情報の活用を検討している方のなかには、下記のように疑問がある方も多いのではないでしょうか。
- コンピュータビジョンにはどのような技術がある?
- コンピュータビジョンはどのように活用されている?
そこで今回は、コンピュータビジョンでできることや実用例、将来性を解説します。また、コンピュータビジョンの理解を深められる本もまとめました。
本記事では、コンピュータビジョンを自社で活用できるかどうかの判断に役立つ情報が満載です!コンピュータビジョンの活用を考えている企業の皆さまは、ぜひ最後までご覧ください。
「コンピュータビジョン」とは?
「コンピュータビジョン」とは、画像や動画からコンピュータを用いて情報を自動的に抽出することです。例えば、製造ライン上のカメラから得られる画像データを分析して異物や不良品を発見したり、無人レジのカメラ画像から商品を認識したりと、さまざまな画像データから情報を抽出します。
またコンピュータビジョンの目的は、人間の視覚を再現することです。例えば、医師の確認作業で使う補助的な「目」や、自動運転のための「目」の役割が期待されています。
コンピュータビジョンが発展すれば、画像上にある情報を人間よりも速く・正確に取り出すことが可能になり、医師や熟練工などが行う専門性の高い作業の効率化を実現できるのです。
コンピュータビジョンのベース技術
コンピュータビジョンの歴史は深く、1960年代頃から開発が進められていました。AI技術が普及する前は、コンピュータビジョンのベース技術と言えば「OCR」でした。
OCRとは、PDFや書籍のテキストを認識し、デジタル文字へ変換するコンピュータビジョン技術のこと
今でもOCRは請求書やアンケート、注文書のデータ入力で活用されており、事務作業の効率化に役立てられています。
そして2000年代に入り、現在のコンピュータビジョンのベース技術でもある「AI」が主流になりました。AI技術のなかでも、大量の画像データを素早く扱える「ディープラーニング」を使った開発が進められています。
ディープラーニングとは、多層構造のニューラルネットワークのこと。1,000カテゴリーの画像分類やリアルタイムでの異常検知など、精度の高い画像処理が可能
10年前には最高レベルのアルゴリズムでも50%の精度しか出せなかった画像分類のタスクに対して、ディープラーニングでは99%まで精度を向上させられるなど、コンピュータビジョン分野の発展に大きく貢献しています。
ひと昔前までは人間が考えたアルゴリズムに基づいて文字を認識する程度しかできませんでしたが、近年ではディープラーニングの登場により、あらゆる画像データに対する物体の抽出からカテゴリーへの分類までコンピュータによって自動でできるようになりました。
コンピュータビジョンでできること
コンピュータビジョンの分野には、さまざまな認識技術が含まれます。ここでは、コンピュータビジョンでできることについて、下記の3つを紹介します。
- 物体検出
- 物体認識
- 画像分類
コンピュータビジョンの活用をお考えの方は、それぞれチェックしておきましょう!
物体検出
物体検出とは、画像や動画内にうつっている物体の種類や位置、数などをコンピュータが自動で検出するコンピュータビジョン手法のことです。物体検出には、YOLOシリーズやR-CNNなどのディープラーニング技術が応用されています。
YOLOとは、画像を1度取り込むだけで瞬時に物体の種類と位置を特定できる物体検出アルゴリズムのこと。「バウンディングボックス」と呼ばれる座標予測の仕組みによって、物体の範囲を高精度に特定できるのが特徴
例えば下記のように、1つの画像内にうつっている物体の位置を特定し、各カテゴリーへ分類します。人や犬、馬のあらゆる画像を学習することで、人間のように正しい検出が実現できるのです。
引用:CNNを用いた物体検出アルゴリズムYOLOv3に迫る!|Kysmo’s Tech Blog
物体検出は、製造業の外観検査でよく活用されている技術です。カメラで撮影された画像から、ライン上に流れる製品の良品・不良品の判定をリアルタイムで行います。熟練工でも見分けが難しい製品を瞬時に判定できる物体検出システムもあり、外観検査の自動化に大きく貢献しています。
物体認識
物体認識とは、画像や動画内の物体をコンピュータが識別するコンピュータビジョン手法のことです。CNNベースのEfficientNetなどのディープラーニング技術が応用される傾向にあります。
例えば、下記のように画像全体が何の画像かを判定します。100万個を超える大量の画像で学習したディープラーニングモデルにより、画像にうつる内容が「牛なのか?」「猫なのか?」を適切に見分けることが可能です。
引用:物体認識|農学情報科学
物体認識の技術は、顔認識や自動運転の障害物情報を抽出するシステムで活用されています。
なお、機械学習と画像認識の関係性は下記で詳しく解説しているので、参考にしてみてくださいね!
画像分類
画像分類とは、コンピュータが画像をカテゴリー別に分けるコンピュータビジョン手法のことです。ImageNetなど、CNN系がベースになったディープラーニング技術がよく使われています。
CNNとは、画像認識に特化したニューラルネットワークのこと。畳み込み演算による画像データの特徴抽出とプーリングによるダウンサンプリング工程が特徴的
画像分類では、画像にうつっている内容が各カテゴリーに対してどれくらい当てはまるかを確率で求めます。例えば下記では、犬である確率が85.6%と最も当てはまる確率が高いので、画像に移っている内容は「犬のカテゴリー」へ分類されることになります。引用:Image Classification~医用画像分類のAI~|NEXTGEM
画像分類は、内視鏡の画像からがんの兆候を見つけるコンピュータビジョンシステムで活用されています。
なお、画像分類の流れや導入事例については、下記で詳しく解説しているので画像分類に興味がある方はチェックしてみてくださいね!
【業界別】コンピュータビジョンの実用例
コンピュータビジョンの技術は、さまざまな業界で導入されています。例えば、飲食店の入り口にある「熱感知システム」やスーパーの「不審者監視システム」など、身近なサービスでも使われています。
ここでは、下記3つの業界別にコンピュータビジョンの実用例を紹介します。
- 医療
- 製造業
- 小売業
なお、今回紹介する以外の活用例は下記でも解説しているので、参考にしてみてくださいね。
医療
医療業界において、下記のようなコンピュータビジョンシステムの活用が進んでいます。
- CTやMI画像からガンを発見する「がん診断の支援システム」
- 文字認識技術を利用した「医療アプリケーション」
医療業界では、CTやMI画像を活用するコンピュータビジョンシステムが多く開発されています。最近では、コンピュータビジョン分野にて第一線で活躍し続けている「富士フイルム株式会社」と神戸大学が共同して、腹部のCT画像から膵臓ガンが疑われる所見を検出するAIベースのコンピュータビジョンシステムを開発しました。
また、医療業界ではAI技術だけではなくOCRも活用されており、レセプト作成を自動化する「保険証OCR」が普及しています。
医療業界においてコンピュータビジョンは、医師の診断を補助する目的や、診断以外の事務業務を簡易化するために利用されています。
製造業
工場ラインや物流倉庫でも、コンピュータビジョンが活用されています。製造業では「スマートファクトリー」を進めるために、コンピュータビジョン技術の導入が推進されています。
スマートファクトリーとは、工場内の機器や設備をIoTやAIなどの最先端デジタル技術により、生産性の向上を目指す工場のこと
例えば、下記のようなコンピュータビジョンシステムが挙げられます。
- 欠陥品を特定する「検査システム」
- 機械の故障を監視する「予知保全システム」
工場のライン上のカメラから得られる画像を用いて、リアルタイムで欠陥品を検知したり、ロボットや設備の状態を監視したりするシステムに応用されています。
製造業界の多くの企業ではコンピュータビジョンシステムを導入することによって、製造工程の目視検査の自動化を実現しているのです。
小売業
コンビニエンスストアやスーパーなどの小売業でも、下記のようなコンピュータビジョンシステムの実用化が進められています。
- 利用客の行動を監視する「セキュリティシステム」
- 利用客の体温を感知する「熱感知システム」
- 利用客が買った商品を識別する「スマート無人レジシステム」
多くのスーパーでは万引きを減らすために、監視カメラ画像を利用してお客さんの異常行動を検知するコンピュータビジョンシステムの導入が始まっています。
また最近では、小売業の人手不足を解消するために、「無人レジ」の導入が増えてきています。無人レジでは、カメラにうつる商品を識別するために、コンピュータビジョンの画像分類技術が応用されています。
小売業では、リアルタイムで利用客や商品の情報を検知するコンピュータビジョンシステムを導入することで、セキュリティ強化や省人化を目指しているのです。
コンピュータビジョンの今後
コンピュータビジョンの世界市場は、今後もディープラーニング技術の進歩とともに、大きく拡大していくでしょう。例えば「Mordor Intelligence」のレポートによると、コンピュータビジョンの市場規模は2023年の約146億米ドルから2028年には約331億米ドルまで拡大し、年平均成長率はたった5年で17.72%になると見込まれています。
医療や小売、教育などあらゆる業界で応用が増加していますが、なかでも大幅な成長が期待されているのが「製造業」です。例えば大手クラウド企業の「Amazon」が、30枚の画像を登録するだけで品質検査を簡単に自動化できるサービスを提供するなど、各企業が製造業のコンピュータビジョンシステムを支援するサービスを提供し始めています。
ただし、市場の成長を制限する課題がないわけではありません。例えば、大切な顧客データなどをクラウド上で共有することに対するセキュリティ問題や、コンピュータビジョンを扱えるIT・AI人材の不足問題は、市場の拡大を制約する重要な課題です。
特に日本においては、コンピュータビジョンの専門人材の不足が深刻で、政府と教育機関が一丸となって取り組んでいる課題でもあります。セキュリティや人材不足の課題を解決すれば、現在の予測以上に大きく拡大するでしょう。
コンピュータビジョンの理解に役立つ本
コンピュータビジョン系の本は、下記の3種類のカテゴリーに大きく分けられます。
- 基本的な概念を解説した本
- 最先端技術をまとめている本
- 実装メインの本
下記の表にて、コンピュータビジョンの理解に役立つ本を3種類のカテゴリーからおすすめの本を1つずつ厳選したので、それぞれチェックしてみてくださいね!
カテゴリー | 書籍名 | 特徴 | おすすめな人 |
---|---|---|---|
コンピュータビジョンの基本的な理論を解説した本 | ディジタル画像処理[改訂第二版] | 画像処理のアルゴリズムや分野ごとの応用事例など、コンピュータビジョン技術の基本がわかる | コンピュータビジョンの基礎理論を理解したい人 |
最先端技術をまとめている本 | コンピュータビジョン最前線シリーズ | ・年間4回(春夏秋冬)発行されている
・代表的な研究まとめ/最新研究の深掘り/代表的なアルゴリズムのチュートリアル解説の3つの視点から最新技術を紹介している |
コンピュータビジョンの最先端技術をキャッチアップしたい人 |
実装メインの本 | 詳解 OpenCV ―コンピュータビジョンライブラリを使った画像処理・認識 | コンピュータビジョンの開発現場で使われる「OpenCV」の基本的な使い方をまとめている | ・コンピュータビジョンの技術開発に必要な基礎スキルを習得したい人
・アルゴリズムを自分で実装したい人 |
例えば、コンピュータビジョンの基本を「ディジタル画像処理」で理解したあとに、「詳解 OpenCV」で実装力を身につける流れがおすすめです。
OpenCVとは、画像・動画処理機能が多数サポートされているオープンソースのライブラリ。画像の平滑化やしきい値処理などのデータの前処理はもちろんのこと、物体検出も可能
また「コンピュータビジョン最前線」を使って、トレンドの技術を押さえるようにすることも、市場のニーズに合ったコンピュータビジョンシステムを提供するうえで重要です。
なお、本を読んでも理解できないことがある場合には「Tech Teacher」をご利用ください!
Tech Teacherとは、AIやコンピュータビジョンの知識・スキルを持った講師へ直接質問できたり、プログラムのコードを見てもらえたりするプログラミング学習サービスです。現役の大学生や社会人から最新のコンピュータビジョンの技術や開発スキルを学べるので、「気軽にコンピュータビジョンのことを聞ける専門家を探している」方は、ぜひお問い合わせください!
データサイエンスを学習するならTech Teacherで!
『Tech Teacher』3つの魅力
魅力1. オーダーメイドのカリキュラム
『Tech Teacher』では、決められたカリキュラムがなくオーダーメイドでカリキュラムを組んでいます。「質問だけしたい」「相談相手が欲しい」等のご要望も実現できます。
魅力2. 担当教師によるマンツーマン指導
Tech Teacherでは、完全マンツーマン指導で目標達成までサポートします。
東京大学を始めとする難関大学の理系学生・院生・博士の教師がが1対1で、丁寧に指導しています。
そのため、理解できない箇所は何度も分かるまで説明を受けることができます。
魅力3. 3,960円/30分で必要な分だけ受講
Tech Teacherでは、授業を受けた分だけ後払いの「従量課金制」を採用しているので、必要な分だけ授業を受講することができます。また、初期費用は入会金22,000円のみです。一般的なプログラミングスクールとは異なり、多額な初期費用がかからないため、気軽に学習を始めることができます。
まとめ
・魅力1. 担当教師によるマンツーマン指導
・魅力2. オーダーメイドのカリキュラム
・魅力3. 3,960円/30分で必要な分だけ受講
質問のみのお問い合わせも受け付けております。
『Tech Teacher』3つの魅力
魅力1. オーダーメイドのカリキュラム
『Tech Teacher』では、決められたカリキュラムがなくオーダーメイドでカリキュラムを組んでいます。「質問だけしたい」「相談相手が欲しい」等のご要望も実現できます。
魅力2. 担当教師によるマンツーマン指導
Tech Teacherでは、完全マンツーマン指導で目標達成までサポートします。
東京大学を始めとする難関大学の理系学生・院生・博士の教師がが1対1で、丁寧に指導しています。
そのため、理解できない箇所は何度も分かるまで説明を受けることができます。
魅力3. 3,960円/30分で必要な分だけ受講
Tech Teacherでは、授業を受けた分だけ後払いの「従量課金制」を採用しているので、必要な分だけ授業を受講することができます。また、初期費用は入会金22,000円のみです。一般的なプログラミングスクールとは異なり、多額な初期費用がかからないため、気軽に学習を始めることができます。
まとめ
・魅力1. 担当教師によるマンツーマン指導
・魅力2. オーダーメイドのカリキュラム
・魅力3. 3,960円/30分で必要な分だけ受講
質問のみのお問い合わせも受け付けております。
まとめ
コンピュータビジョンとは、コンピュータを使って画像や動画から情報を得るための解析方法の総称です。今後もコンピュータビジョン技術は発展し続けて、医療や製造業、小売業など幅広い業界で活用されると予想されています。
今回紹介した内容に加えて、コンピュータビジョンを深く理解したい方には「Tech Teacher」をご利用ください!TechTeacherでは、コンピュータビジョンやOpenCVに熟知した講師から、マンツーマンでレッスンを受けられるメリットがあります。
コンピュータビジョンについて深く知りたい方は、お気軽にお問い合わせください。