こんにちは。画像処理大好き人間のAI coordinator 清水です。
YOLOv8が出たっちゅうことで、まあちょっと動かしてみるかとやってみたところ、これが過去バージョンとして比較して、ぶっちぎりに簡単に物体検出を試せるようになっていたので、「これは未経験にお勧めだ!」と思い、記事にすることにしました。
これからAI始めたいけど、何をして良いか分からんという方は、まずこのYOLOv8を動かして、「AIエンジニアに俺はなる!」と感動するところから始めてください。
いきなりソースコード
で、
3行ってどんなpythonロジックなんだ?
これです。
from ultralytics import YOLO
model = YOLO(“yolov8n.pt”)
results = model(0 , show=True)
この、たった3行で以下のようにリアルタイム物体検出が出来ます。
ね?簡単でしょ!
凄すぎる!
数式なんぞ理解せんでも簡単に出来ます。というかぶっちゃけ数式を意識して開発することなんてほとんどないです。というか無いです。
だって世界中の天才数学者たちによって、ライブリーとして簡単に扱えるように既に準備してくれているのに、それを使わず一から勉強して開発する必要なんかないし、はっきりいってそんなのは時間の無駄で、金になりません。
よって、数学分からんし文系だからという理由でAIエンジニアを諦めるのは本当にもったいないです。「習うより慣れろ」です。
とにかく数多くのオープンソースを動かしまくり、AIの感覚を掴んだほうがよっぽどビジネスでは役に立ちます。この感覚がビジネスでは重要で、
顧客要求をAIでクリア出来そうかどうかが、肌感覚で分かるようになります。
さて、YOLOv8を動かすために必要なライブラリーはたった一つです。以下のコマンドでインストールしましょう。
pip install ultralytics
これだけで、条件が全部そろって動かせます。
「pip install」ってなんだよって方もいるかと思うので、簡単に説明するとpythonのライブラリーをインストールするコマンドです。
Macをお使いの方であればターミナルからすぐに使えますが、windowsは標準で準備されていないため、Anacondaをインストールする必要があります。インストールすればpipコマンドが使えるようになります。Anacondaのセットアップの詳細は他サイトで沢山紹介しているサイトがあるので、ここでは割愛します。
さて、話はYOLOに戻して、一昔前までは、えらく苦労して動かしたものです。技術の進歩は凄いですね。
ちなみにYOLOv8の本家はこちらです。
ごちゃごちゃとドキュメントに使い方などが記載してあるので、詳しい使い方を知りたい方は目を通してみましょう。
英語ですが、chromeの翻訳で十分読めます。
セグメンテーションもできる優れもの!
モデルを変更すると、ピクセル単位で物体検出ができるセグメンテーションも出来ちゃいます。
モデルの変更ってどこ変えるねん?
2行目です。
from ultralytics import YOLO
model = YOLO(“yolov8n-seg.pt“)
results = model(0 , show=True, save=True)
こんな感じで動きます。
凄すぎる!やばいなこれ。面白すぎる!
もちろん動画にも対応!
当然ながら動画にも対応しています。
動画にも対応って、どこ修正すんねん?
3行目です。
from ultralytics import YOLO
model = YOLO(“yolov8n.pt”)
results = model(“movie.mp4” , show=True)
動画ファイルを指定すれば、指定した動画で物体を検出してくれます。
最近のゲームのグラフィック性能はホント奇麗ですね。AIも人と間違えるほどのレベルです。
物体検出した結果の動画も保存できる。
save=True を追加するだけです。
どこに?
3行目です。
from ultralytics import YOLO
model = YOLO(“yolov8n.pt”)
results = model(0 , show=True, save=True)
実行すると、実行時のディレクトリに「runs」というフォルダが作成され、その配下に物体検出結果の動画を保存してくれます。
もう何でもありですね。本当に簡単に出来るようになりました。
これはもうAIエンジニアになるしかないでしょ!
これを知ったら、もうAIエンジニアになるしかないですね。
この程度のことが出来るだけで世間からすげ~と言われる職業が「AIエンジニア」です。
思い立ったが吉日です。もう始めるしかないです。
今回紹介したYOLOv8に限らず、色々なソースコードがそこら中に転がっているので、色々動かしながらAIの感覚を掴んでいけば、数カ月でAIエンジニアとしてやっていけるようになります。数式なんぞ必要ないです。
なにより、動かした数だけ会話が出来るようになります。
この会話ってのが重要で、
数多く動かしていれば、要望している性能をAIでクリア出来そうかどうかの判断が感覚値で掴めるようになります。
今回は画像処理メインで紹介しましたが、最近ではchatGPTを始めとした自然言語処理や画像生成ができるGANなんかも数多くのサイトで紹介されています。
是非色々参考にして、手を動かしながらAIエンジニアを目指して頂ければと思います。
python未経験に朗報!話題のYOLOv8が、たった3行でリアルタイム物体検出が出来るぞ!
を読ませて頂きました。
貴重な記事と動画をありがとうございます。
「動画の続きはこちら」をクリックすると、アクセスが拒否されてしまいます。
もし視聴可能でしたら方法を教えて頂きたいです。
よろしくお願いいたします。