現在は画像認識はデープラーニングの中身は知らなくても、アプリケーションは割と簡単に構築できるようになっています。
ハードもエッジ的に使えるものが出てきているので、こういうものを使うことでアプリケーションに画像認識機能を取り込むことができます。
現在割とメジャーなものはM5stackから販売されているUnitV2 AI cameraでしょう。
コストの高い学習はクラウド側で実行して、エッジ側は認識処理を実行するというような分担になっています。
いくつかの学習データ、さらには標準的なアプリケーションも組み込まれているので、つなぐだけで(Linuxはドライバ不要、Windows/Macは専用のドライバインストール)物体認識や、顔抽出などの機能がブラウザから実現できます。
https://notenoughtech.com/home-automation/m5stack-unitv2/
Linuxで動いているので、sshでログオンすればさまざまな機能が使えます。
<sshログオン方法>
ssh m5stack@10.254.239.1
//user: m5stack
//pwd: 12345678
//user: root
//pwd: 7d219bec161177ba75689e71edc1835422b87be17bf92c3ff527b35052bf7d1f
<認識結果の出力>
認識結果はブラウザでデフォルト画面を立ち上げると、バックグランドでjson形式で送付されるので、M5stackやラズパイなどでも扱うことができるようになります。
M5stackと接続するにはいろいろな方法がありそうですが、M5stack経由で電源も供給できるということを考えるとgroveコネクタ経由のシリアル通信が適切だと思います。
https://github.com/chateight/UnitV2_camera/tree/master/src
にシリアルインターフェース経由でUnitV2のデフォルトであるブラウザ画面で”Face_recognition”モードを設定して、顔を登録して出力される認識結果のjsonデータを受信しているコードです。