PyBind11 for c++

c++の高速性が必要でなおかつ、Pythonの書きやすさが必要な場合にはPythonからc++の処理の呼び出しが必要です。

いろいろな方法がありそうですが、PyBind11は2011年ごろに登場と比較的に新しく、それ故に機能も洗練されているだろうから動かしてみた。

ネットにも情報が多いから問題解決が難しくないだろうと思う。

<本家>

https://pybind11.readthedocs.io/en/stable/index.html#

“pybind11 is a lightweight header-only library that exposes C++ types in Python and vice versa,”

とあるようにpythonからc++も呼べるし、逆もまた可なりのヘッダーファイルライブラリにすぎないと。

<install>

$ pip3 install pybind11

—Installed path—

/Library/Frameworks/Python.framework/Versions/3.10/lib/python3.10/site-packages/pybind11/include/pybind11

<sample program & compile>

https://qiita.com/takuyakubo/items/b7503d7555bbc6c44aba

このリンク先にある、以下のclangコンパイルで作成できた。本家のドキュメントと全く同じですが。

% clang++ -O3 -Wall -shared -std=c++17 -fPIC `python -m pybind11 –includes` -undefined dynamic_lookup py_call.cpp -o example`python3-config –extension-suffix`

『コンパイラオプションは、最適化(-O3)、共有ライブラリとしてビルド(-shared -fPIC)、言語標準の指定(-std=c+17)、インクルードディレクトリの追加( `python3 -m pybind11 –includes`)、コンパイル対象(py_call.cpp)、出力(cpplcm`python3-config –extension-suffix`)となります』

https://buildersbox.corp-sansan.com/entry/2019/12/09/110000

の説明から引用。

<sample code : py_call.cpp>

PYBIND11_MODULE以下がマクロで、pybind11で解釈されます。

m.def()中の”add”はPythonから呼び出される時の関数名で、&addはint add()関数がそれに相当すると定義しています。

#include <pybind11/pybind11.h>

int add(int i, int j) {

  return i + j;

}

PYBIND11_MODULE(example, m) {

  m.doc() = "pybind11 example plugin";                          // optional module docstring

  m.def("add", &add, "A function which adds two numbers");

}


<call from python>

コマンドラインで実行して、import exampleが実行できればモジュールが作成できています。

% python

Python 3.10.3 (v3.10.3:a342a49189, Mar 16 2022, 09:34:18) [Clang 13.0.0 (clang-1300.0.29.30)] on darwin

Type "help", "copyright", "credits" or "license" for more information.

>>> import example

>>> example.__doc__

'pybind11 example plugin'

>>> example.add(24, 43)

67

作成されるのは、共有ライブラリファイルで、”example.cpython-310-darwin.so“がPythonから呼び出されるファイルになります。MacOSなのでこんな名前になります。Pythonも実装はcだから、インターフェースは出来て当たり前ということでしょう。

-rwxr-xr-x   1 hogehoge  staff  148016  4 28 10:07 example.cpython-310-darwin.so

このケースは一番単純な機能確認ですが、実際には配列などを引数にするときにはc++とPython間で何らかの変換が必要になるでしょう。

 

admin

‘wchar.h’ file not found #include_next

久々CMake使おうとしたら、buildでこのようなエラーが発生。

解決方法は、

https://qiita.com/m0n0/items/b13998de1da4c7c1964d

中にある、

% make SDKROOT=`xcrun --show-sdk-path` MACOSX_DEPLOYMENT_TARGET=
[ 33%] Building CXX object CMakeFiles/main.dir/main.cpp.o
[ 66%] Building CXX object CMakeFiles/main.dir/header.cpp.o
[100%] Linking CXX executable main
[100%] Built target main

を実行すると解決。Xcodeに関連するようで、おそらくMacOSのアップデートと関係するようです。

以前のcmake記事

https://isehara-3lv.sakura.ne.jp/blog/2022/03/03/cmakec-ビルドツール/

 

admin

VScodeでPyGame動作

コマンドラインからでなく、VScode環境で動かそうとすると、

import pygame

のリンクが見つからないとなる。

実行すると問題なく実行されるので、エディタ環境と実行環境でPythonのパスが違うようです。

 

“PYTHON : ENVIROMENTS” (Pythonマーククリック)

で、”Set as active workplace interpretor”でコンソールから実行する最新版数を設定したらimport pygameのリンク見つからないエラーは消えました。

 

admin

c++とPythonの実行速度差

ほんの一面に過ぎませんが、速度比較をしてみた。

やってみたことは整数100万までの素数を求める。ロジックはどちらも同じで平方根までの割り算でどこかで割り切れる(非素数)で判定、割り切れた時点で素数では無いから計算量削減のため打ち切り、しています。求めた素数はvector(c++)、list(python)に保存しています。

計算量(時間)は一桁増えるとほぼ30倍(10の2分の3乗)になるから、桁数の多い因数分解の計算量を現在の暗号原理とするのも理解できます。

<c++ code>

sqrtは本来は不動小数点ですが、clang +17では暗黙変換(出力も)されてます。コンパイラによってはエラーになるかも知れない。

#include <iostream>
#include <chrono>
#include <cmath>
#include <vector>

int main(){

int sqt;
bool flag;
std::vector vec{};

std::chrono::system_clock::time_point  start, end;
start = std::chrono::system_clock::now();

for (int i = 2; i <= 1000000; ++i){         // check prime numbers
    flag = false;
    sqt = sqrt(i);
    for (int j = 2; j <= sqt; ++j){
        if (i%j == 0){
            flag = true;
            break;
        }
    } 
    if (flag != true){
        vec.push_back(i);
    }
}

end = std::chrono::system_clock::now();
double elapsed = std::chrono::duration_cast(end-start).count();
std::cout << "elapsed time : " << elapsed << " ms" << std::endl;

std::cout << std::endl;
std::cout << "number of prime integers(up to 1M) : " << vec.size() << std::endl;
std::cout << std::endl;
std::cout << "last five prime integers " << std::endl;

for (auto itr = (vec.end() - 5); itr != vec.end(); ++itr){
    std::cout << *itr << std::endl;
}
}


<Python code>

c++とpython(for in range)ではループの上限値の捉え方が違うのでループ回数に+1しないと正しい結果が出ない。

それは、内部ループのforで素数の二乗(例えば9, 25, 49)が素数判定されてしまうから。

import time
import math

start = time.time()
set = list()

flag = False
sqt = 0;
for i in range(2, 1000001):        # check prime numbers
    flag = False;
    sqt = math.sqrt(i)
    for j in range(2, int(sqt) + 1):
        if i%j == 0:
            flag = True
            break
    if flag != True:
        set.append(i)


end = time.time()
print("elapsed time : ",'{:.0f}'.format((end-start)*1000)+ " ms")
print("number of prime integers(up to 1M) : ",len(set))
print("")
print("last five prime integers")
for i in range(5):
    print(set[-5 + i])

以下に最後部分の素数と実行時間を記載しています。

c++

elapsed time : 268 ms

number of prime integers(up to 1M) : 78498

last five prime integers 
999953
999959
999961
999979
999983


Python

elapsed time :  9433 ms
number of prime integers(up to 1M) :  78498

last five prime integers
999953
999959
999961
999979
999983

その差はおよそ40倍近くc++の方が高速で、実際のアプリでの体感速度ももちろん種類によるけど、概ね一桁は違うんだろうと思う。

もちろんPythonも全てインタプリタ処理されるわけではなく、例えばループ処理はキャッシュされているだろうけど、やはり実行効率は比較にならない。

 

admin

PyGame(pythonのゲームライブラリ)

Pythonでゲームを作るというのは、他の言語を使うよりは相対的な敷居は低そうです。Python自体にすでに豊富なライブラリもあるから。PyGameはゲームエンジンというよりはゲームライブラリで、ゲームに必要なGUIとかボタン処理(event listener)、あるいは計算量の多い処理をライブラリ化することで、Pythonでのゲーム作成を簡単にできるようにしてくれます。

・本家

https://www.pygame.org/news

取っ掛かりのページ、

IMG_0425.PNG

・PyGameをインストール

% pip3 install pygame    

python起動して、

>>> import pygame

が問題なければ正常にインストールされてます。

・サンプルプログラム

https://www.pygame.org/download.shtml

からダウンロードして、tar.gzを解凍するとsamplesディレクトリがあるのでそれを持ってくる。

Numpyとpyopenglが必要なサンプルあったのでインストール。

% pip3 install numpy

% pip3 install PyOpenGL

Pythonとゲームの構造の両方を習得できるから良いツールでは無いかと思う。

 

admin

Unit V2カメラ Mac OSでの接続

今までMac OSだと、ドライバー必要と思っていたけど、以下のやり方でドライバーは入れなくても使えます。

Linuxのように完全に手続き不要ではなく、ifconfigで接続先を切り替える方法です。

ifconfig(部分)で以下のようなメッセージが出てますが、

en6: flags=8863<UP,BROADCAST,SMART,RUNNING,SIMPLEX,MULTICAST> mtu 1500
	options=6467<RXCSUM,TXCSUM,VLAN_MTU,TSO4,TSO6,CHANNEL_IO,PARTIAL_CSUM,ZE
 % sudo ifconfig en6 down
 % sudo ifconfig en6 up  

のように入力するとUnit V2に接続されるので、Chromeからhttp://10.254.239.1/

を入力すれば管理画面が出てきます。

参考は、https://qiita.com/kowloon/items/99073be408f6432711aad

です。

 

admin

通読完了(modernized c++)

以下の二つのブログで言及してますが、『独習C++』をVScode環境で動作させながら完了。

通読してみることにした

c++の仕様が巨大化していく理由

おそらくこの本の目的とするところは、APIドキュメントの意味を理解できることができるようになることだろうだし、実用的にもほぼこの範囲でカバーできるはず。

上のブログと同じくC++が必要とされる領域は、ハードウェアリソースが限定される領域と、速度優先の領域だろう。例えば自動運転とかはリアルタイム性が必要条件だから、スクリプト言語を車で使えそうなのはエンタメぐらいだろうから。

 

admin

 

 

色々な規格が追加になっている

家電製品の規格はそれほど気にしたことはなかったけれども、Bluesound Nodeで初めて目にした規格を列挙してみる。

① MQA

ちょっと見は圧縮方式のように見えるけれども、ロスレスだから両方向で変換できるんだろう。割とホットのようで、NodeのチャネルでもMQA対応チャネルがあって、CD品質以上が確保できるようです。(添付の仕様では記載されてません)

 

② aptXおよびaptX HD

Bluetoothは音はそれなりの印象しか持ってなかったけれども、一番大きいのはワイヤレスイヤホンの普及だろうけど、クアルコムが定義した高品質音声伝送規約で可逆圧縮方式です。

 

③ eARC

テレビのハイレゾ対応規格と思えばよさそう。HDMI経由で伝送されるが、ケーブルはHDMI2.1対応でないと適応できません

 

admin

Airplay@Bluesound Node

Apple製品でWi-Fiで音声や画像(aiplay2)を他のデバイスに飛ばす規格ですが、Bluesound Nodeもサポートしているので、Macの画面上からは写真のように(Nodeはホームシアターに名称設定)見えます。

Airplayさせると、Nodeで再生中の音源は中断されますが、それは仕様としては正しいだろうと思う。

 

admin

Macbookでキーボードの英字とひらがな切り替えできない

英語キーボード使っていて、karabiner使ってデフォルトの左右の『コマンドキー』に切り替えを割り当てていますが、切り替えできなくなることが2〜3回発生。おそらくOSアップデートと関係ありそうです。

対応はリブートしなくとも、karabinerの終了/再起動で復活はします。今度発生したらevent viewerで見てみようと思います。

 

P.S.

再発して、karabiner再起動でも復旧せず、ログ見るとキーからはちゃんと入力を受け取っているから再起動対応(@2022/4/15)

 

P.S.

やはり時々発生するけれども、LCD閉じて開いて再度ロック解除するとほとんどの確率で復旧するから、これが一番簡単な回避方法(@2022/5)

 

admin