3.3 检测Python模块和包

NOTE:此示例代码可以在 https://github.com/devcafe/cmake-cookbook/tree/v1.0/chapter-03/recipe-03 中找到,包含一个C++示例。该示例在CMake 3.5版(或更高版本)中是有效的,并且已经在GNU/Linux、macOS和Windows上进行过测试。

前面的示例中,我们演示了如何检测Python解释器,以及如何编译一个简单的C程序(嵌入Python解释器)。通常,代码将依赖于特定的Python模块,无论是Python工具、嵌入Python的程序,还是扩展Python的库。例如,科学界非常流行使用NumPy处理矩阵问题。依赖于Python模块或包的项目中,确定满足对这些Python模块的依赖非常重要。本示例将展示如何探测用户的环境,以找到特定的Python模块和包。

准备工作

我们将尝试在C++程序中嵌入一个稍微复杂一点的例子。这个示例再次引用Python在线文档,并展示了如何通过调用编译后的C++可执行文件,来执行用户定义的Python模块中的函数。

Python 3示例代码(Py3-pure-embedding.cpp)包含以下源代码(请参见https://docs.python.org/2/extending/embedding.html#pure-embedded 与Python 2代码等效):

  1. #include <Python.h>
  2. int main(int argc, char* argv[]) {
  3. PyObject* pName, * pModule, * pDict, * pFunc;
  4. PyObject* pArgs, * pValue;
  5. int i;
  6. if (argc < 3) {
  7. fprintf(stderr, "Usage: pure-embedding pythonfile funcname [args]\n");
  8. return 1;
  9. }
  10. Py_Initialize();
  11. PyRun_SimpleString("import sys");
  12. PyRun_SimpleString("sys.path.append(\".\")");
  13. pName = PyUnicode_DecodeFSDefault(argv[1]);
  14. /* Error checking of pName left out */
  15. pModule = PyImport_Import(pName);
  16. Py_DECREF(pName);
  17. if (pModule != NULL) {
  18. pFunc = PyObject_GetAttrString(pModule, argv[2]);
  19. /* pFunc is a new reference */
  20. if (pFunc && PyCallable_Check(pFunc)) {
  21. pArgs = PyTuple_New(argc - 3);
  22. for (i = 0; i < argc - 3; ++i) {
  23. pValue = PyLong_FromLong(atoi(argv[i + 3]));
  24. if (!pValue) {
  25. Py_DECREF(pArgs);
  26. Py_DECREF(pModule);
  27. fprintf(stderr, "Cannot convert argument\n");
  28. return 1;
  29. }
  30. /* pValue reference stolen here: */
  31. PyTuple_SetItem(pArgs, i, pValue);
  32. }
  33. pValue = PyObject_CallObject(pFunc, pArgs);
  34. Py_DECREF(pArgs);
  35. if (pValue != NULL) {
  36. printf("Result of call: %ld\n", PyLong_AsLong(pValue));
  37. Py_DECREF(pValue);
  38. }
  39. else {
  40. Py_DECREF(pFunc);
  41. Py_DECREF(pModule);
  42. PyErr_Print();
  43. fprintf(stderr, "Call failed\n");
  44. return 1;
  45. }
  46. }
  47. else {
  48. if (PyErr_Occurred())
  49. PyErr_Print();
  50. fprintf(stderr, "Cannot find function \"%s\"\n", argv[2]);
  51. }
  52. Py_XDECREF(pFunc);
  53. Py_DECREF(pModule);
  54. }
  55. else {
  56. PyErr_Print();
  57. fprintf(stderr, "Failed to load \"%s\"\n", argv[1]);
  58. return 1;
  59. }
  60. Py_Finalize();
  61. return 0;
  62. }

我们希望嵌入的Python代码(use_numpy.py)使用NumPy设置一个矩阵,所有矩阵元素都为1.0:

  1. import numpy as np
  2. def print_ones(rows, cols):
  3. A = np.ones(shape=(rows, cols), dtype=float)
  4. print(A)
  5. # we return the number of elements to verify
  6. # that the C++ code is able to receive return values
  7. num_elements = rows*cols
  8. return(num_elements)

具体实施

下面的代码中,我们能够使用CMake检查NumPy是否可用。我们需要确保Python解释器、头文件和库在系统上是可用的。然后,将再来确认NumPy的可用性:

  1. 首先,我们定义了最低CMake版本、项目名称、语言和C++标准:

    1. cmake_minimum_required(VERSION 3.5 FATAL_ERROR)
    2. project(recipe-03 LANGUAGES CXX)
    3. set(CMAKE_CXX_STANDARD 11)
    4. set(CMAKE_CXX_EXTENSIONS OFF)
    5. set(CMAKE_CXX_STANDARD_REQUIRED ON)
  2. 查找解释器、头文件和库的方法与前面的方法完全相同:

    1. find_package(PythonInterp REQUIRED)
    2. find_package(PythonLibs ${PYTHON_VERSION_MAJOR}.${PYTHON_VERSION_MINOR} EXACT REQUIRED)
  3. 正确打包的Python模块,指定安装位置和版本。可以在CMakeLists.txt中执行Python脚本进行探测:

    1. execute_process(
    2. COMMAND
    3. ${PYTHON_EXECUTABLE} "-c" "import re, numpy; print(re.compile('/__init__.py.*').sub('',numpy.__file__))"
    4. RESULT_VARIABLE _numpy_status
    5. OUTPUT_VARIABLE _numpy_location
    6. ERROR_QUIET
    7. OUTPUT_STRIP_TRAILING_WHITESPACE
    8. )
  4. 如果找到NumPy,则_numpy_status变量为整数,否则为错误的字符串,而_numpy_location将包含NumPy模块的路径。如果找到NumPy,则将它的位置保存到一个名为NumPy的新变量中。注意,新变量被缓存,这意味着CMake创建了一个持久性变量,用户稍后可以修改该变量:

    1. if(NOT _numpy_status)
    2. set(NumPy ${_numpy_location} CACHE STRING "Location of NumPy")
    3. endif()
  5. 下一步是检查模块的版本。同样,我们在CMakeLists.txt中施加了一些Python魔法,将版本保存到_numpy_version变量中:

    1. execute_process(
    2. COMMAND
    3. ${PYTHON_EXECUTABLE} "-c" "import numpy; print(numpy.__version__)"
    4. OUTPUT_VARIABLE _numpy_version
    5. ERROR_QUIET
    6. OUTPUT_STRIP_TRAILING_WHITESPACE
    7. )
  6. 最后,FindPackageHandleStandardArgs的CMake包以正确的格式设置NumPy_FOUND变量和输出信息:

    1. include(FindPackageHandleStandardArgs)
    2. find_package_handle_standard_args(NumPy
    3. FOUND_VAR NumPy_FOUND
    4. REQUIRED_VARS NumPy
    5. VERSION_VAR _numpy_version
    6. )
  7. 一旦正确的找到所有依赖项,我们就可以编译可执行文件,并将其链接到Python库:

    1. add_executable(pure-embedding "")
    2. target_sources(pure-embedding
    3. PRIVATE
    4. Py${PYTHON_VERSION_MAJOR}-pure-embedding.cpp
    5. )
    6. target_include_directories(pure-embedding
    7. PRIVATE
    8. ${PYTHON_INCLUDE_DIRS}
    9. )
    10. target_link_libraries(pure-embedding
    11. PRIVATE
    12. ${PYTHON_LIBRARIES}
    13. )
  8. 我们还必须保证use_numpy.pybuild目录中可用:

    1. add_custom_command(
    2. OUTPUT
    3. ${CMAKE_CURRENT_BINARY_DIR}/use_numpy.py
    4. COMMAND
    5. ${CMAKE_COMMAND} -E copy_if_different ${CMAKE_CURRENT_SOURCE_DIR}/use_numpy.py
    6. ${CMAKE_CURRENT_BINARY_DIR}/use_numpy.py
    7. DEPENDS
    8. ${CMAKE_CURRENT_SOURCE_DIR}/use_numpy.py
    9. )
    10. # make sure building pure-embedding triggers the above custom command
    11. target_sources(pure-embedding
    12. PRIVATE
    13. ${CMAKE_CURRENT_BINARY_DIR}/use_numpy.py
    14. )
  9. 现在,我们可以测试嵌入的代码:

    1. $ mkdir -p build
    2. $ cd build
    3. $ cmake ..
    4. -- ...
    5. -- Found PythonInterp: /usr/bin/python (found version "3.6.5")
    6. -- Found PythonLibs: /usr/lib/libpython3.6m.so (found suitable exact version "3.6.5")
    7. -- Found NumPy: /usr/lib/python3.6/site-packages/numpy (found version "1.14.3")
    8. $ cmake --build .
    9. $ ./pure-embedding use_numpy print_ones 2 3
    10. [[1. 1. 1.]
    11. [1. 1. 1.]]
    12. Result of call: 6

工作原理

例子中有三个新的CMake命令,需要include(FindPackageHandleStandardArgs)

  • execute_process
  • add_custom_command
  • find_package_handle_standard_args

execute_process将作为通过子进程执行一个或多个命令。最后,子进程返回值将保存到变量作为参数,传递给RESULT_VARIABLE,而管道标准输出和标准错误的内容将被保存到变量作为参数传递给OUTPUT_VARIABLEERROR_VARIABLEexecute_process可以执行任何操作,并使用它们的结果来推断系统配置。本例中,用它来确保NumPy可用,然后获得模块版本。

find_package_handle_standard_args提供了,用于处理与查找相关程序和库的标准工具。引用此命令时,可以正确的处理与版本相关的选项(REQUIREDEXACT),而无需更多的CMake代码。稍后将介绍QUIETCOMPONENTS选项。本示例中,使用了以下方法:

  1. include(FindPackageHandleStandardArgs)
  2. find_package_handle_standard_args(NumPy
  3. FOUND_VAR NumPy_FOUND
  4. REQUIRED_VARS NumPy
  5. VERSION_VAR _numpy_version
  6. )

所有必需的变量都设置为有效的文件路径(NumPy)后,发送到模块(NumPy_FOUND)。它还将版本保存在可传递的版本变量(_numpy_version)中并打印:

  1. -- Found NumPy: /usr/lib/python3.6/site-packages/numpy (found version "1.14.3")

目前的示例中,没有进一步使用这些变量。如果返回NumPy_FOUNDFALSE,则停止配置。

最后,将use_numpy.py复制到build目录,对代码进行注释:

  1. add_custom_command(
  2. OUTPUT
  3. ${CMAKE_CURRENT_BINARY_DIR}/use_numpy.py
  4. COMMAND
  5. ${CMAKE_COMMAND} -E copy_if_different ${CMAKE_CURRENT_SOURCE_DIR}/use_numpy.py
  6. ${CMAKE_CURRENT_BINARY_DIR}/use_numpy.py
  7. DEPENDS
  8. ${CMAKE_CURRENT_SOURCE_DIR}/use_numpy.py
  9. )
  10. target_sources(pure-embedding
  11. PRIVATE
  12. ${CMAKE_CURRENT_BINARY_DIR}/use_numpy.py
  13. )

我们也可以使用file(COPY…)命令来实现复制。这里,我们选择使用add_custom_command,来确保文件在每次更改时都会被复制,而不仅仅是第一次运行配置时。我们将在第5章更详细地讨论add_custom_command。还要注意target_sources命令,它将依赖项添加到${CMAKE_CURRENT_BINARY_DIR}/use_numpy.py;这样做是为了确保构建目标,能够触发之前的命令。