Python:将 SwigPythonObject 转换为 PythonObject

Python: Cast SwigPythonObject to Python Object

我正在使用一些封闭的 Python 模块:我可以通过 API 调用方法,但我无法访问实现。我知道这个模块基本上包装了一些 C++ 代码。

所以方法之一 return 值类型是 SwigPythonObject。假设我没有模块分发者提供的任何其他帮助,也没有文档,我以后如何使用这个对象?

我想以某种方式将他转换为 "regular" python 对象并在内部成员结构的调试器中观察他。

目前我在调试器中看到的是这样的:

{SwigPythonObject} _<hexa number>_p_unsigned_char

有点不清楚您所问内容的语义,但基本上您似乎已经从 SWIG 获得了一个指向您想要使用的 unsigned char 的指针。稍微猜测一下,您可能会遇到以下 3 种情况:

  1. 指针确实是指向单个无符号字节的指针
  2. 该指针是指向以 null 结尾的字符串的指针。 (为什么它不只是包装成一个字符串?)
  3. 指针指向一个固定长度的无符号字节数组。 (你需要 know/guess 长度)

在这个特定的实例中,因为对于所有三种情况都无需担心打包或对齐,我们实际上可以为上述所有情况编写一些东西,使用 ctypes 将 SWIG 引用的内存直接读入 Python并绕过 SWIG 代理。 (请注意,如果我们正在查看的类型比指向单个内置类型或它们的数组的指针更复杂,我们将无法在这里做很多事情)

首先用 C 编写一些代码 - test.h 来练习我们正在做的事情:

inline unsigned char *test_str() {
  static unsigned char data[] = "HELLO WORLD";
  return data;
}

inline unsigned char *test_byte() {
  static unsigned char val = 66;
  return &val;
}

接下来是包装这个的最小 SWIG 模块:

%module test

%{
#include "test.h"
%}

%include "test.h"

我们可以在 ipython 中查看它并看到它被包装(类似地)到 你观察到的:

In [1]: import test

In [2]: test.test_byte()
Out[2]: <Swig Object of type 'unsigned char *' at 0x7fc2851cbde0>

In [3]: test.test_str()
Out[3]: <Swig Object of type 'unsigned char *' at 0x7fc2851cbe70>

In [4]: hex(int(test.test_str()))
Out[4]: '0x7f905b0e72cd'

我们在每种情况下使用的是调用 int(x) 的事实,其中 x 是我们未知的 SWIG unsigned char 指针,为我们提供了指针指向的地址值作为整数。结合 ctype 的 from_address 静态方法,我们可以构造 ctypes 实例来直接访问 SWIG 知道的内存。 (注意:调用 int() 返回的地址与字符串表示中的地址不匹配,因为前者是指向的数据的真实地址,而后者是 SWIG 的地址代理 对象)

可能最简单的包装是固定长度的情况——我们可以通过在正确大小的 c_ubyte 上使用 * 运算符创建一个 ctypes 类型,然后调用 from_address

对于以 null 结尾的字符串,我们实际上有两个选择:要么使用 libc strlen 函数计算出字符串长度,然后构造一个匹配的 ctypes 类型,要么从 Python 直到我们遇到空值。我在下面的示例中选择了后者,因为它更简单。我可能通过使用生成器和 itertools.count() 来跟踪位置而使它过于复杂。

最后,对于指向单字节情况的指针,我基本上重用了现有的 ctypes 类型,我必须创建一个 1 字节数组并从中读取值。可能有一种方法可以使用 ctypes.POINTER(ctypes.c_ubyte) 然后 .contents 从地址构造类型,但我无法快速看到它,因此使用 1 字节数组技巧使它对我来说变得微不足道。

所有这些结合起来得到以下 Python 代码:

import ctypes
import test
import itertools

# Case 2
def swig_to_str(s):
  base = int(s)
  ty = ctypes.c_ubyte*1
  def impl():
    for x in itertools.count():
      v=ty.from_address(base+x)[0]
      if not v: return
      yield chr(v)
  return ''.join(impl())

# Case 1
def swig_to_byte(b):
  ty=ctypes.c_ubyte*1
  v=ty.from_address(int(b))
  return v[0]

# Case 3
def swig_to_fixed_len(s, l):
  ty=ctypes.c_ubyte*l
  return ''.join(chr(x) for x in ty.from_address(int(s)))

t=test.test_str()
print(t)
print(swig_to_str(t))
print(swig_to_fixed_len(t,5))

u=test.test_byte()
print(u)
print(swig_to_byte(u))

这 运行 正如 Python 2.7 所希望的那样(应该花费最少的努力使其对 3 正确):

swig3.0 -python -Wall test.i
gcc -std=gnu99 -Wall test_wrap.c -o  _test.so -shared -I/usr/include/python2.7/ -fPIC
python run.py 

<Swig Object of type 'unsigned char *' at 0x7f4a57581cf0>
HELLO WORLD
HELLO
<Swig Object of type 'unsigned char *' at 0x7f4a57581de0>
66