numpy 以浮点型( float32 )来保存,然后 C++以浮点型( float )可以正常读取数值。 为了减少保存文件的大小以半精度浮点型来保存的话,无法读取到正确的数值。 请问有知道 C++的读取问题出在哪里吗?
用 Python 保存 npy 文件
import numpy as np
outputDirectory = './t.npy'
data = [1] * (5)
# npData = np.array(data, dtype=np.float32).reshape(5)
npData = np.array(data, dtype=np.float16).reshape(5)
np.save(outputDirectory, npData)
用 C++来读取 npy 文件 ※参照以下库的写法 https://github.com/llohse/libnpy/blob/master/include/npy.hpp#L554
// ・・・
// read the data
//stream.read(reinterpret_cast<char*>(data.data()), sizeof(Scalar) * size);
stream.read(reinterpret_cast<char*>(data.data()), 2 * 3);
下面是测试代码片段 ・59957800大小的npy数组不论float16还是32Python的numpy来load的话仅需0.047s ・float32型npy通过C++来读取需要0.115s(增加近两倍) ・float16型npy通过C++来读取+转换需要1.7s(增加近35倍) 从结论来看npy以float32来保存还比较实用。
std::vector<float> data;
int total = 59957800;
data.resize(total);
// float32型npy(二维数组214135 * 280)⇒用Python的numpy来load的话仅需0.047s
// stream.read(reinterpret_cast<char*>(&data[0]), 4 * total);
// ⇒用时0.115s
// float16型npy(二维数组214135 * 280)⇒用Python的numpy来load的话跟32bit一样仅需0.047s
uint16_t f16;
for (int i = 0; i <= total; i = i + 1)
{
stream.read(reinterpret_cast<char*>(&f16), 2);
// https://www.programiz.com/cpp-programming/online-compiler/
data[i] = float16_to_float32(f16);
}
// ⇒用时1.7s
1
lonewolfakela 2022-12-02 14:12:54 +08:00
你这个 data vector 里的 Scalar 是啥类型呢
|
2
sunhk25 OP |
3
lonewolfakela 2022-12-02 14:25:55 +08:00
你把 16 位的数据塞进 32 位 float 的 vector 当然没法得到正确数据啦
|
4
tool2d 2022-12-02 14:50:49 +08:00
需要用 gcc 编译,VC 并不支持 float16 硬件类型。
https://gcc.gnu.org/onlinedocs/gcc/Half-Precision.html 在 x86 上,如果没开 mavx512fp16 ,就是纯软件的 float16 ,计算速度会相当慢。不如转换到 float32 。 |
5
sunhk25 OP @lonewolfakela
16 位的数据时我读取的时候指定的大小是 2 ( float 的时候 sizeof 是 4 ) |
6
lonewolfakela 2022-12-02 15:07:23 +08:00
@sunhk25 #5 你指定大小是 2 它也对不了啊,两个 float16 被你塞到一个 float32 里去了你觉得你能读出来什么呢……
|
7
sunhk25 OP @tool2d
Python 里 float16 和 float32 的计算速度之前有过比较没有变慢所以才想到保存为半精度也没有问题。 想着用 C++来再提高下速度,就遇到了这个问题了。 gcc 编译的话好像挺麻烦的样子 我了解了解。 |
8
sunhk25 OP |
9
kirory 2022-12-03 00:13:20 +08:00
可以提出指数和小数部分之后再放到 float 里
|
10
kirory 2022-12-03 00:53:25 +08:00 1
|
11
sunhk25 OP |
14
c0xt30a 2022-12-17 09:38:37 +08:00 1
OP 为啥不直接 dump 内存?
array.tofile( ... ) array.fromfile( ... ) 就可以了啊 C++ 里也是类似处理 |
15
sunhk25 OP @c0xt30a numpy 按 16bit 的 array 数组存到文件,然后 c++dump 这个文件后,数组再转换到 float ?这个方案可以参考下。
|
16
hunk 2023-01-07 15:31:54 +08:00
新手小白插一句,浮点真的比较坑,最近看华泰的 sdk 学到一招,浮点数统统乘 1000 ,瞬间安静。
仅供参考。 |