nlflw 发表于 2024-4-17 08:32:35

期货量化交易软件在 ONNX 模型中使用 float16 和 float8 格式

1. ONNX模型中使用的新数据类型为了加快计算速度,一些模型使用精度较低的数据类型,如Float16甚至Float8。添加了对这些新数据类型的支持,以便与MQL5语言中的ONNX模型一起使用,从而允许操作8位和16位浮点表示。脚本输出ENUM_ONNX_DATA_TYPE枚举的完整元素列表。//+------------------------------------------------------------------+//|                                              ONNX_Data_Types.mq5 |//|                                  Copyright 2024, MetaQuotes Ltd. |//|                                             https://www.mql5.com |//+------------------------------------------------------------------+#property copyright "Copyright 2024, MetaQuotes Ltd."#property link      "https://www.mql5.com"#property version   "1.00"//+------------------------------------------------------------------+//| Script program start function                                    |//+------------------------------------------------------------------+void OnStart(){//---   for(int i=0; i<21; i++)      PrintFormat("%2d %s",i,EnumToString(ENUM_ONNX_DATA_TYPE(i)));}输出: 0: ONNX_DATA_TYPE_UNDEFINED 1: ONNX_DATA_TYPE_FLOAT 2: ONNX_DATA_TYPE_UINT8 3: ONNX_DATA_TYPE_INT8 4: ONNX_DATA_TYPE_UINT16 5: ONNX_DATA_TYPE_INT16 6: ONNX_DATA_TYPE_INT32 7: ONNX_DATA_TYPE_INT64 8: ONNX_DATA_TYPE_STRING 9: ONNX_DATA_TYPE_BOOL10: ONNX_DATA_TYPE_FLOAT1611: ONNX_DATA_TYPE_DOUBLE12: ONNX_DATA_TYPE_UINT3213: ONNX_DATA_TYPE_UINT6414: ONNX_DATA_TYPE_COMPLEX6415: ONNX_DATA_TYPE_COMPLEX12816: ONNX_DATA_TYPE_BFLOAT1617: ONNX_DATA_TYPE_FLOAT8E4M3FN18: ONNX_DATA_TYPE_FLOAT8E4M3FNUZ19: ONNX_DATA_TYPE_FLOAT8E5M220: ONNX_DATA_TYPE_FLOAT8E5M2FNUZ因此,现在可以执行使用此类数据的ONNX模型。此外,在MQL5中,还添加了用于数据转换的附加函数:bool ArrayToFP16(ushort &dst_array[],const float &src_array[],ENUM_FLOAT16_FORMAT fmt);bool ArrayToFP16(ushort &dst_array[],const double &src_array[],ENUM_FLOAT16_FORMAT fmt);bool ArrayToFP8(uchar &dst_array[],const float &src_array[],ENUM_FLOAT8_FORMAT fmt);bool ArrayToFP8(uchar &dst_array[],const double &src_array[],ENUM_FLOAT8_FORMAT fmt);bool ArrayFromFP16(float &dst_array[],const ushort &src_array[],ENUM_FLOAT16_FORMAT fmt);bool ArrayFromFP16(double &dst_array[],const ushort &src_array[],ENUM_FLOAT16_FORMAT fmt);bool ArrayFromFP8(float &dst_array[],const uchar &src_array[],ENUM_FLOAT8_FORMAT fmt);bool ArrayFromFP8(double &dst_array[],const uchar &src_array[],ENUM_FLOAT8_FORMAT fmt);由于16位和8位的浮点格式可能不同,转换函数中的“fmt”参数必须指定需要处理的数字格式。对于16位版本,将使用新的ENUM_FLOAT16_FORMAT枚举,该枚举当前具有以下值:
FLOAT_FP16 - 标准的16位格式,也称为半浮点。
FLOAT_BFP16 - 特殊的脑浮点浮点格式。
对于8位版本,将使用新的ENUM_FLOAT8_FORMAT枚举,该枚举当前具有以下值:
FLOAT_FP8_E4M3FN—8位浮点数、4位指数和3位尾数。通常用作系数。
FLOAT_FP8_E4M3FNUZ—8位浮点数、4位指数和3位尾数。支持NaN,不支持负零和Inf。通常用作系数。
FLOAT_FP8_E5M2FN — 8位浮点数、5位指数和2位尾数。支持NaN和Inf。通常用于梯度。
FLOAT_FP8_E5M2FNUZ — 8位浮点数、5位指数和2位尾数。支持NaN和Inf,不支持负零。也用于梯度。
1.1. FP16格式FLOAT16和BFLOAT16格式是用于表示浮点数的数据类型。FLOAT16,也称为“半精度浮点”格式,使用16位表示浮点数。这种格式提供了精度和计算效率之间的平衡。FLOAT16广泛用于深度学习和神经网络,在处理大量数据时需要高性能。这种格式允许通过减少数字的大小来加速计算,这在图形处理单元(GPU)上训练深度神经网络时尤为重要。BFLOAT16(或 脑浮点16)也使用16位,但它与FLOAT16的不同之处在于表示数字的方式。在这种格式中,8个比特被分配用于表示指数,其余7个比特用于表示尾数。这种格式是为用于深度学习和人工智能而开发的,尤其是在谷歌张量处理单元(Tensor Processing Unit,TPU)处理器中。BFLOAT16在训练神经网络时提供了良好的性能,并且可以有效地用于加速计算这两种格式都有其优点和局限性。FLOAT16提供了更高的精度,但需要更多的资源用于存储和计算。另一方面,BFLOAT16在处理数据时提供了更高的性能和效率,但可能不那么精确。

添加图片注释,不超过 140 字(可选)图 1. 浮点数字FLOAT16和BFLOAT16的位表示格式

添加图片注释,不超过 140 字(可选)
表 1. FLOAT16格式的浮点数字
1.1.1. FLOAT16 ONNX Cast 运算符的执行测试作为示例,让赫兹量化交易软件考虑将FLOAT16类型的数据转换为float和double类型的任务。带有Cast操作的ONNX模型:
添加图片注释,不超过 140 字(可选)
图 2. 模型 test_cast_FLOAT16_to_DUBLE.onnx 的输入和输出参数

添加图片注释,不超过 140 字(可选)
图 3. 模型 test_cast_FLOAT16_to_FLOAT.onx 的输入和输出参数
从ONNX模型的属性描述中可以看出,输入需要ONNX_data_type_FLOAT16类型的数据,并且模型将返回ONNX_data_type_FLOAT格式的输出数据。要转换这些值,赫兹量化交易软件将使用带有FLOAT_FP16参数的函数ArrayToFP16()和ArrayFromFP16()。
页: [1]
查看完整版本: 期货量化交易软件在 ONNX 模型中使用 float16 和 float8 格式