SetFixSplit

【免费下载链接】asc-devkit 本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。 【免费下载链接】asc-devkit 项目地址: https://gitcode.com/cann/asc-devkit

功能说明

设置固定的baseM、baseN、baseK,单位为元素个数。

函数原型

int32_t SetFixSplit(int32_t baseMIn = -1, int32_t baseNIn = -1, int32_t baseKIn = -1)

参数说明

表 1 参数说明

参数名

输入/输出

描述

baseMIn

输入

设置固定的baseM,默认值为-1,表示不设置固定baseM,由tiling函数进行计算。

baseNIn

输入

设置固定的baseN,默认值为-1,表示不设置固定baseN,由tiling函数进行计算。

baseKIn

输入

当前仅支持取值为-1,暂不支持设置其它值。

返回值说明

-1表示设置失败;0表示设置成功。

约束说明

  • baseM*baseN个输出元素所占的存储空间大小不能超过L0C Buffer大小,即baseM * baseN * sizeof(C_TYPE) <= L0CSize。
  • baseM需要小于等于singleM按16个元素向上对齐后的值(如ceil(singleM/16)*16),baseN需要小于等于singleN以C0_size个元素向上对齐的值,其中singleM为单核内M轴长度,singleN为单核内N轴长度,half/bfloat16_t数据类型的C0_size为16,float数据类型的C0_size为8,int8_t数据类型的C0_size为32,int4b_t数据类型的C0_size为64。例如singleM=12,则baseM需要小于等于16,同时baseM需要满足分形对齐的要求,所以baseM只能取16;如果baseM取其他超过16的值,获取Tiling将失败。

调用示例

auto ascendcPlatform = platform_ascendc::PlatformAscendC(context->GetPlatformInfo());
matmul_tiling::MatmulApiTiling tiling(ascendcPlatform); 

tiling.SetFixSplit(16, 16, -1);  // 设置固定的baseM、baseN

【免费下载链接】asc-devkit 本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。 【免费下载链接】asc-devkit 项目地址: https://gitcode.com/cann/asc-devkit

Logo

欢迎加入 MCP 技术社区!与志同道合者携手前行,一同解锁 MCP 技术的无限可能!

更多推荐