SetFixPipeAddr

【免费下载链接】asc-devkit 本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。 【免费下载链接】asc-devkit 项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品

是否支持

Ascend 950PR/Ascend 950DT

x

Atlas A3 训练系列产品 / Atlas A3 推理系列产品

x

Atlas A2 训练系列产品 / Atlas A2 推理系列产品

x

功能说明

DataCopy(CO1->GM)过程中进行随路量化后,通过调用该接口设置Elementwise操作时LocalTensor的地址。

函数原型

template <typename T>
__aicore__ inline void SetFixPipeAddr(const LocalTensor<T>& eleWiseData, uint16_t c0ChStride)

参数说明

表 1 参数说明

参数名称

输入/输出

含义

eleWiseData

输入

L1 Buffer上的源操作数。类型为LocalTensor。

支持的TPosition为A1/B1/C1。起始地址需要保证32字节对齐,仅支持half数据类型。

c0ChStride

输入

L1 Buffer上的C0 channel stride,单位是C0_SIZE(32B)。

eleWiseData沿N方向以C0为单位切分得到的数据块称为C0 channel,两块C0 channel的间隔称之为C0 channel stride。

约束说明

返回值说明

调用示例

__aicore__inline void SetEleSrcPara(const LocalTensor <half>& eleWiseData, uint16_t c0ChStride)
{
    AscendC::SetFixPipeAddr(eleWiseData, c0ChStride);
}

【免费下载链接】asc-devkit 本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。 【免费下载链接】asc-devkit 项目地址: https://gitcode.com/cann/asc-devkit

Logo

欢迎加入 MCP 技术社区!与志同道合者携手前行,一同解锁 MCP 技术的无限可能!

更多推荐