【Triton 教程】triton.heuristics

2025-05-17 0 850

Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN 计算内核,并能够在现代 GPU 硬件上以最大吞吐量运行。

更多 Triton 中文文档可访问 →https://triton.hyper.ai/

triton.heuristics(values)
用于指定如何计算某些元参数值的装饰器。这在自动调优成本过高或不适用的情况下非常有用。

@triton.heuristics(values={'BLOCK_SIZE': lambda args: 2 ** int(math.ceil(math.log2(args[1])))})
@triton.jit
def kernel(x_ptr, x_size, **META):
    BLOCK_SIZE = META['BLOCK_SIZE'] # smallest power-of-two >= x_size  最小的 2 的幂 >= x_size

values (dict[str, Callable[[list[Any]], Any]]**) – 包含元参数名称和计算元参数值的函数的字典。每个这样的函数都接受一个位置参数列表作为输入。

相关文章

发表评论
暂无评论
  • 167553 +

    访问总数

  • 6766 +

    会员总数

  • 267 +

    商品总数

  • 0 +

    今日发布

  • 0 +

    本周发布

  • 92 +

    运行天数

壹快网与你10年之约,你的前景远超我们想象