新闻

PPI学术讲座0523 | oneDNNGraph接口和编译技术

发布时间:2024-05-21浏览次数:10

李剑

间:5月23期四15:00

点:B415

题目:oneDNNGraph接口和编译技术 

摘要

  随着深度学习模型的快速发展和硬件对密集计算的支持,深度学习工作负载特性从少数热点计算转换到广泛分布在模型各处的操作。在这种情况下,利用专家调优的原语库来加速少数计算密集型操作不再能充分利用AI硬件的性能潜力。深度神经网络(DNN)图编译的最大挑战是通过为密集计算密集型操作生成专家级性能代码,并在跨多个计算密集型操作的DNN计算图范围内应用编译优化来实现高性能张量编译。

  我们提出了oneDNN Graph编译器,采用了从编译器优化和专家调优内核两方面技术的混合方法,用于生成深度神经网络图的高性能代码。oneDNN Graph编译器解决了深度学习领域的独特优化挑战,如低精度计算、图操作的激进融合、静态张量形状和内存布局的优化、常数权重优化以及内存缓冲区重用。实验结果表明,在英特尔至强可扩展处理器上,与现有的张量编译器和原语库相比,oneDNN Graph编译器在性能关键的DNN计算图和端到端模型上实现了显著的性能提升。



李剑慧,英特尔软件和先进技术事业部高级首席Al工程师,领导深度学习编译,底层软件库开发,框架集成和工作负载优化。他曾是二进制翻译和JIT编译器方面的主要软件开发人员。领导开发 Houdini二进制翻译器,在英特尔架构平台上透明地运行 Android*ARM应用。主导设计oneDNNGraph接口和编译器,MLIR XeGPU方言, 并在英特尔架构优化Pytorch和Triton。毕业于复旦大学,获计算机科学博士学位,发表有二十多项美国专利和二十篇学术论文。


位:

                据基础系统软件研究所

人:鲁云萍 luyping@fudan.edu.cn