OpenAITriton已开始合并AMDROCm代码,9月20日举行开发
2023-09-05 14:09 来源:IT之家 阅读量:7698
,Triton 是一种类似于 Python 的开源编程语言,它可以使没有 CUDA 经验的研究人员顺利编写高效的 GPU 代码,而且号称小白也可以写出与专业人士相媲美的代码,就是让用户用相对较少的努力实现最高的硬件性能,但 Triton 初期只支持英伟达 GPU。
OpenAI 声称:Triton 只要 25 行代码,就能在 FP16 矩阵乘法上达到与 cuBLAS 相当的性能。
从 Github 我们可以看到,OpenAI 已经开始在最新的Triton 版本中合并 AMD ROCm 相关分支代码,也正因此暴露了很多东西。也就是说,最新 Triton 后端已适配 AMD 平台,可谓意义重大。
通过官方的说法来看,他们已经通过了“test_core.py”上的大多数单元测试环节,但由于各种原因跳过了一些测试。
IT之家注意到,OpenAI 还宣布将于 9 月 20 日上午 10 点至下午 4 点在加利福尼亚州山景城的微软硅谷园区举行 Triton 开发者大会,而日程安排中就包括“将 Triton 引入 AMD GPU”和“Triton 的英特尔 XPU”两大环节,预计 Triton 将很快摆脱英伟达 CUDA 垄断的历史。
值得一提的是,Triton 是开源的,比起闭源的 CUDA,其他硬件加速器能直接集成到 Triton 中,大大减少了为新硬件建立 AI 编译器栈的时间。
在此前发布的 PyTorch 2.0 版本中,TorchInductor 便引入了 OpenAI Triton 支持,可为多个加速器和后端自动生成快速代码,同时实现用 Python 取代 CUDA 编程来写底层硬件的代码。也就是说,Triton 已经是PyTorch2.0 后端编译器关键构成部分。
实际上,此前 AMD ROCm 则主要是采用 Hipify 工具实现CUDA 兼容,而随着 AMD 开始为 RDNA 3 消费级显卡提供 ROCm 支持,预计后续将会有更多平台选择适配 AMD 硬件。
相关阅读:
《AMD 将为 RDNA 3 消费级显卡提供 ROCm 支持,从 Radeon RX 7900 XTX 和 Pro W7900 开始》
《AMD 正式推出 HIP SDK:拓展 ROCm 生态,支持运行英伟达 CUDA 应用》
广告声明:文内含有的对外跳转链接,用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。
为您推荐
精彩放送
热门文章
-
Adobe宣布明年关闭旗下CreativeCloud文件同步服务:个人版
-
联想小新PadPro12.7英寸体验:论大尺寸平板带来的便利与舒适感
-
法大大连获市级省级人力资源服务创新大赛大奖!
-
final推出ZE8000TWS耳机:主动降噪、骁龙畅听,1900元
-
携程集团发布2023Q2财报:净营业收入112亿元同比增长180%
-
汇聚金陵,共创未来。世界林氏总商会南京林氏商会联络委员会就职典礼圆满成功!
-
新迪数字荣获浙江省工业软件产业技术联盟“2022年度突出贡献奖”
-
保障正品、品质消费成效突出,得物App入选“中国服务实践案例”
-
多家银行理财公司高管变动体系内部输送仍为常态
-
白酒x咖啡?!茅台将开启全新“酱香”打开方式
热文
-
阿斯利康三赴服贸会达成多项签约成果
-
四大看点沉浸式体验太保服务亮相2023年服贸会
-
七彩虹iGameG-ONEPlus一体机降至4299元:i5+RTX30
-
消息称腾讯9月初发布混元大模型,腾讯文档、腾讯游戏已接入测试
-
宝马发布VisionNeueKlasse概念车:设计语言彻底颠覆,预计2
-
赛车电影《GT赛车:极速狂飙》豆瓣开分7.4分,首日票房240.8万
-
极氪001车主发表联名信:因赠送ZAD被“差异对待”,感觉被背刺了
-
苏州之后江苏无锡确认已执行“认房不认贷”
-
全民国际08170预期成立合营企业将踏足美国订约、项目管理及土木工程咨询
-
商务部:中国今年1-7月出口277.8万辆汽车,全年有望向500万辆进军