我们梳理了AI芯片高峰论坛和云AI芯片论坛的核心点
2022-09-02 17:44 来源:C114通信网 阅读量:6650
东西8月27日报道今天,GTIC 2022全球AI芯片峰会在深圳南山区圆满落幕会上,2022中国AI芯片企业50强榜单正式揭晓
本次高规格行业会议由芯东和智慧东西公开课联合主办,不要辜负未来以此为主题,汇聚AI芯片领域的产学研投资专家和先锋代表,展示智能计算创新落地的最新情况
两天内,32位嘉宾通过主题演讲和高峰对话,分享了自己对干货和通俗易懂的行业见解峰会现场座无虚席,全网直播总人数达到220万+人作为智一科技产业对接平台GTIC的首届产业峰会落地深圳,GTIC 2022全球AI芯片峰会受到深圳业界人士的广泛好评
昨天我们梳理了AI芯片高峰论坛和云AI芯片论坛的核心点。
今天,精彩还在继续!五位大牛分别出席了edge AI芯片专题论坛,集成内存与计算芯片专题论坛,计算新技术专题论坛,畅谈AI芯片的创新之路和加速商业化过程中积累的经验。
1.南科大余浩:Rdquo低碳AI芯片,高精度低功耗并存
中国南方科技大学深港微电子研究所创始副校长余浩教授亲临现场,Rdquo低碳人工智能芯片。
我们渴望让机器做计算,帮助我们平躺但就目前的计算中心而言,它需要在功耗和效率方面付出很大的代价,比如电力和能源的消耗因此,在数字经济和可持续经济的背景下,我们需要一种高能效的低碳芯片
中国南方科技大学深港微电子研究所创始副校长俞浩教授
现有的有效解决方案包括并行GPU和脉动TPU,但这些解决方案仍然存在功耗高,能效低的问题那么,如何在保证精度和降低功耗的同时,训练多精度多复杂度的模型,实现节能的硬件计算呢
余浩教授团队的方法是自动搜索设计网络架构,逐层优化网络,获得高能效的混合精度神经网络,在硬件层面,每个数据单元可以支持多精度并行处理,同时每个并行多精度阵列可以进行数据复用,使多复杂度网络模型高效运行。
中国南科大团队开发了四款AI芯片,其中X—Edge芯片平均能效达到200TOPS/W,超过人脑的10TOPS/W。
基于上述R&D概念,X—Edge芯片可应用于构建低碳边缘计算平台,机器人平台,移动巡逻平台,元宇宙平台等。
第二,软硬件协同设计,应对AI落地碎片化问题
相比云端AI芯片,边缘端和端端AI芯片公司面临的应用场景更加多样化他们不仅要优化底层技术,还要抓住时间窗口加速芯片和相应解决方案的大规模实现
在上午举行的edge AI芯片专题论坛期间,来自石清科技,艾欣袁志,Imagination,奇感科技,Innoda,建安科技的行业大牛分享了他们观察到的下游市场需求变化,以及应对这些变化的产品创新,落地玩法和实践经验。
1.石清科技邱建乐:分布式存储和计算,迎接端到端AI落地碎片化的挑战。
AIoT时代,AI应用越来越多地使用云端协作表单出现相比云端AI芯片,端侧AI芯片需要满足一些特定的要求,比如:计算能力能够支持本地预处理或简单决策,对功耗和成本更敏感,传感器接口和应用市场碎片化
面对这样的市场特点,端侧智能芯片公司石清科技选择了DSA芯片设计方案,石清采用神经网络数据压缩引擎支持自主研发的基于RISC—V架构的端侧DSA智能处理器。
据石清科技研发副总裁邱建乐介绍,该处理器可以进行分布式存储和计算,适应AI算法的快速演进,保持较高的计算效率目前已经能够在128GOPS—2TOPS的计算能力范围内实现很强的扩展性
清科技研发副总裁邱建乐
当进入客户应用场景进行部署时,设计的AI端侧芯片面临新的挑战mdashmdash部署模型多为小型化网络模型,数据难以量化。
因此,Time Engine通过TimesFlow平台提供了多种量化方式,包括INT8/INT16的对称/非对称量化选项,从而减少量化过程中的精度损失Engine还配备了一键部署功能,丰富的操作员库和多种预处理方式,优化客户的应用部署体验
2.艾欣袁志刘建伟:两大核心技术加速端侧AI芯片落地。
过去10年,AI技术发展迅速伴随着计算能力的日益增强,市场空间暴涨,端侧和边缘侧的AI芯片也迎来了发展机遇端侧和边缘侧需要的智能越多,需要的算法就越多同时,AI的应用也对感知和计算提出了更高的要求
Ai袁志联合创始人,副总裁刘建伟表示:AI袁志在AI芯片领域对感知和计算的探索,已经成功量产两代四款芯片,在消费电子和智慧城市领域进行布局。
爱新智联合创始人,副总裁刘建伟
AI袁志将感知和计算作为两大基础技术进行研发,其中AI—ISP技术将AI和ISP结合起来,从传统ISP中选取模块进行增强混合精度NPU提供基本的计算能力,可以实现模块间的并行计算
此外,艾欣袁志不仅提供人工智能芯片,还提供面向场景的解决方案在设计整个芯片时,会帮助客户从芯片,应用到算法进行协同设计
3.畅想郑魁:CPU+GPU+AI异构计算,满足边缘智能多元化需求。
伴随着人工智能市场的快速增长,PC,智能手机,安防,汽车等市场都需要不同的计算能力正因如此,IP解决方案提供商Imagination最近推出了覆盖AI,GPU,CPU等IP的异构计算架构
Imagination中国智能及汽车产品市场副总裁郑奎表示,作为一家IP设计公司,PPA是产品始终强调的关键元素同时,手机,自动驾驶等领域对计算能力的需求是多样化的,这就需要更高的硬件计算架构,甚至软件栈异构计算是未来的发展方向正因如此,Imagination在IP层面整合了所有计算异构能力,提供灵活,标准化,开放的解决方案
畅想中国智能及汽车产品市场副总裁郑奎
AI方面,畅想推出了NNA等IP产品,在自动驾驶,消费等领域落地,在CPU方面,基于RISC—V的RTXM—2200是第一个实时嵌入式和高度可扩展的实时确定性32位嵌入式CPU在GPU方面,基于PowerVR的首创架构不仅拥有出色的PPA,还拥有强大的计算能力扩展性Power VR架构已经走过了30年,现在高计算的IMG GPU已经拓展到了很多新的市场,比如桌面,车载,高性能计算
4,七感科技勇者:芯片+解决方案,帮助不同AI场景的应用快速落地。
七感科技市场副总裁齐勇表示,AI行业市场正在高速发展目前典型的AI应用包括语音识别,自然语言处理和视觉应用,其中视觉应用增长最快
技术市场副总裁齐勇
家居,智慧零售,智慧农牧,机器人,智慧教育等落地场景对AI视觉芯片的需求非常强烈对于AI视觉芯片公司来说,仅仅用自己的经验来满足不同的业务需求,可能会面临很多挑战对此,七感科技以AI SoC芯片为核心,推出一整套解决方案,帮助客户在设计相关产品时快速落地
目前,奇感科技已经推出了两代芯片平台QG21和QG31,共八款芯片在此基础上,布局了智能网络摄像机,低功耗视觉应用,智能门锁,AI智能分析盒,智能云台,翻译机等解决方案
此外,已经部署了很多没有AI的摄像头,但它们实际上可能有升级和增加AI加速能力的需求奇感科技的AI智能分析解决方案为这些产品提供了升级路径
5.Innoda李希:满足芯片设计云需求的大规模AI芯片验证平台。
电源已经成为半导体行业新的增长点当人们追求更先进的工艺技术时,集成电路设计成本迅速上升,芯片设计软件EDA的云化成为新趋势
Innoda市场和销售总监李希表示,IC设计中的云面临着数据安全,商业模式和技术支持等多重挑战EDA Cadence推出的Palladium硬件仿真加速器是业界通用的硬件仿真器,支持百亿亿门级SoC的全芯片验证但价格昂贵,安装维护费用高,中小型公司往往难以负担
李希,英诺达市场和销售总监
因此,Innoda推出了国内首个由Cadence独家授权的基于Palladium的异构云平台,在国内建设异构机房,保证数据传输的安全可控,并将成本降低到中小公司可以承受的范围目前已经形成了按需使用,按时收费的商业模式
同时,平台还将提供机器故障诊断与维护,客户配置初始调试,验证环境建立等技术支持疫情期间,Innoda的云服务优势明显,客户机器利用率保持在80%以上,不仅让用户不断推进R&D进度,也让用户更专注于体现核心竞争力的芯片设计
6.建安科技唐微微:拥抱软硬件开源生态,算法平台和仓库帮助轻松部署。
AI应用的发展逐渐走向场景化,设备化,多元化建安科技副总裁唐微微说AI开始在云端伴随着技术的不断成熟,AI算法模型的切割和量化,AI芯片的性能和性价比不断提升,边缘AI算力更加普及
嘉科技副总裁
AI边缘计算设备的多样化,导致该领域未来的发展不仅仅局限于大公司,更多的是中小公司和个人开发者但是在开发过程中,开发者往往会面临很多门槛,比如选择芯片平台,买不到芯片硬件,获取开发资料和获得支持等在他看来,降低门槛最好的办法就是开源
因此,建安科技采用RISC—V通用处理器核心架构,多代自研KPU架构,实现全流程自主研发,能够更好地支持开源,快速迭代和客户支持在过去的两三年里,建安科技已经出货超过200万片RISC—V AI芯片
此外,新的AI算法平台和仓库计划在年底上线,这将大大降低AI开发的门槛在体验现有AI演示集的基础上,开发者可以在空中升级新加入的AI算法演示和算法的二次开发,在硬件上轻松优化部署
嘉楠科技的AI工具链,软件SDK等代码和文档已经在Github等平台全面开源,以Kanzhi Kendryte AI品牌呈现。
三,沉淀和计算的核心实力集结!从小算力到大算力
计算的集成是AI芯片领域最热门的架构创新方向这一有望突破传统计算能力瓶颈的创新赛道,不仅是芯片科学国际顶级会议的焦点话题,也开始在业界频频吸金,甚至获得了各路资本的投资
今天下午,五家国内AI芯片创始人的创始人和CEO齐聚middot,GTIC 2022全球AI芯片峰会,集成芯片专题论坛,展示前沿架构和落地进度,探索高能效低成本的可行路径。
1.智存科技王绍迪:内存计算芯片能效和成本优势明显,WTM系列芯片率先生态布局。
与传统的计算架构相比,内存和计算的融合更适合AI计算利用欧姆定律乘法的计算原理,这种架构可以实现百万级,千万级的并行计算,使得AI的计算能力效率提升数倍到数十倍,比CPU,GPU具有更高的密度,更高的并行性,更高的能效和更大的计算能力
智存科技创始人兼CEO王绍迪表示,存储与计算的融合在成本,计算能力,功耗等方面都有很大优势,但在通用性,工具链,精度等方面仍需弥补。
智存科技创始人兼CEO王绍迪
智科科技已量产商用内存计算SoC芯片WTM2101,AI计算能力50Gops,功耗仅5uA—3mA,主要用于可穿戴场景下的语音识别,语音增强,健康监测等功能未来五年,更高计算能力的芯片序列WTM8系列,WTM—C系列和WTM—S系列将陆续发布
接下来,凭借内存计算产品R&D和商业化的先发优势,智存科技将在算法体系,架构创新和工具链,底层技术三个层面持续投入,推动内存计算生态建设王绍迪说,内存计算未来要拥抱小芯片,把兼容性和能效做得更好
2.苹果核心技术岳洋:AI算力下沉时代,用SRAM突破记忆墙限制
AI时代,计算能力正在向移动物联网和AIoT终端下沉,计算更加注重能耗和效率。
解决记忆墙为了减少数据在内存和处理器之间的传输损失,业界出现了CMOS加速器,近内存计算,内存计算等路径苹果核心技术联合创始人兼CEO岳洋认为,在能够实现内存计算的各种内存技术中,SRAM具有很大的计算优势
辛平科技联合创始人兼首席执行官岳洋
针对这一领域,辛平科技推出了SRAM数字内存计算内核,支持常见的定点/浮点运算,可实现5倍以上的效率提升,纳秒级读写延迟,擦除次数无限制,可兼容先进工艺节点引入无ADC设计,达到精密无损效果从内核硬件到SoC产品,苹果核心技术在可挂载PIM内核和软件构建方面加大了布局目前NE002,NE003,PIMCHIP S230等几款芯片正在陆续推出
权威报告显示,2030年全球AI芯片市场规模有望达到2021亿美元岳洋表示,苹果核心定位的市场不仅限于AI识别算法,还涵盖其他矩阵运算包括降噪算法,SLAM算法,ISP算法,智能穿戴目标落地,机器人,智能工农业装备等领域
3.朱彝科技熊大鹏:基于ReRAM的全数字存储和计算集成大计算能力芯片技术。
AI芯片正从通用CPU和专用加速器发展到存储和计算集成阶段,而冯middot诺曼架构的内存墙,能效墙,编译墙正在阻碍AI芯片的计算能力和能效比的不断发展。
朱彝科技创始人,董事长兼CEO熊大鹏表示,存储和计算的一体化架构在突破这些瓶颈方面具有先天优势目前,实现存储和计算一体化体系结构的方法有两种:模拟和数模混合仿真可以将能效比提高两个数量级以上,数模混合可以部分解决精度问题,但这两种方法都会牺牲一些精度同时,数模和模数转换会带来能耗,面积和性能的瓶颈
朱彝科技创始人,董事长兼CEO熊大鹏
为了突破上述瓶颈,朱彝科技构建了基于ReRAM的全数字AI大计算力芯片技术通过数字化彻底解决精度问题,在整个计算过程中不受技术环境影响,实现高精度,大计算力和超高能效比,将一体化的内存和计算架构实际应用到大计算力领域
不同的存储介质应用在不同的场景下各有利弊熊大鹏认为,ReRAM是目前最适合AI计算场景的存储介质ReRAM的优点是非易失性的,密度高,密度提升空间巨大,能耗低,读写速度快,成本低,稳定,与CMOS工艺兼容目前ReRAM的制造工艺已经成熟,ReRAM产品已经投入量产
4.知心客张:在AI落地中解决把大象塞进冰箱难题
杭州智新科微电子创始人兼CEO张说,千千有上千家AI公司在做AI落地,面向把大象塞进冰箱问题比如手机功耗不能超过5W,否则热量无法散发,AI模型在手机上落地会失去很多效果
杭州智新科微电子创始人兼CEO张
看到这个市场发展的瓶颈,智新科选择了基于SRAM的内存计算技术来解决后摩尔时代的强大的计算能力和低功耗市场痛点智新科主要围绕视觉处理芯片和GPNPU两个落地方向
钟铉表示,智芯的视觉处理器AT700 AI CIM和int8的能耗比达到10 TOPS/W,AT700X前置ISP图像增强可以使计算能力超过20TOPS,而功耗低于1w在落地网络摄像机领域,可实现0.5~2W的低功耗,运算能力10~50TOPS,暗光下实现全彩效果,AT800 GP CIM是其代表的edge AI处理器,采用12nm工艺,int8的能耗比达到30TOPS/W,几乎达到同芯片5nm的水平
软件方面,智芯科推出了一套AI工具流程,为客户提供网络优化,高达int8的定量浮点计算服务,支持神经网络图形编译,可执行二进制文件生成的相关硬件。
5.九天瑞新刘洪洁:基于混合信号SRAM存储和计算,多模态传感器协同工作。
人机交互系统智能化程度的提高带来了传感器数量,时空分辨率要求和神经网络应用规模的提高,对多维数据同步采集,传输,处理,运算和存储操作的能量效率,表面效率和时效性提出了更高的要求。
九天睿芯创始人,董事长兼CEO刘洪洁表示,基于SRAM的混合信号内存计算可以实现更小的计算单元和更高的能效,同时保持商用精度,体现了这种架构良好的应用优势从面积上来说,九天瑞信的产品尺寸只有1.41.4平方毫米
九睿信创始人,董事长兼CEO刘洪洁
混合SRAM同时结合了模拟预处理和高性能ADC九天核心让整个信号链更加智能高效这种架构可以打破传感器端ADC速度和精度的瓶颈,存储和计算的一体化实现了NPU功耗瓶颈的突破因此适用于追求极低功耗,低延迟,高精度的场景对于两种应用:1 .未来在VR/AR领域的应用,可以帮助实现基于混合信号SRAM传感,存储和计算的眼球追踪,以及VR/AR头戴设备的超低功耗语音识别,SLAM同步定位和构图2.具有集成模拟预处理或高速ADC以及存储和计算的车辆传感器终端的低延迟,低功耗和高集成度处理
第四,锻造新的计算钥匙,开启通用智能的未来之门。
后摩尔时代,AI芯片越来越面临芯片设计制造从器件,工艺,架构,能耗,成本等方面的挑战与此同时,尽管深度学习算法越来越受欢迎,但业界仍在探索更多实现通用智能的可能方式,这需要AI芯片从底层架构上进行创新,以应对主流AI算法的不确定性
除了内存和计算的集成,还有几种新型的计算架构已经走出学术象牙塔,走向产业化在新计算技术专题论坛上,类脑计算创奇代表灵犀科技,光子计算创奇代表新智科技,量子计算创奇代表Bose Quantum发表主题演讲,分享了他们如何通过转化前沿技术加速AI计算无人区,
1.灵犀科技华宝红:类脑芯片已经量产,异构集成成为新趋势。
灵犀科技副总经理华认为,类脑计算是后摩尔时代具有颠覆性的战略技术,已经成为中美欧的必争之地该方法受人脑启发,是融合了生物脑科学和计算机科学原理的计算系统,具有近似计算,抗噪声,稀疏性,时空相关性等特点
华洪堡,灵犀科技副总经理
华表示,异构集成是类脑计算的发展趋势灵犀科技相关成果于2019年登上国际顶级学术期刊《自然》封面基于此,灵犀科技已经流片并量产了首款商用大脑芯片Lynchip KA200,兼容人工神经网络和生物神经网络采用12nm工艺,支持25万个神经元和2500万个突触,支持200万个稀疏模式神经元,DNN计算能力32TOPS16TFLOPS,功耗从1到14瓦不等在运行ResNet50—64,yolo5等主流网络时,该芯片的能效比和性价比都远高于英伟达T4
目前,灵犀科技的类脑计算芯片已经应用于脑科学和类脑计算领域,还覆盖了安防,机器人,无人机等传统AI应用。
2.新智科技胡永强:光电混合,重新定义计算基础设施。
硅基时代从10mu开始的半导体工艺,m工艺发展到3nm工艺,进入后摩尔时代企业开始探索发展光子计算,量子计算和内存计算Xi科技全球副总裁胡永强表示,光子计算的潜在优势是低延迟,低能耗和高吞吐量与电传输相比,光信号以光速传输,可以实现从微米到百米的TB级数据传输能力
Xi科技全球副总裁胡永强
基于光子矩阵计算oMAC,片上光网络oNET,片上光网络oNOC三大核心技术,希智科技打造了光子计算和光子网络两条产品线。
与电子芯片相比,光计算单元具有很强的并行能力,可以利用波分复用同时计算多个数据,同时可以获得较高的能效比和极低的计算延迟,对工艺的要求也较低此外,片上光网络oNOC技术将CMOS硅电子芯片堆叠在光芯片上,可以通过光波导实现高带宽,低能耗,低延迟的小芯片网络互联方案
去年,希智科技发布了第二代光计算处理器PACE,该处理器采用6464光矩阵乘法器,在单个光子芯片上集成了超过10000个光子器件其运行特定神经网络的计算速度可以达到目前高端GPU的数百倍今年下半年,于之科技将推出全球首款基于oNOC技术的光电混合3D封装AI加速计算芯片,并搭载自研软件栈
3.凯:光量子芯片正从理论优势走向实用优势。
量子计算代表了下一代计算能力的重要突破方向在量子计算的世界里,基本的运算单位是量子比特,它的基本状态是0和1的叠加对n个量子比特的一次运算相当于对经典比特的n次方的两次运算这体现了量子计算机巨大的计算潜力,可以应用于仿真,优化,机器学习,密码学等方向
Bose Quantum创始人兼首席执行官凯文分享道,光量子计算是商用量子计算机的一种新形式目前正从空间光向集成光芯片发展,从理论优势向实用优势发展比如中科大的第九章Ldquo去年开发了113个光量子,第九章2.0完成高斯玻色采样计算实验,比经典超级计算机快10倍左右到24次方,验证了量子计算的理论优越性最近几年来,北京大学王建伟团队,美国PsiQuantum公司,加拿大Xanadu公司等都开展了基于芯片的光量子计算的相关探索
玻色量子创始人兼首席执行官凯文
玻色量子,成立于2020年底,团队来自斯坦福大学,麻省理工学院,清华大学,中科院等高校多年来一直在研究基于DOPO的相干量子计算方案,开展了量子神经元生成芯片和通用光量子计算芯片的研究
目前玻色量子已经推出了第一代田量子计算验证平台是国内首次验证25节点任意连接可编程MAX—CUT问题的最优解,能在50微秒内从3000多万种可能性中筛选出4种最优解之一在商业应用上,玻色量子在金融,交通,生物制药等方面也实现了突破
结论:AI芯片坡长雪厚,走向智能计算的未来。
至此,GTIC 2022全球AI芯片峰会圆满落幕。
在这场AI芯片的盛宴上,我们可以看到技术创新的力量依然在闪耀从争夺有效计算能力到专注于解决实际问题,很多创新方案为破解AI芯片瓶颈提供了更加差异化的思路,很多创业团队积累的AI芯片实力也开始积累
同时,我们也看到越来越多的高性能产品,无论是高算力还是低算力的AI芯片,无论是相对成熟的领域专用架构,通用GPU,还是存储与计算一体化,类脑计算,光子计算,量子计算等前沿技术路线,即将大规模生产和商用
伴随着疫情的有效控制和行业秩序的逐步恢复,承载着智能计算核心力量的AI芯片产业,面对智能化,数字化,电气化带来的海量数据计算需求,继续快速运行,未来市场发展空间广阔。
我们希望GTIC 2022全球AI芯片峰会成为前沿技术交流和行业对接的平台通过邀请各子赛道有代表性的AI芯片公司同台,共同绘制AI芯片行业最强音
预告:GTIC的另一场行业峰会——2022全球自动驾驶峰会也将于近期在深圳举行,敬请期待。
接下来Core Things会对一些演讲和高峰论坛做一个比较完整的报道请关注核心事物的后续推送
声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。