在浮点16位精度下,推理的计算量约为78gflops,芯片每秒处理的resnet50帧率乘以78g,即真实有效的输出计算能力。这些先进的半导体技术制造的计算能力设备往往性能强,兼容性好,在异构计算领域占据主流地位。
边缘计算的边界在哪里?
云、边、端更多地分为应用场景,而不仅仅是基于性能。从这个意义上说,云、边、端的场景相对清晰。当然,从任务处理的角度来看,将更多的推理任务分配到边缘和终端的趋势,以及更多的云边缘集成合作场景。然而,对于终端和边缘设备,将有更多的成本和功耗限制,提高计算能力效率是更关键的指标,包括单位计算能力的成本和实际应用效果。
终端侧和边缘侧自诞生以来就承担着不同的使命。作为一种直接与用户交互的设备,终端的主要功能是感知。低功耗、低延迟是基本要求,计算能力也相应平衡。一般来说,终端侧设备的计算能力弱于边缘侧。他强调,我们需要澄清终端制造商声称的计算能力是理论计算能力还是有效计算能力。只有当终端和边缘侧的有效计算能力相等时,才能真正达到边缘设备的计算能力水平。
云边界本身的定义是由于BFC233620473芯片计算能力和通信传输能力的限制。在某种程度上,边界和终端之间的边界确实变得模糊,但对不同应用场景的性能要求可能有不同的定义。对于计算能力要求低的场景,终端设备性能足够,可能不需要特殊的边缘计算设备;对于道路合作、智能交通等计算能力要求高的场景,终端传感器设备不能满足需求,需要使用边缘计算设备处理摄像头、激光雷达和毫米波雷达数据,实现全息传感功能,他说,随着芯片和通信技术的迭代,我相信边界有时会模糊和清晰。
什么是核心指标?
计算能力是一个广义词。如何评估计算能力设备?有两件更重要的事情:理论峰值计算能力和真实有效的计算能力。理论计算能力是指公式推导的理论计算能力;有效计算能力是指设备在实际运行过程中真正输出的计算能力,是设备实际计算能力效率的体现。
计算芯片峰值计算能力
理论计算,理想情况下的峰值计算能力。主频率、核数量和单核计算能力输出的理论峰值与实际场景中的真实有效处理能力有很大差距。
计算芯片的有效计算能力
设备在实际运行过程中真正输出的计算能力。例如,在浮点16位精度下,推理的计算量约为7.8gflops,芯片每秒处理的resnet50帧率乘以7.8g,即真实有效的输出计算能力。若推理帧率为400fps,则实际计算能力为400*7.G=3tflops。
计算芯片的有效利用率
它代表了芯片真实输出的计算能力。计算方法为:真实有效的输出计算能力/理论计算能力。计算结果值越高,芯片工作效率越高。在实际应用场景中,传统架构计算芯片的有效利用率一般在30%左右,而新架构计算芯片的有效利用率在50%以上。灵启KA200异构众核,集成芯片的有效利用率可达60%以上。
计算芯片对主流神经网络的支持
下一代人工智能有两种不同的开发路线图,一种是以深度学习算法为代表的传统计算科学,另一种是以生物神经网络为代表的大脑科学。大多数计算芯片只能支持其中之一。它们的合并和支持也是衡量计算芯片的核心指标之一,异构集成是实现该指标的重要途径之一。
芯片能效比
计算方法为:典型网络(如Resnet50)的推理能力/芯片功耗,单位:推理帧率(fps/w)。
芯片的性价比
每平方毫米推理的帧率计算方法为:典型网络(如Resnet50)的推理能力/芯片面积。
异构精华-针对性
在边缘计算领域,各种应用催生了各种计算需求,往往需要权衡计算能力、功耗、体积等问题。由于资源的优化,异构计算逐渐成为业界的共识。在计算能力需求激增的第一阶段,以CPU和GPU为代表的芯片率先迎来了强劲增长。这些先进的半导体技术制造的计算能力设备往往性能强,兼容性好,在异构计算领域占据主流地位。
所谓的异构计算实际上希望有不同的处理器形式来更有效地处理不同的算法。异构的目的应该比特定的应用程序更有针对性,而不是一般的计算能力。
从指令集结构的角度来看,该行业已经形成了自己的力量范围。从技术的角度来看,它们并不是那么绝对,它们也会相互渗透。例如,ARM架构也有服务器和个人计算机应用程序,RISC-V将越来越多地朝着高性能的方向尝试。在未来,更常见的生态问题是由于技术角度的差异,生态尤为重要。然而,先入为主的替代成本和门槛非常高,这个过程将相对较长。
Imagination计算业务产品管理总监Robfisher表示,随着性能需求的增加,需要降低系统功耗水平,这才是异构结构真正体现价值的地方。
至于异构计算的未来发展趋势,他认为最密集的计算部分将定位在加速器上,可以高效运行,提供性能和管理功耗。然而,只有当加速器能够扩展和满足应用程序的性能需求时,它才能发挥作用,也就是说,可扩展性是未来结构的焦点。除了在一个维度上扩展外,复杂的计算工作负荷还必须在多个维度上实现可扩展性,以改变计算资源的组合,以满足需求。
异构计算平台的主流发展方向必须能够更有效地获得结构灵活性高、可扩展性好、计算资源利用率高的高性能计算能力框架。由于不同的计算架构有自己的优点,场景变得更加多样化和复杂,我们应该更深入地分析不同计算架构和芯片的优点,并设计适合特定应用场景的异构计算方案。
随着新系统结构的不断出现,CPU、GPU和新系统结构的集成将不可避免地出现在未来的异构计算中,即传统冯·诺依曼系统结构与非冯·诺依曼系统结构的集成,而不仅仅是当前CPU和XPU的集成。