Cadence??Tensilica Vision Q7 DSP,运算速度最高可达每秒1.82 TOPS,进一步扩大广受欢迎的Tensilicon?Vision DSP家族的高端系列产品。为了满足嵌入式视觉和人工智能应用日益增长的计算需求,Tensilica 第六代Vision 产品Vision Q7 DSP在面积不变的前提下提供了较其前一代产品Vision Q6 DSP高达2倍的人工智能和浮点性能。Vision Q7 DSP特别针对同步定位和地图创建(SLAM)进行了优化,SLAM是机器人、无人机、移动和汽车市场的常用技术,用于自动构建或更新未知环境的地图,也用于AR/VR应用的内向外追踪。如需了解更多信息,请访问www.cadence.com/go/visionq7。
边缘应用对图像传感器的需求不断增长,推动了嵌入式视觉市场的发展。今天的视觉用例需要视觉和人工智能操作的混合,而边缘 SoC需要高度灵活、高性能且低功耗的人工智能解决方案。此外,包括成像摄像头在内的边缘应用需要配置在任何人工智能任务之前执行预处理或后处理的视觉DSP。执行SLAM任务的同时,边缘SoC还需要搭载计算卸载引擎来提高性能、减少延迟,进一步降低电池驱动设备的功耗。由于SLAM同时使用定点和浮点运算来实现必要的精度,因此任何用于SLAM的视觉DSP都必须同时为两种数据类型提供更高的性能。
凭借其低功耗、架构和增强指令集,Vision Q7 DSP是满足边缘视觉和人工智能处理严苛需求的理想方案。Vision Q7 DSP可以大大提高多项关键指标的性能:
- 与相同面积的Vision Q6 DSP相比,其超长指令字(VLIW)和单指令多数据(SIMD)架构提供了1.7 倍TOPS的提升
- 配备支持8/16/32位数据类型的增强指令集和支持单精度和半精度的可选VFPU,SLAM内核性能较Vision Q6和Vision P6 DSP有2倍的提升
- 与Vision Q6和Vision P6 DSP相比,半精度(FP16)和单精度(FP32)的每mm2?(FLOPS/ mm2)浮点运算性能有2倍的提升
- 与Vision Q6 DSP相比,同一面积下的AI性能有2倍的提升, 从而GMAC密度(GMAC/mm2)也有2倍的提升
面向人工智能应用,Vision Q7 DSP提供了灵活的解决方案,支持512个8位MAC,而Vision Q6 DSP仅支持256个MAC。为获得更高的人工智能性能,Vision Q7 DSP可以与Tensilica DNA 100处理器协同使用。除了计算性能,Vision Q7 DSP还增强了包括3D DMA、压缩和256位的AXI总线数据位宽在内的iDMA性能。Vision Q7 DSP是Vision Q6 DSP的超集,保留了客户现有的软件实现,可以方便地从Vision Q6或Vision P6 DSP完成移植。
“视觉的人工智能应用非常多样化,同时需求增长非常快速,这些应用通常对计算性能需求极高。达到所需性能水平的同时控制成本和功耗,是业界面临的共同挑战;而且越来越多的视觉应用需要部署到成本敏感和电池供电的设备,”Embedded vision Alliance总裁Jeff Bier表示,“Cadence持续的投入为视觉AI应用的需求来开发一系列的处理引擎,Cadence一直致力于解决这些挑战的投入是非常值得业界赞许的。“
“我们在前两代Cadence Vision DSP上开发并部署了人工智能和基于视觉的应用程序。Tensilica Vision Q7 DSP在视觉和人工智能性能上都提高了2倍,这对SLAM尤其有利,因为低延迟是关键”,ArcSoft营销副总裁 Frison Xu说,“性能提高将助力我们开发新的摄像头应用,包括搭载多个图像传感器的产品。”
“与Cadence还有我们的客户一起,我们将人脸检测和视觉技术成功地移植到一些应用中,而高性能,低功耗和低延时对这些应用是至关重要的,”Megvii 高级产品营销总监David Shen说道。“Cadence拥有业界最优越的视觉和AI平台之一,同时提供能够充分展示我们技术的必要软件工具和库。我们非常期待使用Tensilica Vision Q7 DSP,进一步稳固我们同Cadence的合作。”
“对于我们所专注的边缘计算市场,将视觉应用处理卸载到一个高性能,低功耗且具有高度灵活性的DSP上是须的。”Cadence公司Tensilica IP产品管理和营销高级总监Lazaar Louis说道。“Cadence已经拥有了六代视觉DSP产品,经久不衰且产品成功。Vision Q7 DSP的设计初衷是为了满足我们的关键客户利用复杂视觉和AI算法的需求,包括将SLAM用于认知能力的提升。Vision Q7 DSP强化了我们非常成功的汽车产品,将边缘计算引入‘车载计算机’中,同时符合ISO 26262等安全标准。”
借助于Tensilica Xtensa 神经网络编译器(XNNC),Vision Q7 DSP可以支持基于caffe,TensorFlow和Tensorflowlite框架下开发的AI应用。Tensilica Xtensa??神经网络编译器(XNNC)可以将神经网络映射成可在Vision Q7 DSP执行且高度优化的高性能代码。Vision Q7 DSP同时支持安卓神经网络(ANN)API,实现安卓设备的本地AI加速;其软件环境也经过优化,可完整支持超过1700个基于Open CV的视觉库功能,助力实现现有视觉应用的快速和高层次迁移。另外,开发工具和库的设计也可以确保SoC供应商通过ISO 26262汽车安全完整性等级D(ASIL D)认证。
|