IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 嵌入式 -> TI ADI DSP 与 ARM Cortex-A 的 FIR FFT 性能对比 -> 正文阅读

[嵌入式]TI ADI DSP 与 ARM Cortex-A 的 FIR FFT 性能对比

????????DSP 作为计算密集型的数字信号处理芯片,一度是FIR和FFT运算的主力芯片,而 TI 和 ADI 两大DSP 芯片公司推出的 DSP 产品也互不相让,各占一席之地。

????????目前 TI 主流的 DSP 是低功耗的 C674x 系列和高性能的 C66x 系列。C674x 系列最高可以达到 3648 MIPS / 2746 MFLOPS 的性能,而性能最高的 TMS320C6678 具有8个 C66x 核,可以达到 320 GMAC/160 GFLOP @ 1.25GHz 的性能。

????????TI 公布的 DSP 与 Cortex-A15 的 ARM 芯片的性能对比:

??????? 由上表可以算出,1.5GHz 的 Cortex-A15 ARM 芯片的性能,已经和C674x差不多了。

??????? 目前 ADI 主流的 DSP 是 Sharc 系列,其中的 ADSP-2146x 系列性能达到 2700MFLOPS,与 TI 的?C674x 在 1k 点 复数FFT 的耗时都是 24us,针锋相对,旗鼓相当。

????????而 SC58x 的双核 DSP 里的 FFT 硬核加速器,只需要 5.5us 就可以完成了,比 TI 1GHz 的高性能 C66x 的速度都要快。

??????? ADI 公布的 DSP 性能如下:

?

??????? DSPConcepts 对 ARM 核芯片和 ADI 的 DSP 做了测试,结果如下:

??????? 可以看到, Cortex-A15 的每 Cycle 性能虽然不如 Sharc 21489,确也已经超过了 Blackfin,而考虑到芯片的速度,1.5GHz 的 Cortex-A15 芯片的性能,已经超过了 450MHz 的 Sharc 21489。

???????? 而目前的主流ARM芯片也从 armv7(32 位)构架升级到性能更高的 armv8(64 位)构架,而且普遍采用了多核构架,性能更加强大。

??????? 以树莓派为例,树莓派3B+ 的 4 核 Cortex-A53,性能已经达到 5.5GFLOPS;树莓派4 的 4 核 Cortex-A72,性能已经达到 13.8GFLOPS,已经超过 SC58x 的双核 DSP 的 5.4GFLOPS。

??????? 可以预见,随着ARM的广泛使用和性能的提高,DSP作为独立的芯片,应用场景会越来越少,也许会慢慢退出历史的舞台;而数字信号处理,会以 DSP IP 软核或者硬核的形式,出现在各种芯片当中。

????????摩尔定律和制造工艺的发展,推动着芯片行业飞速前进,不进则退。

????????全志推出的 R329-N4芯片便是很好的例子。该芯片含有双核 ARM Cortex?-A53@1.5GHz,搭载周易TZ1AIPU(最大支持0.25TOPS@600MHz),芯片内集成两颗HIFI4 DSP@400MHz,并且片上集成SIP 256MB DDR3,性能不凡。

????????TI 也推出了针对汽车领域 ADAS 应用的芯片,TDA4VM Jacinto? 7 处理器,性能强劲,直接把自己的 AM5729 拍在沙滩上:?????????????

????????? 双核 64 位 Arm? Cortex?-A72 微处理器子系统,性能高达?2.0GHz

????????? 六个 Arm? Cortex?-R5F MCU,性能高达?1.0GHz

????????? C7x 浮点矢量?DSP,性能高达?1.0GHz、80GFLOPS、256GOPS

????????? 深度学习矩阵乘法加速器?(MMA),性能高达8TOPS (8b)(频率为?1.0GHz)

????????? 两个?C66x 浮点?DSP,性能高达?1.35GHz、40GFLOPS、160GOPS

????????? 3D GPU PowerVR? Rogue 8XE GE8430,性能高达?750MHz、96GFLOPS、6Gpix/s

??????? 回想当年叱咤风云的主角,如今廉颇老矣,令人唏嘘;而ARM,也面临着新的挑战,RISC -V芯片,深度学习芯片,各种 SOC,如雨后春笋,已经遍地开花,性能大大提升。

??????? 怀念那段从 5510,6713,6416,OMAP,Blackfin BF533,到 SharC 21489,6748 的历程,当年需要花钱买的CCS,做的仿真器和板卡,以及写的那本小册子《使用CCS进行DSP编程》。

????????沉舟侧畔千帆过,再回首已过二十年。乐见国产芯片,芯芯向荣。

??????? 特收集整理在此,以纪念那段和朋友们一起有DSP芯片陪着走过的慢慢尘封的岁月。

??????? 未来,将是一个崭新的时代!

????????????????????????????????????????????????????????????????????????????????????????????????????????????? 老徐,2022年惊蛰

  嵌入式 最新文章
基于高精度单片机开发红外测温仪方案
89C51单片机与DAC0832
基于51单片机宠物自动投料喂食器控制系统仿
《痞子衡嵌入式半月刊》 第 68 期
多思计组实验实验七 简单模型机实验
CSC7720
启明智显分享| ESP32学习笔记参考--PWM(脉冲
STM32初探
STM32 总结
【STM32】CubeMX例程四---定时器中断(附工
上一篇文章      下一篇文章      查看所有文章
加:2022-03-08 22:42:39  更:2022-03-08 22:43:56 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 7:49:35-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码