单核 AI 加速,在 FPS、FPS/mm2 和 FPS/Watt 方面提供一流的性能

Cadence® Tensilica® NNA 110 加速器集成了一个定制的硬件加速器引擎 (NNE) 和 Tensilica Vision P6 或 P1 DSP紧密互连。NNA 110 硬件内的专用计算块利用了随机稀疏性、张量压缩/解压缩等功能,提供了一个整体的一流嵌入式人工智能加速器解决方案。

单核 NNA 110 加速器支持 256 到 2K MAC 8x8 位 MAC 计算,并具有各种用户定义的可配置选项。NNA 110 加速器可以运行所有神经网络层,包括但不限于卷积、全连接、LSTM、LRN 和池化操作。NNA 110 中随附的 Tensilica DSP 可以运行任何非加速器原生支持的操作,从而使 NNA 110 成为高度灵活、性能强大、面向未来的产品。NNA 110 解决方案交付物包括一站式软 RTL IP、软件编译器工具链和用于benchmark测试的准确仿真器。

nna-110-hardware

核心优势

可扩展、可配置的硬件完整解决方案

灵活适用于从 0.5 到 4 TOPS 性能需求的不同用例

完整的端到端基于 GLOW 的 Xtensa 神经网络编译器 (XNNC) 工具链

适用于各种模型格式,包括 Tensorflow、ONNX、PyTorch、Caffe2、TensorflowLite 等

硬件和软件混合精度支持

支持 8 位/16 位量化格式,精度接近浮点模型保真度

真正的稀疏计算引擎和张量压缩

利用激活/权重随机稀疏性和无损压缩/解压缩逻辑

在 TOPS、TOPS/Watt 和 TOPS/mm2 方面实现一流的 KPI

获取最佳的MAC 利用率从而达到高吞吐率,低延迟,低带宽和低功耗开销。

主要功能

  • 支持可扩展的 NNE MAC 配置:256、512、1024 和 2048 个 8 位 MAC(16 位 MAC 的数量 = 8 位 MAC 的 1/4)
  • 支持 UBUF 配置:256KB 到 2MB
  • 支持各种带宽配置:32/16/8/4 字节/时钟和 128 或 256 位的 AXI 总线宽度
  • 支持高达 1GHz 的时钟速率
  • 基于运行时稀疏性性能加速
  • 4-bit 权重聚类
  • 运行时张量带宽压缩/解压缩
  • 非对称量化支持

Support

Cadence is committed to keeping design teams highly productive with a range of support offerings and processes designed to keep users focused on reducing time to market and achieving silicon success.

Free Software Evaluation

Try our SDK Software Development Toolkit for 15 days absolutely free. We want to show you how easy it is to use our Eclipse-based IDE.

Apply Now

Training

Our hands-on training has been demonstrated to dramatically speed up the understanding of Tensilica tools and best use of the products.

Browse Catalog

Online Support

Get 24x7 online access to a knowledgebase of the latest articles and technical documentation. (Login Required)

Access Now

Xtensa Processor Generator (XPG)

The Xtensa Processor Generator (XPG) is the heart of our technology - the patented cloud-based system that creates your correct-by-construction processor and all associated software, models, etc. (Login Required)

Launch XPG