Kneron瞄准GPU短缺，推出了神经处理单元(NPU)_专栏

易百纳社区

由于担心全球人工智能GPU短缺，边缘人工智能初创公司耐能（Kneron）将其神经处理单元（NPU）技术视为有竞争力的替代方案。

耐能今天宣布其最新的KL730 NPU，该公司声称其能源效率是其先前型号的四倍。新芯片还专门用于帮助加速基于变压器的 GPT（基于变压器的 AI 模型）。

耐能的芯片主要针对边缘应用，如自动驾驶汽车以及医疗和工业应用，尽管该公司也看到了企业部署的潜力。耐能受益于高通和富士康的支持，并在边缘服务器中部署了广达。

“与GPU相比，NPU具有更多的内核，”耐能创始人兼首席执行官Albert Liu告诉VentureBeat。“核心效率更高，它们更专注于细致入微的连接。

当然，英伟达的GPU技术是市场领先的，是构建现代大型语言模型（LLM）和生成AI的基础。他说，刘认为情况不会一直如此，他希望随着组织越来越多地寻找满足人工智能需求的方法，他的公司能够扩大市场足迹。

耐能的芯片使用可重新配置的AI架构来加速AI，这与GPU中使用的架构不同。KL730 的架构还针对 GPT 基于变压器的 AI 模型进行了专门优化。

KL730并不是耐能第一款针对变压器优化的芯片 - 该公司两年前宣布推出KL530芯片。。耐能芯片变压器模型的原始用例是帮助自动驾驶汽车制造商。刘说，变压器模型对于实时时间相关性检测用例非常有帮助。

变压器将广泛用于实现LLM和生成AI。为了帮助满足LLM的需求，刘说他的公司已经将其AI芯片用于GPT风格的应用。“可重构的AI架构可以动态改变芯片内部的结构，以支持几乎任何类型的新模型，”刘说。、

凭借新的KL730，耐能对其NPU芯片进行了一些显着的性能改进。

刘说，KL703的性能比前几代更好，也可以集群。因此，如果单个芯片不足以满足特定用例，则可以在更大的部署中将多个KL703聚集在一起。

虽然耐能的芯片目前主要用于推理用例，但Liu希望将多个KL730组合在一起的能力也将能够更广泛地使用该技术进行机器学习（ML）训练。

Kneron瞄准GPU短缺，推出了神经处理单元(NPU)