华为达芬奇架构NPU为什么聪明?

易百纳技术社区 2020-09-24 11:13:20 4060

华为达芬奇( HUAWEI DaVinci )架构,是华为自研的面向AI计算特征的全新计算架构,具备高算力、高能效、灵活可裁剪的特性,是实现万物智能的重要基础。

AI计算的核心是矩阵乘法运算,计算时由左矩阵的一行和右矩阵的一列相乘,每个元素相乘之后的和输出到结果矩阵。在此计算过程中,标量( Scalar)、向量( Vector)、矩阵(Matrix)算力密度依次增加,对硬件的AI运算能力不断提出更高要求。

华为达芬奇架构采用3D Cube针对矩阵运算做加速,大幅提升单位面积下的AI算力,每个AI Core可以在一个时钟周期内实现4096个半精度MAC操作,相比传统的CPU和GPU实现数量级的提升。为提升AI计算的完备性和不同场景的计算效率,达芬奇架构还集成了向量、标量、硬件加速器等多种计算单元。同时支持多种精度计算,支撑训练和推理两种场景的数据精度要求,实现AI的全场景需求覆盖。

华为达芬奇架构具备灵活可裁剪的特性,可用于小到几十毫瓦,大到几百瓦的训练场景,支持AI从端侧、边缘侧到中心侧的全场景部署。

华为达芬奇架构具备灵活可裁剪的特性,可用于小到几十毫瓦,大到几百瓦的训练场景,支持AI从端侧、边缘侧到中心侧的全场景部署。

举例来说,在智能手机这一典型的AI场景中, 麒麟990 5G采用华为达芬奇架构NPU,创新设计NPU双大核加NPU微核架构,NPU大核展现卓越性能与能效,微核实现超低功耗。基于麒麟990 5G的AI强劲算力,华为P40系列带来AI路人移除、AI反光消除等功能,让更多受限于功耗和算力的AI应用成为现实。

在边缘侧、中心侧甚至是云端,华为达芬奇架构同样能够提供强在边缘侧、中心侧甚至是云端,华为达芬奇架构同样能够提供强劲算力,赋能异腾系列人工智能芯片开启智慧未来。其中,舁腾310是华为首款全栈全场景人工智能芯片,为智慧城市、自动驾驶、云业务和IT智能、智能制造、机器人等应用场景提供解决方案;异腾910更是业界算力最强的AI处理器,支持云边端全栈全场景应用,算力完全达到设计规格,充分展现强劲AI实力。

关于华为自研的达芬奇NPU架构,您怎么看?

声明:本文内容由易百纳平台入驻作者撰写,文章观点仅代表作者本人,不代表易百纳立场。如有内容侵权或者其他问题,请联系本站进行删除。
红包 2 收藏 评论 打赏
评论
0个
内容存在敏感词
手气红包
    易百纳技术社区暂无数据
相关专栏
置顶时间设置
结束时间
删除原因
  • 广告/SPAM
  • 恶意灌水
  • 违规内容
  • 文不对题
  • 重复发帖
打赏作者
易百纳技术社区
易百纳技术社区
您的支持将鼓励我继续创作!
打赏金额:
¥1易百纳技术社区
¥5易百纳技术社区
¥10易百纳技术社区
¥50易百纳技术社区
¥100易百纳技术社区
支付方式:
微信支付
支付宝支付
易百纳技术社区微信支付
易百纳技术社区
打赏成功!

感谢您的打赏,如若您也想被打赏,可前往 发表专栏 哦~

举报反馈

举报类型

  • 内容涉黄/赌/毒
  • 内容侵权/抄袭
  • 政治相关
  • 涉嫌广告
  • 侮辱谩骂
  • 其他

详细说明

审核成功

发布时间设置
发布时间:
是否关联周任务-专栏模块

审核失败

失败原因
备注
拼手气红包 红包规则
祝福语
恭喜发财,大吉大利!
红包金额
红包最小金额不能低于5元
红包数量
红包数量范围10~50个
余额支付
当前余额:
可前往问答、专栏板块获取收益 去获取
取 消 确 定

小包子的红包

恭喜发财,大吉大利

已领取20/40,共1.6元 红包规则

    易百纳技术社区