海思昇腾模型压缩工具使用指南(ONNX)

 免费 
成为会员,免费下载资料
文件大小:1.01 MB 上传者:陌人丶 时间:2023-07-21 15:16:12 下载量:7
本文档详细介绍了如何使用昇腾模型压缩工具(Ascend Model CompressionToolkit,简称AMCT),对ONNX网络模型进行压缩。昇腾模型压缩工具是一个针对昇腾芯片亲和的模型压缩工具包,提供量化等多种模型压缩特性,压缩后模型体积变小,部署到SoC上后可使能低比特运算,提高计算效率,达到性能提升的目标。 昇腾模型压缩工具基于ONNX+ONNX Runtime框架运作,实现了模型中模型部署优化、数据与权重8比特量化的功能,该工具优点如下: ● 使用方便,安装工具包即可。 ● 接口简单,在用户基于ONNX Runtime框架的推理脚本基础上,调用API即可完成模型压缩。 ● 与硬件配套,生成的压缩模型经过ATC工具转换后可在SoC上实现8比特推理。 ● 量化可配置,用户可自行修改量化配置文件,调整压缩策略,获取较优的压缩结果。
展开
折叠
523
评论
共 0 个
内容存在敏感词
    易百纳技术社区暂无数据
相关资料
关于作者
易百纳技术社区
陌人丶
贡献资料 2
易百纳技术社区 我上传的资料
登录查看
我赚取的积分
登录查看
我赚取的收益
登录查看
上传资料 赚取积分兑换E币
易百纳技术社区
删除原因
广告/SPAM
恶意灌水
违规内容
文不对题
重复发帖
置顶时间设置
结束时间
举报反馈

举报类型

  • 内容涉黄/赌/毒
  • 内容侵权/抄袭
  • 政治相关
  • 涉嫌广告
  • 侮辱谩骂
  • 其他

详细说明

审核成功

发布时间设置
发布时间:
是否关联周任务-资料模块

审核失败

失败原因
备注
易百纳技术社区