Hi3559A SDK SVP nnie sample code要如何优化达30 fps?
2 E币
成为会员,免费下载资料
文件大小:10.14 KB
上传者:qn1534489079
时间:2018-10-11 14:20:41
下载量:53
本帖最后由 qn1534489079 于 2018-10-12 09:06 编辑
想请教关于Hi3559A SDK SVP nnie sample code的问题:
Q1. 在\Hi3559AV100_SDK_V2.0.1.0\package\mpp\sample\svp\multi-core\nnie 里sample_nnie_main有0~9项目可以测试nnie model,在项目0.RFCN的部分,我在HI_MPI_VPSS_GetChnFrame时,去累加frame rate counter,算出来的frame rate只能每秒达11 fps左右,所以我想请问Hi3559A AI nnie要达30 fps的条件为何?
0) RFCN(VI->VPSS->NNIE->VGS->VO).
1) Segnet(Read File).
2) FasterRcnnAlexnet(Read File).
3) FasterRcnnDoubleRoiPooling(Read File).
4) Cnn(Read File).
5) SSD(Read File).
6) Yolov1(Read File).
7) Yolov2(Read File).
8) LSTM(Read File).
9) Pvanet(Read File).
Q3.我将svp sample cdoe加入一些time debug log( see sample_nnie_main_rfcn_src_fps_1009.zip ),看到瓶颈如下,请问可以如何优化减少执行时间?
[DBG]SAMPLE_SVP_NNIE_Forward()
[DBG]stmCurrentTime(18281s96768us), u64TimeIntervalUs=40845 -->40.845ms
[DBG]SAMPLE_SVP_NNIE_Rfcn_Rpn()
[DBG]stmCurrentTime(18281s115577us), u64TimeIntervalUs=18809 -->18.809ms
[DBG]SAMPLE_SVP_NNIE_ForwardWithBbox()
[DBG]stmCurrentTime(18281s128415us), u64TimeIntervalUs=12838 -->12.838ms
如果要达30 frame rate,nnie处理时间必须小于 1/30=33ms
想请教关于Hi3559A SDK SVP nnie sample code的问题:
Q1. 在\Hi3559AV100_SDK_V2.0.1.0\package\mpp\sample\svp\multi-core\nnie 里sample_nnie_main有0~9项目可以测试nnie model,在项目0.RFCN的部分,我在HI_MPI_VPSS_GetChnFrame时,去累加frame rate counter,算出来的frame rate只能每秒达11 fps左右,所以我想请问Hi3559A AI nnie要达30 fps的条件为何?
0) RFCN(VI->VPSS->NNIE->VGS->VO).
1) Segnet(Read File).
2) FasterRcnnAlexnet(Read File).
3) FasterRcnnDoubleRoiPooling(Read File).
4) Cnn(Read File).
5) SSD(Read File).
6) Yolov1(Read File).
7) Yolov2(Read File).
8) LSTM(Read File).
9) Pvanet(Read File).
Q3.我将svp sample cdoe加入一些time debug log( see sample_nnie_main_rfcn_src_fps_1009.zip ),看到瓶颈如下,请问可以如何优化减少执行时间?
[DBG]SAMPLE_SVP_NNIE_Forward()
[DBG]stmCurrentTime(18281s96768us), u64TimeIntervalUs=40845 -->40.845ms
[DBG]SAMPLE_SVP_NNIE_Rfcn_Rpn()
[DBG]stmCurrentTime(18281s115577us), u64TimeIntervalUs=18809 -->18.809ms
[DBG]SAMPLE_SVP_NNIE_ForwardWithBbox()
[DBG]stmCurrentTime(18281s128415us), u64TimeIntervalUs=12838 -->12.838ms
如果要达30 frame rate,nnie处理时间必须小于 1/30=33ms
展开》
折叠》