江苏思远集成电路与智能技术研究院有限公司宋政伟获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉江苏思远集成电路与智能技术研究院有限公司申请的专利一种基于FPGA的改进神经网络硬件加速方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115564035B 。
龙图腾网通过国家知识产权局官网在2026-04-28发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211242004.1,技术领域涉及:G06N3/063;该发明授权一种基于FPGA的改进神经网络硬件加速方法及装置是由宋政伟;孙莉;于淼;张元淳;侯俊;郑培清;张国和设计研发完成,并于2022-10-11向国家知识产权局提交的专利申请。
本一种基于FPGA的改进神经网络硬件加速方法及装置在说明书摘要公布了:本发明涉及图像处理技术领域,尤其涉及一种基于FPGA的改进神经网络硬件加速方法及装置,包括通过迁移学习、数据增强、多尺度训练、余弦退火对SSD_MobilenetV1网络进行训练;对训练后的SSD_MobilenetV1网络进行结构化剪枝,以卷积核或每个网络层为基本单位进行剪枝;采用QAT算法,引入伪量化的操作进行训练,用于模拟量化过程的误差;将量化后的SSD_MobilenetV1网络转换为计算图。本发明同时使用FPGA和ARM处理器对模型进行推理,将卷积网络模型中耗时的卷积算子在FPGA执行,其它算子在ARM处理器中执行,能够实现网络模型的快速推理,并且功耗较低,利于部署到终端。
本发明授权一种基于FPGA的改进神经网络硬件加速方法及装置在权利要求书中公布了:1.一种基于FPGA的改进神经网络硬件加速方法,其特征在于,包括以下步骤: 步骤一、通过迁移学习、数据增强、多尺度训练、余弦退火对SSD_MobilenetV1网络进行训练;训练集为图像; 步骤二、对训练后的SSD_MobilenetV1网络进行结构化剪枝,以卷积核或每个网络层为基本单位进行剪枝; 步骤三、采用QAT算法,引入伪量化的操作进行训练,用于模拟量化过程的误差;在反向传播的过程中,weight在输入卷积之前进行量化,如果有BatchNormalization层,就将BatchNormalization层融入到weight中,激活值在激活函数执行完成后再进行量化; 步骤四、将量化后的SSD_MobilenetV1网络转换为计算图; SSD_MobilenetV1中的每个算子或变量都对应计算图的一个节点;其中,算子节点和变量节点相邻;在计算图的基础上,进行操作融合和prior_box算子离线计算; 操作融合包括:得到计算图后,通过操作融合将多个连续的算子合并为一个算子;对两种计算图进行替换,第一种是conv2d+batch_norm+relu6;第二种是depthwise_conv2d+batch_norm+relu6;将三个计算节点融合,形成新的计算节点,公式如下: 7 8 9 10 其中,w为卷积核的一个权重参数;xi为输入特征图中的一个数据;m为一个batch中数据的数量;ϵ为极小量;和分别为一个batch中数据的均值和方差;γ、β可学习参数; prior_box算子离线计算包括:在计算图中对prior_box算子结构进行优化,对计算图中所有算子进行遍历,当检索到prior_box算子时,根据prior_box算子只与特征图的通道数相关而不依赖于特征图的具体数值的特性,计算得到prior_box算子结果,同时计算与prior_box连接的flatten2算子和concat算子的结果,并固化为box_coder算子的参数,只保留box_coder算子。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人江苏思远集成电路与智能技术研究院有限公司,其通讯地址为:213100 江苏省常州市武进区常武中路18号常州科教城江南现代工业研究院5楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励