清大凯联科技(北京)有限公司国强获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉清大凯联科技(北京)有限公司申请的专利一种智能音频分析与语音识别云融合计算服务平台获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120895026B 。
龙图腾网通过国家知识产权局官网在2026-04-07发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511169761.4,技术领域涉及:G10L15/02;该发明授权一种智能音频分析与语音识别云融合计算服务平台是由国强;周健;肖晶晶;李洪艳设计研发完成,并于2025-08-20向国家知识产权局提交的专利申请。
本一种智能音频分析与语音识别云融合计算服务平台在说明书摘要公布了:本发明公开了一种智能音频分析与语音识别云融合计算服务平台,包括如下模块:音频采集模块采集来自多终端设备的多通道音频数据;Gammatone滤波模块对音频数据进行滤波,提取初步音频特征;特征优化模块细化频谱信息,生成优化音频特征;状态检测模块分析特征并结合历史档案生成状态报告或告警;数据库模块存储音频记录、声学档案与模型参数;识别模块依据状态报告选择边缘或云端模型进行语音识别,输出识别结果;输出模块接收各类结果并生成统一的服务报告。本发明可实现多场景下音频信息的自适应识别与分析。
本发明授权一种智能音频分析与语音识别云融合计算服务平台在权利要求书中公布了:1.一种智能音频分析与语音识别云融合计算服务平台,其特征在于,包括音频采集模块、Gammatone滤波模块、SincNet特征优化模块、状态检测模块、数据库模块、分布式识别模块、输出模块; 音频采集模块用于采集来自移动终端、车载设备、智能音箱、会议系统及工业语音采集设备的多通道音频数据; Gammatone滤波模块用于对音频数据进行Gammatone滤波处理,形成初步音频特征; SincNet特征优化模块用于对初步音频特征进行频谱细化,生成优化音频特征; 状态检测模块用于接收优化音频特征并结合数据库中存储的历史声学档案,生成状态报告,若检测异常则生成告警报告; 数据库模块用于存储历史音频数据、声学档案及模型参数; 分布式识别模块用于根据状态报告动态选择边缘端或云端模型对优化音频特征进行语音识别处理,生成识别结果; 输出模块用于接收识别结果、状态报告及告警报告,并统一输出音频分析与语音识别服务报告; 接收状态检测模块输出的状态报告,并解析当前检测状态标记; 依据状态报告中状态标记,若状态标记为正常,则选择边缘端语音识别模型,若状态标记为异常,则选择云端语音识别模型; 将SincNet特征优化模块输出的优化音频特征按时间顺序划分为帧级特征序列,并对每帧特征按预设均值与标准差归一化后输入选定的语音识别模型; 在边缘端,语音识别处理包括以下子步骤:接收归一化帧级特征序列,利用轻量级声学模型计算每帧在预定义音素集合上的分类概率分布,选取最大概率对应音素作为帧标签;对相邻帧标签相同的连续帧进行合并,生成初步音素序列;应用边缘端预置的有限状态转移词典,对初步音素序列逐一匹配合法词条,形成边缘端识别文本结果; 在云端,语音识别处理包括以下子步骤:接收归一化帧级特征序列,利用全量深层声学模型计算每帧在扩展音素集合上的分类概率分布,采用维特比解码算法求取最优帧路径,生成初步帧级音素标签序列;将初步标签序列输入云端上下文无关语言模型,执行上下文概率修正,生成修正后音素序列;根据音素到词的映射规则,将修正后音素序列转换为识别文本结果; 当边缘端与云端均生成可用识别文本结果时,分别计算各结果的平均帧级置信度; 比较边缘端与云端识别文本的平均帧级置信度,选择置信度较高的文本作为最终识别结果; 最终识别结果记录包含帧序列、对应时间戳、识别路径标识及平均置信度,输出至输出模块。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人清大凯联科技(北京)有限公司,其通讯地址为:101100 北京市通州区通胡大街15号院7号楼5层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励