Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请提供了一种多语言音频内容检索方法,可以应用于人工智能技术领域。该方法包括:通过预先训练的音频编码器对示例片段进行音频特征提取,得到示例通用语音序列;对示例通用语音序列进行离散化处理,生成用以表征示例通用语音序列的音频词汇的示例离散序列...
  • 本发明公开了一种基于语音识别的低时延集群语音调度方法,包括:步骤一:采集语音流数据,并切分为多个语音分片;步骤二:进行节点分配处理,形成调度状态向量;步骤三:计算排队状态参数与推理时延参数,并构建排队状态指标;步骤四:利用改进型CUSIDE...
  • 本申请公开了无数据语音识别。描述了使用不需要任何与用于人机接口的说出的唤醒词(WW)或命令匹配的语音数据来训练的语音识别系统来识别WW或命令的技术。系统在部署之前使用WW或命令的文本或字素表示来进行训练。该技术包括由系统接收目标语言的目标短...
  • 本公开涉及用于多说话者环境中免注册的自动语音识别(ASR)的系统和方法。该系统可以处理包含来自目标说话者和一个或更多个干扰说话者的语音的混合音频信号。通过应用诸如房间脉冲响应(RIR)和/或语音干扰能量比等声学特性,该系统可以模拟环境以提高...
  • 一种基于对比学习预训练的语音关键词识别系统,其步骤如下,首先,将大量易获取的成对的语音‑文本数据送入设计好的基于三元对比学习的预训练框架中进行预训练,目的是通过优化语音元对比损失、语音‑音素元对比损失和音素元对比损失三类损失,训练得到能够将...
  • 本发明涉及语音交互技术领域,具体公开了一种AI机器人低延迟语音交互方法及系统,本发明获取流式声学特征向量序列和语音元数据,基于该序列提取词元获取词元嵌入向量,根据预设回复长度与已识别词元数量差确定待预测位置,选取掩码标识符嵌入向量组成初始掩...
  • 本申请提供一种语音识别大模型的训练方法、语音处理方法和产品,属于语音处理的技术领域。所述语音识别大模型的架构包括初始编码器和大模型,所述方法包括通过初始编码器提取语音数据的语义特征;通过目标语音离散化模型提取语音数据的声学特征,并通过知识蒸...
  • 本申请提供了一种基于意图推测与前缀流式拼接的低延迟人机交互方法、系统、电子设备及存储介质。该方法包括:在用户语音输入过程中,实时接收音频流并基于不完整的语义片段预测候选意图;针对候选意图,预先生成不包含具体事实性信息的通用响应前缀,并将其转...
  • 本申请提供了一种面向汽车音响系统声音模式的识别方法及系统,应用于声音识别技术领域,通过采集车内声音信号并处理得到声音模式判断结果及判断可靠度指数,同时获取车辆运行状态信息和车内环境噪声信息以评估环境稳定度并量化为环境稳定度指数,进而根据判断...
  • 本发明实施例公开了一种穿戴设备、语音处理方法和装置。通过在穿戴设备中设置多轴骨传导传感器,利用多轴骨传导传感器采集各个轴的第一语音信号,确定穿戴设备的使用场景后,根据使用场景在各个轴的第一语音信号中选择一个轴的第一语音信号确定为目标第一语音...
  • 本发明提供了一种增强车载语音识别效果的方法、装置、电子设备及介质,涉及语音识别技术领域,包括:通过数据感知层,实时获取车辆的多维度上下文信息;通过区域化配置层,基于实时地理位置,动态加载与当前地域关联的区域化语言资源包;融合多维度上下文信息...
  • 本发明涉及用于语音识别的HMM解码补偿和用于低资源命令识别的多结构解码。描述了使用语音识别系统来识别用于人机接口的所说出的唤醒词(WW)或命令的技术,该语音识别系统不需要任何WW/命令匹配的语音数据进行训练。系统在部署之前使用WW或命令的文...
  • 本实施方式所涉及的系统,旨在通过专家保障生成AI生成物的可靠性。本实施方式所涉及的系统,具备受理部、分析部、委托部、检查部及存储部。受理部受理来自委托人的委托。分析部分析由受理部受理的委托。委托部向由分析部确定的专家发出委托。检查部由委托部...
  • 本实施方式所涉及的系统,旨在基于视频数据自动制作易于理解的操作手册。本实施方式所涉及的系统,具备解析部、生成部、制作部和支持部。解析部用于解析视频。生成部基于解析部解析的视频内容生成图像和说明文。制作部基于生成部生成的图像和说明文制作操作手...
  • 本申请提供了一种语音助手交互的方法和电子设备,电子设备可以根据自身的设备姿态和设备动作来确定是否唤醒语音助手,该设备姿态可以是结合电子设备的多种传感器的测量数据确定的,例如:IMU的测量数据、超声信号的测量数据、电容屏的触控信息或接近传感器...
  • 本申请实施例提供一种显示设备与语音指令识别方法。显示设备在接收到语音指令的情况下,通过采集与当前媒资画面相关的视觉数据构建热词库,以提供包含上下文信息的多个热词。以及对语音指令进行分析,拆分得到多个候选路径。进而基于对多个候选路径与热词的匹...
  • 本公开提供了一种适用于工业控制的语音指令识别方法,包括:将用户输入的语音指令转换为原始文本;对原始文本进行术语标准化处理得到标准文本;使用静态匹配列表对标准文本进行静态匹配;若静态匹配列表未命中,则执行如下多级动态匹配:使用包含完整字段的匹...
  • 本申请提供了一种车辆的语音处理方法、车辆、服务器、系统及介质,应用于车辆,所述方法包括:接收用户发出的语音指令;对语音指令进行语音识别,将语音指令转化为指令文本;对指令文本进行语义解析,获得与指令文本对应的语义解析结果,语义解析结果用于表征...
  • 本申请提供一种显示设备及基于目标场景的语音交互方法,预先在场景指令库中设置目标场景,并存储目标场景对应的场景指令。控制器响应于在第一目标场景下接收的语音指令,在第一目标场景对应场景指令中查询与语音指令匹配的目标场景指令,若查询到目标场景指令...
  • 本申请提供一种语音多意图指令的响应方法及系统,涉及语音识别技术领域,方法包括:对接收的用户语音输入进行解析,识别出用户的各个操作意图;基于每个操作意图的特征对每个操作意图进行分类,获得不同类别的操作意图;将单交互类别下的操作意图转化为对应的...
技术分类