谷歌有限责任公司唐·明·良获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉谷歌有限责任公司申请的专利使用无监督数据增强来训练机器学习模型获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN113826125B 。
龙图腾网通过国家知识产权局官网在2026-04-07发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202080031320.7,技术领域涉及:G06N20/00;该发明授权使用无监督数据增强来训练机器学习模型是由唐·明·良;国·V·勒;谢其哲;戴自航设计研发完成,并于2020-04-24向国家知识产权局提交的专利申请。
本使用无监督数据增强来训练机器学习模型在说明书摘要公布了:用于训练机器学习模型的方法、系统和装置,包括编码在计算机存储介质上的计算机程序。所述方法之一包括接收包括多个未标记训练输入和多个标记训练输入的训练数据;生成经增强的训练数据,包括针对所述多个未标记训练输入中的每一个通过将数据增强技术应用于所述未标记训练输入来生成相应的经增强的训练输入;以及在经增强的训练数据上训练机器学习模型。特别地,但不排他地,可针对感知任务例如,与视觉或语音有关的任务训练模型。
本发明授权使用无监督数据增强来训练机器学习模型在权利要求书中公布了:1.一种用于训练机器学习模型的计算机实现的方法,所述机器学习模型被配置为将模型输入映射到模型输出,以执行特定机器学习任务,其中: 所述机器学习模型被训练为将包括视觉数据的模型输入映射到模型输出,由此执行计算机视觉任务,或 所述机器学习模型被训练以将包括表示口头话语的音频数据的输入映射到输出,以执行语音分类任务,或 所述模型输入包括针对患者的电子健康记录数据,并且对应的所述模型输出包括针对所述患者的可能诊断上的概率分布,或 所述特定机器学习任务是文档分类,所述模型输入是来自互联网资源或文档的文本,并且给定互联网资源、文档或文档部分的所述模型输出是话题集合中的每一个话题的分数,每个分数表示所述互联网资源、文档或文档部分是关于所述话题的估计似然性,或 所述特定机器学习任务是自然语言理解任务,所述模型输入是文本序列,给定文本序列的所述模型输出是适合所述自然语言理解任务的概率分布, 所述方法包括: 接收训练数据以用于训练所述机器学习模型,所述训练数据包括: 多个未标记训练输入;以及 多个已标记训练输入,以及针对每个已标记训练输入的应当由所述机器学习模型通过对该已标记训练输入执行所述特定机器学习任务而生成的地面真值输出; 生成经增强的训练数据,包括针对所述多个未标记训练输入中的每一个通过将数据增强技术应用于该未标记训练输入来生成相应的经增强的未标记训练输入; 在所述经增强的训练数据上训练所述机器学习模型,包括: 在所述多个未标记训练输入和所述对应的多个经增强的未标记训练输入上训练所述机器学习模型以优化无监督目标,所述无监督目标测量i由所述机器学习模型针对给定未标记训练输入所生成的模型输出与ii由所述机器学习模型针对从所述给定未标记训练输入所生成的所述经增强的未标记训练输入生成的模型输出之间的差异,以及 在所述多个已标记训练输入上训练所述机器学习模型以优化监督目标,所述监督目标测量i由所述机器学习模型针对给定已标记训练输入所生成的模型输出与ii针对所述给定已标记训练输入的所述地面真值输出之间的差异。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人谷歌有限责任公司,其通讯地址为:美国加利福尼亚州;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励