新译信息科技(深圳)有限公司李志伟获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉新译信息科技(深圳)有限公司申请的专利训练数据管理方法、训练数据管理设备和可读存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115600611B 。
龙图腾网通过国家知识产权局官网在2026-04-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211291124.0,技术领域涉及:G06F40/42;该发明授权训练数据管理方法、训练数据管理设备和可读存储介质是由李志伟;邢俊文;柳晓;张旭敏设计研发完成,并于2022-10-21向国家知识产权局提交的专利申请。
本训练数据管理方法、训练数据管理设备和可读存储介质在说明书摘要公布了:本申请公开了一种训练数据管理方法、训练数据管理设备和计算机可读存储介质,该方法包括:根据在模型选择界面接收到的第一选定操作,确定目标基准模型,并获取所述目标基准模型对应的训练数据集;根据训练数据集的选择界面接收到的第二选定操作,确定所述目标基准模型对应的目标训练数据集;根据所述目标训练数据集确定测试数据集;基于所述目标训练数据集对所述目标基准模型进行训练,并基于所述测试数据集对训练后的所述目标基准模型进行测试。解决了使用常规方法确定的测试数据客观性不强,导致测试结果不准确的技术问题,实现了获取较高质量的测试数据,准确评价翻译模型的技术效果。
本发明授权训练数据管理方法、训练数据管理设备和可读存储介质在权利要求书中公布了:1.一种训练数据管理方法,其特征在于,所述训练数据管理方法包括: 在接收到训练任务的创建指令时,输出所述训练任务对应的模型选择界面; 基于所述模型选择界面接收到的第一选定操作,确定目标基准模型,并获取所述目标基准模型对应的训练数据集; 输出所述训练数据集的选择界面,并基于所述选择界面接收到的第二选定操作,确定所述目标基准模型对应的目标训练数据集; 在接收到关联处理指令时,输出测试数据集的选定界面; 基于所述测试数据集的选定界面接收到的第三选定操作,确定预设数量以及所述测试数据集的名称; 在所述目标训练数据集中,随机选取所述预设数量的训练数据,组成所述测试数据集,并根据所述名称命名所述测试数据集,以确定所述测试数据集; 将所述测试数据集与所述目标训练数据集关联存储; 所述随机选取所述预设数量的训练数据的步骤包括: 确定所述关联处理指令对应的领域类型以及句对长度; 根据所述预设数量,随机抽取所述目标训练数据集中,与所述领域类型以及所述句对长度匹配的所述训练数据; 基于所述目标训练数据集对所述目标基准模型进行训练,并基于所述测试数据集对训练后的所述目标基准模型进行测试。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人新译信息科技(深圳)有限公司,其通讯地址为:518000 广东省深圳市前海深港合作区前湾一路1号A栋201室(入驻深圳市前海商务秘书有限公司);或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励