Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 四川大学王海舟获国家专利权

四川大学王海舟获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉四川大学申请的专利一种基于监督学习的社交网络敏感委婉语检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116257698B

龙图腾网通过国家知识产权局官网在2026-04-28发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310284154.7,技术领域涉及:G06F16/9536;该发明授权一种基于监督学习的社交网络敏感委婉语检测方法是由王海舟;周罡;金地;陈雅宁;杨菲;王文贤;陈兴蜀设计研发完成,并于2023-03-22向国家知识产权局提交的专利申请。

一种基于监督学习的社交网络敏感委婉语检测方法在说明书摘要公布了:本发明公开了一种基于监督学习的社交网络敏感委婉语检测方法,首先对某社交网络平台上的数据进行采集,包括用户评论和视频弹幕信息,然后利用敏感委婉词对数据集进行数据过滤和严格的人工标注,建立了有标注的数据集敏感委婉语数据集,最后利用基于对比学习的ConSERT框架进行句子表征,并结合Bi‑LSTM和注意力机制提出了敏感委婉句分类检测模型,实现了对敏感委婉语的有效检测。实验评估结果表明,SED模型在敏感委婉语检测问题上的效果优于常用的敏感内容检测方法。本发明的研究工作为将来面向社交网络的敏感委婉语检测提供了方法与思路。

本发明授权一种基于监督学习的社交网络敏感委婉语检测方法在权利要求书中公布了:1.一种基于监督学习的社交网络敏感委婉语检测方法,其特征在于,总体包括以下步骤: 步骤1:数据收集与标注:采用Web爬虫,对待检测社交网络平台上的数据进行采集,并对采集到的数据进行数据过滤和选择,再进行人工标注,从而构建敏感委婉语数据集; 步骤2:特征提取:在对输入句子进行初始化Embedding以后生成初始句向量,通过不同的数据增强方式生成句向量的不同增强版本,再使用BERT共享编码共享句向量生成参数,再采用对比学习层进行优化调整,使句向量的空间特征分布均匀化,最终输出增强句向量; 步骤3:检测模型:基于ConSERT模型以及增强句向量,并结合Bi-LSTM和注意力机制构建敏感委婉句分类检测模型,将所述增强句向量输入至敏感委婉句分类检测模型中,基于句子特征向量对社交网络平台上的敏感委婉语进行检测; 所述步骤2具体包括: 步骤2.1:通过输入层输入经过预处理的数据文本; 预处理后的句子包含个字,为设置的最大序列长度,将超过字的部分舍去,不足则补0; 步骤2.2:通过调优后的BERT模型对输入层的数据文本处理后生成初始句向量; 步骤2.2.1:利用所述社交网络平台上的视频评论和弹幕数据对BERT-Base-Chinese模型进行预训练,并运用SES-Dataset数据集对该模型进行微调,得到调优后的BERT模型; 步骤2.2.2:将预处理后的数据文本标记化后得到标记文本,将其输入至调优后的BERT模型中,进行词嵌入提取后通过平均池化,从而得到句嵌入形式的优质语义特征;如下式: 2; 3; 4; 其中,S为句向量; 步骤2.3:通过数据增强层根据不同的数据增强策略生成用于对比学习的样本对; 步骤2.4:通过对比损失层完成对比预测任务; 给定一个集合,包括一对正样本和,对比预测任务的目的是对于一个给定的,在中识别出; 从同一增强集合中采样两个单独的数据增强算子,并应用于每个数据样本,以获得两个相关的样本对;利用得到的样本对,对一个基本编码器网络和一个投影神经网络进行训练,训练完成后,去掉投影头,并将编码器和表示用于下游任务; 通过随机抽取批样本,并且对于小批量的增强样本对,定义对比预测任务,得到个数据点;再给定一个正样本对,将一个小批中的其他增强样本视为负样本; 由此得到正样本对的损失函数的定义,即正则化温度缩放交叉熵损失函数,如下式所示: 5; 其中,是一个当且仅当时取值为1的指标函数,代表温度参数;表示通过正则化后的和的余弦相似度,、和分别为样本、样本和样本向量。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人四川大学,其通讯地址为:610065 四川省成都市武侯区一环路南一段24号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。