一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

预上线道路挖掘方法、装置、电子设备及存储介质与流程

2022-11-12 01:14:04 来源:中国专利 TAG:

技术特征:
1.一种预上线道路挖掘方法,包括:从预定数据源获取文本信息;从获取到的文本信息中筛选出与预上线道路相关的文本信息;对筛选出的文本信息进行预上线道路信息提取,得到挖掘出的预上线道路。2.根据权利要求1所述的方法,其中,所述从预定数据源获取文本信息包括:在预定应用提供的搜索框中输入所构建的搜索词进行搜索,得到搜索结果列表,分别对所述搜索结果列表中的各搜索结果页进行信息抓取,得到所述文本信息;和/或,对预定的信息发布源发布的信息进行抓取,得到所述文本信息。3.根据权利要求1所述的方法,其中,所述从获取到的文本信息中筛选出与预上线道路相关的文本信息包括:根据所构建的筛选词从获取到的文本信息中筛选出与预上线道路相关的文本信息。4.根据权利要求3所述的方法,其中,所述根据所构建的筛选词从获取到的文本信息中筛选出与预上线道路相关的文本信息包括:针对获取到的任一文本信息,若确定所述文本信息中同时包括第一白名单列表中的筛选词以及第二白名单列表中的筛选词,且不包括黑名单列表中的筛选词,则将所述文本信息作为筛选出的文本信息,所述第一白名单列表中的筛选词和所述第二白名单列表中的筛选词为不同类型的筛选词。5.根据权利要求3所述的方法,还包括:对筛选出的文本信息进行二次筛选,所述二次筛选包括:针对筛选出的任一文本信息,分别利用预先训练得到的分类模型对所述文本信息进行分类,若根据分类结果确定所述文本信息为与预上线道路相关的文本信息,则将所述文本信息作为筛选出的文本信息。6.根据权利要求1~5中任一项所述的方法,还包括:对筛选出的文本信息进行文本去重处理;对进行去重处理后的文本信息进行预上线道路信息提取。7.一种预上线道路挖掘装置,包括:获取模块、筛选模块以及挖掘模块;所述获取模块,用于从预定数据源获取文本信息;所述筛选模块,用于从获取到的文本信息中筛选出与预上线道路相关的文本信息;所述挖掘模块,用于对筛选出的文本信息进行预上线道路信息提取,得到挖掘出的预上线道路。8.根据权利要求7所述的装置,其中,所述获取模块在预定应用提供的搜索框中输入所构建的搜索词进行搜索,得到搜索结果列表,分别对所述搜索结果列表中的各搜索结果页进行信息抓取,得到所述文本信息,和/或,对预定的信息发布源发布的信息进行抓取,得到所述文本信息。9.根据权利要求7所述的装置,其中,所述筛选模块根据所构建的筛选词从获取到的文本信息中筛选出与预上线道路相关的文本信息。10.根据权利要求9所述的装置,其中,所述筛选模块针对获取到的任一文本信息,若确定所述文本信息中同时包括第一白名
单列表中的筛选词以及第二白名单列表中的筛选词,且不包括黑名单列表中的筛选词,则将所述文本信息作为筛选出的文本信息,所述第一白名单列表中的筛选词和所述第二白名单列表中的筛选词为不同类型的筛选词。11.根据权利要求9所述的装置,其中,所述筛选模块进一步用于,对筛选出的文本信息进行二次筛选,所述二次筛选包括:针对筛选出的任一文本信息,分别利用预先训练得到的分类模型对所述文本信息进行分类,若根据分类结果确定所述文本信息为与预上线道路相关的文本信息,则将所述文本信息作为筛选出的文本信息。12.根据权利要求7~11中任一项所述的装置,其中,所述挖掘模块进一步用于,对筛选出的文本信息进行文本去重处理,对进行去重处理后的文本信息进行预上线道路信息提取。13.一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-6中任一项所述的方法。14.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使计算机执行权利要求1-6中任一项所述的方法。15.一种计算机程序产品,包括计算机程序/指令,所述计算机程序/指令被处理器执行时实现权利要求1-6中任一项所述的方法。

技术总结
本公开提供了预上线道路挖掘方法、装置、电子设备及存储介质,涉及智能交通、深度学习以及自然语言处理等人工智能领域,其中的方法可包括:从预定数据源获取文本信息;从获取到的文本信息中筛选出与预上线道路相关的文本信息;对筛选出的文本信息进行预上线道路信息提取,得到挖掘出的预上线道路。应用本公开所述方案,可节省人力和时间成本,提升处理效率等。等。等。


技术研发人员:李壮 葛德金 李江龙 谷艳蕾 李曼 卢振 曹婷婷 杨建忠 夏德国 于文文 白玉
受保护的技术使用者:北京百度网讯科技有限公司
技术研发日:2022.02.22
技术公布日:2022/11/10
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献