技术特征:
1.一种阅读支援系统,包括:读取对象文件的文件读取部;将所述对象文件分割成多个块的文件分割部;按所述多个块的每一个取得单词的分布式表示的第一分布式表示取得部;读取查询文本的查询文本读取部;抽出包括在所述查询文本中的单词而取得单词的分布式表示的第二分布式表示取得部;以及对所述查询文本和所述多个块的每一个中的单词的分布式表示进行比较而求出相似度的相似度取得部,其中,所述相似度取得部从包括在块中的单词检索与包括在所述查询文本中的单词一致的单词而求出所一致的单词的所述块中的单词的分布式表示与所述查询文本中的单词的分布式表示的相似度。2.根据权利要求1所述的阅读支援系统,其中所述多个块各自包括所述对象文件中的一个或多个段落。3.根据权利要求1所述的阅读支援系统,其中所述多个块各自包括一个或多个句子。4.根据权利要求1所述的阅读支援系统,其中只对于规定词类进行所述相似度的取得。5.根据权利要求1所述的阅读支援系统,其中通过算出余弦相似度来取得所述相似度。6.根据权利要求1所述的阅读支援系统,其中当在所述查询文本与所述块中存在有多个一致的单词时,所述相似度取得部将各单词的分布式表示的相似度的总和设为所述块的分数。7.一种阅读支援方法,包括如下步骤:读取对象文件的步骤;将所述对象文件分割成多个块的步骤;按所述多个块的每一个取得单词的分布式表示的步骤;读取查询文本的步骤;抽出包括在所述查询文本中的单词而取得单词的分布式表示的步骤;以及对所述查询文本和所述多个块的每一个中的单词的分布式表示进行比较而求出相似度的步骤,其中,在求出所述相似度的步骤中,从包括在块中的单词检索与包括在所述查询文本中的单词一致的单词而求出所一致的单词的所述块中的单词的分布式表示与所述查询文本中的单词的分布式表示的相似度。8.根据权利要求7所述的阅读支援方法,其中所述多个块各自包括所述对象文件中的一个或多个段落。9.根据权利要求7所述的阅读支援方法,其中所述多个块各自包括一个或多个句子。10.根据权利要求7所述的阅读支援方法,
其中只关于规定词类进行所述相似度的取得。11.根据权利要求7所述的阅读支援方法,其中通过算出余弦相似度来取得所述相似度。12.根据权利要求7所述的阅读支援系统,其中当在所述查询文本与所述块中存在有多个一致的单词时,将各单词的分布式表示的相似度的总和设为所述块的分数。
技术总结
提供一种阅读支援系统或阅读支援方法,该阅读支援系统或阅读支援方法能够作为查询文本输入自然语言且将与所输入的文本的相关度高的部分提示到读者。该阅读支援系统包括:读取对象文件的文件读取部;将对象文件分割成多个块的文件分割部;按多个块的每一个取得单词的分布式表示的第一分布式表示取得部;读取查询文本的查询文本读取部;抽出包括在查询文本中的单词而取得单词的分布式表示的第二分布式表示取得部;以及对查询文本和多个块的每一个中的单词的分布式表示进行比较而求出相似度的相似度取得部。相似度取得部从包括在块中的单词检索与包括在查询文本中的单词一致的单词而求出所一致的单词的块中的单词的分布式表示与查询文本中的单词的分布式表示的相似度。似度。似度。
技术研发人员:道前芳隆 东和树 山本一宇
受保护的技术使用者:株式会社半导体能源研究所
技术研发日:2020.06.22
技术公布日:2022/2/23
再多了解一些
本文用于企业家、创业者技术爱好者查询,结果仅供参考。