一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

结构化信息卡的搜索和检索的制作方法

2022-07-06 06:18:49 来源:中国专利 TAG:
结构化信息卡的搜索和检索1.分案说明2.本技术属于申请日为2017年10月26日的中国发明专利申请201711019617.8的分案申请。
技术领域
:3.本说明书与搜索引擎有关。
背景技术
::4.搜索查询可用于识别与用户的需要相关的资源(例如,web页面、图像、文本文档、电子邮件文档、多媒体内容等)并且用于以对用户最有用的方式呈现与资源有关的信息。计算机系统可以接收搜索查询,对该搜索查询进行处理,识别与该搜索查询相关的结果,并且响应于用户提交的查询返回搜索结果集。技术实现要素:5.在一些实施方式中,提供了可识别结构化信息卡的附加触发词项的卡触发词项识别单元。该卡触发词项识别单元允许通过评估潜在地包括在结构化信息卡的语法中的候选词项来随着时间的推移而调谐一个或多个结构化信息卡的语法。例如,假定“movie(电影)”结构化信息卡的语法包括词项“movietime(电影时间)”、“movieticketconfirmation(电影票确认)”和“ticketconfirmationnumber(票确认号码)”。该卡触发词项识别单元可以分析与“movie”结构化信息卡的语法相关联的词项和一个或多个候选查询,并且识别“movie”结构化信息卡的诸如触发词项“movieticket(电影票)”的附加触发词项。因此,被接收到的包括诸如“movietime”、“movieticket”或两者的词项的后续查询将响应于这样的查询而触发“movie”结构化信息卡的显示。6.根据一个实施方式,可以在促进识别结构化信息卡的附加触发词项的方法中具体实现本说明书的主题。所述方法可以包括响应于搜索查询而访问与用于呈现结构化信息的模板相关联的数据的动作,其中所访问的数据引用(i)一个或多个标签词项,所述一个或多个标签词项在被包括在所述搜索查询中时触发根据所述模板呈现所述结构化信息,以及(ii)用于所述一个或多个标签词项中的每一个标签词项的值,从而获取尚未与用于呈现所述结构化信息的所述模板相关联的候选标签词项。针对所述一个或多个标签词项中的每一个标签词项,识别与该标签词项相关联的一个或多个实体,识别与所述候选标签词项相关联的一个或多个实体。针对与所述候选标签词项相关联的所述一个或多个实体中的每一个实体,使以下两者与所述候选标签词项相关联:(i)和该实体相关联的所述一个或多个标签词项中的一个或多个,以及(ii)对于与该实体相关联的所述一个或多个标签词项中的所述一个或多个中的每一个标签词项,和该标签词项相关联的值;以及在随后接收到包括所述候选标签词项的搜索查询时,使用与所述候选标签词项相关联的一个或多个值来确定是否触发根据所述模板呈现所述结构化信息。7.其它版本包括用于执行在计算机存储设备上编码的方法的动作的对应系统、装置和计算机程序。8.这些和其它版本可以可选地包括以下特征中的一个或多个。例如,在一些实施方式中,所述一个或多个标签词项与搜索查询的一个或多个参数相对应。9.在一些实施方式中,所述值指示所述搜索查询已用于触发呈现所述结构化信息的次数。10.在一些实施方式中,获取尚未与用于呈现所述结构化信息的所述模板相关联的候选标签词项可以包括从查询日志识别一个或多个查询词项。11.在一些实施方式中,使用与所述候选标签词项相关联的所述一个或多个值来确定是否触发根据所述模板呈现所述结构化信息可以包括:合计与所述候选标签词项相关联的所述一个或多个值;确定所合计的值是否满足预定阈值;以及响应于确定所合计的值满足所述预定阈值,确定包括所述候选标签词项的所述搜索查询将触发呈现所述结构化信息。12.在一些实施方式中,使用与所述候选标签词项相关联的所述一个或多个值来确定是否触发根据所述模板呈现所述结构化信息可以包括:合计与所述候选标签词项相关联的所述一个或多个值;确定所合计的值是否满足预定阈值;以及响应于确定所合计的值超过所述预定阈值,确定包括所述候选标签词项的所述搜索查询将不触发呈现所述结构化信息。13.在一些实施方式中,所述方法可以进一步包括基于候选标签与所述一个或多个标签词项的相似性来调整与候选标签相关联的所述一个或多个值。14.这些和其它版本各自可以可选地包括以下特征中的一个或多个。附图说明15.图1是用于识别结构化信息卡的附加触发词项的系统的示例的场境图。16.图2a是卡触发词项识别单元的方面的示例的场境图。17.图2b是卡触发词项识别单元的附加方面的示例的场境图。18.图3是用于识别结构化信息卡的附加触发词项的过程的示例的流程图。19.图4是卡触发词项识别单元的示例的场境图。20.在附图和以下描述中阐述了这些和其它实施方式的细节。其它特征和优点根据说明书和附图并根据权利要求书将是显而易见的。具体实施方式21.图1是用于识别结构化信息卡170的附加触发词项的系统100的示例的场境图。系统100包括用户设备110、服务器120和网络130。22.在图1的示例中,在阶段a处,假定用户设备110的用户正站在用户到科罗拉多州丹佛的航班#437前面的机场售票柜台处。为了检查用户的行李并获取登机牌,用户需要为用户的即将到来的航班提供航班确认号码。响应于来自航空公司雇员对用户的航班确认号码的请求,用户设备110的用户可以设法从航空公司获取包括了用户的航班确认号码的确认电子邮件。为了获取该确认电子邮件,用户将包括词项“flightticket(机票)”的搜索查询112a输入到用户界面111a的搜索框113a中。23.在接收到搜索查询112a之后,用户设备110可以经由网络130将搜索查询112a传送到服务器120,所述网络130包括lan、wan、蜂窝网络、互联网等中的一个或多个。服务器120可以对搜索查询112a进行处理,识别响应于搜索查询112a词项“flightticket”的一个或多个搜索结果,然后将搜索结果返回134给用户设备110。搜索结果可以由用户设备110接收,并且被提供用于使用用户设备110的界面111a来显示。在此示例中,搜索结果可以包括对电子邮件文档的引用,诸如引用114a、115a、116a、117a、118a、119a。引用可以包括链接,所述链接当被选择时,提供与该链接相关联的电子邮件文档以用于在用户设备110上显示。每个相应的引用可以包括诸如电子邮件发件人的名字、电子邮件的主题行、电子邮件被接收到的时间以及电子邮件被接收到的日期的文本。24.基于搜索查询词项“flightticket”而识别的搜索结果可以包括来自各种不同的发件人的电子邮件。例如,搜索结果可以包括对来自与用户购买电影票以看“pilot’sfirstflight(飞行员的第一次飞行)”有关的电影院“abctheatre(abc电影院)”的电子邮件的引用114a。搜索结果也可以包括对来自用于预订“wineflightbar(飞行酒吧)”的餐厅预订服务“closedtable(闭式餐桌)”的电子邮件的引用115a。搜索结果也可以包括对包括来自“dcoutfitters(dc旅行用品店)”的针对购买“flightjacket(飞行夹克)”的订单确认的电子邮件的引用117a。搜索结果也可以包括对来自诸如“neairlines(ne航空公司)”、“seairlines(se航空公司)”等的航空公司的与机票购买确认相关联的电子邮件的多个引用116a、118a、119a。例如,一个特定引用116a引用用户在从“neairlines”购买“flight437(航班437)”的机票之后接收到的确认电子邮件。25.然而,给定响应于搜索查询112a而提供的搜索结果的集合,获取用户的航班确认号码可以是相当费时的。这是因为用户必须读取对响应于用户的搜索的每个相应的电子邮件的每个引用的发件人和主题行。例如,甚至直到用户读取引用114a、115a和116a的发件人和主题用户才能识别包括航班确认号码的正确的电子邮件。然后,用户设备110的用户必须选择引用116a以请求与引用116a相关联的电子邮件文档。最后,在与引用116a相对应的电子邮件文档被选择之后,具有用户的即将到来的航班#437的航班确认号码的电子邮件文档被返回。尽管用户能够获取用户的确认号码,然而该过程效率低。此外,该过程由于诸如因为售票柜台处位于用户后面的一长排不守规矩的乘客对用户造成的压力、由于机场候机楼里的不良接收而导致的慢蜂窝数据信号等的许多原因而可能不太顺利。26.系统100提供用于改进用户从用户的电子邮件收件箱中检索信息的解决方案。例如,在阶段a处,系统100提供被存储在结构化信息卡存储单元140a中的多个结构化信息卡142a、144a、146a。每个结构化信息卡包括模板152a和语法154a。结构化信息卡的模板152a包括可响应于特定搜索查询的用来自电子邮件文档的信息填充的一个或多个预定字段。例如,结构化信息存储单元140a可以包括“flight(航班)”信息的结构化信息卡142a。“flight”信息的结构化信息卡142a可以包括“to”字段、“from”字段、“departs”字段、“conf.#”字段和“flight#”字段。27.语法154a可以包括与卡142a相关联的一个或多个触发词项。触发词项可以包括一个或多个词项,所述词项当由服务器120检测到为被包括在搜索查询中时,触发与该触发词项相关联的结构化信息卡的检索、填充和显示。例如,响应于包括词项“flightreservation(航班预订)”的查询,“flight”结构化信息卡142a可以被获取,用来自与即将到来的航班相关联的最近的电子邮件的数据填充,并且被提供用于经由诸如用户界面111a的用户界面显示。然而,因为在阶段a处搜索词项“flightticket”未被包括在“flight”结构化信息卡142a的语法154a中,所以响应于具有搜索词项“flightticket”的搜索查询112a而未触发“flight”结构化信息卡142a。28.服务器120可使用卡触发词项识别单元160来识别可用于触发“flight”结构化信息卡142a的一个或多个附加词项。附加词项可以基于例如从与由用户设备显示的用户界面相关联的搜索框(诸如用户界面111a的搜索框112a)接收到的一个或多个查询。在一些实施方式中,卡触发词项识别单元160可从接收到的查询词项的日志获取查询词项,确定该查询词项是否与结构化信息卡的语法中的一个或多个其它词项有关,并且在一些情况下,将该查询词项添加到结构化信息卡的语法。例如,卡触发词项识别单元160可以确定应该将词项“flightticket”添加到“flight”结构化信息卡的语法154a。将词项“flightticket”添加到“flight”结构化信息卡的语法在阶段b处导致更新的结构化信息存储单元140b。29.在阶段b处,相同用户设备110的用户可在稍后的时间点访问用户界面111b。用户界面111b可以是与用户界面111a相同的用户界面。用户可以将包括词项“flightticket”的搜索查询112b输入到搜索框113b中。以与相对于阶段a所描述的方式类似的方式,用户设备110可以经由网络130将搜索查询112b传送132到服务器120,所述网络130包括lan、wan、蜂窝网络、互联网等中的一个或多个。服务器120可以对搜索查询112b进行处理,识别响应于搜索查询112b“flightticket”的一个或多个搜索结果,然后将搜索结果返回134给用户设备110。搜索结果可以由用户设备110接收,并且被提供用于使用用户设备110的界面112b来显示。在此示例中,搜索结果可以包括对电子邮件文档的引用,诸如引用114b、115b、116b、117b、118b、119b。在此示例中,返回给用户设备110并在用户界面111b上显示的搜索结果是与被提供用于经由用户界面111a显示的引用114a、115a、116a、117a、118a、119a对相同的电子邮件文档的相同引用。30.然而,在阶段b处,用户界面111b也包括结构化信息卡170。结构化信息卡170可以包括例如包括已经用从响应于搜索查询112b的资源中提取的数据填充的一个或多个字段的显示。结构化信息卡170可以被获取、填充并提供用于经由用户界面111b显示,因为存储在结构化信息卡存储单元140b中的结构化信息卡142b的语法现在包括词项“flightticket”。词项“flightticket”基于卡触发词项识别单元160对包括在一个或多个结构化信息卡142a的语法内的现有词项的分析、包括在结构化信息卡142a的语法内的现有词项之间的一个或多个识别的关系以及前述语法词项与经由搜索框113a先前提交的一个或多个查询之间的一个或多个识别的关系被添加到“flight”结构化信息卡142b的语法。31.所获取并显示的特定结构化信息卡170可以基于通过搜索框113b提交的查询词项。例如,服务器120可以基于诸如“flightticket”的搜索查询词项与和特定结构化信息卡170相关联的一个或多个语法词项匹配的确定来选择用于经由用户界面111b显示的特定结构化信息卡170。服务器120可以用包括通过结构化信息卡模板152b的字段所请求的信息的排名最高的搜索结果的内容填充所获取的结构化信息卡。在一些实施方式中,排名最高的搜索结果可以是包括通过结构化信息卡模板152b的字段所请求的信息的最近的电子邮件文档。32.结构化信息卡170提供了在无需用户读取与作为搜索结果由服务器120返回的每个引用114b、115b、116b、117b、118b、119b相关联的数据的情况下显示与用户的即将到来的航班有关的相关信息的优点。此外,结构化信息卡170显示用户的航班目的地(例如,科罗拉多州丹佛)、用户的航班起点(例如,华盛顿特区)、用户的航班起飞时间(例如,东部标准时间上午11:45)、用户的航班确认号码(例如,kp4eg)和用户的航班号码(例如,437)。因此,用户不需要打开包括关于用户的即将到来的航班的信息的电子邮件,因为与用户的即将到来的航班相关联的必要信息被包括在结构化信息卡170内。因此,正站在售票柜台处的用户设备110的用户可快速地搜索用户的电子邮件,从结构化信息卡获取用户的航班确认号码,并且以高效的方式将该航班确认号码提供给航空公司代表。33.使用卡触发词项识别单元160来识别可被添加到结构化信息卡的语法的附加词项的系统100的示例是针对“flight”结构化信息卡142b的。然而,本公开不应该受此限制。替代地,卡触发词项识别单元160可用于识别诸如“movieticket”结构化信息卡144b、“dinnerreservation(晚餐预订)”结构化信息卡146b等的任何类型的结构化信息卡的附加语法词项。结构化信息卡的其它示例可以包括例如旅馆预订结构化信息卡、车辆租赁结构化信息卡、设备租赁结构化信息卡等。此外,可以使用任何类型的结构化信息卡,其中可使用一个或多个语法词项的集合来唯一地识别该结构化信息卡。34.图2a是参考卡触发词项识别单元210a的卡触发词项识别单元的各方面的示例的场境图。术语“单元”由本说明书广泛地使用来指代可执行一个或多个特定功能的基于软件的系统或子系统。通常,单元将作为安装在一个或多个位置中的一个或多个计算机上的一个或多个软件模块或组件被实现。然而,在其它情况下,可在相同的一个或多个计算机上安装多个单元。35.卡触发词项识别单元210a用于分析与一个或多个结构化信息卡的语法相关联的现有词项。与一个或多个结构信息卡的语法相关联的词项包括当在搜索查询中接收到时触发特定结构化信息卡的显示的一个或多个词项。36.在一些实施方式中,分析与一个或多个信息卡的语法相关联的现有词项可以包括生成图形结构212a。图形结构212a可以包括各自与触发特定结构化信息卡的选择、填充和显示的特定语法词项相关联的一个或多个查询节点220a、222a。每个查询节点220a、222a可以与相应的标签词项相关联。例如,查询节点220a与标签词项“flightreservation”相关联并且查询节点222a与标签词项“ticket(票)”相关联。可以从结构化信息卡存储单元、查询日志等获取用于构建图形的标签词项。37.查询节点220a、222a中的每一个可以与特定值相关联。例如,查询节点220a与值232a“800”相关联并且查询节点222a与值234a“500”相关联。相应的值232a、234a可以包括与每个相应的查询节点的标签词项相关联的特定权重。在一些实施方式中,该值可以包括特定标签词项用于触发特定结构化信息卡的选择、填充和显示的次数的计数。例如,值232a“800”可以指示标签词项“flightreservation”用于触发“flight”结构化信息卡124a的选择、填充和显示800次。尽管该值可以指示特定标签词项用于触发特定结构化信息卡的选择、填充和显示的次数,然而本公开未必受此限制。例如,在一些实施方式中,可以基于标签词项的重要性来缩放值232a、234a。38.图形结构212a也可以包括一个或多个实体节点250a、252a、254a。实体节点250a、252a、254a可以包括指示一个或多个节点220a、222a的相应的标签词项之间的关系的数据项。在一些实施方式中,关系可以包括与标签词项相关联的语义关系。例如,每个实体节点250a、252a、254a可以各自包括从与查询节点220a、222a相关联的所有标签词项的共享集合中选择的一个或多个词项。例如,共享单词的集合可以包括从查询节点标签词项“flightreservation”和“ticket(票)”的集合得到的“flight”、“reservation(预订)”和“ticket”。因此,在一个实施方式中,可以将来自共享词项的集合的每个特定词项指派给特定实体节点。例如,实体节点250a可以被指派单词“flight”,实体节点252a可以被指派单词“reservation”,而实体节点254a可以被指派单词“ticket”。尽管此示例描述了基于共享单词的集合而生成的实体节点,然而本公开未必受此限制。例如,实体节点可以包括表示节点220a、222a的标签词项之间的另一关系的其它数据项。例如,每个相应的实体节点可以指示响应于对包括一个或多个标签词项的查询的执行而检索到的特定电子邮件。可替选地或此外,相应的实体节点可以指示响应于包括一个或多个标签词项的查询而返回的特定web地址、网页、url等。39.卡触发词项识别单元210a使对应于每个查询节点220a、222a的值232a、234a与和每个相应的查询节点220a、222a相关联的每个实体节点250a、252a、254a相关联。如果实体节点250a、252a、254a包括从与特定查询节点220a、222a相关联的标签词项得到的数据项,则查询节点220a、222a与实体节点250a、252a,254a相关联。例如,查询节点220a与包括词项“flight”的实体节点250a相关联,因为词项“flight”是从与查询节点220a相关联的标签词项“flightreservation”得到的。类似地,查询节点220a也与包括词项“reservation”的实体节点252a相关联,因为词项“reservation”是从与查询节点220a相关联的标签词项“flightreservation”得到的。类似地,查询节点222a与包括词项“ticket”的实体节点254a相关联,因为词项“ticket”是从与查询节点222a相关联的标签词项“ticket”得到的。可以在图形结构212a中通过创建从特定查询节点指向相关联的实体节点的图形边260a、262a、264a来表示查询节点-实体节点关联。例如,可以在图形结构212a中通过创建从查询节点220a到实体节点250a的图形边260a来表示查询节点220a与实体节点250a之间的关联。必要时,可以以相同的方式创建其它图形边,诸如图形边262a、264a。40.使值232a,234a与一个或多个实体节点250a、252a、254a相关联可以包括基于通过所生成的查询图形212a所建立的预定查询节点-实体节点关联将值232a、234a传播到一个或多个实体节点250a、252a、254。例如,可以使用边260a来将值232“800”从查询节点220a传播到实体节点250a。在基于通过图形边260a所建立的关系将值232“800”从查询节点220a传播到实体节点250a之后,值“800”像通过元素270a所示出的那样变得与实体节点250a相关联。可以基于建立的图形结构边262a、264a通过图形结构212a以相同的方式传播值232a、234a。元素270a、272a、274a在图2a中灰显(grayout),因为直到在基于所建立的图形边260a通过图形结构212a传播值232a、234a之后元素270a、272a、274a才与相应的实体节点270a、272a、274a相关联。在一些实施方式中,值232a“800”和243a“500”未必被主动地传播或者指派给相应的实体节点250a、252a、254a。例如,在一些实施方式中,图形边260a、262a、264a的生成可能足以使值232a“800”和242a“500”与它们相应的实体节点相关联。41.以类似的方式,与每个相应的查询节点220a、222a相关联的标签词项也可以与和每个相应的查询节点相关联的实体节点250a、252a、254a相关联。例如,标签词项“flightreservation”可以基于查询节点220a与实体节点250a之间的指示查询节点220a和实体节点250a是相关的图形边而变得与相关实体节点250a相关联。也可以通过图形结构212a以与上述的标签词项“flightreservation”类似的方式向前传播与查询节点222a相关联的标签词项“ticket”。42.卡触发词项识别单元210a也可以访问与诸如电子邮件应用的一个或多个应用相关联的查询日志。可以执行查询日志的访问来识别可被评估以用于在扩展与特定结构化信息卡的语法相关联的触发词项时使用的一个或多个候选查询词项。作为示例,卡触发词项识别单元210a可以获取候选查询词项“flightticket”240a,以便评估潜在地包括在与诸如“flight”结构化信息卡142a的结构化信息卡相关联的语法中的候选查询词项“flightticket”。查询词项“flightticket”在诸如用户设备110的用户设备的用户在将词项“flightticket”包括在“flight”结构化信息卡的语法中之前提交了查询“flightticket”以使用电子邮箱的诸如界面111a的界面来搜索一个或多个电子邮件之后可能已被存储在查询日志中。43.可以基于候选查询词项“flightticket”在图形结构212a中生成查询节点240a。候选查询节点240a在图2a中用灰色示出,因为直到在从查询日志中检索到候选查询词项“flightticket”之后候选查询节点240a才被添加到图形结构212a。候选查询节点240a与候选标签词项“flightticket”相关联。44.图2b是参照卡触发词项识别单元210b的卡触发词项识别单元的附加方面的示例的场境图。45.卡触发词项识别单元210b可以继续分析由图2a中的卡触发词项识别单元210a生成的图形结构。卡触发词项识别单元210b是图2a中所示出的相同卡触发词项识别单元210a。卡触发词项识别单元210b被单独地描述来示出在从图2a的描述结束的地方开始的卡触发词项识别单元对与一个或多个结构化信息卡的语法相关联的词项的分析的后续阶段处执行的附加操作。46.卡触发词项识别单元210b可以分析图形结构212a以检测在每个相应的实体节点250a、252a、254a与每个相应的候选查询节点240a之间可能存在的关系。例如,卡触发词项识别单元210b可以确定每个相应的实体节点250a、252a、254a是否与特定候选查询节点240a相关联。在一个实施方式中,如果与实体节点相关联的词项被包括在候选查询节点的标签词项中,则实体节点可以与特定候选查询节点240a相关联。例如,实体节点250a与候选查询节点240a相关联,因为候选标签词项“flightticket”包括与实体节点250a相关联的单词“flight”。类似地,例如,实体节点254a与候选查询节点240a相关联,因为候选标签词项“flightticket”包括与实体节点254a相关联的词项“ticket”。同样地,实体节点252a不与候选查询节点240a相关联,因为候选标签词项“flightticket”不包括与实体节点252a相关联的词项“reservation”。然而,在实体节点与候选查询节点之间可以存在其它类型的关联。例如,在实体节点包括电子邮件文档、网络地址、url等的情况下,如果与候选查询节点相关联的候选标签词项将响应于包括候选标签词项的查询而返回电子邮件文档、网络地址等,则实体节点可以与候选查询节点相关联。47.卡触发词项识别单元210b可以修改图形结构212a以创建图形结构212b。卡触发词项识别单元210b可以通过生成表示实体节点与候选查询节点之间的每个关系的图形边来修改图形结构212a。实体节点-候选查询节点关系可以例如通过从特定实体节点指向特定候选查询节点的图形边来表示。例如,卡触发词项识别单元210b可以创建从实体节点250a指向候选查询节点240a的图形边280b。图形边280b因此可以表示实体节点250a与候选查询节点240a之间的前述关系。类似地,例如,卡触发词项识别单元210b可以创建从实体节点254a指向候选查询节点240a的图形边282b。必要时,卡触发词项识别单元210b可以生成表示实体节点与候选查询词项之间的其它关系的其它图形边。48.卡触发词项识别单元210b可以使用所生成的基于实体节点与候选查询节点之间的关系的图形边来使实体节点250a、252a、254a值270a、272a、274a与一个或多个候选查询节点240相关联。使实体节点值与候选查询节点相关联可以包括例如基于所建立的图形边将实体节点值传播到候选查询节点。作为示例,实体节点值270a“800”变得与候选查询节点240a相关联,如通过元素290b所表示的。类似地,例如,实体节点值274a“500”变得与候选查询节点240a相关联,如通过元素292b所表示的。元素290b和292b灰显,因为在值“800”和“500”基于所生成的图形边280b、282b与候选查询节点240a相关联之前元素290b和292b不存在。在一些实施方式中,值270a“800”和274“500”未必被主动地传播或者指派给候选查询节点240a。例如,在一些实施方式中,图形边280b、282b的生成可能足以使值270a和274a与候选查询节点240a相关联。49.以类似的方式,像参考图2a所描述的那样与每个相应的实体节点250a、252a、254a相关联的标签词项也可以与和每个相应的实体节点相关联的一个或多个候选查询节点240a相关联。例如,基于图形边260a与实体节点250a相关联的标签词项“flightreservation”可以基于在实体节点250a与候选查询节点240a之间生成的指示实体节点250a和候选查询节点240a是相关的图形边280b而变得与候选查询节点240a相关联。诸如标签词项“ticket”的其它标签词项也可以基于图形结构212b的其它生成的边而变得与候选查询节点240a相关联。50.在值290b“800”和292b“500”与候选查询节点240a相关联之后,卡触发词项识别单元210b可以基于值290b“800”和292b“500”来确定是否应该将与候选查询节点240a相关联的标签词项“flightticket”添加到诸如“flight”结构化信息卡的结构化信息卡的语法。确定标签词项“flightticket”是否应该与结构化信息卡的语法相关联可以包括合计值290b“800”和292b“500”,并且对照预定阈值来评估合计值。如果确定了诸如“1300”(例如,800 500=1300)的合计值满足预定阈值,则可以将标签词项“flightticket”添加到诸如“flight”结构化信息卡的结构化信息卡的语法。然而,如果诸如“1300”的合计值不满足预定阈值,则不将标签词项“flightticket”添加到结构化信息卡的语法。51.在一些实施方式中,所生成的图形结构212b可以用于在无需更新结构化信息卡的语法的情况下触发结构化信息卡的生成。例如,在更新“flight”结构化信息卡的语法154a之前,服务器120可以接收包括原先未与结构化信息卡的语法154a相关联的诸如“flightticket”的查询词项的查询。然后,可以执行关于图2a和图2b所描述的过程,以便使值290b“800”和292b“500”与和候选标签词项“flightticket”相关联的候选查询节点相关联。接下来,可以合计值290b“800”和292b“500”以获取“1300”的合计值。最后,如上所述,可以确定“1300”的合计值是否满足预定阈值。如果合计值满足预定阈值,则可以重写所接收到的包括词项“flightticket”的查询,使得包括在“flight”结构化信息卡142a的语法154a中未找到的词项“flightticket”的查询在无需更新“flight”结构化信息卡的语法154a的情况下触发“flight”结构化信息卡142a的选择、填充和显示。重写查询可以包括例如将标签词项中的一个或多个添加到经由图形结构212b的构建而变得与候选标签词项“flightticket”相关联的查询。例如,重写查询可以包括将标签词项“flight预订”添加到查询。然后,执行现在包括在“flight”结构化信息卡的语法154a中找到的词项(例如,“flightreservation”)的重写查询将导致“flight”结构化信息卡被选择、填充并提供用于显示。如果基于值290b“800”和292b“500”计算出的合计值不满足预定阈值,则所接收到的具有词项“flightticket”的查询将不会被重写,并且将不触发“flight”结构化信息卡的选择、填充和显示。52.尽管上面提供的示例描述了语法将被更新或者可以重写接收到的查询的场景,然而本公开未必受此限制。例如,也设想了可以存在落入本公开的范围内的可以更新语法以包括附加触发单词并且所接收到的查询在对接收到的查询的处理期间被重写的场景。53.已经在简单加法运算的场境中描述了值290b“800”和292b“500”的前述合计。可以采用其它类型的合计方法。例如,可以使值290b“800”和292b“500”相乘。可替选地,可以计算值290b“800”和292b“500”的某种形式的加权和,并且将结果用作合计值。54.图3是用于识别结构化信息卡的附加触发词项的过程300的示例的流程图。通常,过程300可以包括访问与用于呈现结构化信息310的模板相关联的数据,识别一个或多个实体320的第一集合,将一个或多个标签以及一个或多个值与所识别的实体330的第一集合中的一个或多个实体相关联,获得候选标签词项340,从第一实体集350识别一个或多个实体的子集,将一个或多个标签以及一个或多个值与一个或多个候选标签词项360相关联,接收搜索查询370,并且使用与每个候选标签词项相关联的值来确定是否触发结构化信息380的显示。在下文中,将描述由诸如系统100的系统执行的过程300。系统可以包括一个或多个计算机。55.更详细地,过程300在阶段310开始,其中,系统访问与用于呈现结构化信息的模板相关联的数据。访问阶段310可以包括例如系统访问以包括一个或多个查询节点以及一个或多个实体节点的图结构维护的数据。所访问的数据可以包括诸如分别与至少一个查询节点相关联的一个或多个标签词项的数据。一个或多个标签词项可以引用当被包括在搜索查询中时触发呈现包括结构化信息的结构化信息卡的数据。结构化信息可以基于例如与结构化信息卡相关联的模板。56.一个或多个标签词项中的每一个可以与值相关联。该值可以包括例如表示一个或多个标签词项已被用于触发结构化信息卡的显示的次数的访问计数。在一些实施方式中,可以使用缩放因子来缩放值,该缩放因子可以基于与该值相关联的一个或多个标签词项的重要性来增加与该值相关联的权重或减小与该值相关联的权重。57.过程300可以通过系统识别与一个或多个标签词项相关联的第一实体集在阶段320继续。第一实体集中的所识别的实体可以包括一个或多个实体,每个实体包括与一个或多个标签词项相关的数据项。例如,一个或多个实体的集合可以包括与一个或多个标签词项具有语义关系的数据项。例如,由每个识别的实体表示的词项组合集可以包括所有一个或多个标签词项的集合。虽然该示例描述了基于共享字集生成的实体节点,但是本公开不需要如此限制。例如,第一实体集中的特定实体可以包括表示与查询节点相关联的一个或多个标签词项的其他关系的其他数据项。例如,每个相应的实体可以表示响应于执行包括一个或多个标签词项的查询来检索的特定电子邮件。替选或附加地,各个实体可以表示响应于包括一个或多个标签词项的查询返回的特定web地址、网站、url等。58.在阶段330,系统可以将与一个或多个相应的查询节点相关联的一个或多个标签与一个或多个实体相关联。将一个或多个标签与一个或多个实体相关联可以包括将查询节点的标签词项分配给查询节点所关联的每个实体。例如,假设查询节点与标签“flightreservation(航班预订)”相关联。在这样的示例中,标签“flightreservation”可以被分配给实体“flight”,以及标签“flightreservation”也可以被分配给实体“reservation”。替选或附加地,系统还可以将与查询节点相关联的一个或多个值与查询节点相关的一个或多个实体相关联。将与查询节点相关联的一个或多个值与一个或多个实体相关联可以包括将值从查询节点传播到查询节点相关的每个实体。将一个或多个标签词项、一个或多个值或两者从查询节点传播到实体可以被称为标签词项的向前传播、值的向前传播或两者。标签词项、值等的传播不需要将诸如标签词项或值的信息从第一数据结构物理复制到另一数据结构。相反,可以将诸如标签词项或值的信息的传播暗含为生成图形结构的两个或以上节点之间的图形边缘的结果。59.在阶段340,系统可以获得候选标签词项。候选标签词项可以包括由应用接收的查询的一个或多个词项。候选标签词项可以是系统评估以用于潜在包含在结构化信息卡的语法中的词项。替选或附加地,候选标签词项可以是系统评估以确定是否应重写查询以触发结构化信息卡的词项。60.系统可以分析存在于一个或多个实体与所获得的候选标签词项之间的关系。系统执行该分析以在阶段350从与候选标签词项相关的第一实体集识别一个或多个实体的子集。如果与实体相关联的词项被包括在候选标签词项中,则实体可以与获得的候选标签词项相关。然而,在实体节点和候选标签词项之间可能存在其他类型的关联。例如,在实体包括电子邮件文档、网络地址、url等的情况下,如果当执行包括候选标签词项的查询时候选标签词项将返回电子邮件文档、网络地址、url等,那么实体可以与候选标签词项相关联。61.在阶段360,系统可以将一个或多个标签以及一个或多个值与每个候选标签词项相关联。例如,在阶段330与特定实体相关联的任何标签词项可以与实体相关的候选标签词项相关联。因此,在一些实施方式中,从查询节点传播到特定实体的标签词项可以进一步从实体传播到与特定实体相关的候选标签词项。与实体相关联的一个或多个值可以类似地与实体相关的一个或多个候选标签词项相关联。因此,在一些实施方式中,从查询节点传播到特定实体的值可以进一步传播到候选标签词项。将一个或多个标签以及一个或多个值从实体传播到候选标签词项可以被称为标签的向后传播、值的向后传播或两者。标签词项、值等的传播不需要将诸如标签词项或值的信息从第一数据结构物理复制到另一数据结构。相反,可以将诸如标签词项或值的信息的传播暗含为生成图形结构的两个或以上节点之间的图形边缘的结果。62.在一些实施方式中,系统可以分析与候选标签词项相关联的一个或多个值中的每一个,以确定是否应该将候选标签词项添加到与结构化信息卡相关联的语法。确定标签词项是否应该与结构化信息卡相关联可以包括合计与候选标签词项相关联的值,以及相对于预定阈值评估合计值。如果确定合计值满足预定阈值,则可以将标签词项添加到结构化信息卡的语法中。然而,如果合计值不满足预定阈值,则标签词项不会被添加到结构化信息卡的语法中。63.在其他实施方式中,在阶段370,系统可以接收包括候选标签词项的搜索查询。在阶段380,系统可以处理接收的搜索查询,并且使用与每个识别的候选标签词项相关联的值来确定是否触发结构化信息卡的显示。使用与每个候选标签词项相关联的值可以包括例如合计与候选标签词项相关联的一个或多个值,并相对于预定阈值评估合计值。如果确定与候选标签词项相关联的合计值满足预定阈值,则系统可以确定包括候选标签词项的搜索查询将触发相关结构化信息卡的呈现。替选地,如果确定合计值不满足预定阈值,则系统可以确定包括候选标签词项的搜索查询将不会触发相关结构化信息卡的呈现。64.更详细地,可以在接收到搜索查询之后执行阶段380的过程,并且包括为了触发结构化信息卡的生成重写所接收的搜索查询而不更新结构化信息卡的语法。例如,可以接收包括未包括在结构化信息卡的语法中的候选查询词语的查询。然后,可以执行参考图2a和图2b所述的过程以便将一个或多个值与候选查询词项相关联。接着,可以计算一个或多个值的合计值。最后,可以确定合计值是否满足预定阈值。如果合计值满足预定阈值,则可以重写包括在结构化信息卡的语法中未找到的候选查询词项的所接收的查询以包括与查询相关的结构化信息卡的语法中找到的词项。当实现图2a和2b所述的过程时,添加到查询中的词项可以基于从一个或多个查询节点传播到候选标签词项的一个或多个标签词项。可以执行重写的查询,然后触发与包括重写期间添加到查询中的词项的语法相关联的相关结构化信息卡的选择、填充和显示。如果合计值不满足预定阈值,则具有未被包括在结构化信息卡的语法中的词项的接收的查询将不被重写,并且不会触发结构化信息卡的选择、填充和显示。65.图4是卡触发词项识别单元的示例的场境图。66.卡触发词项识别单元可以生成图形结构405。图形结构405可以包括多个查询节点,例如查询节点410、411、412、413、414。查询节点410、411、412、413、414每个与相应的标签词项相关联。例如,查询节点410与标签词项“flightreservation”相关联,查询节点411与标签词“flightticket(飞机票)”相关联,查询节点412与标签词“lasvegasflightreservation”相关联,查询节点413与标签词项“journey(旅程)”相关联,并且查询节点414与标签词项“jacket”相关联。查询节点410、411、412、413、414可以与诸如实体节点440、441、442、443、444、445、446、447的一个或多个实体节点相关。一个或多个实体节点可以对应于来自于在一个或多个词项节点410、411、412、413、414的标签词项之中共享的多个词项集中的一个或多个词项。例如,其他实体节点可以对应于除一个或多个共享词项外的实体。例如,实体440可以对应于响应于执行诸如“flightreservation”的查询而生成的网站。67.图形结构405还可以包括一个或多个候选查询节点420、422。候选查询节点420、422可以基于从查询日志获得的查询词项。例如,候选查询节点420可以基于从查询日志获得的候选标签词项“journeyticket(旅程票)”。类似地,候选查询节点422可以基于从查询日志获得的候选标签词项“flightjacket”。68.可以使用参考图2a、2b和3所述的过程,生成从查询节点到实体节点的图形边缘以及从实体节点到候选查询节点的图形边缘。类似地,可以基于图形边缘,向前传播值430“675”、值432“1125”、值434“150”、值436“680”和值438“150”,然后使用参考图2a、2b和3所述的过程,将其与参考实体值450、451、452、453、454、455、465、457、458、459、460所述的一个或多个实体节点相关联。类似地,可以使用诸如470、472、474、476的生成的图形边缘,将实体值450、451、452、453、454、455、465、458、458、459、460从实体节点向后传播到一个或多个候选查询节点。也可以使用生成的图形边缘,将与每个相应的查询节点相关联的标签词项从相应的查询节点通过图形结构传播到候选标签词项。69.标签词项和值的向前和向后传播导致生成的图形结构405。候选查询节点420可以与一个或多个值480“1125”和481“680”相关联。此外,候选查询节点420还经由通过一个或多个相应的实体节点,从查询节点411、413延伸到候选查询节点420的一个或多个图形边缘,与来自查询节点411和查询节点413的标签词项相关联。因此,候选查询节点420也与标签词项“flightticket”和“journey”相关联。以与候选查询节点420相同的方式,诸如候选查询节点422的其他候选查询节点也可以与一个或多个值以及一个或多个标签词项相关联。70.可以分析图形结构405中的数据,以确定候选查询节点420、422中的一个或多个是否与当被包括在查询中时应该触发结构化信息卡的选择、填充和显示的标签词项相关联。参考图4,例如,可以分析图形结构中的数据,以确定候选查询节点420、422中的一个或多个是否与当在搜索查询中被接收时会导致选择、填充和显示“flight”结构化信息卡的候选标签词项相关联。71.卡触发词项识别单元可以合计与候选查询词项420相关联的值480“1125”和481“680”,以实现合计值“1,805”。类似地,卡触发词项识别单元可以合计与候选查询词项422相关联的值482“675”、483“725”、484“150”和485“150”,以实现合计值“1700”。72.进一步参考图4的示例,可以确立能被用来确定与候选查询节点420、422相关联的标签词项是否应被用于触发“flight”结构化信息卡的显示的预定阈值。例如,如果合计值满足预定阈值,则与查询节点相关联的标签词项将被用于触发显示“flight”结构化信息卡。替选地,例如,如果合计值不满足预定阈值,则与查询节点相关联的标签词项将不被用来触发显示“flight”结构化信息卡。73.作为示例,假设设置为“1750”的预定阈值。与候选标签词项“flightticket”相关联的候选查询节点420与超出预定阈值“1750”的合计值“1805”相关联。但是,另一方面,具有候选标签词项“flightjacket”的查询与低于预定阈值“1750”的累计值“1700”相关联。因此,由于与“flightticket”相关联的合计值满足预定阈值,包括标签词项“flightticket”的所接收的查询将触发“flight”结构化信息卡的选择、填充和显示。然而,由于与“flightjacket”相关联的合计值不满足预定阈值,包含词项“flightjacket”的所接收的查询将不会触发“flight”结构化信息卡的选择、填充和显示。74.对于本文论述的系统收集关于用户的个人信息或可能利用个人信息的情况,可以为用户提供控制程序或功能组件是否收集个人信息(例如,关于用户的社交网络的信息、社交动作或活动、电子邮件、职业、用户偏好或用户的当前位置)、或者控制是否和/或如何从内容服务器接收可能与用户更相关的内容的机会。此外,某些数据可以在被存储或使用之前,以一种或多种方式进行匿名化,从而移除个人可识别信息。例如,用户的身份可以被匿名化,使得不能确定用户的个人可识别信息,或者可以获得位置信息的情况下对用户的地理位置进行一般化(诸如到市、邮政编码或州级),使得不能确定用户的特定位置。因此,用户可以控制如何收集和由内容服务器使用的关于他或她的信息。75.本说明书中所述的图形结构可以由各种适当的物理数据结构中的任何一种来表示。例如,该图可以由三元组表示,每个三元组依次表示两个实体和从第一个实体到第二个实体的关系;例如,[α,β,是父亲],或者[α,是父亲,β],是表示相同事实的替代方式。每个实体和每个关系可以并且通常将被包括在多个三元组中。作为对本公开所述的主题的示例,可以使用三元组来描述查询节点、实体节点和与查询节点和实体节点之间的边缘相关联的值之间的关系。[0076]替选地,每个实体可以被存储为一次节点、为记录或对象,例如,并且通过链接列表数据结构链接到实体具有的所有关系以及实体相关的所有其他实体。更具体地,该图可以被存储为邻接列表,其中,邻接信息包括关系信息。[0077]能在数字电子电路中、在有形地体现的计算机软件或固件中、在计算机硬件中包括在本说明书中公开的结构及其结构等效物、或者在它们中的一个或多个的组合中实施在本说明书中描述的主题、功能操作和过程的实施例。能将在本说明书中描述的主题的实施例实施为一个或者多个计算机程序,即编码在有形非易失性程序载体上的用于由数据处理装置执行或者控制数据处理装置的操作的一个或者多个计算机程序指令模块。替选地或者附加地,能在人为生成的传播信号,例如,机器生成的电、光或者电磁信号上对程序指令编码,该信号被生成用于对信息编码以用于向适当接收器设备发送以供数据处理装置执行。计算机存储介质能是机器可读存储设备、机器可读存储衬底、随机或者串行存取存储器设备或者它们中的一个或多个的组合。[0078]术语“数据处理装置”涵盖各种用于处理数据的装置、设备和机器,举例而言包括可编程处理器、计算机、或多个处理器或计算机。该设备能包括专用逻辑电路,例如,fpga(现场可编程门阵列)或者asic(专用集成电路)。该装置除了硬件之外,还能包括为所述计算机程序创建执行环境的代码,例如,构成处理器固件、协议栈、数据库管理系统、操作系统的代码或者它们中的一个或多个的组合。[0079]计算机程序(也可以被称为或描述为程序、软件、软件应用、模块、软件模块、脚本或者代码)能用任何形式的编程语言编写,包括编译或者解译语言、或说明或者过程语言,并且计算机程序能用任何形式部署,包括部署为独立程序或者部署为适合于在计算环境中使用的模块、组件、子例程或者其他单元。计算机程序可以但是无需对应于文件系统中的文件。程序能被存储于保持其他程序或者数据的文件(例如,存储于标记语言文档中的一个或者多个脚本)的一部分中、在专用于讨论的程序的单个文件中,或者在多个协同文件(例如,存储一个或者多个模块、子程序或者代码部分的文件)中。计算机程序能被部署用于在一个计算机上或者在位于一个地点或者跨多个地点分布并且由数据通信网络互连的多个计算机上执行。[0080]在本说明书中描述的过程和逻辑流能由一个或者多个可编程处理器执行,该一个或者多个可编程计算机执行一个或者多个计算机程序以通过对输入数据操作并且生成输出来执行功能。该过程和逻辑流也能由专用逻辑电路例如fpga(现场可编程门阵列)或者asic(专用集成电路)执行,或装置能实现为专用逻辑电路例如fpga(现场可编程门阵列)或者asic(专用集成电路)。[0081]适合于执行计算机程序的计算机包括例如能基于通用微处理器或者专用微处理器、或者其两者、或者任何其他种类的中央处理器。通常,中央处理器将从只读存储器或者随机存取存储器或者二者接收指令和数据。计算机的必要元件是用于执行指令的中央处理器单元以及用于存储指令和数据的一个或者多个存储器设备。通常,计算机还将包括例如磁盘、磁光盘或者光盘的用于存储数据的一个或者多个海量存储装置,或者被操作地耦合用于从该一个或者多个海量存储设备接收数据或者向该一个或者多个海量存储设备发送数据或者接收和发送二者。然而,计算机无需具有这样的设备。另外,计算机能被嵌入于另一设备中,聊举数例,例如,移动电话、个人数字助理(pda)、移动音频或者视频播放器、游戏控制台、全球定位系统(gps)接收机、或者便携存储设备(例如,通用串行总线(usb)闪存驱动)。[0082]适合于存储计算机程序指令和数据的计算机可读介质包括所有形式的非易失性存储器、介质和存储器设备,举例而言包括半导体存储器设备,例如,eprom、eeprom和闪速存储器设备;磁盘,例如,内部硬盘或者可移动盘;磁光盘;以及cd-rom和dvd-rom盘。处理器和存储器能由专用逻辑电路补充或并入专用逻辑电路中。[0083]为了提供与用户的交互,能在计算机上实施在本说明书中描述的主题的实施例,该计算机具有用于向用户显示信息的显示设备(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器),以及用户能用来向计算机提供输入的键盘和指向设备,例如,鼠标或者轨迹球。其他种类的设备也能用来提供与用户的交互;例如,向用户提供的反馈能是任何形式的感官反馈,例如,视觉反馈、听觉反馈或者触觉反馈;并且能用包括声音、语音或者触觉输入的任何形式接收来自用户的输入。此外,计算机能通过向用户使用的设备发送文档和从该设备接收文档来与用户交互,例如,通过响应于从用户的客户端设备上的web浏览器接收的请求向web浏览器发送web页面。[0084]在本说明书中描述的主题的实施例能在计算系统中实施,该计算系统包括例如作为数据服务器的后端组件,或者包括中间件组件,例如应用服务器,或者包括前端组件,例如具有用户能通过它与在本说明书中描述的主题的实施方式交互的图形用户界面或者web浏览器的客户端计算机,或者一个或者多个这样的后端、中间件或者前端组件的任何组合。系统的组件能通过任何数字数据通信形式或者介质(例如,通信网络)互连。通信网络的示例包括局域网(“lan“)和广域网(”wan“)例如因特网。[0085]计算系统能包括客户端和服务器。客户端和服务器一般相互远离并且通常通过通信网络交互。客户端和服务器的关系借助在相应计算机上运行并且相互具有客户端-服务器关系的计算机程序而产生。[0086]尽管本说明书包含许多具体实施方式细节,但是不应将这些解释为限制要求保护的内容的范围,而是解释为对具体实施例特定的特征的描述。在本说明书中在分开的实施例的中描述的某些特征也能在单个实施例中被组合实施。相反地,在单个实施例的上下文中描述的各种特征也能在多个实施例中分开地或者在任何适当子组合中被实施。另外,虽然上文可能将特征描述为在某些组合中动作并且甚至起初这样要求保护,但是来自要求保护的组合的一个或者多个特征能在一些情况下从该组合中被删除,并且要求保护的组合能涉及子组合或者子组合的变型。[0087]类似地,尽管在附图中以特定顺序描绘操作,但是这不应被理解为要求以所示特定次序或者以顺序次序执行这样的操作或者执行所有所示操作以实现希望的结果。在某些境况中,多任务和并行处理可能是有利的。另外,在上文描述的实施例中的各种系统组件的分离不应被理解为在所有实施例中要求这样的分离,并且应当理解描述的程序组件和系统一般能一起集成于单个软件产品中或者被封装到多个软件产品中。[0088]已经描述了本主题的具体实施例。其他实施例在所附权利要求的范围内。例如,在权利要求中记载的动作能按不同顺序被执行而仍然实现希望的结果。作为一个示例,在附图中描绘的过程未必需要所示特定次序或者顺序次序以实现希望的结果。在某些实施方式中,多任务和并行处理可能是有利的。可以提供其他步骤,或可以从所述的过程删除步骤。因此,其他实施方式在下述权利要求的范围内。当前第1页12当前第1页12
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献