专利内容由知识产权出版社提供
专利名称:一种大规模高效获取识别对话意图用语料的方法专利类型:发明专利发明人:简仁贤,王海波申请号:CN2019112412.5申请日:20191211公开号:CN1110783A公开日:20200428
摘要:本发明属于计算机技术领域,公开了一种大规模高效获取识别对话意图用语料的方法,包括以下步骤:步骤一、根据对话意图从预置数据库中调取对应于该对话意图的一个或多个种子语料;步骤二、取一个种子语料输入搜索引擎进行搜索,获取搜索结果;然后进入步骤三;步骤三、对获取到的搜索结果,逐条进行标题抽取操作,将抽取到的标题作为待选语料,获得待选语料集合。本发明解决了现有技术中扩充语料效率低,容易受标注人员水平影响和不能反映真实语料多样性的问题。
申请人:竹间智能科技(上海)有限公司
地址:200233 上海市徐汇区宜山路700号B2幢楼18层整层
国籍:CN
代理机构:北京挺立专利事务所(普通合伙)
代理人:王静思
更多信息请下载全文后查看