博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
《中国人工智能学会通讯》——12.38 知识库与 HTML 表格的融合
阅读量:6112 次
发布时间:2019-06-21

本文共 445 字,大约阅读时间需要 1 分钟。

12.38 知识库与 HTML 表格的融合

近年来,HMTL 表格(Web Table)作为万维网上重要的结构化数据,受到了广泛关注。HTML 表格有两个优点,其一是数量巨大,根据微软在 2012年的统计,万维网上存在着近6亿的HTML表格[33] ;其二结构良好,如图 4 所示,左侧和右下的 HTML表格以良好的结构提供了公司的信息。image

因此,本文提出将HTML表格的数据抽取出来,链接到知识库中,以实现知识库补全。图 4 给出了这一想法的示意,将 HTML 表格中的公司实体与属性映射到知识库的公司(company)类型,从而扩充知识库的公司实体及相关关系。

实现这一目的的第一步是类型匹配,即给定HTML 表格的一列,确定其对应的知识库中的概念。这一工作可以通过众包链接任务完成,如图 5 所示,image

给出以 Title 为表头的一列,让众包判断它的类型是电影名称、图书标题,或是其他。类型匹配是后续实体链接、类型链接的重要基础。下面以此为例说明众包机器协同工作的机制(见 4.2 节)。

转载地址:http://lwyka.baihongyu.com/

你可能感兴趣的文章
Tomcat与Spring中的事件机制详解
查看>>
Spark综合使用及用户行为案例区域内热门商品统计分析实战-Spark商业应用实战...
查看>>
初学者自学前端须知
查看>>
Retrofit 源码剖析-深入
查看>>
企业级负载平衡简介(转)
查看>>
ICCV2017 论文浏览记录
查看>>
科技巨头的交通争夺战
查看>>
当中兴安卓手机遇上农行音频通用K宝 -- 卡在“正在通讯”,一直加载中
查看>>
Shell基础之-正则表达式
查看>>
JavaScript异步之Generator、async、await
查看>>
讲讲吸顶效果与react-sticky
查看>>
c++面向对象的一些问题1 0
查看>>
直播视频流技术名词
查看>>
网易跟贴这么火,背后的某个力量不可忽视
查看>>
企业级java springboot b2bc商城系统开源源码二次开发-hystrix参数详解(八)
查看>>
java B2B2C 多租户电子商城系统- 整合企业架构的技术点
查看>>
IOC —— AOP
查看>>
比特币现金将出新招,推动比特币现金使用
查看>>
数据库的这些性能优化,你做了吗?
查看>>
某大型网站迁移总结(完结)
查看>>