史上最大规模:这有一份1.4亿的中文开源知识图谱
机器之心整理
参与:郑丽慧、杜伟
知识图谱是人工智能新时代的产物,简单地说知识图谱就是通过关联关系将知识组成网状的结构,然后我们的人工智能可以通过这个图谱来认识其代表的这一个现实事件,这个事件可以是现实,也可以是虚构的。
近日,一直致力于知识图谱研究的 OwnThink 平台在 Github 上开源了史上最大规模 1.4 亿中文知识图谱,其中数据是以(实体、属性、值),(实体、关系、实体)混合的形式组织,数据格式采用 csv 格式。
Github 地址:https://github.com/ownthink/KnowledgeGraphData
ownthink 网站地址:https://www.ownthink.com/




百度网盘链接: https://pan.baidu.com/s/1LZjs9Dsta0yD9NH-1y0sAw
提取码: 3hpp
注:解压密码是 ownthink
首页地址:https://www.ownthink.com/
$ wc -l ownthink_v2.csv
140919781 ownthink_v2.csv
$ head ownthink_v2.csv
实体,属性,值
胶饴,描述,别名: 饴糖、畅糖、畅、软糖。
词条,描述,词条(拼音:cí tiáo)也叫词目,是辞书学用语,指收列的词语及其释文。
词条,标签,文化
红色食品,描述,红色食品是指食品为红色、橙红色或棕红色的食品。
红色食品,中文名,红色食品
红色食品,是否含防腐剂,否
红色食品,主要食用功效,预防感冒,缓解疲劳
红色食品,适宜人群,全部人群
红色食品,用途,增强表皮细胞再生和防止皮肤衰老
import sysimport csv
with open('ownthink_v2.csv', 'r', encoding='utf8') as fin:
reader = csv.reader(fin)
for index, read in enumerate(reader):
print(read)
if index > 10:
sys.exit(0)
['实体', '属性', '值']
['胶饴', '描述', '别名: 饴糖、畅糖、畅、软糖。']
['词条', '描述', '词条(拼音:cí tiáo)也叫词目,是辞书学用语,指收列的词语及其释文。']
['词条', '标签', '文化']
['红色食品', '描述', '红色食品是指食品为红色、橙红色或棕红色的食品。']
['红色食品', '中文名', '红色食品']
['红色食品', '是否含防腐剂', '否']
['红色食品', '主要食用功效', '预防感冒,缓解疲劳']
['红色食品', '适宜人群', '全部人群']
['红色食品', '用途', '增强表皮细胞再生和防止皮肤衰老']
['红色食品', '标签', '非科学']
['红色食品', '标签', '生活']
关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
关注网络尖刀微信公众号随时掌握互联网精彩
赞助链接
排名
热点
搜索指数
- 1 中法元首相会都江堰 7904738
- 2 中方不接受日方所谓交涉 已当场驳回 7808835
- 3 大闸蟹为何会在欧美泛滥成灾 7712786
- 4 国际机构看中国经济 关键词亮了 7617846
- 5 男子欠近5000元房费 酒店倒贴都不搬 7523058
- 6 日方军机滋扰擅闯或被视为训练靶标 7426045
- 7 长沙一男子要取现20万 银行紧急报警 7331820
- 8 罪犯被判死缓破口大骂被害人一家 7238994
- 9 日军机滋扰辽宁舰训练 中方严正交涉 7135709
- 10 千吨级“巨无霸”就位 7047486







机器之心
