-
基于众包标注系统的文言文语言理解测评基准及数据集
C-CLUE是一个基于众包标注系统构建的文言文语言理解测评基准及数据集,由天津大学数据库课题组贡献。本次开源了由系统标注结果获取的近2万个实体以及4千多个关系,并处理分割成为训练集、校验集、测试集等文件,... -
网易云音乐知识图谱和音乐推荐系统
我们构造的网易云音乐图谱中包含歌曲(music)、演唱者(artist)、专辑(alnum)、歌单(playlist)四类实体和相应的属性(name、lyric等),以及歌曲之间的相似关系(similarTo)、... -
Fights Break Firmament《斗破苍穹》知识图谱
基于《斗破苍穹》小说构建的人物、势力、异火知识图谱 -
水稻表型知识图谱及其可视化系统的构建与实现
中国是世界上水稻产量最大、消费最多的国家,水稻的培育及研究是中国粮食安全战略的重要内容。水稻表型组学研究是植物生物学的研究热点,水稻表型数据的高通量、高维、海量的数据特征对数据的快速检索和知识的有效提取提出了更高的技术要求。 本项目,我们构建了一个水稻表型知识图谱。我们来自国家水稻数据中心(http://www.ricedata.cn)... -
RJUA-QADatasets: 蚂蚁-仁济泌尿专科QA数据集
数据集概况 本数据集为基于医疗泌尿专科知识构造的QA推理数据集,由蚂蚁集团医疗大模型团队(AntGroup Medical LLM)与上海交通大学医学院附属仁济医院泌尿科(Department of Urology, Shanghai Jiao Tong University School of Medicine Affiliated Renji... -
浙江大学校史人物关系数据库
浙江大学在长期的办学过程中,以严谨的“求是精神”作为学风培养了大批优秀... -
GuwenEE:细粒度古汉语事件抽取数据集
面向古汉语领域事件抽取的数据集,原始数据是从《二十四史》中按篇随机选取而来,包含语料950条,事件Schema72个,包含事件1826个。 -
国内外TOP250电影作品知识图谱
我们基于国内外优秀影视作品,构建了一个关于其类型、主演、导演、上映时间的知识图谱。本项目运用了数据爬虫技术、深度抽取技术、知识图谱构建技术等关键技术,并在图谱上进一步实现了搜索、问答、挖掘等简单的应用。 -
希腊神话人物知识图谱
基于百度百科及其他开放域数据作为语料来源,将神话人物名字作为主题关键词,通过爬虫爬取结构化数据作为知识图谱基本数据,并进行语义抽取构建了希腊神话人物关系的核心数据 在上述基础上,我们对数据进行半结构化,实体消歧(指爬虫的过程中选取希腊神话故事的人物),实体互补(指利用实体的亲属关系值的内容进行实体补充) 利用知识图谱实现了简单的知识问答 -
基于cnScheme的外国文学研究领域知识图谱
基于开放域数据CNKI的12833 篇研究文献作为语料来源,将文献中的关键词作为主题关键词,作者作为研究人员。通过爬虫爬取结构化数据作为知识图谱基本数据,结合爬取一些自然语言数据与半结构化数据,并进行语义抽取构建了外国文学研究领域的核心数据 在上述基础上,我们进行了实体对齐与部分的实体消歧,比如译名的对齐:列夫·托尔斯泰 和 托尔斯泰... -
IREE:投资领域细颗粒度风险事件抽取数据集
A Dataset for Chinese Event Extraction in Investment Research 更新 20220703 论文已录用 20220604 双盲审稿暂时隐去作者及机构信息 背景介绍 目前,中文数据集主要来源于百度的千言数据集评测LUGE、中文信息学会主办的CCKS、中国计算机学会主办的CCF-... -
新冠多跳问答数据集
我们精心挑选了OpenKG-COVID19发布的知识图谱中的7个子图谱来构建关于新冠多跳问答数据集。我们对这些个子图谱进行了数据清洗,以及构建了有意义的多跳关系问题。这些知识包含了新冠肺炎疫情期间人们更关注以及日常生活中更容易问到的话题。 -
浙江大学—大规模细粒度中文概念图谱OpenConcepts
OpenConcepts 介绍 OpenConcepts (http://openconcepts.openkg.cn/)... -
魔兽世界人物信息知识图谱
《魔兽世界》(英语:World of Warcraft,缩写作... -
明代历史知识图谱
项目设计并实现了明代历史知识图谱,涵盖了明代历史的重要人物、历史事件、历史地名、著作等若干实体,并实现了知识图谱的可视化展示。 -
The Lord of The Rings
⼩说《魔戒》(The Lord of the Rings)中的⼈物、家族、种族的知识图谱 -
周深歌曲关系知识图谱
周深,1992年9月29日出生于湖南邵阳 ,长于贵州贵阳 ,中国内地男歌手,2016年6月毕业于乌克兰利沃夫国立立谢科音乐科学院美声专业 。其声线独特,爱岗敬业,多次受邀在央视中秋晚会、央视七夕晚会、央视节目... -
多模态实体链接数据集 MELBench
1. 摘要 多模态实体链接是多模态数据处理的基础任务之一,旨在将多模态数据中的实体链接到知识图谱中,在多模态数据理解、多模态知识图谱、多模态问答中具有广泛应用意义。然而,目前开源和能重现的多模态实体链接数据集还很少,一定程度上制约着相关工作的研究。 东南大学团队发布的多模态实体链接数据集MELBench包含3个任务:Weibo-... -
火影忍者人物关系图谱
《火影忍者》是日本漫画家岸本齐史的代表作,作品于1999年开始在《周刊少年JUMP》上连载,于2014年11月10日发售的JUMP第50号完结。作品设定在一个忍者的世界,故事通过主人公漩涡鸣人的视角,围绕鸣人的奋斗、成长,鸣人的伙伴们,以及这个忍者世界的各种争斗和阴谋展开。... -
宝可梦数据集
宝可梦游戏以及动画中的人物,地点以及宝可梦的数据集。其中部分利用网络爬虫构建,relation中的关系则使用中文bert进行抽取得到。