-
医疗因果实体关系抽取数据集CMedCausal
本数据集来源于CHIP2022医疗因果实体关系抽取学术评测任务:http://cips-chip.org.cn/2022/eval2 , 包括2,000段训练数据,2,000段测试数据。本数据集由阿里巴巴夸克医疗事业部和阿里云天池联合提供。 -
医疗对话临床发现阴阳性判别数据集MDCFNPC
本数据集来源于CHIP2021医疗对话临床发现阴阳性判别学术评测任务:http://cips-chip.org.cn/2021/eval1 , 数据集包括6,000段训练数据,4,000段测试数据。 本数据集由阿里夸克医疗事业部和阿里云天池平台联合提供。 -
新冠疫情相似句对判定数据集
新冠疫情相似句对判定数据集来自天池大赛:https://tianchi.aliyun.com/competition/entrance/231776/information -
中药说明书实体识别数据集TCM-NER
本数据集来源于天池中医药实体识别大赛:https://tianchi.aliyun.com/competition/entrance/531824/information。 数据来自中药药品说明书,通过挖掘中药说明书构建中药合理用药的知识图谱,将为中医规范诊疗奠定较好基础。抽取中药药品说明书中的关键信息可以帮助扩充中医药药品知识库。 -
中医文献问题生成数据集TCM-QG
本数据集来自天池中医药问题生成大赛:https://tianchi.aliyun.com/competition/entrance/531826/information 。中医文献问题生成数据集包含3500篇语料,每篇文档由人工标注产生1~4对(问题, 答案)对。 -
中文糖尿病科研文献实体关系数据集DiaKG
瑞金糖尿病知识图谱数据集,来源天池比赛:https://tianchi.aliyun.com/competition/entrance/231687/introduction -
FR2KG:大规模金融研报知识图谱
大规模金融研报知识图谱数据集FR2KG 知识图谱模式包含10个实体类型,19个关系类型和6种属性 知识图谱包含17,799实体,26,798关系三元组,1,328属性三元组 引用 Wang, W.G., et al.: Data set and evaluation of automated construction of financial... -
文因互联-公众公司人物图谱
本数据包含主板、三板公司31w高管人物简历信息,以API方式提供访问。(署名-非商业性使用-相同方式共享) -
有色行业产业链图谱
有色行业,包括有色金属、贵金属、稀土、金属非金属新材料板块的产品产业链信息。展示行业内部结构的关系有“下位行业”、“主要产品”、“下位产品”;展示产品上下游的关系有“下游”。 -
微观经济学知识库
关于微观经济学的知识和逻辑图谱,涉及市场主体、市场客体和市场行为三部分,关系分is、include、positively related和negatively related四类。目标是应用于经济金融垂直领域的问答和推理。 -
新三板企业年报数据
将新三板企业年报结构化,提供年报文本的结构化数据。本数据集提供数据API,可获取2015至2016年的年报数据。