找到54个数据集

授权: Creative Commons Attribution 机构: 个人

过滤结果
  • 陈奕迅音乐作品知识图谱

    2022年年末,陈奕迅的歌迷们终于盼来了在香港红馆举行的陈奕迅《FEAR AND DREAMS》演唱会,在此背景下,我们构建了陈奕迅音乐作品知识图谱,以便对陈奕迅演唱的作品进行更加深入的了解和分析。...
  • 安卓API关联关系知识图谱及挖掘分析

    基于安卓API级别14-29官方文档,逐文档提取包、类、方法、权限四类实体 针对结构化文本直接解析关系,针对非结构化文本,采用基于模板匹配的关系抽取:人工提取关系匹配模板,逐句进行自然语言处理中的单词主干提取、实体名称规范化等操作,进行关系匹配,获得函数关系、类关系、继承关系、使用参数、返回值、抛出、替代、条件、指代、使用权限等十类关系...
  • 《红楼梦》人物关系知识图谱

    本项目构建了《红楼梦》中的各人物以及他们之间的人物关系的知识图谱。主要包括四部分工作:(1)数据获取与预处理;(2)命名实体识别;(3)实体关系抽取;(4)可视化与知识问答。
  • 郑渊洁相关

    There is no description for this dataset

  • 希腊神话人物知识图谱

    基于百度百科及其他开放域数据作为语料来源,将神话人物名字作为主题关键词,通过爬虫爬取结构化数据作为知识图谱基本数据,并进行语义抽取构建了希腊神话人物关系的核心数据 在上述基础上,我们对数据进行半结构化,实体消歧(指爬虫的过程中选取希腊神话故事的人物),实体互补(指利用实体的亲属关系值的内容进行实体补充) 利用知识图谱实现了简单的知识问答
  • 浙江省文化站基础信息

    来自于浙江省数据开放平台,并利用ChatGPT对文化站的交通消息进行了格式化与抽取。
  • 基于cnScheme的外国文学研究领域知识图谱

    基于开放域数据CNKI的12833 篇研究文献作为语料来源,将文献中的关键词作为主题关键词,作者作为研究人员。通过爬虫爬取结构化数据作为知识图谱基本数据,结合爬取一些自然语言数据与半结构化数据,并进行语义抽取构建了外国文学研究领域的核心数据 在上述基础上,我们进行了实体对齐与部分的实体消歧,比如译名的对齐:列夫·托尔斯泰 和 托尔斯泰...
  • author_article_school

    从知网下载的4000条左右的论文数据集,总共三个实体 作者(author_id,name) 论文(article_id,summary,urls,year,article_name,cite,down) 就读高校(school_id,school_name) 关系:write_to,graduate_to 可以直接导入Neo4j使用
  • 区域供热供冷系统知识图谱

    本开放资源分享的是区域供热供冷系统知识图谱。知识图谱技术能够解决当前区域供热供冷领域亟需解决的知识描述方法和构建数据理解及推理框架两个核心基础理论问题,基于知识图谱技术,一方面可以实现最大程度的知识复用;一方面可以实现复杂智能的知识计算,为大数据分析诊断和运行规律识别提供知识推理支持。
  • ACE实体关系数据集

    开源图谱评测数据
  • DuIE2.0中文关系抽取数据集

    DuIE2.0是业界规模最大的中文关系抽取数据集,其schema在传统简单关系类型基础上添加了多元复杂关系类型,此外其构建语料来自百度百科、百度信息流及百度贴吧文本,全面覆盖书面化表达及口语化表达语料,能充分考察真实业务场景下的关系抽取能力。
  • 石油勘探开发数据集

    There is no description for this dataset

  • DuEE-fin金融领域篇章级事件抽取数据集

    DuEE-fin是百度发布的金融领域篇章级事件抽取数据集,包含13个事件类型的1.17万个篇章,同时存在部分非目标篇章作为负样例。事件类型来源于常见的金融事件,数据集中的篇章来自金融领域的新闻和公告,覆盖了真实应用场景中诸多难以解决的问题。
  • 2014年NLPCC实体链接数据集

    NLPCC 2014 评估任务测试数据
  • OntoNotes5.0数据集

    开源图谱评测数据
  • CoNLL2003数据集

    开源图谱评测数据
  • 知识工厂实体链接数据集

    基于CN-DBpedia的短文本实体链接测试数据 数据集的文本由1037条人工标注的短文本语料组成。其中大约70%来自新闻语料,包括新闻标题和内容,比如“英超-桑切斯4分钟内梅开二度阿森纳3-2五轮不败”;大约20%来自人工构建的基于歧义实体的语料,比如“红楼梦的演员有哪些”;大约10%来自问答语料中的简单问句,比如说“岳阳有哪些旅游景点”。
  • YAGO3-10知识表示数据集

    开源图谱评测数据
  • WN18rr知识表示数据集

    开源图谱评测数据
  • WN18知识表示数据集

    开源图谱评测数据
您也可以使用应用程式界面 (看 API文献)注册.