数据集

  • 支持中文的deepdive:斯坦福大学的开源知识抽取工具(三元组抽取)

    deepdive是由斯坦福大学InfoLab实验室开发的一个开源知识抽取系统。它通过弱监督学习,从非结构化的文本中抽取结构化的关系数据 。本项目修改了自然语言处理的model包,使它支持中文,并提供中文tutorial。后续将持续更新一些针对中文的优化。
  • OLLIE:开放三元组知识抽取

    OpenKG搜集和整理知识图谱相关的技术工具,并将组织开展技术评测。OLLIE和Reverb类似,都是华盛顿大学研发的知识库KnowItAll的三元组抽取组件,OLLIE是第二代提取系统。Reverb的抽取建立在文本序列上,而OLLIE则支持基于语法依赖树的关系抽取,对于长线依赖效果更好。
  • Wandora:知识抽取可视化工具

    OpenKG搜集和整理知识图谱相关的技术工具,并将组织开展技术评测。wandora是封装好的知识抽取桌面程序,支持主题图、RDF、OBO等多种输入输出格式。它内置了http服务器,有完整的交互界面,支持输出可视化。
  • SOFIE: 抽取链接本体及本体间关系

    OpenKG搜集和整理知识图谱相关的技术工具,并将组织开展技术评测。SOFIE是一个自动化本体扩展系统,由max planck institute开发。它可以解析自然语言文件,从文本中抽取基于本体的事件,将它们链接到本体上,并基于逻辑推理进行消歧。
  • Reverb: 开放三元组抽取

    OpenKG搜集和整理知识图谱相关的技术工具,并将组织开展技术评测。 Reverb是华盛顿大学Turing center研发的开放三元组抽取工具,可以从英文句子中抽取形如(augument1, relation, argument2)的三元组。它不需要提前指定关系,支持全网规模的信息抽取。目前用于华盛顿大学开发的knowitall知识库系统。