-
中文多模态命名实体识别数据集
Wukong-CMNER,一个多模态NER数据集包含图像和文本的语料库。有55423个注释我们语料库中的图像-文本对。本数据是由华为发布的Wukong数据集标注得到,感谢华为公司允许对数据进行标注。 -
《红楼梦》人物关系知识图谱
本项目构建了《红楼梦》中的各人物以及他们之间的人物关系的知识图谱。主要包括四部分工作:(1)数据获取与预处理;(2)命名实体识别;(3)实体关系抽取;(4)可视化与知识问答。 -
石油勘探开发数据集
There is no description for this dataset