项目介绍
本项目计划构建一个科研领域知识图谱,提供深度学习在医学影像分析中的应用的相关信息,爬取的信息包括谷歌学术等。然后基于D3可视化工具进行可视化,并提供基础问答功能。
数据
数据爬取
我们采用文献爬取的方式制作医学影像与深度学习的知识图谱。在文献来源方面,我们主要选取三种期刊作为来源,它们分别是IEEE Transactions on Medical Imaging, Medical Image Analysis, 以及Medical Image Computing and Computer Assisted Intervention。
数据清理
我们选取2014年到2019年的时间跨度作为文献检索区间,采用关键词匹配方式进行爬取。在关键词匹配上,我们通过医学影像相关综述,请教专家手动整理了8种器官,20余种疾病作为疾病前缀,通过 “Deep Learning”, “Automatic”, “Neural Network”, “CNN” “Net” 等深度学习关键词作为模板,在期刊网站上爬取搜索目标的标题,摘要与关键词,制作成数据库作为数据源。最后获取的数据文件为 medicalai.json,每一个实体包括“name”、“link”等信息,总共有85个实体。
可视化
我们使用力引导的图布局算法对知识图谱进行可视化,并用不同的颜色对不同类型的关系进行编码。实践方面,我们使用D3.js进行代码实现。
问答系统
我们通过基于模板的方法提供简单的问答功能。