北京大学在构建材料知识图谱研究领域取得重要进展

随着数据挖掘技术的日益成熟,将其运用于材料科学研究已逐渐成为可能。这导致材料信息学这一新兴领域的出现。经过长时间的发展,大量的材料学术文献积累了丰富的科学成果,以文本形式散布在文献中的科学知识一般仍由研究人员手动收集和分析,这通常十分耗时且难以保证信息的完整度。如果将文献中的材料科学信息表示为结构化的知识,再结合知识关联、融合、推理等方法,构建材料知识图谱,可以使研究人员准确而又高效地获取信息,并对过往研究进行脉络梳理,对有潜力的材料进行剖析。材料知识图谱作为高效的知识管理载体,能够大规模地从海量材料科学文献中抽取信息,建立实体之间的对应关系,有助于阐明实体之间的内在关联,这将极大地促进我们对科学知识发展的宏观及全面理解。

基于此,北京大学深圳研究生院新材料学院潘锋教授课题组结合机器学习和依赖匹配算法,发展了一套高精度且高效的同名消歧以及信息搜索框架,在材料科学领域建立了主体(作者)与客体(材料)之间的对应关系(图1),构建了名为MatKG的材料知识图谱,并对锂离子电池正极材料LiFePO4进行自动化分析,生成其发展里程碑,追踪其研究趋势。知识图谱在材料科学中的应用将为材料研究领域提供一个高效的信息处理平台,MatKG可以提供自动化的材料科学领域的信息获取方式,有助于融合和完善各领域的材料科学知识。相关成果以“Construction and Application of Materials Knowledge Graph Based on Author Disambiguation: Revisiting the Evolution of LiFePO4”为题,近日发表在国际知名学术杂志《先进能源材料》(Advanced Energy Materials,DOI:10.1002/aenm.202003580,影响因子25)上。

图1.材料知识图谱的架构

知识图谱是由相互连接的实体以及相关的属性组成的,高精度地实体消歧(如何准确确定文章的作者)是准确构建知识图谱的前提,判断知识库中的同名实体(同名同姓是否是同一个人)是否代表不同的含义以及知识库中是否存在其他命名实体与之表示相同的含义是一项重要任务。在材料知识图谱中,作者的歧义化是知识库构建的主要障碍之一,同名以及相似姓名变体的作者经常会被混淆,常造成信息的搜索或关联错误。因此,基于作者信息以及文本信息,团队结合机器学习和依赖匹配算法对材料知识图谱中的主体(作者)进行高精度消歧,并引入剪枝策略以解决在面对庞大且复杂的数据时查找效率较低的问题,实现高效信息匹配和搜索,从而构建了MatKG的框架(图2)。

图2.MatKG的构建流程图

MatKG可以为不同领域的研究人员提供快速而客观的学术界趋势跟踪,研究团队以诺贝尔奖获得者Good enough教授锂电池正极材料LiFePO4为例,利用建立好的知识图谱框架,对其进行自动化分析,关联相关学者及其研究信息,建立用于锂离子电池的LiFePO4的发展里程碑图(图3),发现其发展的重要历程。

图3.用于锂离子电池的LiFePO4的发展里程碑图

这项工作结合自然语言处理、机器学习等方法,系统地整理了科学出版物中的知识,从而可以有效提高科研人员精准获取信息的效率,有助于探索潜在的知识联系以及有效处理复杂多样的关联分析,并发现隐藏在数据和文本中的有价值的信息。该研究成果为材料科学研究带来了新的见解和启发。研究团队在未来将结合材料的更多特性信息构建基于MatKG的材料推理和预测系统,旨在为材料开发和设计开辟新的范式。

这项工作是在潘锋和李舜宁副研究员的共同指导下,由第一作者北京大学深圳研究生院新材料学院硕士研究生聂志伟及相关人员一起完成。该工作得到国家材料基因组重点研发计划、深圳市科技计划和化学与精细化工广东省实验室科研启动项目的大力支持。

(0)

相关推荐

  • 知识图谱应用研究

    同济大学 zhou xiaohan对知识图谱的应用情况进行了系统性研究,发表在CCEAI2020的会议上,这里是个简单的翻译. 摘要: 知识图谱,将信息表示为语义图,已经引起了工业界和学术界的广泛关注 ...

  • AI热门领域分析|未来在知识图谱领域还会面临哪些挑战?

    如果未来的智能机器拥有一个大脑,知识图谱就是这个大脑中的知识库,对于大数据智能具有重要意义,将对自然语言处理.信息检索和人工智能等领域产生深远影响. 我们已于2019年1月发布<人工智能之知识图 ...

  • 终于有人把知识图谱讲明白了

    导读:知识图谱的概念诞生于2012年,由Google公司首先提出.知识图谱的提出是为了准确地阐述人.事.物之间的关系,最早应用于搜索引擎.知识图谱是为了描述文本语义,在自然界建立实体关系的知识数据库. ...

  • 构建工业知识图谱平台到底有没有用?

    工业制造发展迅速,各式各样的工业互联网平台脱颖而出,但在它们之中做工业知识图谱的少之又少,这到底是为什么呢? 知识图谱最早于2012年由谷歌公司正式提出,其初衷是为了改善搜索性能,提升用户搜索体验.目 ...

  • 北京大学在暗光子暗物质探测研究中取得重要进展

    北京讯     暗物质是天文观测中发现的具有引力相互作用且不发光的未知物质.暗物质无法由标准模型解释,是当前粒子物理学领域最基本.最重要的问题之一.超轻质量的玻色子是一种有力的潜在暗物质,而暗光子正是 ...

  • 《德国应用化学》报道华东理工大学在表面合成化学研究领域的最新进展

    上海讯    超分子聚合物是基于非共价相互作用和自组装形成的聚合物体系,它不仅展现出共价聚合物的传统特征,而且具有刺激响应.自我修复和微环境适应性等独特性质.官能化的超分子聚合物提供了优良的机械.生物 ...

  • 肺癌基础研究领域取得新进展!为新型药物研发提供有效证据

    齐鲁晚报·齐鲁壹点记者 陈晓丽 通讯员 任朋 近日,齐鲁医院东院区肿瘤科杨秋安教授团队在肺癌基础研究领域取得可喜成绩.4月14日,国际权威学术期刊<International Journal o ...

  • 华东理工大学在肺纤维化靶向治疗研究领域取得重要进展

    近日,华东理工大学药学院高峰教授和陈彦佐副教授团队开发了一种新型外泌体-脂质体杂合纳米递药系统,该递药系统能够通过减少肝脏Kupffer细胞对纳米粒的非特异性摄取,同时该系统联合利用了外泌体的归巢效应 ...

  • 我国专家在脑出血研究领域取得新进展

    我国科研人员近期在脑出血研究领域取得新进展,发现在超早期内强化降压可以提高脑出血治疗效果和预测后果的准确率,为脑出血临床治疗和科研带来了新方向. 相关研究成果作为2020年脑出血领域重要进展之一,被国 ...

  • 我国科学家在黑洞研究领域取得重要进展

    北京时间2019年9月5日,国际权威学术期刊<自然>杂志在线发表了中国极地研究中心.中国科学院国家天文台和中国科学技术大学联合国内外多家科研单位和高校共同完成的一项黑洞研究重要成果,论文题 ...

  • PLOS GENETICS | 河北农大王海燕教授团队在小麦病程相关蛋白抗叶锈病研究领域取得新进展!...

    2020年7月13日,PLOS GENETICS在线发表了河北农业大学植物保护学院王海燕教授课题组题为"TaTLP1 interacts with TaPR1 to contribute t ...

  • 强直性脊柱炎研究领域取得新进展

    来源:附属第八医院 2021-09-18 07:41强直性脊柱炎是我国常见的骨免疫相关疾病,目前发病机制仍不清楚,缺乏有效的早期诊治手段.随着疾病进展,患者将逐渐出现脊柱.关节畸形,严重影响患者的生活 ...