传统的材料研发技术是通过实验合成表征对材料进行试错和验证,而过去的计算手段受限于算法效率,无法有效求解实际工业生产中面临的复杂问题。近几年随着大数据和人工智能介入,通过采用支持向量机、神经网络等机器学习算法训练数据集来构建模型,以预测材料的结构、吸附特性、电学特性、催化性能、力学特性和热力学特性等性能,大大推动了新型材料的发现和传统材料的更新,预测结果甚至能够达到与高保真模型基本相同的精度,且计算成本很低。然而,机器学习在材料科学中的应用仍存在一些瓶颈,人工智能研究项目所需的技能和知识匮乏缺失制约着该方向的发展。
入门阶段从机器学习以及机器学习在材料领域的应用基本概念开始讲授,让大家明确机器学习方法的适用性和优势,以及有针对性的对python语言基础进行系统学习,为之后构建相应算法模型框架打下基础。
进阶阶段分别讲授深度学习神经网络、经典机器学习模型、材料基因工程入门与实战、图神经网络与实践、机器学习+Science 五个模块,结合案例实践教学(神经网络在催化领域的应用、预测杂化钙钛矿带隙、有机太阳能电池材料快速筛选、团簇结构数据库构建、同素异形体结构数据库构建、材料指纹和势函数生成、描述符的向量化生成与特征、图神经网络预测无机材料的性能、分子理化性质的预测、量子点发光材料色温的预测、半导体材料物理性质预测、二维材料的性质预测等)
学习目标:对机器学习基本概念进行介绍,让大家对机器学习基本概念有大致了解。明确机器学习方法的适用性,优势,以及局限性
? 什么是机器学习
? 机器学习的应用实例
? 机器学习在材料领域的应用
学习目标:机器学习主流实现是python语言。学习机器学习之前,有针对性的对python进行系统的学习,以方便将来开展机器学习的学习
? python安装与开发环境的搭建
? 基本数据类型、组合数据类型
? 函数、列表 、元组、字典、集合
? 控制结构、循环结构
? Numpy模块——矩阵的科学计算
? Matplotlib模块——数据处理与绘图
学习目标:从零开始手动实现一个神经网络,在这一过程中对所涉及的原理进行系统讲解及实践,让大家能够更深刻的理解算法背后的原理以及实现方法,之后有利于对其他机器学习更全面快速掌握
? logistic 回归与损失函数
? 梯度下降法与导数
? 计算图的导数计算
? logistic 回归中的梯度下降法
? 向量化 logistic 回归的梯度输出
? 神经网络的梯度下降法
? 深层网络中的前向传播
? 深度学习框架——Pytorch的使用
? 案例实践教学一:神经网络在催化中的应用——CO2还原
学习目标:对在材料领域中最常使用的几种机器学习模型进行介绍,总结它们的优缺点及适用范围,通过动手实践快速掌握几种方法
? 线性模型(线性回归、梯度下降、正则化、回归的评价指标)
? 决策树(决策树原理、ID3算法、C4.5算法、CART算法)
? 支持向量机(线性支持向量机、可分支持向量机、不可分支持向量机)
? 集成学习(AdaBoost和GBDT算法、XGBoost算法、LightGBM算法)
? 模型选择与性能优化(数据清洗、特征工程、数据建模)
? Scikit-learn机器学习库的使用
? 案例实践教学二:利用集成学习方法预测杂化钙钛矿的带隙
? 案例实践教学三:利用集成学习实现有机太阳能电池材料快速筛选
学习目标:从数据库出发,对材料领域常见的数据库进行介绍,之后学习如何利用ASE,pymatgen等软件包批量构建及处理数据集,以及对材料进行特征选择。讲解常见的材料结构表示方法及编码,以及机器学习模型的评估与利用
? 材料基因组概述、材料基因组的基本方法
? 常见材料数据库介绍
? Material Project数据库、Pymatgen
? OQMD数据库、AFLOW数据库数据获取与使用
? COMPUTATIONAL MATERIALS REPOSITORY数据库与ASE
? 自定义材料数据集的构建
? 材料化学的特征工程
? 特征选择(过滤特征、包装到其他评估或集成到训练)
? 基于sklearn的python实现
? 案例实践教学四:(包含以下内容)
? 团簇数据库中平均形成能最低的结构数据库的构建
? 利用MP数据库构建同素异形体结构的mongodb数据库
? 利用Pymatgen对原子性质进行分析
? 利用ASE+Dscribe生成材料指纹和势函数
? 描述符的向量化生成与特征的保存/读取,特征预处理
? 模型性能评估(分类性能、回归性能评估、统计交叉验证)和优化
? (拓展)学习计算材料学领域与特征选择高级相关算法:SISSO
学习目标:图神经网络是在科学领域最为火热的研究领域。由于化学结构与图论有着天然的适配性,相较于其他模型,图神经网络在材料化学领域更为擅长。在这一部分我们会对图神经网络进行系统的讲解,学习常见的图神经网络架构,实践图神经网络在部分材料中的应用
? 图论简单入门、图神经网络概念介绍
? 化学与材料领域经典的图神经网络架构——CGCNN与Schnet
? 图神经网络在材料中应用的实践
? 自定义图的实现:第三方依赖 - PyG 图卷积层:GCNConv
? 案例实践教学五:利用图神经网络CGCNN预测无机材料的性能
? 案例实践教学六:利用Schnet实现对分子理化性质的预测
学习目标:机器学习领域前沿内容,让大家了解最新的材料科学与机器学习领域的研究动态,同时介绍几种更为先进的机器学习算法
? 强化学习在材料优化问题中的应用
? 主动学习框架的在科学问题中的实现
? 生成模型在材料设计中的应用与挑战
? Transformer应用——以AlphaFold2为例
包含以下内容:(可根据学员要求补充)
? 案例实践教学七:多种机器学习模型对量子点发光材料色温的预测
? 案例实践教学八:利用机器学习方法预测半导体材料物理性质
? 案例实践教学九:利用多种机器学习方法对二维材料的性质预测