Yueming & Blog

人的内心不种满鲜花,就会长满杂草。

Yueming & Blog

这是一篇关于Hexo-Next博客学习进展的总结文章,记录了作者在博客美化、站点建设和Markdown使用方面的学习笔记,包含如何创建新文章、更改首页置顶顺序、实现文章部分显示、配置域名、添加友链、将ipynb转换为markdown、解决链接跳转问题、添加脚注等实用技巧,每个技巧都标注了学习日期,并提供了相关参考链接和解决方法。

阅读全文 »

标题——数据驱动的高性能聚酰亚胺设计:增强耐热性与介电性能

期刊名称:Advanced Functional Materials

文章解读:

intrduction:强调背景、抛砖引玉、娓娓道来
  • 对象:聚酰亚胺Pi,在高频、高温下的需求
  • 策略:mag,先讲传统策略的缺陷,劣势;突出强调mag方法
  • mag:The MGA is a systematic research strategy to accelerate the discovery and optimization of new materials through high-throughput experimentation, computation, simulation, and data analysis. The core of MGA is to accurately predict material properties through machine learning (ML) and effectively screen desired materials from candidates.
  • 举例:其他人用mag做出了什么,开始说在Pi领域也有人在用mag做研究。
  • However:(画风一转)However, applying these methods to the design of polyimides still faces numerous challenges, such as the issue of data sparsity in high-frequency dielectric properties and the need for precise representation of polyimide structures.
    点明矛盾问题:高频段数据稀缺;聚亚酰胺的空间结构的精确表达
  • 工作方法:the classical Havriliak-Negami (H-N) dielectric relaxation dual-parameter model——对于高频段数据稀缺性采用经典的Havriliak-Negami(H-N)介电弛豫双参数模型(第一性原理的引入);
    developed multi-level descriptors to comprehensively capture the characteristics of the molecular structures of PIs——对于后者空间结构的表征采用的是多级描述符
  • 多层神经网络HNN进行多任务学习MTL——Subsequently, using these data, we employed multi-task learning (MTL) with hierarchical neural networks (HNN) to establish an efficient and accurate machine learning model.
  • 人工神经网络ANN——Meanwhile, an artificial neural network (ANN) model for predicting the glass transition temperature of PIs was developed
  • 遗传算法——A genetic algorithm was employed to create a series of PIs exhibiting exceptional high-frequency dielectric properties and heat resistance.
结果与讨论
  • Section 2.1 introduces the data preparation, and Section 2.2 details the workflow of ML model construction, as shown in Figure 1b. Section 2.3 describes the structural design of polyimides using genetic algorithms. In Section 2.4, we validated the reliability of the MGA method through experiments. Section 2.5 reveals potential chemical rules through interpretable feature analysis.
2.1数据准备
  • 原始数据:ployinfo总的聚亚酰胺的重复单元、介电性能(指不同频率和温度下的介电常数与介电损耗)、玻璃转化温度等参数;另一部分人工方式提取。

  • 对象限制:所以聚酰亚胺均为不可交联型

  • 数据拓展:Considering the need for sufficient low-frequency dielectric performance data to obtain the parameters of Equation 1, fitting was performed for 13 kinds of PIs that met the criteria (having at least 5 data points for low-frequency dielectric properties at the same test temperature).对低频拟合,再对高频计算
    ![[../../images/Pasted image 20251104140004.png]]

  • 分布展示
    ![[../../images/Pasted image 20251104140130.png]]

  • 关于数据表征:聚合物表征——简化的分子输入行条目系统(SMILES
    空间特征表征(多级描述符):were automatically generated using the Python third-party library Mordred。(Python第三方库)
    另外一种:RDKit固有的分子描述符

  • 特征工程:将描述符数量减少,减少至130、107和170个

  • 子结构描述符SD方法,关键基元,更微小的结构。

  • gspan算法:基于图的子结构模式挖掘算法,来提取每种聚酰亚胺中与各项性能相关的子结构,从而整合不同子结构对目标性能的贡献度

  • 结合定量结构-性能关系分析,我们最终分别获得了508、284和1313个特征,用于构建聚酰亚胺结构与介电常数、介电损耗和玻璃化转变温度之间的定量关系模型。

2.2基于机器学习的定量结构-性质关系模型构建
  • 简单来说HNN来多精度问题;ANN用来预测缺失的玻璃化转变温度;广泛使用的高斯过程回归(GPR)模型被确立为基准模型,用以评估神经网络模型的性能
  • Due to the significant impact of the size of the feature set on the performance of ML models, a practical and highly accurate dimensionality reduction method is necessary to reduce redundant information in the features.需要采用一种实用且高精度的降维方法,以减少特征中的冗余信息
  • We selected three feature reduction methods used in ML, including LASSO regression, ridge regression, and recursive feature elimination (RFE)
  • Note that we have taken the logarithm of the dielectric constants and the dielectric losses to guarantee that the final predicted values are all positive.

关于HNN的学习和ANN的学习

未完待续

数据来源(对应数据结构)

这是一篇关于蹇锡高院士学术讲座的笔记,主题为"新型杂环高性能工程塑料及其加工应用发展进展——杂萘联苯型聚芳醚高性能树脂及其应用技术"。笔记包含讲师介绍链接、重点内容(短纤维增强树脂基复合材料、连续纤维增强热塑性树脂基复合材料、耐高温耐辐照绝缘漆、功能膜等应用领域)、启发(机器学习在高分子材料筛选中的适用性)以及前沿研究(2035发展战略研究建议发展重点和复合材料特性),特别提到关注既耐高温又可溶解的新品种材料开发,如引入DHPZ结构实现既耐高温又可溶的特性。

阅读全文 »

这篇笔记基于Kaggle竞赛数据,详细记录了使用CatBoost进行道路风险预测的完整流程,包括第三方库导入与版本查看、数据集导入与清洗、数据可视化分析(目标分布和相关性热力图)、CatBoost模型构建(设置1000次迭代、0.1学习率、6层深度等参数并启用GPU加速)、模型评估(通过RMSE和5折交叉验证)、特征重要性分析(速度限制、光照条件和曲率是最重要的三个特征)、预测结果可视化(实际值vs预测值散点图)以及提交结果生成(创建包含id和accident_risk的submission.csv文件)。

阅读全文 »

这篇笔记基于Kaggle竞赛"Predicting Road Accident Risk"的公开代码,主要介绍了从数据观察、探索性数据分析(EDA)到CatBoost模型应用的完整流程,包括使用pandas读取和分析数据,通过matplotlib和seaborn进行数据可视化,利用CatBoost算法(特别擅长处理类别特征)构建预测模型并设置GPU加速,通过RMSE和交叉验证评估模型性能,提取特征重要性并可视化,以及按比赛要求准备和输出预测结果。

阅读全文 »

域名购买腾讯云
域名购买
等待时间 1-2天

域名绑定以及解析,参考大佬的教程(码的艺术家,2024)

域名备案(最后一步,域名备案,云服务器还要购买,呜呜呜)
云服务器暂且搁置

0%