Yueming & Blog

blog学习进展/hexo-next教程

发表于 2025-10-22 更新于 2025-11-06 分类于学习本文字数： 937 阅读时长 ≈ 3 分钟

这是一篇关于Hexo-Next博客学习进展的总结文章，记录了作者在博客美化、站点建设和Markdown使用方面的学习笔记，包含如何创建新文章、更改首页置顶顺序、实现文章部分显示、配置域名、添加友链、将ipynb转换为markdown、解决链接跳转问题、添加脚注等实用技巧，每个技巧都标注了学习日期，并提供了相关参考链接和解决方法。

阅读全文 »

关于机器（深度）学习的500问/个人版

发表于 2025-11-05 更新于 2025-11-11 分类于学习本文字数： 416 阅读时长 ≈ 2 分钟

解决问题最好的方式，就是正确的提问，从大问题中拆成小问题（一个个解决），这便是思考学习；鉴于每个人的学习情况不同，可以用全局搜索，是否遇到同一个问题。这是将会是一篇汇总自己在学习ml、dl过程中遇到最想的问题。以及我自己还有ai的回答。仅供参考

阅读全文 »

机器学习进展

发表于 2025-10-22 更新于 2025-11-06 分类于学术本文字数： 19 阅读时长 ≈ 1 分钟

这是一篇加密文章，请输入密码查看

阅读全文 »

关于11月24日~11月30日中遇到的问题

发表于 2025-11-24 更新于 2025-11-30 分类于工作周报本文字数： 508 阅读时长 ≈ 2 分钟

这是11月第四周所遇到的所有问题以及思考以及解决方案，并在一周结束时将会整理，梳理（不要说说，说到做到！下周上压力，工作和身体上面的）

阅读全文 »

关于11月17日~11月23日中遇到的问题以及解决方法

发表于 2025-11-17 更新于 2025-11-23 分类于学习本文字数： 3.4k 阅读时长 ≈ 12 分钟

这是11月第三周所遇到的所有问题以及思考以及解决方案，并在一周结束时将会整理，梳理

阅读全文 »

关于机器（深度）学习的炼丹docker部署计划

发表于 2025-11-10 更新于 2025-11-14 分类于学习本文字数： 3.2k 阅读时长 ≈ 12 分钟

这是解决一个关于笔记本远程连接docker，并使用docker来训练深度学习模型以及机器学习，提高ai代码效率问题的笔记

阅读全文 »

复现——Data-Driven Design of High-Performance Polyimides With Enhanced Heat Resistance and Dielectric Properties

发表于 2025-11-04 分类于学术本文字数： 1k 阅读时长 ≈ 4 分钟

标题——数据驱动的高性能聚酰亚胺设计：增强耐热性与介电性能

期刊名称：Advanced Functional Materials

文章解读：

intrduction：强调背景、抛砖引玉、娓娓道来

对象：聚酰亚胺Pi，在高频、高温下的需求
策略：mag，先讲传统策略的缺陷，劣势；突出强调mag方法
mag：The MGA is a systematic research strategy to accelerate the discovery and optimization of new materials through high-throughput experimentation, computation, simulation, and data analysis. The core of MGA is to accurately predict material properties through machine learning (ML) and effectively screen desired materials from candidates.
举例：其他人用mag做出了什么，开始说在Pi领域也有人在用mag做研究。
However：（画风一转）However, applying these methods to the design of polyimides still faces numerous challenges, such as the issue of data sparsity in high-frequency dielectric properties and the need for precise representation of polyimide structures.
点明矛盾问题：高频段数据稀缺；聚亚酰胺的空间结构的精确表达
工作方法：the classical Havriliak-Negami (H-N) dielectric relaxation dual-parameter model——对于高频段数据稀缺性采用经典的Havriliak-Negami（H-N）介电弛豫双参数模型（第一性原理的引入）；
developed multi-level descriptors to comprehensively capture the characteristics of the molecular structures of PIs——对于后者空间结构的表征采用的是多级描述符
多层神经网络HNN进行多任务学习MTL——Subsequently, using these data, we employed multi-task learning (MTL) with hierarchical neural networks (HNN) to establish an efficient and accurate machine learning model.
人工神经网络ANN——Meanwhile, an artificial neural network (ANN) model for predicting the glass transition temperature of PIs was developed
遗传算法——A genetic algorithm was employed to create a series of PIs exhibiting exceptional high-frequency dielectric properties and heat resistance.

结果与讨论

Section 2.1 introduces the data preparation, and Section 2.2 details the workflow of ML model construction, as shown in Figure 1b. Section 2.3 describes the structural design of polyimides using genetic algorithms. In Section 2.4, we validated the reliability of the MGA method through experiments. Section 2.5 reveals potential chemical rules through interpretable feature analysis.

2.1数据准备

原始数据：ployinfo总的聚亚酰胺的重复单元、介电性能（指不同频率和温度下的介电常数与介电损耗）、玻璃转化温度等参数；另一部分人工方式提取。
对象限制：所以聚酰亚胺均为不可交联型
数据拓展：Considering the need for sufficient low-frequency dielectric performance data to obtain the parameters of Equation 1, fitting was performed for 13 kinds of PIs that met the criteria (having at least 5 data points for low-frequency dielectric properties at the same test temperature).对低频拟合，再对高频计算
![[../../images/Pasted image 20251104140004.png]]
分布展示
![[../../images/Pasted image 20251104140130.png]]
关于数据表征：聚合物表征——简化的分子输入行条目系统（SMILES）
空间特征表征（多级描述符）：were automatically generated using the Python third-party library Mordred。（Python第三方库）
另外一种：RDKit固有的分子描述符。
特征工程：将描述符数量减少，减少至130、107和170个
子结构描述符SD方法，关键基元，更微小的结构。
gspan算法：基于图的子结构模式挖掘算法，来提取每种聚酰亚胺中与各项性能相关的子结构，从而整合不同子结构对目标性能的贡献度
结合定量结构-性能关系分析，我们最终分别获得了508、284和1313个特征，用于构建聚酰亚胺结构与介电常数、介电损耗和玻璃化转变温度之间的定量关系模型。

2.2基于机器学习的定量结构-性质关系模型构建

简单来说HNN来多精度问题；ANN用来预测缺失的玻璃化转变温度；广泛使用的高斯过程回归（GPR）模型被确立为基准模型，用以评估神经网络模型的性能。
Due to the significant impact of the size of the feature set on the performance of ML models, a practical and highly accurate dimensionality reduction method is necessary to reduce redundant information in the features.需要采用一种实用且高精度的降维方法，以减少特征中的冗余信息。
We selected three feature reduction methods used in ML, including LASSO regression, ridge regression, and recursive feature elimination (RFE)
Note that we have taken the logarithm of the dielectric constants and the dielectric losses to guarantee that the final predicted values are all positive.

关于HNN的学习和ANN的学习

未完待续

数据来源（对应数据结构）

CatBoost道路风险预测学习笔记（对应的ipynb的markdown版本）

发表于 2025-11-03 更新于 2025-11-04 分类于学习本文字数： 2.6k 阅读时长 ≈ 9 分钟

这篇笔记基于Kaggle竞赛数据，详细记录了使用CatBoost进行道路风险预测的完整流程，包括第三方库导入与版本查看、数据集导入与清洗、数据可视化分析（目标分布和相关性热力图）、CatBoost模型构建（设置1000次迭代、0.1学习率、6层深度等参数并启用GPU加速）、模型评估（通过RMSE和5折交叉验证）、特征重要性分析（速度限制、光照条件和曲率是最重要的三个特征）、预测结果可视化（实际值vs预测值散点图）以及提交结果生成（创建包含id和accident_risk的submission.csv文件）。

阅读全文 »

蹇锡高学术讲座——新型杂环高性能工程塑料及其加工应用发展进展——杂萘联苯型聚芳醚高性能树脂及其应用技术

发表于 2025-11-03 更新于 2025-11-04 分类于学术本文字数： 462 阅读时长 ≈ 2 分钟

这是一篇关于蹇锡高院士学术讲座的笔记，主题为"新型杂环高性能工程塑料及其加工应用发展进展——杂萘联苯型聚芳醚高性能树脂及其应用技术"。笔记包含讲师介绍链接、重点内容（短纤维增强树脂基复合材料、连续纤维增强热塑性树脂基复合材料、耐高温耐辐照绝缘漆、功能膜等应用领域）、启发（机器学习在高分子材料筛选中的适用性）以及前沿研究（2035发展战略研究建议发展重点和复合材料特性），特别提到关注既耐高温又可溶解的新品种材料开发，如引入DHPZ结构实现既耐高温又可溶的特性。

阅读全文 »

CatBoost道路风险预测学习笔记

发表于 2025-10-30 更新于 2025-11-04 分类于学习本文字数： 1.9k 阅读时长 ≈ 7 分钟

这篇笔记基于Kaggle竞赛"Predicting Road Accident Risk"的公开代码，主要介绍了从数据观察、探索性数据分析(EDA)到CatBoost模型应用的完整流程，包括使用pandas读取和分析数据，通过matplotlib和seaborn进行数据可视化，利用CatBoost算法（特别擅长处理类别特征）构建预测模型并设置GPU加速，通过RMSE和交叉验证评估模型性能，提取特征重要性并可视化，以及按比赛要求准备和输出预测结果。

阅读全文 »