机器学习进展
发表于|更新于|学术
|浏览量:
文章作者: 月明
版权声明: 本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 Yueming & Blog!
相关推荐
2025-11-04
复现——Data-Driven Design of High-Performance Polyimides With Enhanced Heat Resistance and Dielectric Properties
标题——数据驱动的高性能聚酰亚胺设计:增强耐热性与介电性能期刊名称:Advanced Functional Materials文章解读:intrduction:强调背景、抛砖引玉、娓娓道来 对象:聚酰亚胺Pi,在高频、高温下的需求 策略:mag,先讲传统策略的缺陷,劣势;突出强调mag方法 mag:The MGA is a systematic research strategy to accelerate the discovery and optimization of new materials through high-throughput experimentation, computation, simulation, and data analysis. The core of MGA is to accurately predict material properties through machine learning (ML) and effectively screen desired materials from candidates. 举例:其他人用ma...
2025-11-03
CatBoost道路风险预测学习笔记(对应的ipynb的markdown版本)
第三方库导入和数据集的导入,数据集的查看第三方库的导入和输出对应的版本编号12345678910111213141516171819202122232425import pandas as pdimport osimport matplotlib.pyplot as pltimport seaborn as snsimport numpy as npfrom sklearn.model_selection import train_test_split, cross_val_scorefrom sklearn.metrics import mean_squared_errorfrom catboost import CatBoostRegressorfrom IPython.core.display import HTMLdef show_object_columns_info(df): "显示DataFrame中所有object类型列的信息,包括列名、唯一值数量和所有唯一值" object_cols = df.select_dtypes(inc...
2025-10-30
CatBoost道路风险预测学习笔记
下面所学知识经验均来自对kaggle竞赛Predicting Road Accident Riskz中的公开Notebook代码的模仿过程 数据观察(主要用pandas库)读取数据 读取文件——pd.read_csv(“path”)pd.read_csv 数据分析 注意kaggle比赛中,数据已经备好了,从赛者可专注于模型的建立和学习一下较为常用的用粗体表示 df.columns 查看列 df.columns 数据DataFrame的信息——df.info(), df.info()输出列名、以及对于列名的数据大小、空值情况、以及对应的数据类型 df.shape查看数据的形状 df.shape 数据DataFrame的前五行——df.head(), df.head()在nb中会自动展示,或者要对比可以print,or display EDA 探索性数据分析(Exploratory Data Analysis,简称EDA)是数据科学中的关键步骤,旨在熟悉数据集、揭示变量间的关系并指导后续处理。通过读取数据、数据汇总、总览、缺失值和异常值分析,以及特征分析,我们可以深入了...
