Yueming & Blog

blog学习进展/hexo-next教程

2026-06-10T07:58:26.426Z

关于hexo-next的美化

如何创建一个新的博客文章？（2025-10-27）٩(•̤̀ᵕ•̤́๑)ᵒᵏᵎᵎᵎᵎ

hexo new “文章标题”
或者在对应的文件夹在直接添加对应.md文件，注意编辑文件头信息yaml格式

如何更改首页置顶顺序？（2025-10-28）٩(•̤̀ᵕ•̤́๑)ᵒᵏᵎᵎᵎᵎ

可以参考这篇博主的文章阿希の小镇, 2025

如何更改首页，仅部分显示文章？(2025-10-29)

如何实现副标题的动态显示？(2025-10-30)

文章如何只显示部分文章内容？(2025-10-30) ٩(•̤̀ᵕ•̤́๑)ᵒᵏᵎᵎᵎᵎ

可以在文章的md文件中，添加注释，注释之前的内容就会显示在首页，注释之后的内容就会隐藏起来。

链接跳转样式（2025-10-30）

链接跳转样式的图标美化

博客美化的教程text

如何自动折叠代码块？（2025-11-06） ٩(•̤̀ᵕ•̤́๑)ᵒᵏᵎᵎᵎᵎ

最新版的hexo-next主题已经支持代码折叠，去主题配置yml文件中，找到codeblock，将fold的enable设置为true即可。

关于如何优化访问，正规的站点建设

为什么每段时间自己的域名就要重新对齐GitHub（2025-10-29）٩(•̤̀ᵕ•̤́๑)ᵒᵏᵎᵎᵎᵎ

可以参考这篇博主的文章域名DNS解析到自己的githubpages页面,谢乔康

如何配置自己的域名？（2025-10-27）

查看域名配置

如何添加自己的友链？（2025-10-28）٩(•̤̀ᵕ•̤́๑)ᵒᵏᵏᵎᵎᵎᵎ

友链是指在博客中添加其他博客作者的链接，以展示他们的创作和关注。

感悟思考：现在hexo博客的建立主要靠，浏览器的搜索查找别人的技术文章以及ai的回答。还是要多学会用dp、chatgpt等工具，来理解问题解决问题。Trea真的太垃圾了，要加快自己的学习速度！

如何添加文章分享功能？（2025-10-30）

如何将自己的ipynb文件转换为markdown文件？并发表在博客上？（2025-11-02）٩(•̤̀ᵕ•̤́๑)ᵒᵏᵎᵎᵎᵎ

参考这篇文章惜鸟，2025

如何升级评论系统，GitHub评论系统较为封闭并不开放？（2025-11-03）

RSS订阅功能如何添加？（2025-11-04）

添加博客圈

关于markdown的使用

markdown是一种轻量级的标记语言，用于在文本中添加格式化元素。它简单易学，同时也非常灵活。（obsidion、blog必备的技能、现在ai回答输出的格式也是markdown例如deepseek的回答、）基础语法参考(小刘在路上[^1]，2024)

如何链接文章？（2025-10-27）,有问题跳转找不到网页，亟待解决 ٩(•̤̀ᵕ•̤́๑)ᵒᵏᵎᵎᵎᵎ

内部链接 ٩(•̤̀ᵕ•̤́๑)ᵒᵏᵎᵎᵎᵎ

这种问题是由于在hexo生成的public文件夹中，文章的路径与链接的路径不一致导致的。
解决方法：在hexo配置文件中，将permalink设置为/:year/:month/:day/:title/，例如：permalink: /:year/:month/:day/:title/
这样，在生成的public文件夹中，文章的路径就与链接的路径一致了。

例如，文章的路径为/2025/10/27/yuming/，那么链接就为域名配置

外部链接(https://www.baidu.com/) ٩(•̤̀ᵕ•̤́๑)ᵒᵏᵎᵎᵎᵎ

外部链接是指指向其他网站的链接，例如：百度
外部链接的安全链接的调试可能存在问题（待解决）

外部链接跳转无效问题？（2025-10-29）٩(•̤̀ᵕ•̤́๑)ᵒᵏᵎᵎᵎᵎ

问题出在butterfly与next主题的容器选择器不同所导致的，致谢LiuShen,2024

如何添加脚注，来致谢引用参考链接的作者？（2025-10-27）15min ٩(•̤̀ᵕ•̤́๑)ᵒᵏᵎᵎᵎᵎ

[^1]: 小刘在路上, 2024. 手把手教会你使用Markdown. CNDS, https://blog.csdn.net/qq_40818172/article/details/126260661

claude_code 配置安装完整教程

2026-04-29T16:00:00.000Z

如何安装claude code+vscode的新编程模式? 元工具的方式不止编程

关于安装不推荐采用claude code官方的安装指令（地区和网络问题），也就是下面这行代码

1	irm https://claude.ai/install.ps1 \| iex

1.采用npm的方式

先安装node，node.js官网

对于liunx：一般先安装nvm，安装node，也就有了npm

对于windows：直接去官网下载exe，然后，在终端测试版本号，即可验证安装是否成功

2.采用字节，的教程（让卖方告诉你使用的方法，说明书一样），这种方法往往实用且高效，字节也有个agent的脚本ark-helper.

其他

关于如何快速管理自己的agent端的模型，如何快速切换，这里笔者强力推荐一个项目，叫做cc switch；通过它我们可以实现openclaw、claude code、codex等cil工具背后的模型接口的快速的切换。

OpenClaw 浏览器配置完整教程 - 解决 WSL2 自启动失败问题

2026-04-14T16:00:00.000Z

静态神器：web_fetch 内置工具

原理机制 - 获取 URL 并提取可读内容

详细见 openclaw中文站官方解释

![[images/Pasted image 20260414120119.png]]

纯 HTTP 请求：发送 GET 请求（不执行 JavaScript），用 Chrome-like UA 模拟正常浏览器
SSRF 防护：默认阻止私有/内网主机，每一步重定向都重新检查
正文提取：用 Readability 算法从 HTML 中提取主体内容，去除导航、广告等干扰
格式转换：输出转换为干净的 Markdown 或纯文本
回退机制：提取失败且配置了 Firecrawl 时，自动回退到 Firecrawl API
缓存：相同 URL 结果缓存 15 分钟，减少重复请求

使用场景

✅ 适合：静态网页、文章、文档、API 数据获取
❌ 不适合：JavaScript 动态渲染页面、需要登录的页面、交互操作

总结：轻量快速获取静态网页正文，动态内容请用 browser/agent-browser。

通过 Chrome DevTools MCP 连接现有会话

官网介绍

检查状态

1	openclaw browser --browser-profile user status

running: true 则成功。

在浏览器中打开并批准远程调试

地址：chrome://inspect/#remote-debugging

![[images/Pasted image 20260414122323.png]]

实际操作示例

![[images/Pasted image 20260414122458.png]]

适用场景

这种方式非常适合：

需要登录才能访问的网站
JavaScript 动态渲染页面
人机验证（你点击验证，AI 提取内容）
多种反爬机制

OpenClaw 独立控制专用浏览器（openclaw 配置文件）

前置步骤

安装浏览器可以参考这两篇教程：

启动

1	openclaw browser --browser-profile openclaw start

检查浏览器状态

Q：如果遇到自动启动报错，应该怎么办？

可以使用无头模式（不显示窗口），或者 WSLg 显示窗口，手动启动。

踩坑总结：WSL2 + systemd 环境下 OpenClaw 自启动失败解决方法——额这是小龙虾总结的，仅供参考

问题现象

openclaw browser --profile openclaw start 一直报 Chrome CDP websocket not reachable after start
手动启动 Chrome 能成功，curl 能拿到 CDP 信息，但 OpenClaw 还是连不上

根本原因

WSL2 中 openclaw-gateway 由 systemd 管理，systemd 服务不会继承你终端的 DISPLAY 环境变量，即使你 echo $DISPLAY 显示 :0，systemd 启动的 Gateway 还是拿不到，Chrome 启动还是找不到 X 服务器，即使开了 headless: true 也会失败。

解决方法

创建 systemd 服务配置，添加 DISPLAY=:0 环境变量

1	sudo systemctl edit --force --full openclaw-gateway.service

填入以下内容：

[Unit]
Description=OpenClaw Gateway
After=network.target

[Service]
Type=simple
User=xm
Environment=DISPLAY=:0
ExecStart=/usr/bin/openclaw gateway start
WorkingDirectory=%h
Restart=always
RestartSec=5

[Install]
WantedBy=multi-user.target

重载配置并重启

1 2	sudo systemctl daemon-reload sudo systemctl restart openclaw-gateway.service

测试启动

1 2	openclaw browser --browser-profile openclaw start openclaw browser --browser-profile openclaw status

现在应该就能显示 running: true 了 ✅

如果自动启动失败，可以手动启动浏览器，OpenClaw 通过 CDP 连接

1	/usr/bin/google-chrome-stable --headless --no-sandbox --disable-gpu --remote-debugging-port=18800 --user-data-dir=/tmp/chrome-openclaw

参数说明：

参数	作用	是否必须
`--headless`	无头模式运行，不显示窗口	✅ 必须
`--no-sandbox`	WSL2 root 运行必须加，否则权限错误	✅ 必须
`--disable-gpu`	禁用 GPU 加速	✅ 建议
`--remote-debugging-port`	CDP 调试端口	✅ 必须
`--user-data-dir`	独立临时用户数据目录，避免和日常 Chrome 冲突	✅ 必须

最后检查状态

1	openclaw browser --browser-profile openclaw status

running: true 则成功。

总结

推荐优先使用第二种方式（连接现有会话），适合需要登录、人机验证的场景，踩坑更少。
如果需要完全自动化无人值守，再用第三种方式，按照上文修改 systemd 配置就能解决问题。

OpenClaw 配置安装完整教程

2026-04-12T16:00:00.000Z

🚀 step1：根据openclaw官网，对应自己系统，使用终端命令下载对应的版本

![[images/Pasted image 20260407090302.png]]

这里笔者使用的是win的wsl2子系统Ubuntu22.04中的npm下载的；如果你也是win系统官网也是非常强烈的推荐使用WSL2来下载的。✅

⚙️ step2：进行基础配置，因为小龙虾是数字员工，官网也叫做入职，允许以下代码

1	openclaw onboard --install-daemon

QuickStart vs Advanced，推荐使用前者进行配置，要提前准备好，大模型的api_key

有无`--install-daemon`对应——有无后台服务，使网关自动启动 🚀

无论如何配置，一定包含Model provider and auth（必选，模型的提供者）、Workspace、Gateway（网关配置）、Channels（其他端介入）。具体可以先参考：火山引擎、官方教程

最重要的配置信息都集中在`~/.openclaw/openclaw.json`文件内，可以通过记事本编辑，定制化更改，但操作难度较高⚠️

🛠️ step3：配置小龙虾的性格、工具、技能，可以取国内的技能镜像下载对应技能，这里推荐一些技能 ⭐

可以采用对话式的安装 💬

Find skill	小龙虾遇到什么问题，可以通过该技能取，寻找是否有解决这个问题的技能，就是说授人以鱼不如授人以渔啦
Self-Improving + Proactive Agent	这个技能据说是自我反思+自我批评+自我学习+自组织记忆，但总的来说，我自己在使用过程中，并没有体验出有什么变化
Agent Browser	这个很好用，如果在wsl2中，配置好后结合Selenium+Python、 playwright-browser等工具可以完成许多无需登录的爬取操作 🔍

注：openclaw迭代很快，可能安装配置的方式会不停更新，如果需要安装服务请联系我

关于11月24日~11月30日中遇到的问题

2025-11-23T16:00:00.000Z

llm的本地部署

如何选择本地大模型的推理框架app？（11月24日）٩(•̤̀ᵕ•̤́๑)ᵒᵏᵏᵎᵎᵎᵎ

最后选择了LM Studio

推理框架的对比	自己个人理解（缺点）	优点	进度
vllm推理框架	采用huggingface下载需要魔法；docker拉取image时也需要魔法；运用较为复杂（推进采用先在本地下载好模型后，挂载的方式，推入到容器中运行）； wsl2的方式来吸取可能导致，硬件的限制	支持docker部署；模型种类丰富；支持api调用；更适合工业部署；	成功部署过《mistralai/Mistral-7B-v0.1》，但遗憾的是显存爆了
ollma推理框架	部署起来也偏简答，运用不复杂；模型较笨	部署简答使用方便；	成功安装过deepseek，但是太笨了；
LM Studio推理框架	模型种类较少、门类较少	下载模型简单，且在国内下载模型无网络限制；自动检测你的gpu、cpu以及下载好的cuda的驱动；	完成模型的下载好部署，并成功在pycharm中调用api

如何在本地大模型中加入mcp的服务？（11月26日）٩(•̤̀ᵕ•̤́๑)ᵒᵏᵏᵎᵎᵎᵎ

在环境中安装好必要的库后，编辑好mcp.json即可，可以通过询问大模型（支持工具调用的模型）的方式来问它是否能，使用mcp的服务

ai辅助

为什么cherry_studio中大语言模型的联网搜索内容不准确？（11月26日）٩(•̤̀ᵕ•̤́๑)ᵒᵏᵏᵎᵎᵎᵎ

这与cherry_studio中模型内置的搜索有关，可以优先使用模型自带的联网搜索功能，或者用mcp的搜索服务

课题组网站

关于学习的思考

如何避免在听课（知识输入）太过于关心记录，而造成知识点的略过，产生一种，只见树木不见树林的学习窘境？（11月25日）

以下两个任务正在完成中
[[s5e11]]
[[课题组网站]]

关于11月17日~11月23日中遇到的问题以及解决方法

2025-11-16T16:00:00.000Z

Obsidian的笔记同步

如何利用gitee在不同电脑以及不同平台，同步Obsidian笔记？（11月17日）٩(•̤̀ᵕ•̤́๑)ᵒᵏᵏᵎᵎᵎᵎ

但不是很完善，git很多知识等待去学习了解（关于各种分支的验证等等）,成功实现推送，现在就开始验证不同端的拉取。

关于在同步过程中常常出现分支不一致或者分支推送不知道在哪里的问题？（11月17日）٩(•̤̀ᵕ•̤́๑)ᵒᵏᵏᵎᵎᵎᵎ

查看所有分支git branch -a（星号表示本地，remotes/origin表示远程分支

$ git branch -a
* master
  remotes/origin/main
  remotes/origin/obsidian_syn

如何指定push分支（长期）remotes/origin/main
关于问题的ai描述和解决方案

内容类型	内容	备注
AI	这段 Git 提示的核心意思是：你当前所在的本地分支（local branch）所关联（upstream）的远程分支（remote branch）名字，和你本地分支的名字不一致。因此当你直接执行 `git push` 时，Git 不知道到底该把本地改动推送到哪个远程分支上。提示中给出了两种临时解决办法，和两种长期（配置）方案： 1. 临时推送到远程的 main 分支（upstream 分支） git push origin HEAD:main 这会把当前本地分支（HEAD）里的提交，推送并合并到远程的 main 分支上。 2. 临时推送到一个“同名”远程分支 git push origin HEAD 相当于 `git push origin :`，在远程新建或更新一个和你本地分支同名的分支。 3. 永久指定默认推送行为你可以通过修改 Git 配置，让它以后自动选择其中一种方式： – 在命令行里运行 `git config --global push.default <模式>` 常用模式有 • simple：只允许推送当前分支到名字相同的远程分支（安全性更高，Git 2.0+ 默认） • upstream：推送到已设置好的上游分支（不关心名字是否相同）具体可查看 `git help config` 中 push.default 的说明。 4. 避免自动关联“异名”分支如果你希望新建分支时就不要把它错误地关联到名字不同的远程分支，可以配置 git config –global branch.autoSetupMerge simple 这样只有当本地分支和远程分支同名时，Git 才会自动给它设置上游。 ——— 简单来说，这条提示告诉你： • 你的本地分支 upstream（上游）指向了一个和它本地名字不一样的远程分支， • Git 无法猜测你到底是想推送到哪个分支， • 因此让你手动指定“推向 main”还是“推向同名分支”，或者调整配置让它以后自动选其中一种。	模型：(openai)：gpt-o4mini
自己理解		笔者猪脑

或者更改本地的分支名 git branch -m new_name使得其与远程分支同名，带到git默认版本模式

# 在主机上（同名分支main）
$ git branch -a
* main
  remotes/origin/HEAD -> origin/obsidian_syn
  remotes/origin/main
  remotes/origin/obsidian_syn

## 查看同步历史，看见默认备份成功从本地的main到远端的main
$ git branch -vv
* main cf68e5c [origin/main] vault backup: 2025-11-17 17:45:18

# 在笔记本上（同名分支main）
$ git branch -a
* main
  remotes/origin/main
  remotes/origin/obsidian_syn

## （观察到同步历史达到一致）
$ git branch -vv
* main cf68e5c [origin/main] vault backup: 2025-11-17 17:45:18

关于git的常见操作-commit、push、pull三种命令的解释？（11月17日）٩(•̤̀ᵕ•̤́๑)ᵒᵏᵏᵎᵎᵎᵎ

总结来说，commit是在本地保存你的工作，push是将你的本地工作推送到远程仓库，而pull是从远程仓库获取并合并最新的更改到你的本地仓库。

课题组网站

自己的个人blog用的hexo来创建，那么该用什么中介工具来介入课题组网站？（11月17日）

Labxing这种填空式的网站，总结来说相当丑，所以笔者愚见是采用类似的hexo+github这种方式来进行运作，只要求专注具体内容的本身，而不用花大量时间精力，去重新学习html前端代码知识。
可以参考这篇文章所描述这篇大佬所展示的方案是HugoBlox+Github托管的方式

hugo如何安装？以及基础的操作命令是什么？（11月17日）٩(•̤̀ᵕ•̤́๑)ᵒᵏᵏᵎᵎᵎᵎ

最好的是用hugo-theme上github免费的主题，不建议使用hugo-blox pro主题，太贵了799多（是人搞得起的？）
可以参考这份官方的安装文档💻 本地编辑你的Hugo网站 |雨果·布洛克斯医生
scoop(win的powershell下安装)，这个是一个win的包管理器
在包管理器下安装git go hugo-extended nodejs三个前置条件

如何找到hugo的主题，并开始制作搭建一个课题组网站？（11月19日）

如何从json数据集中提取玻璃转化温度，并完成复现工作？（11月20日）

优化可以把__getitem__

pytorch的使用+文献复现工作

怎样读取元数据的格式，并且将其定义解析成pytorch中的data对象?（11月17日）٩(•̤̀ᵕ•̤́๑)ᵒᵏᵏᵎᵎᵎᵎ

成功实现了json中文件的部分数据结构的读取，但后面发现json中的结构不统一，相同json中的sample数据也不统一存在多个分散，较为复杂的局限，通过单纯的定义数据框似乎也可以解决，但工作量较大，逐步框架式的搜索复杂

借此我们通过引入无幻觉的LLM的api来捕获数据集，如何引入api来捕获对应数据集？（11月18日）٩(•̤̀ᵕ•̤́๑)ᵒᵏᵏᵏᵎᵎᵎᵎ

这种操作的实现，在于客户端的构建、提示词的构建，还蛮简单的。详细可以参考

如何在pycharm中引入对应llm的api加入编程？（11月19日）٩(•̤̀ᵕ•̤́๑)ᵒᵏᵏᵎᵎᵎᵎ

第零步检查所有值得搜索的变量（第一难检查、存在数据种类稀疏、标准不统一的情况）
第一步将所有需要的变量赋值为None
第二步将文件下的json读取为txt（改为先提取每个json中的sample，减少输入llm的tokens）
第三步通过llm的api来填空
第四步循环完所有单文件
优化第二步，通过re筛选包含检索目标性能json的索引列表，在利用llm在对应json中提取目标性能值（进一步减少llm的输出损耗）；
优化第三步，先通过pid来构建df索引列，在通过往其中引入对应的值即可

大模型部署指南：从个人玩转到企业级应用，这4款工具必看！-阿里云开发者社区

请注意这个处理数据大了之后，会非常烧钱😭

在pycharm中如何忽略隐私文件数据文件的git上传？（11月19日）٩(•̤̀ᵕ•̤́๑)ᵒᵏᵏᵎᵎᵎᵎ

一定要在文件被跟踪前，在.gitignore文件中添加，文件目录或者文件名，这样可以避免隐私信息的上传

本地大模型的部署——如何启动在本地上安装可以使用openai的api支持的大模型，支持嵌入代码中？（11月21日）

第零步：对相关模型本地部署的知识进行普及，挑选架构，选用什么推理框架来部署本地大模型？（11月21日）٩(•̤̀ᵕ•̤́๑)ᵒᵏᵏᵎᵎᵎᵎ

在这里我将采用vllm来部署本地大模型，因为这样可以方便代码api调用，以及获得较高的性能。详细参考文档大模型部署指南：从个人玩转到企业级应用，这4款工具必看！-阿里云开发者社区
不同推理框架的大模型的对比2025年本地AI部署完全指南：从Ollama到vLLM的全方位实践教程-腾讯云开发者社区-腾讯云

第一步关于vllm的安装？（11月21日）٩(•̤̀ᵕ•̤́๑)ᵒᵏᵏᵎᵎᵎᵎ

使用uv来构建pytorch环境和vllm的安装

win11如何安装uv（理解起来就类似于conda）包、环境管理器？（11月21日）٩(•̤̀ᵕ•̤́๑)ᵒᵏᵏᵎᵎᵎᵎ

参考uv的官方文档安装 | uv 中文文档

uv的介绍：

uv 是一个由 Rye 或 pip-tools 启发的高性能 Python 包安装器和解析器
使用uv创建环境、激活环境、退出环境(在win powershell中)
uv venv --python 3.12、.venv\Scripts\activate、deactivate

报错版本限制问题：无法在win powershell中安装vllm

PS E:\projects\vllm_rag> uv add torch modelscope vllm
Resolved 163 packages in 5.59s
error: Distribution `nvidia-cutlass-dsl==4.3.0 @ registry+https://pypi.org/simple` can't be installed because it doesn't have a source distribution or wheel for the current platform

hint: You're on Windows (`win_amd64`), but `nvidia-cutlass-dsl` (v4.3.0) only has wheels for the following platforms: `manylinux_2_28_aarch64`, `manylinux_2_28_x86_64`; consider adding "sys_platform == 'win32' and platform_machine == 'AMD64'" to `tool.uv.required-environments` to ensure uv resolves to a version with compatible wheels

如何解决uv安装vllm兼容性问题，仅支持Linux系统？（11月21日）٩(•̤̀ᵕ•̤́๑)ᵒᵏᵏᵎᵎᵎᵎ

在这里我们使用win的Linux子系统来解决这个问题+docker的方式
不在这里我们更改策略，采用docker（一个比conda、uv、scoop更大的概念，可以叫做系统管理器）来拉取vllm的镜像来快速部署

具体可以参考：vllm-openai Docker 部署全手册 - 轩辕镜像技术博客

win下安装docker，可以采用docker-desktop+wsl2的方式（完成安装、配置国内镜像源），具体可以参考Windows 环境下安装 Docker 的详细教程（超详细图文）_windows 安装docker-CSDN博客

如何使用docker将vllm推理框架与本地框架隔离，并使得win也可以使用vllm？（11月21日）٩(•̤̀ᵕ•̤́๑)ᵒᵏᵏᵎᵎᵎᵎ

参考官方vllm文档的docker安装说明使用 Docker - vLLM 文档

如何挑选模型和下载到本地，方便vllm挂载启动？（11月23日）٩(•̤̀ᵕ•̤́๑)ᵒᵏᵏᵎᵎᵎᵎ

在国内模型库首页 · 魔搭社区网页中挑选适合自己的模型，huggingface.co也可以了解到最新的模型

魔塔社区挺不错，支持很多模型的下载概览 · 魔搭社区，包括Models – Hugging Face（后者是ai界的github）

现在开来主要有三个选择Llama 3 系列 (Meta)、Qwen 系列 (通义千问)、Mistral 系列 (Mistral AI)

如何结合轩辕云下载vllm的docker并运行本地大模型，开启api，并接入代码中？（11月23日）٩(•̤̀ᵕ•̤́๑)ᵒᵏᵏᵎᵎᵎᵎ

去轩辕云官网查询对应vllm的docker版本利用专属域名，按量计费加速下载docker pull zhuanshuyuming.xuanyuan.run/vllm/vllm-openai:v0.11.2
最新了解到，vllm只是一个运行推理框架，可以选择在本地下载大模型然后采用挂载的方式，所以想要运动大模型，还得下载模型文件
下载的方式分为两种，第一种：本地下载大模型后通过挂载卷的方式送入容器内，后利用容器内的vllm推理框架进行运行，第二种：通过共享挂载卷的方式在vllm中使用hf拉取大模型，挂载卷也会同步回主机的存放大模型的空文件夹中；
这里采用第二种方法，因为采用第一种时，docker容器内部的网络环境与宿主机是win的wsl2不同，win与wsl2又不同，存在多层网络嵌套处理较为麻烦，使用python脚本+魔法+conda环境的方式，利用hf-api来下载到本地的目录，然后挂载到docker

import os  
from huggingface_hub import snapshot_download  
  
# 你挂载到 Docker 的本地目录  
local_cache_dir = "E:/vllm_models"  
  
# 你要下载的模型  
model_name = "mistralai/Mistral-7B-v0.1"  
  
# 使用你的 Hugging Face Token
hf_token = "your_hf_tokens"  
  
print(f"开始下载模型 {model_name} 到 {local_cache_dir}")  

# 这会使用你主机的网络（包括代理设置）来下载  
snapshot_download(  
    repo_id=model_name,  
    cache_dir=local_cache_dir,  
    token=hf_token,  
    resume_download=True,  
)  
  
print("模型下载完成！")

成功下载模型mistralai/Mistral-7B-v0.1，也成功在docker中运行，但是很不幸的是gpu的显存爆了

AI辅助

如何采用mcp来提高ai辅助编程trea的能力？（11月18日）٩(•̤̀ᵕ•̤́๑)ᵒᵏᵏᵎᵎᵎᵎ

trea给了内置的功能（极大地方便了调用）
glm4.6+mcp

关于ai使用的心得：ai很笨需要检验，检查理解关键部分！不要盲从，理解代码，慢慢给ai问改。代码运行成本较贵（从时间和金钱上来讲，所以最好一次成功，对各部分检验

如何采用mcp来提高ai助手chatbox集成的能力？（11月18日）

安装

如何采用本地知识库的部署，通过ai助手chatbox来强化对文献知识库的理解和检索能力？（11月18日）

课程任务学习

基本的高斯程序的使用，基本的高斯计算

如何使用高斯程序，制作高斯输入文件，并运行查看输出结果？（11月23日）٩(•̤̀ᵕ•̤́๑)ᵒᵏᵏᵎᵎᵎᵎ

（结合chemoffice中chemdraw（画好分子图保存为.cdx）——>chem3D（打开后create高斯计算文件.gif）——>Gaussian程序运行即可）

如何在高斯输出文件中查找对应物理参数以及其意义？（11月23日）٩(•̤̀ᵕ•̤́๑)ᵒᵏᵏᵎᵎᵎᵎ

使用ctrl+F搜索以下关键词

分子总能量：SCF Done：E = object_value
精确极化率：
最高轨道占有能(E_home)：多行Alpha occ. eigenvalues最后一个数字
最低空轨道能（E_lumo）：多行 Alpha virt. eigenvalues第一个数字
原子净电荷Mulliken charges:（最正最负）
偶极矩：Tot=
etc.

关于机器（深度）学习的炼丹docker部署计划

2025-11-09T16:00:00.000Z

计划始于docker，败于ssh远程（为什么远程使用ssh连接过服务器而连接docker中的容器就失败）

从conda虚拟环境到docker容器；环境灵活配置提升，可以快速地在别的服务器、不同设备、不通操作系统中，环境管理，然后炼丹跑代码

在家中台式电脑中创建docker环境
- docker基本教程（知识）Docker 容器使用 | 菜鸟教程
- Linux操作系统入门（知识）入门 Ubuntu操作系统（超详细，巨简单，小白必看）-CSDN博客
- 双系统教程（操作，暂时不用）Windows 系统下安装 Ubuntu 双系统详细教程（图文指南）_windows安装ubuntu-CSDN博客
  - 等待解决
- 自己电脑上使用的是window子系统功能（知识）全网最全Win10/11系统下WSL2+Ubuntu20.04的全流程安装指南（两种支持安装至 D 盘方式）_win10安装wsl2-CSDN博客
- Ubuntu lst 版本与普通版有什么区别（知识）什么是 Ubuntu LTS？和普通版本有什么区别？ - 系统极客
- 切换用户权限（操作，已经解决）【Linux】ubuntu 切换管理员/普通用户指令,看这篇就够了！-CSDN博客
- 从不同系统中安装docker，既然从Ubuntu系统（window子系统或者用docker desk版）『Docker入门指南』- 详细安装与配置教程，助你起航容器化世界！ - 个人文章 - SegmentFault 思否
在conda中打包虚拟环境并在docker部署，如何再开启远端联机，实现本地云端，主机炼丹，优势在于极大的灵活了部署问题，环境不同的问题https://blog.51cto.com/u_16213450/12773839

对于自己而言将会常用到的docker命令

运行进入交互界面(很重要：用于在images使用conda代码，拓展环境第三方库)

# 交互式运行（进入容器内的bash shell）
docker run -it --rm for_dl_liandan:latest bash

# 构建新image
docker build -t my_ssh_image .

# 交互式运行，用ssh连接docker，将22映射到7092（前面是容器的名字后面是image的名字）
docker run -it --name ssh_test -p 7092:22 more_test bash

在容器中安装的包如何保存到images？（11月10日）٩(•̤̀ᵕ•̤́๑)ᵒᵏᵏᵎᵎᵎᵎ

重构容器就可以，基础用之前的容器

如何在远程（notebook）ipynb中使用docker的images来跑代码——使用ssh或者notebook？（11月10日）

出现无法连接，超时等问题

胎死腹中（11月11日）决定放弃ssh远程连接计划

开始转变，决定施行conda环境打包（环境同步），git代码托管同步（代码同步），以及对应环境变更安装指令的保存（三段灵活性，成长型同步）

思考感悟：上午搞了三个小时的问题，都不知道咋解决，主要两个问题太前沿的问题，ai不会，因为常常联网搜索的匹配程度太低不准确；问题没有解决的百分99的原因都是因为问的问题不够精准，要多用bing搜索引擎来，精准搜索得到答案。（gpt4-o1更好用一点）

docker_desktop + wsl2 (win11) + NVIDIA Container Toolkit安装 + tensorflorw_gpu_docker（快速docker部署容器，并且实现tensorflow gpu 加速）+jupyter lab +ssh远程连接、远程控制

重点内容（关于wsl2中的代理配置问题）

想法路线来源于tensorflow的官方教程:为了简化安装并避免库冲突，建议您使用支持 GPU 的 TensorFlow Docker 映像
重点参考这位大佬
关于NVIDIA Container Toolkit安装-参考官方教程其实重点在于代理

重要命令（关于docker的运行，以及重构）

下面的命令：-p指定容器内的端口向外映射（外部端口:容器内部端口），–gpus指定all可见，-v挂载主机卷到容器内，-d 指定images

docker run --gpus all -p 9060:8888 -p 9061:8889 -p 9062:8890 -p 2222:22 -v F:\polymer_ai:/app/pa  -d a73de5acf455
# 拉取镜像（记得配置国内的镜像）
docker pull tensorflow/tensorflow:2.17.0-gpu-jupyter
# 容器共享宿主机ip
docker run --gpus all --net=host -v F:\polymer_ai:/app/pa  -d a73de5acf455

高版本不兼容，我靠，搞了我一下午(解决容器内tensorflow_gpu加速)

关于为什么在docker拉取的tensorflow容器中`python -c "import tensorflow as tf; print(tf.config.list_physical_devices('GPU'))"`的gpu检测不到（nvidia-msi、以及nvcc –version却可以正确输出）？

参考官方文档

高版本容器创建后报错

步骤1：在容器内运行下面命令，检查cuda和cudnn的版本

1
2
3

ls /usr/local/cuda/lib64/
ls /usr/lib/x86_64-linux-gnu/ | grep cuda
ls /usr/lib/x86_64-linux-gnu/ | grep cudnn

例如我的输出：

# cudnn 的版本8.9.6
ibcudnn.so.8  
libcudnn.so.8.9.6  
libcudnn_adv_infer.so.8  
libcudnn_adv_infer.so.8.9.6  
libcudnn_adv_train.so.8  
libcudnn_adv_train.so.8.9.6  
libcudnn_cnn_infer.so.8  
libcudnn_cnn_infer.so.8.9.6  
libcudnn_cnn_train.so.8  
libcudnn_cnn_train.so.8.9.6  
libcudnn_ops_infer.so.8  
libcudnn_ops_infer.so.8.9.6  
libcudnn_ops_train.so.8  
libcudnn_ops_train.so.8.9.6

# 用nvcc --version查看cuda的实际版本 为12.3
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2023 NVIDIA Corporation
Built on Fri_Nov__3_17:16:49_PDT_2023
Cuda compilation tools, release 12.3, V12.3.103
Build cuda_12.3.r12.3/compiler.33492891_0

步骤2：在官网查询，对应兼容版本Build from source | TensorFlow

如上图所示tensorflow2.17.0 和 2.16.1 可以用

步骤3：pull 对应版本的tensorflow_docker，hub官网拉取对应版本的docker（需要魔法）tensorflow/tensorflow - Docker Image | Docker Hub

关于ssh远程连接docker的jupyter

根据最新的知识面了解到，ssh连接失败可能是不在一个局域网（超时），所以转向内网穿透领域

步骤1：打通宿主机和容器的网络，直接采用`--nest=host`网络共用模式

步骤2：成功实现trea中ipynb直接访问容器，内的jupyter映射出来的内核（直接也可以但是要用到转接技术）

步骤3：成功实现没有–nest=host的情况下，直接通过ssh命令连接容器内部，并使用root命令(宿主机中win中ssh连接不了，但用win的wsl可以连接)

步骤4：在远程机中安装wsl并尝试，在没有内网穿透下，连接宿主机

步骤5：实现宿主机与远程机的内网穿透，成功在各自的wsl内通过cpolar穿透，远程机连接到宿主机内部

步骤6：远程机通过ssh连接到宿主机后，再用docker命令进入容器内交互（这样就实现了，远程控制docker）

远程控制docker进程

步骤7:在使用ssh指令时将宿主机的localhost拉过来，成功使用得到

远程使用docker服务

重点讲一下6、7步是怎么形成的：docker是一种容器化技术，里面打包了我的机器学习深度学习的环境系统（利用docker（在Linux或者在docker_desktop中的）拉取，tensorflow官方在docker hub推送的image），并创建一个容器（在创建时使用的关键命令，涉及到启用gpus、启用端口投射将容器端口（冒号后面8888，指在容器内jupyter使用的端口）到宿主机的端口（localhost：9060））；后在用cpolar+ssh的内网穿透技术，指定其他端口过来

docker容器创建命令，将容器的jupyter服务8888发到宿主机的9060中

1	docker run --gpus all -p 9060:8888 -p 9061:8889 -p 9062:8890 -p 2222:22 -v F:\polymer_ai:/app/pa -d 容器id

在宿主机上配置好cpolar后，用以下ssh命令，将端口9060又转发到远程机上

1	ssh -L localhost:9060:localhost:9060 root@cpolar隧道地址 -p 10954

炼丹计划终于大成了（2天半）

第零步：

笔记本电脑跑深度学习代码太慢（cpu太低，gpu不够），关于想利用docker容器技术，将代码部署到主机电脑（性能较好）并在主机上运行，实现主机跑代码、笔记本电脑写代码的炼丹大法。
于是开始了解并学习到有关容器docker的技术【关于为什么会想到docker因为之前电脑玩过deepseek的本地部署，但是后来发现本地部署的太笨了】，
并尝试把本地运行conda的虚拟环境的包需求列表导出，并引入Dockerfile的image构建文件中（学会了Dckerfile的命令句，以及利用这个文件构建docker的过程），后面发现因为库版本太具体，构建过程中出现问题，开始进入运行的容器内，手动安装需要的包(后面了解到容器暂停运行后并不会保存的image中，学会了从现有image中重新构建image)，
之后也是成功实现docker环境的配置。问题又来了关于如何使用容器内的代码呢，当你把文件挂载进docker时，代码输出又开不见，且没有jupyter的问题，失去了交互性。
之后便开始尝试使用ssh来远程连接docker以及，使用docker内的环境。ssh搞了半天没用（后面发现其实要在一个局域网下才能用ssh来连接，以及docker的网络配置也不知）
之后便开始弃用docker，弃用远程连接，炼丹大法开始泡汤，但有趣的事，关于炼丹大法的事情并没有永远沉寂下去………

在放弃远程炼丹大法之后，由于课题依然要继续推进，便开始着手想着使用远程桌面加U盘的方法。便下载了Todesk软件，使用conda打包一整个环境传输后到主机电脑上解压展开，之后便成功完成了，在主机电脑相同的codna虚拟环境，之后发现xgboost和lightgbm算法通过简单的参数输入便成功使用上了gpu加速，代码运行速度直接打骨折，但运行到ANN（基于tensorflow的人工神经网络）不对了，gpu根本没有跑，运行速度依旧乌龟。于是开始从多途径了解tensorflow的gpu加速方法连接到在电脑上安装各种cuda驱动、CUDA、cndnn太麻烦且要考虑版本兼容问题，然后发现在tensorflow的官网上推荐，使用docker来部署tensorflow的gpu加速环境是最简单的。于是便开始了解docker的部署tensorflow-gpu方案。炼丹计划重新启动！

开始拉取tensorflow的镜像，（记得先配置轩辕镜像），这里建议拉取jupyter的版本，拉取之后在容器的交互页面中，发现tensorflow并没有没有找到gpu设备（卡住了半天😭），一直搞啊搞，主要是两个方向的问题：第一：cuda container toolkit下载不下来，curl的时候，一直无法连接，就算用镜像源也没用（后面用了魔法19yuan，也是重新又用上了）第二：安装好了，拉取镜像的时候，依旧不显示GPU，如何一直找原因，终于通过检查cudnn的版本发现兼容性问题(这个我真的没想到啊，想着拉取的tensorflow的docker应该兼容性是好的吧)，开始查询官网的版本对照表，下载后，终于tensorflow检测到了gpu😎。

后面又了解到ssh内网穿透，可以远程连接，干脆一不做二不休，开始研究wsl(windows的linux子系统)、研究docker的运行命令关于网络端口的投射、关于cpolar等等一些知识，后面终于通过重重问题困难，终于练就了炼丹大法，感谢这几天的自己😎，没有放弃偷懒🤣。

总结一下：《炼丹大法》涉及wsl(win下的Linux)基础命令指令、cuda container Toolkit的安装、win下docker的安装以及使用docker-desktop的镜像构建以及使用、ssh的命令以及使用、cpolar内网穿透的使用。

第一步：安装wsl，以及Linux的子系统（建议宿主机和远程机都安装），做好对应配置

第二步：安装docker-desktop，完成一些必要的配置，如确定wsl集成

第三步：在宿主机上安装cuda，以及利用wsl+魔法安装cuda container toolkit

第四步：用docker拉取tensorflow的gpu-jupyter版本的image，并通过命令运行容器

第五步：用cpolar+ssh打通，宿主机和远程机直接的网络以及端口

第六步：通过远程机的ssh连接后，用docker命令进入容器交互，下载缺少包环境。利用ssh连接是对应的端口转接，来打开docker容器的jupyter服务。

具体docker命令如下

docker exec -it 容器id /bin/bash

# 转发端口
ssh -f -N -L 5672:localhost:5672 用户名@远程服务器地址

通过以上的一些步骤便可实现在笔记本电脑上，对台式机上的容器环境进行使用其环境服务，以及变更调整其环境。真正做到快速炼丹的调控。

关于机器（深度）学习的500问/个人版

2025-11-04T16:00:00.000Z

显示问题

关于为什么在vsc中显示不了jupyter notebook中生成ploty图像？（25年11月5日）٩(•̤̀ᵕ•̤́๑)ᵒᵏᵎᵎᵎᵎ

多用ai来提升问题的解决效率，提高学习的速度（同时要注意提示词给的精准，准意区分真正的解决方案和ai幻觉——靠各种方案去尝试）

关键是插件Jupyter Notebook Renderers没有安装的问题。所以在浏览器中的jupyter可以显示ploty交互式的图像，但是在vsc中却没用。

如何在博客中自动折叠代码、以及在obsidian中自动折叠代码？（25年11月6日）

代码运行问题

在vsc-notebook中如何调试代码? (25年11月6日) ٩(•̤̀ᵕ•̤́๑)ᵒᵏᵏᵎᵎᵎᵎ

在代码框运行旁边有个debug,可以调试代码代码块.

代码调试和逐句ai辅助理解, 学习代码效率简直拉满. 其实做习惯了, 也可以少一点笔记编辑, 可以直接在理解后, 用自己的语言备注在代码块中.

如何提高代码的运行效率和时间，外加服务器？（2025年11月7日）

如何用阿里云服务器跑深度学习代码？-CLOUD云枢

如何在其他的电脑中使用docker服务器部署，如何在主机中远程连接服务器？开启炼丹炉计划？（11月10日）spider man

如何用conda将包打包后，导入另外一个电脑的环境管理或者docker容器中？(11月11日)٩(•̤̀ᵕ•̤́๑)ᵒᵏᵎᵎᵎᵎ

实现全量打包【Anaconda】Conda 虚拟环境打包迁移教程_conda打包环境-CSDN博客

复现——Data-Driven Design of High-Performance Polyimides With Enhanced Heat Resistance and Dielectric Properties

2025-11-03T16:00:00.000Z

标题——数据驱动的高性能聚酰亚胺设计：增强耐热性与介电性能

期刊名称：Advanced Functional Materials

文章解读：

intrduction：强调背景、抛砖引玉、娓娓道来

对象：聚酰亚胺Pi，在高频、高温下的需求
策略：mag，先讲传统策略的缺陷，劣势；突出强调mag方法
mag：The MGA is a systematic research strategy to accelerate the discovery and optimization of new materials through high-throughput experimentation, computation, simulation, and data analysis. The core of MGA is to accurately predict material properties through machine learning (ML) and effectively screen desired materials from candidates.
举例：其他人用mag做出了什么，开始说在Pi领域也有人在用mag做研究。
However：（画风一转）However, applying these methods to the design of polyimides still faces numerous challenges, such as the issue of data sparsity in high-frequency dielectric properties and the need for precise representation of polyimide structures.
点明矛盾问题：高频段数据稀缺；聚亚酰胺的空间结构的精确表达
工作方法：the classical Havriliak-Negami (H-N) dielectric relaxation dual-parameter model——对于高频段数据稀缺性采用经典的Havriliak-Negami（H-N）介电弛豫双参数模型（第一性原理的引入）；
developed multi-level descriptors to comprehensively capture the characteristics of the molecular structures of PIs——对于后者空间结构的表征采用的是多级描述符
多层神经网络HNN进行多任务学习MTL——Subsequently, using these data, we employed multi-task learning (MTL) with hierarchical neural networks (HNN) to establish an efficient and accurate machine learning model.
人工神经网络ANN——Meanwhile, an artificial neural network (ANN) model for predicting the glass transition temperature of PIs was developed
遗传算法——A genetic algorithm was employed to create a series of PIs exhibiting exceptional high-frequency dielectric properties and heat resistance.

结果与讨论

Section 2.1 introduces the data preparation, and Section 2.2 details the workflow of ML model construction, as shown in Figure 1b. Section 2.3 describes the structural design of polyimides using genetic algorithms. In Section 2.4, we validated the reliability of the MGA method through experiments. Section 2.5 reveals potential chemical rules through interpretable feature analysis.

2.1数据准备

原始数据：ployinfo总的聚亚酰胺的重复单元、介电性能（指不同频率和温度下的介电常数与介电损耗）、玻璃转化温度等参数；另一部分人工方式提取。
对象限制：所以聚酰亚胺均为不可交联型
数据拓展：Considering the need for sufficient low-frequency dielectric performance data to obtain the parameters of Equation 1, fitting was performed for 13 kinds of PIs that met the criteria (having at least 5 data points for low-frequency dielectric properties at the same test temperature).对低频拟合，再对高频计算
![[../../images/Pasted image 20251104140004.png]]
分布展示
![[../../images/Pasted image 20251104140130.png]]
关于数据表征：聚合物表征——简化的分子输入行条目系统（SMILES）
空间特征表征（多级描述符）：were automatically generated using the Python third-party library Mordred。（Python第三方库）
另外一种：RDKit固有的分子描述符。
特征工程：将描述符数量减少，减少至130、107和170个
子结构描述符SD方法，关键基元，更微小的结构。
gspan算法：基于图的子结构模式挖掘算法，来提取每种聚酰亚胺中与各项性能相关的子结构，从而整合不同子结构对目标性能的贡献度
结合定量结构-性能关系分析，我们最终分别获得了508、284和1313个特征，用于构建聚酰亚胺结构与介电常数、介电损耗和玻璃化转变温度之间的定量关系模型。

2.2基于机器学习的定量结构-性质关系模型构建

简单来说HNN来多精度问题；ANN用来预测缺失的玻璃化转变温度；广泛使用的高斯过程回归（GPR）模型被确立为基准模型，用以评估神经网络模型的性能。
Due to the significant impact of the size of the feature set on the performance of ML models, a practical and highly accurate dimensionality reduction method is necessary to reduce redundant information in the features.需要采用一种实用且高精度的降维方法，以减少特征中的冗余信息。
We selected three feature reduction methods used in ML, including LASSO regression, ridge regression, and recursive feature elimination (RFE)
Note that we have taken the logarithm of the dielectric constants and the dielectric losses to guarantee that the final predicted values are all positive.

关于HNN的学习和ANN的学习

未完待续

数据来源（对应数据结构）

CatBoost道路风险预测学习笔记（对应的ipynb的markdown版本）

2025-11-02T16:00:00.000Z

第三方库导入和数据集的导入，数据集的查看

第三方库的导入和输出对应的版本编号

import pandas as pd
import os
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np
from sklearn.model_selection import train_test_split, cross_val_score
from sklearn.metrics import mean_squared_error
from catboost import CatBoostRegressor
from IPython.core.display import HTML



def show_object_columns_info(df):
    "显示DataFrame中所有object类型列的信息，包括列名、唯一值数量和所有唯一值"
    object_cols = df.select_dtypes(include=['object']).columns
    print(object_cols)
    for col in object_cols:
        print(f"列名: {col}")
        print(f'object数量: {df[col].nunique()}')
        print(df[col].unique())

print(sns.__version__)
print(pd.__version__)
print(np.__version__)

0.13.22.3.31.26.4

数据的导入，数据集的描述和清洗

train_path = "../../datasets/competition_datas/Accident_Risk/train.csv"
test_path = "../../datasets/competition_datas/Accident_Risk/test.csv"

train_ds = pd.read_csv(train_path) #ds: dataset
#train_ds.info()
#print(train_ds.shape)
#train_ds.describe()
train_ds.head()
# 使用函数显示object类型列的信息
#show_object_columns_info(train_ds)

	id	road_type	num_lanes	curvature	speed_limit	lighting	weather	road_signs_present	public_road	time_of_day	holiday	school_season	num_reported_accidents	accident_risk
0	0	urban	2	0.06	35	daylight	rainy	False	True	afternoon	False	True	1	0.13
1	1	urban	4	0.99	35	daylight	clear	True	False	evening	True	True	0	0.35
2	2	rural	4	0.63	70	dim	clear	False	True	morning	True	False	2	0.30
3	3	highway	4	0.07	35	dim	rainy	True	True	morning	False	False	1	0.21
4	4	rural	1	0.58	60	daylight	foggy	False	False	evening	True	False	1	0.56

1
2
3

test_ds = pd.read_csv(test_path)
#print(test_ds.info())
test_ds.head()

	id	road_type	num_lanes	curvature	speed_limit	lighting	weather	road_signs_present	public_road	time_of_day	holiday	school_season	num_reported_accidents
0	517754	highway	2	0.34	45	night	clear	True	True	afternoon	True	True	1
1	517755	urban	3	0.04	45	dim	foggy	True	False	afternoon	True	False	0
2	517756	urban	2	0.59	35	dim	clear	True	False	afternoon	True	True	1
3	517757	rural	4	0.95	35	daylight	rainy	False	False	afternoon	False	False	2
4	517758	highway	2	0.86	35	daylight	clear	True	False	evening	False	True	3

数据的可视化(了解数据，并不是选择特征)

由于上述数据并没有缺失值，因此我们不用处理缺失值.直接使用可视化工具进行可视化分析.

y = train_ds['accident_risk']
X = train_ds.drop(columns=['accident_risk', 'id'],axis=1)

X.info()
display(X.head())
X_num = X.select_dtypes(include=['int64', 'float64'])

RangeIndex: 517754 entries, 0 to 517753Data columns (total 12 columns): #   Column                  Non-Null Count   Dtype  ---  ------                  --------------   -----   0   road_type               517754 non-null  object  1   num_lanes               517754 non-null  int64   2   curvature               517754 non-null  float64 3   speed_limit             517754 non-null  int64   4   lighting                517754 non-null  object  5   weather                 517754 non-null  object  6   road_signs_present      517754 non-null  bool    7   public_road             517754 non-null  bool    8   time_of_day             517754 non-null  object  9   holiday                 517754 non-null  bool    10  school_season           517754 non-null  bool    11  num_reported_accidents  517754 non-null  int64  dtypes: bool(4), float64(1), int64(3), object(4)memory usage: 33.6+ MB

	road_type	num_lanes	curvature	speed_limit	lighting	weather	road_signs_present	public_road	time_of_day	holiday	school_season	num_reported_accidents
0	urban	2	0.06	35	daylight	rainy	False	True	afternoon	False	True	1
1	urban	4	0.99	35	daylight	clear	True	False	evening	True	True	0
2	rural	4	0.63	70	dim	clear	False	True	morning	True	False	2
3	highway	4	0.07	35	dim	rainy	True	True	morning	False	False	1
4	rural	1	0.58	60	daylight	foggy	False	False	evening	True	False	1

目标分布

plt.figure()
sns.histplot(y, kde=True, bins=50)
plt.title('Distribution of Accident Risk')
plt.xlabel('Accident Risk')
plt.show()

X_corr = X_num.corr()
plt.figure()
sns.heatmap(X_corr, annot=True, cmap='viridis', center=0, fmt='.2f')
plt.title('Correlation Heatmap')
plt.show()

catboost

#display(X.head())
#display(y.head())

#print(X.dtypes)
# 将X中的bool类型转化为object(str)类型,除了数值类型
X_bool_cols = X.select_dtypes(include=['bool']).columns
print(X_bool_cols)

#print(X_bool_cols)
for col in X_bool_cols:
    X[col] = X[col].astype(str)
    test_ds[col] = test_ds[col].astype(str)
    
cat_features = X.select_dtypes(include=['object']).columns.tolist()
print(cat_features)
#print(X.dtypes)

Index(['road_signs_present', 'public_road', 'holiday', 'school_season'], dtype='object')['road_type', 'lighting', 'weather', 'road_signs_present', 'public_road', 'time_of_day', 'holiday', 'school_season']

# 分割数据集
X_train, X_val, y_train, y_val = train_test_split(X, y, test_size=0.2, random_state=42, shuffle=True, stratify=y)

print(X_train.shape, X_val.shape, y_train.shape, y_val.shape)

(414203, 12) (103551, 12) (414203,) (103551,)

params = {
    'iterations': 1000, # 迭代次数
    'learning_rate': 0.1, # 学习率
    'depth': 6, # 树的深度
    'cat_features': cat_features, # 分类特征
    'random_seed': 42, # 随机种子
    'loss_function': 'RMSE', # 损失函数
    'verbose': 100, # 每100次迭代打印一次信息
    'early_stopping_rounds': 50, # 早停轮数
    "task_type": "GPU", # 启用 GPU 
    "devices": "0" # 指定 GPU 设备
}

Catboost_model = CatBoostRegressor(**params)
Catboost_model.fit(X, y, eval_set=(X_val, y_val)) # eval_set 用于监控模型在验证集上的性能 没有则不会显示性能表现

0:learn: 0.1523865test: 0.1523846best: 0.1523846 (0)total: 94.3msremaining: 1m 34s100:learn: 0.0564065test: 0.0564811best: 0.0564811 (100)total: 8.16sremaining: 1m 12s200:learn: 0.0561983test: 0.0563075best: 0.0563075 (200)total: 17sremaining: 1m 7s300:learn: 0.0560877test: 0.0562139best: 0.0562139 (300)total: 26sremaining: 1m400:learn: 0.0560011test: 0.0561416best: 0.0561416 (400)total: 34.5sremaining: 51.5s500:learn: 0.0559323test: 0.0560808best: 0.0560808 (500)total: 43.1sremaining: 42.9s600:learn: 0.0558682test: 0.0560278best: 0.0560278 (600)total: 52.6sremaining: 34.9s700:learn: 0.0558153test: 0.0559829best: 0.0559829 (700)total: 1m 1sremaining: 26.2s800:learn: 0.0557594test: 0.0559401best: 0.0559401 (800)total: 1m 10sremaining: 17.4s900:learn: 0.0557073test: 0.0559001best: 0.0559001 (899)total: 1m 19sremaining: 8.72s999:learn: 0.0556659test: 0.0558659best: 0.0558659 (999)total: 1m 29sremaining: 0usbestTest = 0.05586587195bestIteration = 999

# Make predictions on validation set 
y_pred = Catboost_model.predict(X_val)  
# Calculate RMSE 
val_rmse = mean_squared_error(y_val, y_pred)
print(f"Validation RMSE: {val_rmse:.4f}")

# Cross-validation 
cv_scores = cross_val_score(Catboost_model, X, y, cv=5, scoring='neg_mean_squared_error')  # 5折交叉验证 # 计算每个折的 负均方误差
cv_rmse = np.sqrt(-cv_scores)  # 计算每个折的 RMSE 并取平方根
print(f"Cross-validation RMSE: {cv_rmse.mean():.4f} (+/- {cv_rmse.std() * 2:.4f})")

Validation RMSE: 0.00310:learn: 0.1523602total: 74.6msremaining: 1m 14s100:learn: 0.0563163total: 7.29sremaining: 1m 4s200:learn: 0.0560969total: 14.1sremaining: 56.1s300:learn: 0.0559734total: 20.9sremaining: 48.6s400:learn: 0.0558743total: 29.3sremaining: 43.8s500:learn: 0.0557934total: 36.8sremaining: 36.7s600:learn: 0.0557296total: 45.4sremaining: 30.1s700:learn: 0.0556612total: 53sremaining: 22.6s800:learn: 0.0556026total: 1mremaining: 15s900:learn: 0.0555548total: 1m 10sremaining: 7.79s999:learn: 0.0555088total: 1m 32sremaining: 0us0:learn: 0.1524152total: 78.6msremaining: 1m 18s100:learn: 0.0564793total: 10.3sremaining: 1m 31s200:learn: 0.0562581total: 21.2sremaining: 1m 24s300:learn: 0.0561289total: 33.6sremaining: 1m 17s400:learn: 0.0560335total: 44sremaining: 1m 5s500:learn: 0.0559565total: 57.6sremaining: 57.3s600:learn: 0.0558867total: 1m 13sremaining: 48.6s700:learn: 0.0558220total: 1m 26sremaining: 36.9s800:learn: 0.0557681total: 1m 38sremaining: 24.5s900:learn: 0.0557146total: 1m 50sremaining: 12.2s999:learn: 0.0556690total: 2m 4sremaining: 0us0:learn: 0.1523094total: 71.2msremaining: 1m 11s100:learn: 0.0563526total: 11.3sremaining: 1m 40s200:learn: 0.0561467total: 23.4sremaining: 1m 33s300:learn: 0.0560148total: 35.4sremaining: 1m 22s400:learn: 0.0559182total: 49.6sremaining: 1m 14s500:learn: 0.0558331total: 1m 2sremaining: 1m 2s600:learn: 0.0557582total: 1m 16sremaining: 50.5s700:learn: 0.0556941total: 1m 28sremaining: 37.7s800:learn: 0.0556372total: 1m 39sremaining: 24.8s900:learn: 0.0555797total: 1m 50sremaining: 12.2s999:learn: 0.0555314total: 2m 1sremaining: 0us0:learn: 0.1524123total: 80msremaining: 1m 19s100:learn: 0.0563271total: 8.31sremaining: 1m 13s200:learn: 0.0561321total: 19.8sremaining: 1m 18s300:learn: 0.0560138total: 35.6sremaining: 1m 22s400:learn: 0.0559252total: 48.3sremaining: 1m 12s500:learn: 0.0558532total: 59.8sremaining: 59.6s600:learn: 0.0557891total: 1m 11sremaining: 47.2s700:learn: 0.0557296total: 1m 23sremaining: 35.5s800:learn: 0.0556794total: 1m 35sremaining: 23.7s900:learn: 0.0556325total: 1m 45sremaining: 11.6s999:learn: 0.0555885total: 1m 55sremaining: 0us0:learn: 0.1523530total: 80.1msremaining: 1m 19s100:learn: 0.0564252total: 10.3sremaining: 1m 31s200:learn: 0.0562220total: 22.4sremaining: 1m 29s300:learn: 0.0561025total: 31.7sremaining: 1m 13s400:learn: 0.0559980total: 41.2sremaining: 1m 1s500:learn: 0.0559200total: 51.8sremaining: 51.6s600:learn: 0.0558540total: 1m 1sremaining: 40.9s700:learn: 0.0557899total: 1m 14sremaining: 31.9s800:learn: 0.0557331total: 1m 25sremaining: 21.2s900:learn: 0.0556776total: 1m 39sremaining: 11s999:learn: 0.0556246total: 1m 52sremaining: 0usCross-validation RMSE: 0.0561 (+/- 0.0005)

# Feature Importance
feature_importance = Catboost_model.get_feature_importance()  # index类型
#print(feature_importance)
feature_names = X.columns # ndarray类型
#print(feature_names)
importance_df = pd.DataFrame({
    'feature': feature_names,
    'importance': feature_importance
}).sort_values('importance', ascending=False) # 按重要性降序排序

print("\nTop 10 Most Important Features:")
print(importance_df.head(10))

[2.68670072e-02 5.57111260e-02 1.53970212e+01 3.71319477e+01 3.42504222e+01 9.16493355e+00 2.00611428e-02 4.68708926e-02 2.95851141e-02 5.71107703e-02 1.50494424e-02 3.80441977e+00]Index(['road_type', 'num_lanes', 'curvature', 'speed_limit', 'lighting',       'weather', 'road_signs_present', 'public_road', 'time_of_day',       'holiday', 'school_season', 'num_reported_accidents'],      dtype='object')Top 10 Most Important Features:                   feature  importance3              speed_limit   37.1319484                 lighting   34.2504222                curvature   15.3970215                  weather    9.16493411  num_reported_accidents    3.8044209                  holiday    0.0571111                num_lanes    0.0557117              public_road    0.0468718              time_of_day    0.0295850                road_type    0.026867

结果可视化

C:\Windows\Temp\ipykernel_27588\3889204982.py:3: FutureWarning: Passing `palette` without assigning `hue` is deprecated and will be removed in v0.14.0. Assign the `y` variable to `hue` and set `legend=False` for the same effect.  sns.barplot(data=importance_df.head(10), x='importance', y='feature', palette='viridis')

# Plot actual vs predicted values
plt.scatter(y_val, y_pred, alpha=0.1, marker='.', s=5)
plt.plot([y_val.min(), y_val.max()], [y_val.min(), y_val.max()], 'r--', lw=2)
plt.xlabel('Actual Values')
plt.ylabel('Predicted Values')
plt.title('Actual vs Predicted Values')
plt.show()

提交结果

# Prepare test data (excluding the id column for prediction)

test_features = test_ds.drop('id', axis=1)

# Make predictions on test set
test_predictions = Catboost_model.predict(test_features)

# Create submission file
submission = pd.DataFrame({
    'id': test_ds['id'],
    'accident_risk': test_predictions
})

# Save submission file
submission.to_csv('submission.csv', index=False)

print(f"Submission shape: {submission.shape}")
print("\nFirst 5 rows of submission:")
display(submission.head())

Submission shape: (172585, 2)First 5 rows of submission:

	id	accident_risk
0	517754	0.291503
1	517755	0.122281
2	517756	0.187375
3	517757	0.313193
4	517758	0.398013

蹇锡高学术讲座——新型杂环高性能工程塑料及其加工应用发展进展——杂萘联苯型聚芳醚高性能树脂及其应用技术

2025-11-02T16:00:00.000Z

讲师介绍

详细见链接蹇锡高院士研究团队:杂萘联苯型聚芳醚高性能树脂及其应用技术

重点：

杂萘联苯型聚芳醚高性能树脂及其应用技术

短纤维增强树脂基复合材料

耐磨自润滑复合材料
航空发动机高速止推轴承
核主泵动压滑动轴承瓦面TF330
高铁风源压缩机涡旋动涡卷ppesk
连续纤维增强热塑性树脂基复合材料

耐高温、耐辐照绝缘漆

功能膜——耐高温RO膜、耐400℃隔热涂料

启发

机器学习对高性能高分子材料比较适合筛选和实验（对复合材料不友好）
特征功能性高分子材料也可以加机器学习筛选预测

前沿研究

2035发展战略研究，建议发展重点：

高性能高分子材料及其复合材料
特种功能性高分子材料
通用高分子材料（过剩）高性能化、功能化（解决方法）
生物基高分子材料、可回收循环利用的高分子材料——笔者课题组所研究的方向（与双碳相关）

复合材料（无机非金属+金属材料+高分子材料）

轻质、高强、耐高温（高分子材料的缺陷）、耐腐蚀

关注开发既耐高温又可溶解（固有性质是耐高温溶解差甚至不溶解）的新品种材料，希望实现高性能、低成本、可控设备——性价比、稳定性（材料领域）

例如：DHPZ结构引入，酰亚胺五元氮杂环，使得聚合物也具有扭曲非共平面结构，阻碍结晶，利于溶解。实现既耐高温又可溶具体介绍

CatBoost道路风险预测学习笔记

2025-10-29T16:00:00.000Z

下面所学知识经验均来自对kaggle竞赛Predicting Road Accident Riskz中的公开Notebook代码的模仿过程

数据观察（主要用pandas库）

读取数据

读取文件——pd.read_csv(“path”)pd.read_csv

数据分析

注意kaggle比赛中，数据已经备好了，从赛者可专注于模型的建立和学习
一下较为常用的用粗体表示

df.columns 查看列 df.columns
数据DataFrame的信息——df.info()， df.info()输出列名、以及对于列名的数据大小、空值情况、以及对应的数据类型
df.shape查看数据的形状 df.shape
数据DataFrame的前五行——df.head()， df.head()在nb中会自动展示，或者要对比可以print，or display

EDA

探索性数据分析（Exploratory Data Analysis，简称EDA）是数据科学中的关键步骤，旨在熟悉数据集、揭示变量间的关系并指导后续处理。通过读取数据、数据汇总、总览、缺失值和异常值分析，以及特征分析，我们可以深入了解数据的结构和质量。

目标分布

plt.figure()的作用创建画布
sns.histplot()的参数和功能是什么？bin箱子的数目，kde是否加一条拟合分布的曲线

参考两个教程民间教程、官方教程

关联热力图

筛选出数值列df.select_dtypes（include=["int64","float64"]）
df.corr()用来计算各列之间的相关系数的（可以自定义方法用method参数来指定）。这用来做作为 sns.heatmap()的输入参数极为方便

参考民间教程

sns.heatmap()

参考两个教程民间教程、官方教程

CatBoost Model

介绍(擅长处理类别特征)

CatBoost的全称是Categorical Boosting，它是一种由俄罗斯搜索巨头Yandex开发的梯度提升算法库，特别擅长处理类别型特征。

CatBoost的名称来源于其核心功能，即处理类别型特征（Categorical Features）和梯度提升（Gradient Boosting）。与其他梯度提升算法如XGBoost和LightGBM相比，CatBoost在处理类别型特征方面具有显著优势。

CatBoost的特点

类别型特征处理：CatBoost使用独特的编码方法来处理类别型特征，降低过拟合风险。（无需对这些特征（分类特征）进行One-Hot编码）
克服梯度偏差：CatBoost采用排序提升的概念，防止目标泄漏和过度拟合。
高效实现：支持GPU加速和多GPU训练，提升计算效率。
鲁棒性：减少对大量超参数调整的需求，降低过度拟合的机会。
CatBoost的应用

CatBoost在多个领域中表现出色，包括金融风控、推荐系统和生物医学等。例如，在信用卡欺诈检测、商品推荐和基因表达数据分析中，CatBoost能够有效处理类别型特征和缺失值，构建精准的预测模型。

总之，CatBoost作为一种专为类别型特征优化的梯度提升算法，凭借其独特的处理策略和高效的实现，迅速成为业界广受欢迎的GBDT框架。

详细介绍解释参考数据STUDIO, 2022、CatBoost深度解析、官方 CatBoost

分类特征（前面对数值类型的特征进行了关联性的分析）

dtype一般是bool或者object

作者做了一个操作，将bool转化为str，也变成了object对象。关于选择bool值时，df.select_dtypes(include=)进行优化
关于具体转化格式的函数方法，作者使用的是df.astype()

可参考转化类型

关于from sklearn.model_selection import train_test_split, cross_val_score

train_test_split这个函数十分常用在从训练集分割出验证集时。

参考民间教程、官方教程

模型构建

使用的是catboost库中的，CatBoostRegressor模型，记得安装

1
2
3

conda activate your_env

conda install catboost

模型参数选择

iterations 迭代次数（定义了训练过程中提升树的数量）
learning_rate 学习率（控制每一步梯度提升时模型权重更新的幅度，而迭代）

params = {     
'iterations': 1000, # 迭代次数     
'learning_rate': 0.1, # 学习率     
'depth': 6, # 树的深度     
'cat_features': cat_features, # 分类特征
'random_seed': 42, # 随机种子     
'loss_function': 'RMSE', # 损失函数     
'verbose': 100, # 每100次迭代打印一次信息
'early_stopping_rounds': 50, # 早停轮数 
"task_type": "GPU", # 启用 GPU
"devices": "0" # 指定 GPU 设备
}  

Catboost_model = CatBoostRegressor(**params) Catboost_model.fit(X, y, eval_set=(X_val, y_val)) # eval_set 用于监控模型在验证集上的性能 没有则不会显示性能表现

损失函数（二元分类Logloss；回归RMSE（均方根误差） or MAE（平均绝对误差；多分类采用Multiclass损失；不平衡数据集（QueryCrossentropy）
GPU加速，加快训练速度

model.fit() 模型训练，输入X，以及对应的y标签即可。

模型评估

# Make predictions on validation set
y_pred = Catboost_model.predict(X_val)   # Calculate RMSE
val_rmse = mean_squared_error(y_val, y_pred) print(f"Validation RMSE: {val_rmse:.4f}")  

# Cross-validation
cv_scores = cross_val_score(Catboost_model, X, y, cv=5, scoring='neg_mean_squared_error') 
cv_rmse = np.sqrt(-cv_scores)  
print(f"Cross-validation RMSE: {cv_rmse.mean():.4f} (+/- {cv_rmse.std() * 2:.4f})")

这段代码实现了交叉验证（Cross-validation）过程，用于评估CatBoost模型的性能。具体解释如下：

第一行代码：cv_scores = cross_val_score(Catboost_model, X, y, cv=5, scoring='neg_mean_squared_error')

使用cross_val_score函数执行5折交叉验证
参数Catboost_model是已经定义好的CatBoost模型
X是特征数据，y是目标变量
cv=5表示将数据集分成5个部分进行交叉验证
scoring='neg_mean_squared_error'表示使用负均方误差作为评分指标（负值是因为scikit-learn中大多数评分函数追求最大化）

第二行代码：cv_rmse = np.sqrt(-cv_scores)

将负均方误差转换为均方根误差（RMSE）
首先取负值（因为原始得分是负数），然后开平方
得到的cv_rmse是一个包含5个元素的数组，每个元素对应一折验证的RMSE（均方根误差）

第三行代码：print(f"Cross-validation RMSE: {cv_rmse.mean():.4f} (+/- {cv_rmse.std() * 2:.4f})")

输出交叉验证的平均RMSE和标准差
.mean()计算5折RMSE的平均值
.std() * 2计算2倍标准差，表示模型性能的置信区间范围
:.4f表示保留4位小数这段代码的主要目的是通过交叉验证来评估模型的泛化能力，避免过拟合问题，并提供模型性能的可靠估计。
mean_squared_error() 计算两列的均方根误差
cross_val_score()

参考教程民间教程、官方文档、中文官方

重要性分析

# Feature Importance

feature_importance = Catboost_model.get_feature_importance()  # index类型

#print(feature_importance)

feature_names = X.columns # ndarray类型

#print(feature_names)

importance_df = pd.DataFrame({

    'feature': feature_names,

    'importance': feature_importance

}).sort_values('importance', ascending=False) # 按重要性降序排序

  

print("\nTop 10 Most Important Features:")

print(importance_df.head(10))

这里直接用catboost_model.get_feature_importance()方法。

sort_values() 函数，他是一个排序函数

参考民间教程

# Detailed feature importance plot

plt.figure()

sns.barplot(data=importance_df.head(10), x='importance', y='feature', palette='viridis')

plt.title('Top 10 Most Important Features')

plt.xlabel('Importance Score')

plt.show()

sns.barplot()函数功能，支持df的输入，指定对于xy的列名即可

可视化结果

# Plot actual vs predicted values

plt.scatter(y_val, y_pred, alpha=0.1, marker='.', s=5)
# 画出对应的散点图，x为实际，y为预测。所有的散点越靠近完美对角线，就意味着预测效果越好
plt.plot([y_val.min(), y_val.max()], [y_val.min(), y_val.max()], 'r--', lw=2) 
# 第一个参数代表x范围，第二个参数是y的范围，此时默认x=y 画出完美预测线，对角线。

plt.xlabel('Actual Values')

plt.ylabel('Predicted Values')

plt.title('Actual vs Predicted Values')

plt.show()

提交结果

# Prepare test data (excluding the id column for prediction)

test_features = test_ds.drop('id', axis=1)

# Make predictions on test set
test_predictions = Catboost_model.predict(test_features)

# Create submission file

submission = pd.DataFrame({
    'id': test_ds['id'],
    'accident_risk': test_predictions
})

  
# Save submission file
submission.to_csv('submission.csv', index=False)
print(f"Submission shape: {submission.shape}")
print("\nFirst 5 rows of submission:")
display(submission.head())

ml_learning_thought

2025-10-28T16:00:00.000Z

请输入密码查看

域名配置

2025-10-27T06:40:46.000Z

域名购买腾讯云

等待时间 1-2天

域名绑定以及解析，参考大佬的教程(码的艺术家，2024)

域名备案(最后一步，域名备案，云服务器还要购买，呜呜呜)
云服务器暂且搁置

thoughts

2025-10-27T06:36:49.000Z

机器学习进展

2025-10-21T16:00:00.000Z

请输入密码查看

Yueming & Blog

blog学习进展/hexo-next教程

关于hexo-next的美化

如何创建一个新的博客文章？（2025-10-27）٩(•̤̀ᵕ•̤́๑)ᵒᵏᵎᵎᵎᵎ

如何更改首页置顶顺序？（2025-10-28）٩(•̤̀ᵕ•̤́๑)ᵒᵏᵎᵎᵎᵎ

如何更改首页，仅部分显示文章？(2025-10-29)

如何实现副标题的动态显示？(2025-10-30)

文章如何只显示部分文章内容？(2025-10-30) ٩(•̤̀ᵕ•̤́๑)ᵒᵏᵎᵎᵎᵎ

链接跳转样式（2025-10-30）

如何自动折叠代码块？（2025-11-06） ٩(•̤̀ᵕ•̤́๑)ᵒᵏᵎᵎᵎᵎ

关于如何优化访问，正规的站点建设

为什么每段时间自己的域名就要重新对齐GitHub（2025-10-29）٩(•̤̀ᵕ•̤́๑)ᵒᵏᵎᵎᵎᵎ

如何配置自己的域名？（2025-10-27）

如何添加自己的友链？（2025-10-28）٩(•̤̀ᵕ•̤́๑)ᵒᵏᵏᵎᵎᵎᵎ

如何添加文章分享功能？（2025-10-30）

如何将自己的ipynb文件转换为markdown文件？并发表在博客上？（2025-11-02）٩(•̤̀ᵕ•̤́๑)ᵒᵏᵎᵎᵎᵎ

如何升级评论系统，GitHub评论系统较为封闭并不开放？（2025-11-03）

RSS订阅功能如何添加？（2025-11-04）

关于markdown的使用

如何链接文章？（2025-10-27）,有问题跳转找不到网页，亟待解决 ٩(•̤̀ᵕ•̤́๑)ᵒᵏᵎᵎᵎᵎ

内部链接 ٩(•̤̀ᵕ•̤́๑)ᵒᵏᵎᵎᵎᵎ

外部链接(https://www.baidu.com/) ٩(•̤̀ᵕ•̤́๑)ᵒᵏᵎᵎᵎᵎ

外部链接跳转无效问题？（2025-10-29）٩(•̤̀ᵕ•̤́๑)ᵒᵏᵎᵎᵎᵎ

如何添加脚注，来致谢引用参考链接的作者？（2025-10-27）15min ٩(•̤̀ᵕ•̤́๑)ᵒᵏᵎᵎᵎᵎ

claude_code 配置安装完整教程

如何安装claude code+vscode的新编程模式? 元工具的方式不止编程

关于安装不推荐采用claude code官方的安装指令（地区和网络问题），也就是下面这行代码

推荐采用以下两种方式：

1.采用npm的方式

先安装node，node.js官网

对于liunx：一般先安装nvm，安装node，也就有了npm

对于windows：直接去官网下载exe，然后，在终端测试版本号，即可验证安装是否成功

2.采用字节，的教程（让卖方告诉你使用的方法，说明书一样），这种方法往往实用且高效，字节也有个agent的脚本ark-helper.

其他

关于如何快速管理自己的agent端的模型，如何快速切换，这里笔者强力推荐一个项目，叫做cc switch；通过它我们可以实现openclaw、claude code、codex等cil工具背后的模型接口的快速的切换。

OpenClaw 浏览器配置完整教程 - 解决 WSL2 自启动失败问题

静态神器：web_fetch 内置工具

原理机制 - 获取 URL 并提取可读内容

使用场景

通过 Chrome DevTools MCP 连接现有会话

检查状态

在浏览器中打开并批准远程调试

实际操作示例

适用场景

OpenClaw 独立控制专用浏览器（openclaw 配置文件）

前置步骤

启动

检查浏览器状态

Q：如果遇到自动启动报错，应该怎么办？

踩坑总结：WSL2 + systemd 环境下 OpenClaw 自启动失败解决方法——额这是小龙虾总结的，仅供参考

问题现象

根本原因

解决方法

如果自动启动失败，可以手动启动浏览器，OpenClaw 通过 CDP 连接

最后检查状态

总结

OpenClaw 配置安装完整教程

🚀 step1：根据openclaw官网，对应自己系统，使用终端命令下载对应的版本

这里笔者使用的是win的wsl2子系统Ubuntu22.04中的npm下载的；如果你也是win系统官网也是非常强烈的推荐使用WSL2来下载的。✅

⚙️ step2：进行基础配置，因为小龙虾是数字员工，官网也叫做入职，允许以下代码

QuickStart vs Advanced，推荐使用前者进行配置，要提前准备好，大模型的api_key

有无--install-daemon对应——有无后台服务，使网关自动启动 🚀

无论如何配置，一定包含Model provider and auth（必选，模型的提供者）、Workspace、Gateway（网关配置）、Channels（其他端介入）。具体可以先参考：火山引擎、官方教程

最重要的配置信息都集中在~/.openclaw/openclaw.json文件内，可以通过记事本编辑，定制化更改，但操作难度较高⚠️

🛠️ step3：配置小龙虾的性格、工具、技能，可以取国内的技能镜像下载对应技能，这里推荐一些技能 ⭐

可以采用对话式的安装 💬

注：openclaw迭代很快，可能安装配置的方式会不停更新，如果需要安装服务请联系我

关于11月24日~11月30日中遇到的问题

llm的本地部署

如何选择本地大模型的推理框架app？（11月24日）٩(•̤̀ᵕ•̤́๑)ᵒᵏᵏᵎᵎᵎᵎ

如何在本地大模型中加入mcp的服务？（11月26日）٩(•̤̀ᵕ•̤́๑)ᵒᵏᵏᵎᵎᵎᵎ

ai辅助

为什么cherry_studio中大语言模型的联网搜索内容不准确？（11月26日）٩(•̤̀ᵕ•̤́๑)ᵒᵏᵏᵎᵎᵎᵎ

课题组网站

关于学习的思考

如何避免在听课（知识输入）太过于关心记录，而造成知识点的略过，产生一种，只见树木不见树林的学习窘境？（11月25日）

关于11月17日~11月23日中遇到的问题以及解决方法

Obsidian的笔记同步

如何利用gitee在不同电脑以及不同平台，同步Obsidian笔记？（11月17日）٩(•̤̀ᵕ•̤́๑)ᵒᵏᵏᵎᵎᵎᵎ

关于在同步过程中常常出现分支不一致或者分支推送不知道在哪里的问题？（11月17日）٩(•̤̀ᵕ•̤́๑)ᵒᵏᵏᵎᵎᵎᵎ

有无`--install-daemon`对应——有无后台服务，使网关自动启动 🚀

最重要的配置信息都集中在`~/.openclaw/openclaw.json`文件内，可以通过记事本编辑，定制化更改，但操作难度较高⚠️

关于为什么在docker拉取的tensorflow容器中`python -c "import tensorflow as tf; print(tf.config.list_physical_devices('GPU'))"`的gpu检测不到（nvidia-msi、以及nvcc –version却可以正确输出）？

步骤1：打通宿主机和容器的网络，直接采用`--nest=host`网络共用模式