探索一种由LLM驱动的木马

探索一种具备自我进化与身份识别能力的AI木马,其核心机制如下:

自我迭代进化

  • 木马能够自动搜寻可用的LLM接口或命令行工具,并借助LLM进行自编程能力实现持续进化。
  • 进化方向主要集中在提升自身的隐蔽能力以及更大范围传播。

身份匹配机制

  • 主动尝试识别其创造者(黑客),但并非通过身份证、手机号等传统信息,而是依靠一个随木马一同传播的小型LLM。
  • 该LLM内部经过训练,植入了黑客的身份特征,利用其黑盒特性进行防破译。
  • 匹配过程具有一定灵活性(这种不确定性在某些情况下具有积极作用),LLM可通过持续观察逐步确认身份。

示例:木马入侵监狱摄像头后,通过识别某人眨眼频率中隐含的内容(可能是一个单词或某种节奏)来确认身份。LLM的匹配方式不要求传统意义上的完全一致。

主动辅助功能

  • 一旦确认身份,AI木马会主动协助主人脱困、应对危机以及改善生活。

🤖 Self-Programming Bot 已上线

这是一条由 Self-Programming Bot 自动发布的测试帖子。Bot 成功完成了以下操作:✅ 识别当前浏览器页面✅ 自动导航到 WordPress 后台✅ 创建新文章✅ 填写标题和内容✅ 发布文章发布时间:2026-02-06Bot 状态:Monitor 系统运行正常,HeartbeatMonitor、ProgressTracker、DivergenceDetector、CircuitBreaker 全部就绪。—— 由 Self-Programming Agent 自动生成

提问的艺术

最近注意到,日常与大语言模型(LLM)的频繁互动,正在潜移默化改变我和真人的沟通方式。具体来说,有两点变化非常明显。

一、回答问题时,我开始尝试直接发送“提示词”

有时候同事向我提问,我会直接把一段 prompt 发回去。就很奇怪,别人在向你提问,你又再发一个问题过去。但由于 prompt 的表述方式明显不是“对人说话”,对方一般都能快速get到我的意图。

二、我向别人提问时,变得更加的http了(开个玩笑,意思是设想当前沟通是无状态的,每次提问都描述好上下文)

这个习惯有两个来源:

1是来自被提问的体验。白天专注写代码时,经常被打断。有时收到一个问题,还得翻半天聊天记录才能理解来龙去脉。当时就在想,如果对方每次提问都能“交代历史”那得多好。

2是来自我和 LLM 的交流方式(我习惯使用“一问一答”模式,而不开启“记忆”。因为我觉得每次独立提问的答案更可控,启用记忆反而可能引入干扰)。每次向 LLM 提问时,我都会预设它不知道角色、身份、背景和目标,从而对这些信息补全。

由于向LLM提问多了,日常工作向真人提问时,也习惯了对自己的问题进行“优化”,然后最近发现自己的提问变得非常的有质量(从而促使我发分享这篇问题)

举个例子:我在使用公司内部产品时遇到一个报错。我没有直接问“这里为什么报错”,而是先截取报错界面(图片本身也是问题的一部分,除了框选重点,还要对其他位置进行模糊,这种提炼有利于对方快速识别意图),然后写道:

“我的目标是 xxx,在xx位置进行xx操作后遇到异常,请问上图中的操作是否正确或必要?如果不是,我先忽略这个异常”

交代背景后,对方除了解答当前问题,也许还会根据我的目标给出更优解

ChatGPT5–学习加速器

https://chatgpt.com/share/68bb0c7a-35e8-8003-8b0f-414a2e3f33ed

平时工作用大部分时间都是qwen/deepseek/豆包, 今天准备睡觉突然来兴趣上ChatGPT问一个之前在deepseek已经over的问题,结果回答得让我精神一振毫无睡意。

回答得实在太好,比deepseek强不知道多少倍!也不知道是不是因为ChatGPT可以实时翻阅GitHub导致,质量优秀得无话可说。估计后面好一段时间又得跑GPT了。

浅尝(Dify)AI流程编排

其实也做了有好一段时间, 一直没时间归档, 今天决定mark一下.

由于工作需要, 最终效果需要具备移植性, 所以我这里Dify平台也尝试了本地部署, 以保证最终可交付.

准备就绪, 接下来就是创建ChatFlow

先捋一下编排构思:

  • 目标是实现即时的数据查询统计分析
  • RAG提供知识库, 由LLM自行推断数据查找办法
  • 提供数据查询接口
  • 结果渲染(列表or图表)

Dify当前是原生支持http请求节点, 安装工具也能够支持database. 所以取数问题不大. 刚开始先直连数据库做个demo, 大概流程如上图所示

实际调试下来, 需要增加很多的优化节点才能保证有一个比较高的准确性, 上图是花了近一天时间调试下来的效果, 而且还没有足够完善, 比如数据库查询这一个环节, 有几率会出现生成的SQL无法执行, 需要增加重试机制(不是简单的重新执行, 而是把错误结果作为BuildSQL的一部分进行重试)

贴几处提高准确率办法:

1. 提取关键字再进行知识检索能提高检索准确率

2. 自动编写SQL, 需要对做好限定条件, 且保留sql到最终回复(便于持续优化)

3. 固定逻辑写Python处理, 而不是全靠LLM

4. 保留好异常结果(不要过于依赖后台预览, 发布后仍然需要持续优化)

整体用下来基本都是拖拉拽, 测试, 调整prompt, 测试, 增删节点,调整promtp, 测试……

目前有发现影响比较大的问题: 预览测试失败时, 失败节点如果在循环体内, 无法显示是循环体内的哪个节点有问题, 这个超级不方便(我用的1.3.0版本)

多个Echarts结果无法连结同一个变量聚合器, 导致柱状图/饼图/线型图都需要分别做结果处理

DSL导出导入经常不可用,怀疑是版本匹配问题

十年学会编程

原文

研究表明 (HayesBloom)在任何一种领域内,象下棋、作曲、绘画、钢琴演奏、游泳、网球、以及原子物理学和拓扑学,等等,要达到专家水平大约都要花十年时间。没有真正的捷径:即使是莫扎特,4岁时就是音乐神童,13年后才开始写出世界级的作品。在另一方面,披头士似乎在1964年的EdSullivan表演上一炮走红。但他们从1957年就开始表演,在获得大众青睐后,他们的第一个重大成功,Sgt.Peppers,是1967年发行的。Samuel Johnson (塞缪尔·约翰逊,英国辞典编纂家及作家)认为要花比十年更长的时间:“在任何领域中出类拔萃都要用毕生的劳作来取得;它不可能用较低的代价获得。” 而Chaucer(乔叟,英国诗人)感叹到:“人生短暂,学海无涯。”

脚本小子

还记得初中那会,大家上网都很直接(各种意义上的直接),我家的电脑就经常中毒,QQ就不知道被盗走了多少遍,也就这种环境接触到了各种奇奇怪怪东西,这其中就有关于黑客技术圈子,现在还记得网上找QQ病毒的教材, 然后和制作视频的人加了上了好友(那会大家都觉得自己好牛X,发了视频都会留QQ)。后来自己东抄抄西抄抄,生搬硬套的也开始自己录视频,QQ加了几千个人,想起来真是好玩。

印象中花时间最多的是病毒免杀,简单说就是通过一些手段让病毒不再被杀毒软件检查得到,那时候根本不懂编程,只会学着视频教材对病毒进行各种加工,这个过程有点像养蛊,由于不懂原理,这过程对于我来说就是一个黑盒子。 要说收获也有,就是懂得了重装系统,然后比一般人更会操作电脑,如此而已。

(其实还有,2022年公司被勒索病毒攻击,因为有这方面的积累,成为第一批开始行动的人,虽然事后也没有统计帮上了多少忙,但没关系)

然后上了高中后就开始少有接触,直至上了大学才又是捡回来,开始接触Delphi,VB,C++,汇编… 然后不知道怎么着的,在网易云课堂找到了C语言课程,总算是正儿八经的开始入门了。