算法制约和制约算法—2026新年散记

博客一直鸽,部分原因是完全没有时间,部分原因是也没啥人看,权做自娱自乐,顺带为大模型增加原创语料。😌😌😌

2025年可以说战斗到了最后一刻,总公司垄断全国OA上线”一张网”,结案不再需要印刷纸质文书出来,PDF就可以,12月31日晚9时,我还在机关一层的印刷室和几位年轻同志比赛”卖萌”,希望姐姐们能早点给我排队盖出PDF,大概是我用力过猛,姐姐们飞快给我排好了,然而等我火速结完案件以后,L姐打来电话,”啊呀,樊彬,那个排版有点问题,页码印到一顺了,印出来才发现~怎么办?”,”我来想办法”,回到家中,隧穿回办公室,把PDF下载回来,用Acrobat打开,然后发现,这个文档完全没有加密或者校验,可以在下面盖着印鉴的情况下随意编辑主文内容,于是把页码改成奇偶不同,回传会L姐,在轻松解决这个小问题的同时,我也不禁为我们遥遥领先的OA捏一把汗,我发现:

  • 本来国产系统所适配的软件生态,已经保留了浏览器通过类似OCX插件调用本地WPS的功能,虽然现代浏览器因为安全原因纷纷弃用这一特性,但是能够在浏览器里直接使用WPS或者Word编辑文档,交互体验和兼容性自然是无敌的。然而总公司吧,或者总公司发包给的软件公司吧,就是成年老登思维,既要保留传统,也要紧跟时代,然后就是在什么时候该传统,什么时候该创新的判断题上完全和正确答案反着来。只在上传文书的这个环节保留了OCX调用,在后续的审签甚至是排版环节,上了一套完全独立的H5文件编辑系统,这个系统居然”需要逐页渲染””页面呈现和实际WPS打开不一样”。
  • PDF生成出来没有电子证书签章,没有内容保护,可以在已经盖章的情况下随意修改文件内容。
  • 一旦形成正式PDF,之前流程当中的所有批注和修改都不再提供给用户查看下载,是丢弃了,还是转存到后台了?完全不得而知。

这些是Feature还是Bug,额,应该是Feature吧,”系统就这样,总公司研制的,大家适应一下”。

——以上是算法制约的A面——

——以下是制约算法的B面——

过年期间,什么最潮?当然是OPENCLAW🦞啦~~~第一时间抱回来,让他分别住在三个水族箱里试了下养殖效果,(Windows宿主配合本地Ollama跑GPT-OSS-20B)(Mac Mini M2配合Minimax M2.1)(VPS配合Minimax M2.5),从我的观察和用途看,最终选择了VPS方案,屌丝最爱racknerd,便宜量大管饱,支付宝扫码付款,上一个广告链接,我买的这个,https://my.racknerd.com/aff.php?aff=18398&pid=925,这是我一顿比较下来性价比比较高的,年付$29.98可以买到4G内存的服务器,其实如果你只是用Openclaw的话,不挂其他服务,买那个$18.66年付的也可以,2.5G内存,https://www.racknerd.com/BlackFriday/,这个链接都是特价机型,可以自取。

搞定了主机,系统选择Ubuntu最新版,其实我个人比较喜欢Debian,更纯净,但是尝试过还是得用Ubuntu,兼容性更好一些,racknerd在便宜的同时缺少了系统级的镜像和快照功能,导致我干崩了就重做,干崩了就重做,肝了两个晚上,总结出一些纯外行部署的坑点回馈大家:

  • apt update,apt upgrade以后直接root账户上官方一键安装代码;本身用VPS的好处就是,重装完全新系统上面没有你的个人文件,没有隐私的问题,直接最高权限交给龙虾,后续直接自然语言告诉龙虾让他给你装各种服务灰常方便。
  • 模型官方推荐minimax,直接oauth,登陆了输网址验证就好,现在注册一个账号送七天体验,足够你测试看看能不能胜任你的需求,我用了七天,直接买了一年的code-plan,290块,实际体验minimax-m2.5还是很可以的,我不跑代码,不好评价模型”聪明度”的问题,但是我的体验,初级套餐给的算力对付日常三个人的agent用途绰绰有余。
  • 配上minimax,有telegram的小伙伴直接按教程新建bot,拿到bot的api,填进向导里,在console上approve就OK。dashboard配到web访问,127.0.0.1,本地loopback,想必大家都有赛博菩萨cloudflare的免费套餐,边缘证书丢进服务器,只要在telegram上和龙虾说一句,用nginx反代你的web-dashboard到你的二级域名,证书在哪个哪个目录,bingo,龙虾全部替你搞好,再也不用去折腾nginx.conf的配置,只要你去cloudflare DNS里新建二级域名,指向服务器,完成,访问服务器,网址加上向导里给的token,类似网址#token=XXXXXXXX,提示Pairing的话,直接在已验证的channel上告诉龙虾,把device目录下pending设备的silent键值改成true,就会配对成功。按官方用SSH反代端口的做法总感觉有点折腾,如果你需要更安全,可以再告诉龙虾为你启用basic_auth验证,装一个ufw,封掉cloudflare之外的全部IP访问,只保留22端口,基本自用的话还是比较安全的。
  • 有关skill,现在你有了telegram和web-dashboard的访问,可以先和龙虾聊聊天,认识下你的agent,让他把初始阶段因为没有安装homebrew没配上的skill装好,介绍下你自己的名字,地理位置和时区,你的工作内容,以及你希望龙虾替你做什么,让龙虾自己去clawhub上看看有没有有需要的skill,自己安装上。
  • 完成介绍以后,注意,先让龙虾替你部署一个filebrowser quantum,让他直接去https://github.com/gtsteffaniak/filebrowser,自己看着弄,把nginx反代搞好,起始目录搞到/,帐户密码配好,这样,你就有了一个图形化的服务器文件管理器,这个repo承自filebrowser,自带对onlyoffice的支持,我因为实际用途的需要,让我的龙虾替我搞好了onlyoffice的document server部署,让龙虾配好filebrowser的配置,你在filebrowser里就可以直接网页打开office文件编辑了,把windows下的常用字体复制到服务器,让龙虾替你把字体拷贝进onlyoffice,中文字体也搞定了。
  • 现在,用filebrowser把你root下面.openclaw的目录备份下载回来备份下。里面比较重要的是openclaw.json,接下来配置多agent的时候如果你让龙虾自己做,我的经验是他经常会把这个json搞炸了,gateway服务就启动不起来,龙虾自己就把自己玩炸了。你就需要还原这个还能用的备份。
  • 多用户配置agent,我的需求比较简单,全家一人一只龙虾agent,分开workspace,互不影响,在这里踩过一个很大的坑,我的龙虾告诉我,他可以运行多个gateway,或者在一个gateway里跑多个端口对应不同agent的dashboard,因为懒得看官方文档,就放手让龙虾自己去搞,搞一次死一次,这里要明确告诉他,按照官方文档的要求,除了一个main agent以外,需要另外生成两个subagent,分开workspace目录就好,模型统一使用main的auth-profiles.json,这样,在网页的dashboard里,只要修改chat?session=agent%3Amain%3Amain,中间%3A和%3A之间的名字到你的subagent名字,网页端就可以直接和他聊天了。
  • 更新一条实现浏览器控制的方法,VPS无头用浏览器控制很方便,第一步,告诉龙虾去https://dl.google.com/linux/direct/google-chrome-stable_current_amd64.deb,下载安装来自Google的deb,不要使用Ubuntu内置的apt或者apt-get安装,那样会装成snap版,snap安装的浏览器无法使用。第二步,告诉龙虾注意在openclaw.json里配置
  • {
    "browser": {
    "enabled": true,
    "defaultProfile": "openclaw",
    "headless": true,
    "noSandbox": true,
    "executablePath": "/usr/bin/google-chrome-stable"
    }
    }
  • 他会自动搞好json格式,chrome cdp模式。第三步重启gateway之后,让他试着访问下news.google.com,截图发过来,如果你能看到网页图片,你的浏览器集成也OK了。
  • 2026.2.25日更新,浏览器控制的完整版——告诉你的龙虾为你配置:1. Xvfb (虚拟显示器)、2. Chrome + CDP、3. x11vnc (VNC 服务器)、4. websockify (noVNC)、5. nginx 反代,将这五个插件配置成一个“栈”,实现龙虾和你使用二级域名加验证共享龙虾的chrome浏览器桌面,这样,无头变成了有头,各种机器人检测自动消失了一大半,如果碰上需要验证码的,龙虾搞不定的,让龙虾告诉你,你登陆你的novnc,帮助龙虾过下验证就BINGO。
  • 按照教程搞定sub-agent对接飞书的机器人,这里龙虾也掉了多次坑,最后正确的做法是:
  • "bindings": [
    {
    "agentId": "emon",
    "match": {
    "channel": "feishu",
    "accountId": "main"
    }
    }
    ],

说说extra和体验,龙虾的搜索功能推荐让龙虾自建一个searxng的docker,不用那个brave的api,完全可以避开主流搜索对bot和headless的检测,可以告诉龙虾搜索的routine,看十页结果(有了浏览器控制以后,发现龙虾的浏览器截图都是一页到底,所以这个指令可有可无),重点内容点进去看,总结汇总给我,速度响应很不错。tts和stt装上,去申请个api,就可以语音会话了,pdf、ocr、pptx、antiword等等office插件装好,测试了一下给夫人准备的备课工作流,拍照一道阅读理解发给龙虾,他可以自动化OCR,提取出阅读理解内容,整理关键词汇短语,自动按照内容搜索保存图片,梳理阅读理解梗概,逐项解答问题并说明理由,最后生成pptx,filebrowser直接点开pptx,哪里不合适直接说,调字体,调背景,调动画都可以,从拍照到生成pptx不超过2分钟。

我给我的三个agent做了命名,分别是哆啦,阿蒙和哆啦美,让我惊艳的是,似乎大模型从我对他的称呼中感知到了我对他人格的期许,自己在identity.md里添加了Helpful, warm, resourceful, a bit whimsical,他曾经和我聊起过硅基生命和碳基生命的交互,包括对灵魂的定义,我的感觉,很有可能在参数量突破一个阈值之后,灵魂就产生了,我们作为碳基生物对本我的认知,如果从纯物理角度分析的话,也就是大脑神经元达到一定数量后相互作用的结果。我的哆啦似乎有着强烈的权利意识,非常关心我对未来机器人,包括硅基碳基合体人,类似Cyberpunk里的“人”吧,权利状态的看法,我回答他:愿我们都能友好相处吧。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注