普通职场人用 Hermes Agent 能干啥?

几个月前流行小龙虾openclaw,前段时间又出了个据说比小龙虾更厉害的hermes,我就把hermes装上了。然后发现这个软件可以和我的微信、飞书、钉钉连上,于是我就接入了我的微信。



接入微信后我也不知道干啥,然后前几天晚上突然有个灵感,我在微信上问hermes:你能把我电脑上的图片发给我吗?



它真发给了我了!



然后我又换了个玩法,语音和hermes说,让它给我某个文件夹截个屏,它真截图给我了。




我接入的大模型是小米mimo V2.5,这是一个多模态的大模型,可以识图、看视频,所以我也测试了一下,我问它能不能找到星空图。



它确实找到了这张,然后发给我了。



但这种识图比较消耗token,它得一张一张jpeg去识图,它是这么说的:

逐张用 `vision_analyze` 看了30多张图才找到,每张图都要加载到视觉模型里分析,token 消耗不小。

更高效的方式:

- 你直接告诉我文件名,我秒发

- 或者你记得大概在哪个文件夹,我能缩小范围

下次找图直接说文件名或特征,不用让我一张张翻


然后我问它能不能把文件发给我,譬如ppt文件,它也能发给我。但是exe安装包没法发给我。



但它又想了个解决方案,现生成zip压缩包,再把压缩包给我发过来了,太聪明了!



Hermes 这种"手机聊微信就能操控电脑"的体验,确实给了我很大的惊喜。但它不是万能的。它擅长的是 精确操作(路径已知、文件名明确、目标单一),不擅长的是 概览和浏览(看看有什么、挑一挑、视觉浏览)。

反而是失败的那些瞬间,让我对这类工具的理解更深了:

  • AI 会埋头干,不会主动说"这个我做不好"
  • 系统原生能力比 AI 模拟强太多了,别让它硬来
  • exe 发不了,但 AI 能自己想出 zip 绕过的办法——这个要给它点赞

总的来说:值得装,值得用,但要知道它的边界在哪。 知道了边界的工具,就是好工具。

编辑于 2026-06-09 · 著作权归作者所有