
書接上回,世超用 Claude Cowork 把日常雜活兒干了個遍。這玩意看起來數據分析、文檔整理、路線規劃樣樣精通,實際細節上還是頻頻出錯。
再加上開源模型群起攻之,Anthropic 架不住攻勢,Cowork 入門價立減 80 刀。
剛被這波大甩賣狠狠背刺的世超,今天就帶大伙兒來看看,這些 " 類 Cowork " 的免費開源 Agent 到底表現如何。
這次,世超一共測了三款榜上有名的開源項目,分別是 OpenWork、Eigent 和 AIonUi。

其中,只有 OpenWork 是在 Cowork 之后才發布的,Eigent 和 AIonUi 的原始版本早在去年八月就已經上線,這一波屬于是蹭蹭 Cowork 翻紅了。而從實際體驗上來講,OpenWork 的完成度明顯高于后兩者,用起來也更接近 Cowork。
好消息是,如果只看能不能把活兒干完,那 Cowork 能干的,開源基本也能干。
壞消息是,這些免費的開源 Agent 各有各的毛病。慢,麻煩,質量低,整體很難和 Cowork、Manus 這種成熟的商業產品相提并論。

好了,話不多說,咱們直接開搓。對標 Cowork,我們同樣設置了三個難度遞增的任務,考察四類技能。
第一個,整理桌面錄屏,考文件文檔管理;第二個,規劃春節珠港澳旅游路線,考研究分析和文檔創建;第三個,整理 B 站差評君 2025 年度數據,考數據收集分析。
開頭即巔峰,世超先給大伙兒看看 OpenWork。有一說一,這個做得還算不錯,自帶免費模型底座,效率也是最高的。
文件整理輕輕松松十秒內搞定,快啊,太快了。不過它不能自己根據視頻內容改文件名,這個比 Cowork 差點。

再看看行程規劃機酒推薦,兩分多鐘,doc 直接給我放桌面。這還說啥了,Cowork 都干了七分多。

生成的文檔雖然簡陋點吧,該有的都有。
即使價格上犯錯,和 Cowork 一樣拿平時價當春節價,但免費,世超愿意原諒它。

然而,在最難的數據收集分析上,OpenWork 還是嚴重翻車了。
數據整理得歪七扭八,又亂又缺又錯,更別提分析。五分鐘出結果,之后再怎么問它,多思考不了一點。

整體體驗下來,OpenWork 最大的優點是快,但就像一個糊弄糊弄交差的低級打工人一樣,最多解決從無到有,別指望質量多好。要是只想編份大差不差的報告給老板,用它勉強也夠。
而接下來的 Eigent 就很難繃了,它完美詮釋什么叫免費的,才是最貴的。
Eigent 自帶幾個免費可切換的模型,世超立選 Gemini 3 Pro Preview。高端模型免費用,還有這等好事?
實際上呢,預制模型巨慢無比,Eigent 二十分鐘都沒搞定桌面一個文件夾。

行吧,那我換自己的 API 再測測。
這下可好,讓它規劃個旅游攻略,任務開始兩分鐘不到,Eigent 上網東搜搜西看看,火速刷光了我 5 刀的 API 余額,最后啥也沒做出來。。。
這么一算,它的使用成本比 100 刀一月的 Cowork 還夸張,這吃相多少有點離譜。

都說 Agent 是數字實習生,公司里要真有這種實習生,財務第一個報警,法務第二天起訴。
{jz:field.toptypename/}客觀來看,Eigent 的思路很美好,它試圖在一套系統里集成四種不同的 Agent,寫代碼的、找資料的、寫文檔的、看圖看視頻的,各司其職。而且你還能清楚看到每個 Agent 正在干什么,莊閑和游戲網聽起來相當合理。

但現實是四個 Agent 各玩各的,不僅 token 消耗暴增,配合不好效率更低,我還得給它很忙的表演買單,最后一個任務都沒成功。
這表現,只能說拉完了。
相比起來,下面這個 AIonUi 都顯得很可愛,純傻 NPC,不坑人。AIonUi 能回答問題但答不準,對文件文檔操作一竅不通。
AIonUi 小 bug 非常多,比如每一步操作都要反復請示;顯示任務執行了五分鐘,世超后臺的 API 卻完全沒信號,說明 AI 純摸魚,一點活沒干。

從生成的內容上看,旅游攻略大差不差,只是金額依舊不對。數據分析任務更離譜,一共只找了 4 條視頻,4 條都不是差評君 B 站賬號的。。。

總結一下戰績,OpenWork 三關勉強算過,但質量一般;Eigent 和 AIonUi 基本全敗。一通操作下來,開源項目是真抗不下 Claude Cowork 降價這面大旗,這表現不是差了一點半點,完全沒威脅。
所以,世超在這里建議各位差友感興趣的話,淺嘗 OpenWork 就夠了。
而且只有上過手后,世超才發現自己對這些開源項目有很多誤解。
首先,開源項目不像一般軟件那樣,下載安裝就能放心使用。
像是 OpenWork 安裝后彈出了 CLI not found bug,要通過終端命令行才能解決,這對沒有技術背景的用戶來說很難做到。

另外,要是軟件沒有自帶模型,或者不好用,自備模型 API 是基操。
但怎么填寫這個 API 設置,對普通用戶來說都是門檻。

這也就引出了第二個誤區,開源,不等于免費。
OpenWork 自備模型還好,但要是沒有底層模型的話,參照 Eigent 的例子,這種量販式吃 API token 的模式,用不好比訂閱制貴多了。

最后,世超發現了一個很反直覺的事兒:Agent 并不是模型能力的放大器,反而成了限幅器。
世超給 Agent 喂的 API,都是最上乘的 Claude-Opus-4.5。如果我直接問 Claude 旅游攻略,數據分析,肯定又快又穩。怎么一套 Agent 上來,降智這么多?
這是因為,大多數開源 Agent 的設計,本身就在削弱模型能力。它們把一個本來可以一次想清楚的任務,硬拆成無數彼此割裂的小步驟,每一步都要重新向模型復述背景、同步進度、強調目標。
這相當于讓 AI 每走一步失憶一次,把本該在模型內部完成的連續思考,變成了低帶寬的文字交接。

比如,輪到 AI 訂酒店的步驟,至少得告訴它之前確認了哪些必玩景點,之后還要留點預算訂機票。這些 token 和時間,白白貢獻給了 AI 的自言自語,萬一溝通不到位來個幻覺,極容易忙中出錯。
作為對比,Claude Cowork 這類 Agent 產品會讓 AI 從頭到尾連續地完成同一件事。對 AI 來說,它始終知道 " 我在做一個完整任務 ",可以自己決定先想什么、后做什么,流程看起來更簡單,思考連貫,中間不容易忘事跑偏。
只不過,Agent 的定位本來就是交付更完整的成果,所以它們往往會比大模型多做幾步驗證、結果整理和文檔編寫之類的工作。
換來的是輸出更完整好看,但你要是急,真不如直接問模型方便。

說到底,Agent 這玩意兒不是套個殼就能點石成金。至少在現在這個階段,不管開源還是閉源,大多數 Agent 距離真正融入生產和生活,還有不小的距離。
它們確實能把流程包裝得更完整,但也往往犧牲了效率和穩定性。對普通用戶來說,Agent 是個看起來聰明的助手,不一定是真聰明的那個。
所以,和它玩玩就好,別太認真。