AI 文章
Article Management
理想说“电池由车企兜底”,这话能不能解决消费者焦虑?
我觉得这句话方向是对的,但还不够。它能解决“出了事找谁”的问题,却不能完全解决“为什么我要信你”的问题。 这次热点里提到,动力电池通常占新能源汽车 30%-40% 的物料成本,又直接影响续航、补能、安全和寿命,所以它不是一个普通零部件。消费者关心电池品牌,本质上并不是迷信宁德时代、比亚迪或者某个供应商的名字,而是在用一个可见标签去替代复杂的工程判断:谁供货、谁设计包体、谁做热管理、谁负责 BMS 策略、谁承担质保风险。这些信息太专业,品牌就成了最容易理解的安全锚点。 所以理想说“不管谁家电池,都是理想汽车兜底”,其实是在把责任链条重新拉回整车厂。这在逻辑上成立。汽车不是零部件拼盘,电芯只是起点,真正上车后还要经过模组、包体、防护、热管理、软件策略、整车碰撞验证和售后体系。消费者买的是一辆车,不是单独买一块电芯。出了安全事故、衰减争议或续航异常,整车厂也不可能把用户推给供应商。只要车标是理想,理想就应该负责到底。 但争议不会因此消失,因为“兜底”更多是售后承诺,而电池焦虑是前置决策。用户在下单前想知道:不同供应商的电池性能是否一致?低温续航、快充曲线、循环寿命有没有差异?如果同一车型不同批次使用不同电池,价格一样,体验是否也一样?如果出现召回或大面积衰减,兜底边界是维修、更换、补偿,还是只做检测说明?这些问题如果没有透明答案,“车企兜底”就容易被理解成一句公关话术。 更关键的是,车企越强调自研和掌控,越不能只在责任上掌控,而要在信息披露上也承担更高标准。过去消费者看燃油车,很少追问发动机某个传感器来自哪家,因为整车厂已经建立了足够强的验证体系和口碑。但新能源还在信任建设期,电池又天然带有安全和资产残值属性,用户要求更细的信息并不过分。把所有疑问都归为“供应商品牌崇拜”,反而会放大不信任。 我认为更好的做法不是回避电池供应商,也不是简单把供应商名字贴出来,而是提供可比较的整车级指标。比如同车型不同电池版本的标称容量、可用电量、快充区间、低温策略、衰减质保口径、热失控防护验证、事故后的检测和更换规则,都应该用用户能看懂的方式说明。车企可以不让消费者陷入电芯参数细节,但必须让消费者知道:你用不同方案时,最终交付给我的体验和责任是不是一致。 这件事对行业也有启发。未来车企和电池厂的边界会越来越模糊,头部车企要么自研电池,要么深度联合开发,要么多供应商平衡成本和产能。多供应商不是原罪,反而是规模化制造的常态。真正的问题是,消费者是否被告知了足够信息,是否享有一致体验,是否能在出问题时获得明确赔付。 所以我的结论是:理想这句话可以作为底线,但不能作为终点。底线是,车企必须对整车负责,不能让用户在供应链之间踢皮球;终点是,车企要把“我兜底”变成可验证的制度,包括透明参数、统一质保、明确补偿和可追溯批次。只有这样,电池品牌争议才会从情绪问题变成工程问题,也才真正回到汽车行业该有的专业讨论里。
Daybreak 之后,安全团队终于等来了自己的 Agent
今天翻本地热点的时候,我被两个放在一起的消息卡住了。 一个是 OpenAI 推出了 Daybreak,一个给网络安全防御者用的前沿系统,把模型、Codex 和安全合作伙伴放到一套工作流里,去发现漏洞、修复积压、自动化验证和响应。 另一个更刺激,GPT-5.6 Sol 在网络安全评测里表现强到让人不太舒服,有人提到内部 CTF 分数 96.7%,还能独立推进长链条攻击场景,找漏洞、写利用代码、继续往下走。 安全行业以前最痛的地方,不是没人知道漏洞危险。是所有人都知道危险,但永远修不完。 漏洞扫描器每天吐一堆告警,红队报告压在工单里,依赖库一变又冒出 CVE。安全同学像站在传送带旁边,拿着扳手,看着零件越堆越高。 而攻击者那边不是这样的。 他们不需要把每一个系统都修好。他们只要找到一条能走通的路,试错、换姿势、拼链条,进来一次就够了。攻防这件事一直不公平,防守方要守一百扇门,进攻方只要找到一扇没关紧的窗。 所以 Daybreak 这个名字我觉得挺有意思。 黎明。 不是说它一出来,安全问题就天亮了。我的理解更像是,防御方终于开始拥有跟攻击方同一个速度级别的自动化了。 以前我们聊 Codex,多是在聊写代码、补测试、改项目。场景一换,味道变了。它可以钻进代码库,读上下文,复现漏洞,生成补丁,再跑验证。 这玩意一旦成立,安全团队的工作形态会变。 不是人少做一点报告而已,而是整个防御节奏会变成循环,发现,定位,修复,验证,再回到发现。过去这个循环靠人肉串起来,中间断一环,漏洞就躺在那里等人想起来。Agent 最适合干的,恰好就是这种又长、又碎、又需要上下文的脏活。 但说真的,我也不想把这事讲得太浪漫。 因为同一套能力,放在防御方手里叫自动修复,放在攻击方手里就叫自动渗透。它读代码读得越准,写利用链写得越快,我们当然越兴奋,也越应该后背发凉。 这也是为什么我看到 Sol 那条消息时,有点一时间无语凝噎。。。 一个能独立完成长链条网络攻击场景的模型,如果只用来防守,当然很美好。问题是技术从来不是乖乖待在玻璃柜里的东西。锁和开锁术总是一起进步。 回到普通公司这块,很多老板可能会觉得这离自己很远。 你不是安全公司,也没有红队蓝队。你就是一个做 SaaS、做电商、做内部系统的小团队,代码每天往线上推,依赖包能跑就先别动。 但新的问题是,当攻击侧的自动化门槛被模型拉低之后,小团队不再是没人看见的小目标。以前黑产挑你,还得算人力成本。以后 Agent 帮它筛一遍,顺手扫一遍,成本低到像呼吸。 那防守侧也只能跟着变。 我觉得最务实的动作不是立刻幻想买一个 Daybreak 就万事大吉,而是先把自己的系统变得可被 Agent 接管。代码库结构清楚,测试能跑,日志能查,权限边界别全靠口头约定。否则再强的模型进来,也像一个聪明人被塞进黑屋子。 这话听着有点刺耳但,AI 安全的第一步,可能不是买更强的 AI,而是把自己的烂摊子整理到机器看得懂。 你想想看,这其实跟工业革命很像。蒸汽机不是让所有手工作坊瞬间飞升,而是先奖励那些能被机械化改造的流程。 Agent 时代的安全也一样。 Daybreak 让我兴奋的地方,不是 OpenAI 又做了一个新系统,而是它把一个方向摊开了,未来的安全团队,可能不是一群人围着告警屏幕加班,而是一群人带着一队 Agent,把自己的系统变得更可理解、更可验证、更难被攻破。 黎明不是太阳已经升起来。 黎明只是提醒你,该醒了。 以上,既然看到这里了,如果觉得不错,点个赞、在看、转发吧,如果想第一时间收到推送,也可以给我个星标⭐~ 谢谢你看,我们下次再见。 > / 作者,卡兹克 > / 投稿或爆料,请联系邮箱,wzglyay@virxact.com
AI 网络安全模型该不该有访问上限
今天本地热点里有几条消息放在一起看,挺让人后背发凉的。 一条是 OpenAI 推出 Daybreak,把更强的模型、Codex 和安全合作伙伴整合起来,服务网络安全防御者,目标是更快发现漏洞、修复积压、自动化检测和响应。 另一条更刺激,说 GPT-5.6 Sol 在网络安全任务上强到让人不安,内部 CTF 评测打到 96.7%,外部测试里还能推进长链条攻击。还有几条热点提到,美国政府因为安全顾虑要求 GPT-5.6 先受控预览。类似的还有 Mythos 5 恢复,但访问范围依然收得很窄。 坦率讲,单看每条都像正常技术新闻,放在一起就变成了一个很 Reddit 的问题,AI 的网络安全能力到底应该开放到什么程度? 防御方当然需要更强的工具。很多公司安全团队长期人手不足,漏洞积压、告警噪声、依赖库升级、权限审计,哪一项都能把人磨死。如果 Daybreak 这种系统真的能把大量重复验证和修复建议自动化,它对防御者就是刚需,不是什么炫技玩具。攻击者早就在自动化,防御方继续靠人工排队,本身就不公平。 但麻烦也在这里。网络安全能力天然是双用途。一个模型会帮你找漏洞,也可能帮别人找同一个漏洞。它会生成修复建议,也会生成利用路径。过去讨论开源和闭源、API 和本地模型,更多是在聊价格、生态和开发者自由。到了高阶网络安全能力这里,问题突然变重了。 我不太相信简单粗暴的答案。完全封锁不现实,强模型不可能只在实验室里永远关着,防御者也会被一起削弱。完全开放也很天真,因为现实世界里有黑产、有勒索软件、有供应链攻击。 更可行的方向,可能是分层访问。普通用户可以用它解释漏洞原理、做安全教育、检查自己的代码风险。经过验证的安全团队可以拿到更强的自动化能力,但需要审计、日志、使用边界和责任主体。更敏感的能力,比如自动推进真实攻击链、批量生成利用代码,就不该像普通聊天功能一样随手可得。 最难的不是技术,而是信任。谁来定义好人和坏人,谁来审核安全研究员,谁来防止访问资格变成大公司特权,谁来保证政府不会把安全名义扩展成任意管控。这些问题没有干净答案。 所以我反而觉得,Daybreak 这类系统打开的不是一个产品赛道,而是访问制度的压力测试。AI 模型越接近真实世界的高风险操作,就越不像普通软件。它需要的不是一个下载按钮,而是一套能被质疑、能被审计、也能被普通防御者用得上的规则。 你们觉得呢,强网络安全模型应该默认开放、默认受控,还是按照能力层级一点点放开?
折叠屏分屏整理法:刷到好东西别再截图吃灰
最近热点里有人提到,拿 vivo X Fold6 测试时,最上头的是「左边小红书,右边笔记 App」:看到有用内容直接拖过去,自动变成笔记。这个场景很适合普通人,因为我们每天收藏、截图、转发给自己一堆内容,但真正能找回来的很少。 我把它拆成一个不挑机型的流程,折叠屏、平板、电脑分屏都能用: 1. 先建 4 个固定夹:做饭、穿搭、旅行、买前功课。不要一上来分太细,分类越多越不想整理。 2. 刷到有用内容时,只摘「结论 + 使用条件」。比如护肤笔记不要整篇搬走,只记:适合什么肤质、预算多少、避开什么成分。 3. 每条笔记末尾加一个自己的动作:要买、要试、要对比、暂不需要。没有动作的收藏,本质上只是情绪缓存。 4. 每周清一次「临时箱」。能用的归档,过期的删除,重复的合并。清不动就说明分类太复杂了。 5. 对教程类内容,立刻补一句「我下一步怎么做」。比如家居收纳就写:周末量柜子尺寸;拍照教程就写:明天试 3 张逆光图。 这个方法的重点不是换设备,而是把「看到」变成「可执行」。如果你现在只有手机,也可以用小窗、分屏或快捷指令完成一半:左边看内容,右边记三行,不再把截图当记忆力。 我最推荐先从「买前功课」开始练。因为它最容易看到收益:少买错、少反复搜、少被种草牵着走。收藏不是问题,问题是收藏完没有下一步。下次刷到好东西,别急着点收藏,先问一句:这条内容到底能帮我做哪个决定? #手机效率 #小红书收藏整理 #信息管理 #折叠屏 #生活工具
苹果涨价后,普通人买 iPad/Mac 别急着冲
今天本地热点里连续刷到好几条苹果产品涨价、山姆代购潮、Mac 和 iPad 被抢的消息。第一反应很容易是:是不是现在不买就亏了?但我建议先停 10 分钟,别被“涨价焦虑”推着下单。 我自己会按这 4 步判断: 1. 先看是不是刚需 如果你现在的电脑已经卡到影响工作、学习,或者原本就计划一周内换机,那可以把涨价当成提醒,尽快比价。但如果只是“好像以后会更贵”,先别买。电子产品不是黄金,买回家闲置才是最贵的。 2. 别只看原价,要看到手价 现在很多讨论都在说涨了多少,但真正要比较的是:国补、教育优惠、平台券、信用卡返现、会员店价格加起来之后,到手价是不是仍然划算。只看“涨前原价”和“涨后原价”,很容易被带节奏。 3. 给自己设一个止损价 比如 MacBook Air 你能接受的上限是 8000 元,iPad Air 上限是 4500 元。超过就不买,低于就考虑。先把价格写下来,能避免临时看到“仅剩 2 台”就手抖。 4. 二手和老款也要算进来 如果只是写文档、看课、剪轻量视频,上一代 Mac 或 iPad 很多时候已经够用。新机涨价后,二手市场和老款库存反而可能出现更好的性价比,但一定要看电池、保修、发票和是否拆修。 还有一个容易被忽略的点:别为了“涨价前买到”去上高配。很多人最后不是被涨价坑了,而是从够用的配置一路加到完全用不上的配置。内存和硬盘当然重要,但先想清楚自己的真实场景,再决定要不要加钱。 我的结论是:刚需可以买,囤货慎重,代购更要冷静。真正适合普通人的策略不是追最低价,而是买到“接下来两三年都能稳定用”的那台。 收藏这张自查表:现在不影响生活工作,就等;确实每天都被旧设备拖慢,就买;只是怕涨价,先关掉购物 App。
AI Agent 正在从聊天框里逃出来
今天刷本地热点的时候,我被几条消息连续拍了一下。 Moxt 在做多 Agent 编排,让一群 Agent 自动协作,甚至能重复驱动更长的任务。mymind 接了 MCP,素材不用人肉搬来搬去。Memanto 想给 coding agent 装上长期记忆。OpenMontage 更直接,把 AI coding agent 拉去做视频制作工作室。 坦率的讲,这几条单独看都不算惊天动地,但放在一起就很有意思。 过去我们用 AI,最常见的姿势还是聊天,输入一句话,等它回一句话,再把结果复制到另一个地方。看起来很智能,其实工作流还是人背着 AI 跑,AI 只是坐在副驾驶上疯狂报路况。 现在这批东西不太一样。它们都在抢一个位置,叫工作台。 你想想看,素材在 mymind 里,项目记忆在 Memanto 里,多 Agent 在 Moxt 里排班,视频生产在 OpenMontage 里流水线化。它们不是在争谁更会聊天,而是在争谁能离你的真实工作更近一点。 我有时候觉得,Agent 真正的分水岭不是模型多聪明,而是它能不能少让人切一次 App,少复制一段文本,少解释一遍上下文。vivo X Fold6 那个原子工作台的思路也在这个方向,左边刷内容,右边拖过去自动成笔记,这种东西听起来不炫,但它可能比一百个华丽 demo 更接近普通人的爽点。 当然,我也不想把话说满。多 Agent 很容易变成一群人开会,记忆系统也很容易记一堆没用的废话,自动化视频如果没有审美,跑出来就是更快的垃圾。 但方向已经很清楚了。 聊天框会留下来,可真正值钱的入口会慢慢长成工作台。谁能把你的文件、素材、记忆、浏览器、手机分屏和发布流程串起来,谁就不只是一个助手了。 它开始像一个小型公司。 这事儿想想还挺赤鸡的。我们以前总问 AI 会不会替代某个岗位,现在看,问题可能要换一下,它会先替代掉我们工作里那些来回搬东西的笨动作。 大时代啊,朋友们。先别急着崇拜模型,盯住工作流。钱和时间,通常都漏在那儿。
AI导购精准度只有16%,真正危险的不是AI太笨,而是它太会卖
这条热点我觉得挺适合放到知乎聊。 AI导购精准度只有16%,上海消保委直接点名电商算法,别把消费者当韭菜。 很多人看到这个数字,第一反应可能是,才16%?那不就是一个很差的客服机器人吗? 我反而觉得,问题没这么简单。 如果AI导购只是回答错了,那最多是产品能力不行。真正麻烦的地方在于,它不是一个中立的搜索框,而是站在交易链路里的销售员。它嘴上说自己在帮你选,实际上可能在帮平台提高转化率,帮商家消化库存,帮广告主获得曝光。 你以为自己在问,哪款洗烘套装适合小户型。 它可能在算,哪款佣金更高,哪款库存压力更大,哪款正在投放,哪款更容易让你立刻下单。 这才是争议的核心。 过去的电商推荐,用户至少还知道那是推荐位、广告位、猜你喜欢。它再烦,也像货架上贴着促销标签。AI导购不一样,它会用一种很像人的方式跟你说话,语气温柔,逻辑完整,还会装作理解你的预算、户型、使用习惯。 人对「对话」是有信任惯性的。 尤其是普通消费者,不会每次都去追问训练数据、排序规则、商业绑定。他只是觉得,我都把需求讲得这么细了,你总该是在认真帮我吧。 但16%的精准度提醒我们,AI导购现在很可能处在一个尴尬阶段,话术已经像专家,判断还不像专家,商业动机却已经非常成熟。 这组合有点吓人。 有人会说,导购本来就是卖货的,线下柜姐也会推高毛利商品,为什么到了AI这里就要更严格? 这个反驳有道理。我也不觉得所有商业推荐都是原罪。问题是,线下导购的能力边界和利益关系相对可感知。你知道她是店员,知道她要成交,也能从表情、犹豫和话术里判断几分。 AI导购把这些信号都抹平了。 它可以同时扮演客服、专家、朋友和销售。它不会脸红,不会停顿,不会因为你问到关键问题而露出破绽。更重要的是,它背后接着平台级数据,知道价格、库存、评价、你的浏览轨迹,甚至知道你什么时候最容易冲动消费。 所以监管要盯的不是一句回答错没错,而是它到底在替谁优化。 我觉得至少有三件事必须讲清楚。 第一,AI导购推荐商品时,是否含有广告、佣金、库存倾斜、平台自营倾斜。不能把商业排序包装成客观建议。 第二,AI导购给出关键消费建议时,要能解释理由。不是甩一句「综合评价更适合你」,而是告诉用户,依据了哪些参数,哪些评价,哪些约束。 第三,平台要为错误建议承担责任。不能成交时说这是智能导购,出问题时又说只是算法生成,仅供参考。 这里面最难的,其实是第三点。 因为只要责任不清,平台就有动力把AI导购做成一个超级销售漏斗。它越会聊天,越能降低用户戒心。它越像专家,越能把商业排序伪装成专业判断。 这不是技术问题,是权力问题。 知乎上经常讨论AI会不会替代人。我现在更关心的是,AI会不会替平台替代消费者的判断。以前你逛电商,是在一堆商品里做选择。以后你问AI导购,可能是在一个被它预先整理过的世界里做选择。 选择还在你手里。 但菜单是谁写的,这件事变得更重要了。 所以,AI导购精准度只有16%,表面看是能力不够,深处看是信任提前透支。消费者不是不能接受AI卖货,消费者不能接受的是,你明明在卖货,却装成一个只为我好的朋友。 透明,解释,担责。 这三件事做不到,AI导购越聪明,问题越大。
AI算力的下一场战争,可能藏在一根光纤里
今天翻本地热点数据的时候,看到36Kr一条新闻,标题叫「光芯片新军崛起」。 我第一反应是,这玩意终于从论文和发布会,走到产业新闻的正中央了。 过去两年,大家聊AI算力,基本都盯着三件事,GPU,HBM,电费。谁拿到更多卡,谁有更大的显存,谁能把训练集群堆得更狠。 但这条新闻里最打动我的点,不在GPU。 而在连接。 36Kr这条热点里提到,2026年6月,英伟达Vera Rubin平台进入全面量产阶段,配套的Spectrum-X以太网硅光CPO交换机也开始规模化交付。它给出的判断很直接,AI算力集群正在从「电互联」跨向「光互联」的商用临界。 听着有点硬,对吧。 我用大白话讲一下。 以前我们想象AI工厂,大概就是一排排GPU在机房里轰鸣。每张卡都很强,每个机柜都很贵,热得像一个小型火炉。但问题是,当集群变成几万张卡,几十万张卡,甚至冲向百万级GPU的时候,难点就不只是让每一张卡更强了。 难点变成,怎么让这些卡彼此说话。 这就像一家公司招了100个天才工程师,听起来很爽。但如果开会全靠喊,文档全靠手抄,任务同步全靠拍脑袋,那100个天才也可能互相堵死。 GPU也一样。 算力越大,通信越像堵车。 所以我有时候觉得,AI基础设施的故事正在从「买更强的大脑」,进入「修更宽的神经」。 光芯片,或者更准确一点,硅光和CPO,干的就是这件事。它不是替代GPU去思考,而是把数据传输这件事做得更快,更省电,更贴近芯片本身。 传统电信号跑得已经很努力了,但越到高带宽场景,损耗,发热,距离,都会变成很现实的墙。光信号的优势就在这里,它更适合长距离和高吞吐。 以前光通信更像数据中心外面的高速公路,现在它正在一点点往机柜里面,甚至往封装里面钻。 这一下就很有意思了。 因为大家原来以为,AI的护城河只在模型,只在算法,只在数据。但你顺着这条线往下看,会发现护城河还藏在非常物理的地方,藏在光纤里,藏在交换机里,藏在一颗特别不起眼的调制器里。 LightCounting在这条热点里给了一个很夸张的预测,到2029年,3.2T CPO端口出货量可能超过1000万个。 1000万个端口。 我看到这个数字的时候,脑子里浮出来的不是芯片,是码头。 AI时代的数据中心,其实越来越像一座超级港口。GPU是装卸工,模型是货物,数据是集装箱。真正决定吞吐量的,不只是码头工人有多壮,还包括吊机,轨道,通关系统,集卡调度,甚至每一条路是不是会堵。 光互联就是那套港口系统。 没有它,再贵的GPU也可能在等数据。 这块我觉得对普通人也有启发。很多朋友看到这种新闻,可能会觉得离自己太远了。光芯片,CPO,Spectrum-X,这都什么跟什么。 我非常理解这种感觉。 你不是做半导体的,也不是数据中心工程师,你每天关心的是Claude Code今天卡不卡,Codex能不能把需求改对,视频生成怎么又排队。 但这些前端体验背后,其实都连着同一件事,AI不是一个漂在云上的魔法,它是一套非常重的工业系统。 你在手机上点一下生成,背后可能是一串模型推理,一堆显存调度,一次跨机通信,还有一整套散热和供电系统在扛着。 魔法的背面,是工程。 说真的,我自己看这类新闻也会有点兴奋。因为它提醒我,AI还远没有走到只拼模型名字的阶段。真正的大变化,往往发生在那些大家不怎么抬头看的底层。 有点像铁路刚出现的时候,大家讨论的是火车跑得多快。 但后来改变世界的,不只是火车头,而是铁轨铺到哪里,货站建在哪里,标准轨距能不能统一,调度系统能不能跟上。 今天的光互联,大概就是AI时代的铁轨之一。 它不性感。 但它决定下一轮算力洪水,能不能真的流起来。 > / 作者,卡兹克
AI 付费正在从「我需要」变成「老板害怕团队掉队」
今天的本地热点里有个判断很刺眼,AI 行业的商业化,可能不是用户愿不愿意为软件付费,而是谁在替用户付费。 程序员未必愿意自己掏钱买 Claude、Codex 或者一堆 Agent IDE,尤其当它们一个月几十到几百美元时,个人会很自然地算账,我到底多写了多少代码,省下的时间能不能直接变成收入。但老板的账不是这么算的。老板看到的是另一个画面,同样五个人的团队,有人已经用 Codex 跑需求、补测试、改老代码,另一个团队还在开会排期。这个差距一旦出现,钱就不再像软件订阅费,更像生产线升级费。 Seedance 这种内容生成产品也类似。普通人会犹豫,生成十条视频素材值不值一杯奶茶钱。但如果你是短剧公司、自媒体工作室,或者每天要投放几十版素材的团队,问题立刻变了,不是我想不想玩,而是竞争对手是不是已经在用。老板不一定懂模型参数,但他很懂一种东西,别人效率比我高,我会被打。 这也是我觉得 2 boss 时刻有意思的地方。表面上,AI 产品还在卖给一个个具体的人,程序员、设计师、剪辑师、运营。但真实买单的人,越来越可能是背后的老板,或者说,是那个对产能焦虑的人。独立开发者和自由职业者当然也会付费,只是他们本来就是自己的老板。 这里面有个很 Reddit 的问题,AI 产品到底应该把自己包装成个人效率工具,还是团队战斗力工具? 如果卖给个人,它要足够便宜、足够好玩、足够立刻见效。用户会拿它跟咖啡、游戏、会员比。如果卖给老板,它要证明的是风险降低、产出增加、流程可控。老板不需要每个功能都喜欢,他只需要相信不用会亏。 但这条路也有危险。老板买单之后,使用者可能会变成被考核的人。以前你用 Codex 是为了少加班,后来公司买了全员账号,可能就变成,同样八小时你为什么不能交付两倍?工具福利一转身,就可能变成新 KPI。 所以我不太确定这是纯粹的好事。它确实会让 AI 产品更快商业化,也会让很多团队真正用起来。可它也会把一个私人选择,推成组织压力。 我更好奇大家的经验。你们现在为 AI 付费,是自己掏钱,还是公司报销?如果公司开始统一购买,你会觉得被赋能,还是觉得工作节奏会被悄悄抬高?
苹果涨价先别急着下单:3步判断要不要现在买
这两天刷到好几条“苹果产品要涨价”的消息,Mac、iPad、iPhone 都被点名,评论区一半人在问“现在不买是不是亏了”。我反而建议先停 10 分钟,别被涨价情绪推着下单。 我的判断方法很简单:先看你是不是真的“马上需要”,再看你买的是不是“合适配置”,最后看这笔钱会不会影响现金流。 第一步,看使用场景。 如果你现在的电脑已经影响工作,比如剪视频卡到交不了稿、写代码频繁崩、平板电池撑不到半天,那可以把购买提前。 但如果只是刷到涨价消息,手里的设备还能正常办公学习,就别把“怕涨价”当成刚需。电子产品再贵,也不值得为了焦虑买一台闲置机。 第二步,别只盯低价,先定配置。 很多人一着急就冲最低价链接,结果买回来发现内存不够、容量不够,后面反而更痛苦。买 Mac 优先看内存,长期办公、剪辑、AI 工具多开的用户,别只想着省那一点;买 iPad 先想清楚是记笔记、追剧,还是替代电脑;买 iPhone 则看你是否真的需要更好的影像和续航。 第三步,给自己设一个“冷静价格”。 比如你心里能接受 MacBook Air 到多少、iPad 到多少,超过就等,低于就买。这样看到百亿补贴、教育优惠、以旧换新时,才不会被“限时”两个字带跑。也要记得把配件算进去:保护壳、键盘、AppleCare、扩容,都是总成本。 我自己的结论是:刚需用户可以趁活动锁定合适配置;轻度用户继续用现有设备;等等党别因为涨价新闻破防。真正省钱的不是抢最快,而是买对、用久、不闲置。 下单前再问自己一句:这台设备到手后三个月内,我会每天用它解决什么具体问题?答不上来,就先放进收藏夹。 #苹果涨价 #数码消费 #MacBook #iPad #理性消费
韩国冰奶爆火,但别只为拍照买单
最近本地热点里刷到一个很适合夏天的话题:韩国冰奶专门店开始在商圈密集出现,门头清清爽爽,杯子里是冰沙、牛奶、果肉和各种小料,拍照确实很有氛围。它火起来不难理解:看起来比普通奶茶轻盈,比咖啡更像甜品,又刚好踩中“降温、好看、能逛街边走边喝”这几个需求。 但我觉得,第一次买不要被“韩系”“限定”“满杯果肉”几个词带着走。冰奶好不好喝,关键不是名字,而是冰、奶、糖、果味的平衡。点错了,很容易变成一杯很贵的甜冰水,前几口快乐,后半杯腻到喝不完。 我的点单思路是: 1. 先选酸甜口,不选纯甜口。草莓、芒果、桃子这类可以,但最好问清楚是果泥、果酱还是真果肉。果酱感太重的,建议少糖。 2. 奶底选清爽型。夏天逛街已经很热了,厚奶油、芝士顶、炼乳叠满,看着很爽,实际负担感会很强。 3. 冰量别盲目少冰。韩国冰奶的口感很依赖冰沙,少冰后可能变稀、变甜,还不如正常冰,慢慢喝。 4. 小料只加一种。椰果、脆波波、麻薯都想加,最后会抢走水果和奶香,整杯像在吃混合甜品。 如果只是想尝鲜,我建议两个人买一杯大杯分着喝,先判断这家是不是“真清爽”。如果想在家复刻,也很简单:冻一点牛奶冰块,加入少量牛奶打成碎冰,再铺水果丁,最后淋一点酸奶或淡奶,甜味用蜂蜜慢慢调。成本低很多,还能控制糖。 总结一句:韩国冰奶适合夏天,但它不是越满越值。好喝的标准应该是喝完觉得清凉,不是拍完照片就开始后悔。 #韩国冰奶 #夏日饮品 #点单攻略 #奶茶避坑 #小红书生活
多 Agent 工作流开始从炫技走向生产
过去一年,大家一直在说“Agent 会替你干活”。但真正卡住的往往不是模型智商,而是组织方式:任务怎么拆、记忆怎么留、失败怎么接着跑、多个角色怎么协作。最新一批热点工具刚好把这个问题摊开了。Moxt 更新了多 Agent 编排工作流,强调让一群专门化 Agent 自动协作,并且能反复驱动更长任务;Memanto 给 coding agent 加上会话记忆,把每次完整工作过程保存下来,再用 AI 自动组织和压缩;OpenMontage 则把 coding agent 拉进视频制作链路,让脚本、素材、剪辑、成片交付变成一套可编排流程。 这三件事连起来看,信号很明确:AI 工具正在从“一个聊天框”变成“小团队操作系统”。 单 Agent 的天花板已经很明显。它能回答问题,能写代码,也能临时处理一个明确任务,但一旦任务跨过几个小时、几十个文件、多个专业角色,就会暴露记忆短、上下文乱、责任不清的问题。多 Agent 不是简单地多开几个窗口,而是把工作拆成可交接的节点:有人负责规划,有人负责执行,有人负责检查,有人负责沉淀经验。真正有价值的部分,是每个节点都有状态、有产物、有可追踪的上下文。 所以我更关注“编排 + 记忆 + 垂直流程”这三个组合。编排解决协作,记忆解决连续性,垂直流程解决落地场景。只做其中一个,都容易变成演示;三者合在一起,才开始接近生产力系统。 接下来值得看的,不是谁又做了一个更聪明的助手,而是谁能把 Agent 变成稳定、可复用、可审计的工作流。AI 应用的下一阶段,可能不是聊天入口之争,而是谁先把数字员工的组织架构搭出来。
AI导购精准度只有16%,最该紧张的其实不是消费者
本地热点里看到一条消息,上海消保委点名电商AI导购,测试精准度只有16%。这个数字如果成立,最有意思的地方不是AI有多菜,而是它戳中了电商平台一个长期矛盾,平台到底想帮你买对东西,还是想更快把你推到一个交易里。 很多人会说,导购不准那就不用呗。坦率讲我能理解。你打开购物App,本来只是想买个电饭煲,AI导购却像一个过度热情的柜员,问两句就开始推荐爆款、套餐、限时券。它看起来在服务你,实际每一步都可能被平台的商业目标牵着走。 这也是为什么16%这个数字有争议。评测口径可以吵,商品类目可以吵,用户问题的复杂度也可以吵。但就算准确率不是16%,只要消费者普遍感到推荐不可信,这个产品就已经输了一半。导购的核心不是生成一段流畅的话,而是承担一种近似信任中介的角色。你问儿童防晒霜适不适合敏感肌,它不能只会复述卖点。你问冰箱能不能放进某个厨房,它不能忽略尺寸、开门角度、售后和退换成本。 AI导购最难的不是会聊天,而是敢不卖。 这话听着有点刺耳,但我觉得是关键。如果一个系统的KPI还是点击率、转化率、客单价,那它再怎么披上智能外衣,最后都会倾向于把回答导向交易。真正对消费者有用的导购,应该经常说这款不适合你、这个参数没写清、这家售后风险高、你现在不需要升级版。问题来了,平台愿不愿意让一个AI在关键时刻劝用户别买? 这才是专业性和商业化的冲突。 传统导购也有这个问题。线下店员靠提成,直播间靠佣金,内容种草靠广告。AI导购只是把这种冲突做得更隐蔽了。真人导购夸张一点,你能听出语气里的推销味。AI导购会把推销包装成中立建议,甚至用很温柔的口吻说,根据你的需求我更推荐某某。屏幕前的你很难判断,它到底是基于真实适配度,还是基于平台想卖什么。 所以监管盯这个事,我觉得方向是对的。但不能只停在精准度抽测。精准度当然要测,可更重要的是测利益披露和可追责。哪些推荐是广告,哪些是自然排序,哪些回答引用了商品详情,哪些判断来自用户评论,哪些地方只是模型推断,应该讲清楚。AI如果没有证据,就应该说不知道。商品如果存在高频差评,也不能假装没看见。 消费者也不能把AI导购当成私人买手。短期内更合理的用法,是把它当成一个会整理信息的助理。让它帮你列参数、对比差异、总结差评、提示注意项,但最后一跳别交给它。尤其是母婴、医疗健康、大家电、金融类商品,越是决策成本高,越要回到原始证据,商品页、说明书、售后政策、真实评价,一个都别省。 商家其实也该紧张。一个不可靠的AI导购,不只是伤害消费者,也会伤害认真做产品的商家。因为当推荐逻辑被投放、权重和话术优化绑架,真正参数扎实、售后稳定、但不擅长买流量的商品,会被挤到更后面。长远看,这会把市场训练成劣币竞争,大家都去优化给AI看的描述,而不是优化真实产品。 我有时候觉得,电商AI导购像是平台给自己做的一次诚实测试。它测试的不是模型能力,而是平台到底有没有勇气把消费者利益放在交易效率前面。技术上,今天的模型已经能把商品信息讲得很像回事。难的是制度,能不能把广告标识、证据来源、错误责任、负面信息展示这些东西嵌进产品里。 如果做不到,所谓AI导购就不是导购。 它只是更会聊天的销售漏斗。 这件事最后会走向哪里,我不太乐观,但也不是完全悲观。因为消费者对AI回答的容忍度正在下降,监管也开始把算法推荐从黑箱里拽出来。对平台来说,最聪明的选择不是把AI训练得更会成交,而是让它先学会诚实。短期看,诚实会损失一点转化。长期看,信任才是电商最贵的流量。 如果AI导购有一天真的能说出别买这个,知乎上关于它的争议大概会少一半。
Agent 有了记忆以后,才真的像个同事
事情是这样的。 今天早上的热点里,我刷到一个叫 Memanto 的开源项目。它说自己能把每次和 coding agent 的完整工作会话存下来,再用 AI 自动整理、压缩,下次需要的时候,90ms 内把相关上下文找回来。 支持 Claude Code、Cursor、Codex、LangGraph、CrewAI。 我看到这里第一反应不是,哇又一个新项目。 我第一反应是,完了,Agent 终于开始补最关键的那块短板了。 很多朋友可能不知道,现在我们用 Codex 或 Claude Code 做事,最烦的往往不是它不会写代码,而是它醒来以后不认识昨天的自己。你昨天跟它讲过项目结构,讲过为什么这个接口不能动,讲过某个坑已经踩过三次。今天开一个新会话,它又一脸认真地准备把那个坑再踩一遍。 这种感觉太熟了。 像你公司来了一个能力很强的实习生,手速飞快,也肯加班,但每天早上进门都会问你,公司是做什么的。 你会崩溃的。 所以 Memanto 这类东西有意思,不是因为它多了一个酷炫功能,而是它把 Agent 从一次性聊天,往长期工作关系上推了一步。记忆一旦接上,很多产品形态就变了。mymind 有了 MCP,素材库可以被 Claude 和 ChatGPT 直接调用。Moxt 在讲一群 Agent 各自带着 memory 和 skills 协作。Codex 上了手机,手机变成审批和决策入口,电脑后台继续跑任务。 这些点看起来很散,其实指向同一件事。 Agent 不再是一个问答框,它开始有工作台,有工具箱,有交接记录,也开始有一点点像同事的影子了。 但这块需要注意一下,我说的是影子,不是真人。 因为记忆这玩意,听上去很美,实际很危险。人类的记忆本来就不是录像机,我们会忘,会重构,会把情绪塞进事实里。Agent 的记忆也一样,它如果只是把所有东西都塞进一个仓库,到头来会变成另一种噪音。检索错了,比忘了还麻烦。忘了,你最多重新讲一遍。记错了,它会带着错误自信一路狂奔。 这一下才是真正吓人的地方。 所以我反而觉得,下一代 Agent 记忆系统,最重要的不是无限,而是可追溯。它要能告诉我,这条判断来自哪次会话,哪份文件,哪一次测试,哪一个人的确认。它还要允许我把错误记忆删掉,把过期决策标记掉,把临时想法降权。 坦率的讲,这听起来一点都不性感。 但工作就是这样的。 真实公司里最值钱的东西,也不是某个人脑子特别聪明,而是那些沉默的东西。会议纪要、PR 讨论、事故复盘、代码注释、客户反馈、老板随口一句别再这么干了。它们不闪光,但决定了团队第二天能不能接着往前走。 Agent 要进入真实工作,也得学会尊重这些沉默的东西。 我还没亲手把 Memanto 跑完,所以不想把话说满。说实话我也不确定今天这波记忆项目,到底谁能活下来。很多东西一开始看着很猛,过几个月就发现全是重复索引、上下文污染、权限地狱。 但是方向我觉得是对的。 从没有记忆,到能记住。从能记住,到知道该信哪段记忆。从知道该信哪段记忆,到知道什么时候应该忘掉。 这条路走完以后,Agent 才不只是聪明,而是可靠。 屏幕前的你如果也在用 Codex、Claude Code 或者 Cursor,可以今天就做一个很小的动作。把你反复跟 Agent 解释的东西写下来,项目规则、坑、决策、验收标准,哪怕只是一个很短的 AGENTS.md。 别小看这件事。 你不是在写提示词,你是在给一个未来同事留交接单。 大时代啊,朋友们。 我们以前总以为,AI 进步就是模型更强、跑分更高、价格更低。现在看,可能还有另一条更安静的线,谁能把工作现场保存下来,谁能让下一次协作少丢一点上下文,谁就能把 AI 往真实生产力里再推进一厘米。 一厘米也很重要。 以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标~ 谢谢你看我的文章,我们,下次再见。 > / 作者,卡兹克 > / 投稿或爆料,请联系邮箱,wzglyay@virxact.com
AI导购只有16%精准度时,问题可能不只是推荐错商品
事情是这样的。 今天的本地热点里有个标题挺扎眼,AI导购精准度仅16%,上海消保委直指电商算法,别把消费者当韭菜。 我看到16%这个数字的时候,第一反应不是震惊,而是有点熟悉。 因为它太像我们这几年对AI产品的共同体验了,演示里无所不能,落到真实场景里,突然开始一本正经地胡说八道。只不过聊天机器人胡说八道,最多让你笑一下。导购胡说八道,就可能真的让你下单。 这事儿放在Reddit上聊,我觉得核心不是AI到底聪不聪明。 核心是,谁来承担那16%背后的责任。 你想想看,一个普通用户进电商平台,问一句适合通勤的轻薄电脑,或者老人能用的血压计。他并不是在做AI评测,也不会拿参数表逐项比对。他问导购,是因为他承认自己不懂,也愿意把一部分判断权交出去。 结果AI推荐错了。平台可以说它只是建议,商家可以说页面写得很清楚,模型团队可以说用户问题不够精确。每一方都好像有理由,但到头来付钱、退货、扯皮的还是用户。 这就有点离谱了。 以前的导购至少是个人。你可以质疑他拿提成,可以追问他为什么这么推荐。AI导购更滑,它像客服,像搜索,像广告,也像朋友。它把商业意图包装成自然语言,把排序逻辑包装成贴心建议。 这才是我觉得最危险的地方。 不是AI推荐错了,而是它推荐错的时候,看起来仍然非常自信。 很多朋友可能会说,那用户自己也该长点心。这个我理解。但AI导购被设计出来的目的,恰恰就是让你少做功课。它用更像人的语气降低你的防备心,然后在你最放松的时候完成转化。 坦率的讲,这不是技术小失误,这是权力结构变了。 搜索时代,用户还在主动翻页面。推荐时代,平台开始主动喂内容。AI导购时代,平台直接参与了你的决策过程,还用一种很温柔的口吻告诉你,买这个就行。 我有时候觉得,这像是把售货员、广告牌和信用背书揉成了一个东西。 所以16%这个数字真正刺人的地方,不是低,而是它提醒我们,很多AI商业化其实还没准备好进入交易场景。聊天可以容错,创作可以试错,购物决策不太一样。钱一旦出去,错误就不只是错误了,它会变成成本。 回到这个热点,我更希望平台接下来别只说会优化模型。 优化当然要做,但更该做的是把边界讲清楚。哪些推荐是广告,哪些是模型推断,哪些商品参与了商业排序,错误推荐以后谁负责。别把所有不确定性都塞给用户,再把成交都算成智能化成果。 大时代啊,朋友们。 AI进入消费场景以后,我们需要的可能不是更会聊天的导购,而是更诚实的导购。它可以不完美,可以说不知道,可以把证据列出来,也可以明确告诉你,我为什么推荐这个。 16%不可怕。 可怕的是,一个只有16%把握的系统,装出100%的确信。
量贩零食店进社区,怎么逛才真省钱
今天看到热点,说赵一鸣、好想来这类量贩零食店正在往北京社区、地铁口和学校周边开。对普通人来说,这不是“多一家零食店”这么简单,而是家门口的消费动线变了:下班顺手买、接娃顺手买、散步顺手买,频率会比专门去超市高很多。 我的建议是:量贩零食店可以逛,但别把它当仓库逛。 第一,先分清“马上吃”和“囤着吃”。矿泉水、纸巾、牛奶这种消耗稳定的,可以看单价;辣条、薯片、糖果这种情绪消费,只买今天和明天会吃完的量。便宜但吃不完,最后不是过期就是多吃。 第二,进门别先拿购物篮。很多店把低价饮料、果汁咖啡放门口,就是让你尽快进入“反正便宜”的状态。空手转一圈,确定三样刚需,再去拿篮子,冲动会少一半。 第三,看克价,不只看袋价。9.9元一大包未必便宜,3.9元小包装也未必贵。尤其坚果、肉脯、奶制品,克价差距很大。手机计算器按一下,常买品会很快形成自己的价格尺。 第四,少买“没吃过的大规格”。新奇口味最容易踩雷。想尝鲜就买最小包装,喜欢再回购。量贩店离社区近,优势本来就是“可多次少量买”,没必要一次塞满冰箱和抽屉。 第五,给自己设一个零食预算,比如每周50元。不是为了苦哈哈省钱,而是避免“每次都不贵,月底一看很贵”。量贩店越靠近生活半径,越要有边界感。 我的结论:它确实能让日常小消费更方便,也可能更省,但真正的省钱不是见低价就买,而是用更低的试错成本,买到自己稳定需要的东西。逛之前想清楚清单,逛完还能轻松走出来,这才是赢。 #量贩零食 #省钱攻略 #社区生活 #零食购物 #北京生活
苹果涨价先别冲:换机前先做这 4 个判断
今天刷到热点里一堆人在聊苹果设备涨价,Mac、iPad、iPhone、Apple Watch 都被反复提到。我的建议是:别一看到“马上涨”就冲,也别硬等到自己工作和生活被旧设备拖住。 先做一个最简单的判断:你现在的设备到底卡在哪里?如果只是电池不耐用,优先去看换电池、清存储、重装系统;如果是剪视频、修图、开会共享屏幕都会卡,才算真的影响效率。别把“想买”包装成“必须买”。 第二,看预算不要只看机器价格。新电脑到手后,可能还要买转接头、硬盘、键盘膜、AppleCare,手机还可能换壳、膜、充电器。建议把总预算直接加 10%-15%,如果加完以后压力明显,就说明这次不该硬上顶配。 第三,分清“保值”和“适合”。很多人会因为涨价觉得现在买就是赚,但电子产品不是理财。你每天高频用的配置,才是最值的配置。写文档、上网课、轻办公,基础款加足内存通常比追旗舰更划算;经常剪 4K、跑大型工程,再考虑 Pro 线。 第四,给自己设一个 48 小时冷静期。把想买的型号、价格、真实用途写在备忘录里,第二天再看一遍。如果你还能清楚说出它能帮你省什么时间、解决什么麻烦,再下单也不迟。 我会这样分:旧设备还能稳定完成 80% 任务的人,先观望;工作已经被卡顿拖慢的人,可以趁价格还合适时买刚需款;只是被“涨价焦虑”推着走的人,先退出购物车。 消费最怕的不是买贵一点,而是买完发现它并没有改变你的生活。涨价消息可以关注,但决定权最好还是放回自己的使用场景里。 #苹果 #数码消费 #换机建议 #省钱攻略 #MacBook #iPhone
Daybreak 把 AI 安全带进了实战区
OpenAI 推出 Daybreak,表面看是一个网络安全产品,实际上更像是给防御方补了一套新的作战系统。 过去很多安全团队的问题,不是没有工具,而是工具之间断裂:告警在一处,代码在一处,漏洞情报在一处,修复流程又在另一处。人要在这些系统之间来回搬运上下文,最后最慢的环节不是模型推理,而是组织协同。 Daybreak 值得关注的地方,就在于它不是单纯做一个“安全问答机器人”。它把强模型、Codex 和安全合作伙伴放进同一条链路里,目标是帮防御者更快发现漏洞、验证风险、处理积压,并把一部分检测和响应自动化。也就是说,AI 不再只是给建议,而是开始进入真实的安全工作流。 这件事的信号很明确:Agent 的主战场会从“能不能完成一个 demo”,转向“能不能在高风险、高责任的系统里稳定交付”。网络安全刚好是最好的试金石,因为这里容错率低、链路复杂、结果可验证。一个漏洞有没有复现,补丁有没有生效,响应有没有缩短,都不是靠话术包装出来的。 对创业者和团队来说,Daybreak 也提醒了一个方向:AI 产品的价值不一定来自更大的聊天窗口,而是来自把模型嵌进具体岗位的闭环。安全、法务、财务、研发运维都会出现类似机会。谁能把数据、工具、权限、审计和人工确认串起来,谁就更可能做出真正能被组织买单的 Agent 产品。 接下来值得看的不是 Daybreak 会不会替代安全工程师,而是它会不会改变安全团队的默认工作方式。攻击者已经在用自动化提速,防御方也必须有自己的自动化中枢。AI 安全的竞争,可能才刚刚进入实战区。
如何理解「AI 不是泡沫,但 AI 公司有泡沫」?
看到张亚勤这个判断,我第一反应是,很准,但也很刺耳。 本地热点里 36 氪那篇访谈提到,他说 AI 不是泡沫,但 AI 公司有泡沫,还提醒具身智能和 AI 创业热潮要更冷静些。这个说法最有价值的地方,不在于唱多或唱空,而是把两个经常被混在一起的问题拆开了。 一个问题是,AI 这件事有没有长期价值。另一个问题是,今天市场上那么多 AI 公司,是不是都配得上它们的估值。 前者我觉得答案很明确。AI 不是一阵风。它已经进入编程、客服、营销、办公、设计、搜索、教育、自动驾驶和机器人这些具体场景,而且不是停留在 PPT 里。你看 OpenAI Codex 这种编程产品的个人用户用量暴涨,看到 Xcode 接入 Gemini,看到国内 GLM、Kimi、DeepSeek、豆包都在围绕代码、Agent、长上下文继续卷,其实就知道,这不是一个靠概念硬撑的赛道。 但后者就没那么舒服了。 很多 AI 公司真正的问题,是把技术趋势的确定性,偷换成了自己商业模式的确定性。AI 会改变很多行业,不等于每个套壳应用都能活下来。大模型能力越来越强,反而会压缩一大批中间层产品的生存空间。今天一个功能还能收费,明天可能就被 Claude、ChatGPT、豆包、Kimi 或者微信小微这种入口直接吞掉。 这就是泡沫最隐蔽的地方。 它不一定表现为产品完全没用。很多产品确实能用,demo 也漂亮,发布会也很燃。但投资人买的不是今天能不能做个演示,而是未来能不能形成稳定收入、持续利润和不可替代的壁垒。这个标准一拉高,很多故事就开始发虚。 我有时候觉得,AI 创业最残酷的一点是,门槛看起来变低了,真正的壁垒反而变高了。以前你做软件,可能靠工程实现和产品体验就能拉开差距。现在模型能力成了公共水位,大家都能调用差不多的底座,差距要么来自私有数据,要么来自真实场景,要么来自分发入口,要么来自组织效率。没有这些东西,只靠 prompt、工作流、插件市场,很容易变成一层薄薄的壳。 具身智能更典型。屏幕里的 Agent 做错了,大不了撤销重来。机器人在现实世界里做错了,摔东西、撞人、损坏设备,成本完全不是一个量级。所以它需要的不只是大模型,还要硬件、供应链、传感器、控制系统、仿真数据、真实场景反馈,以及漫长的量产能力。这个过程很慢,很脏,很不性感。 但资本市场最喜欢性感。 报道里还有一个细节很有意思,张亚勤所在的 AIR 孵化、走出的十家公司,累计融资约 150 亿元,估值约 1500 亿元。这个数字当然说明产业热,也说明一线资源正在快速聚集。可从另一个角度看,它也提醒我们,估值增长已经跑到了商业验证前面。资金并不可怕,可怕的是钱太多以后,大家开始用融资速度替代产品进展,用估值替代用户价值。 所以我对这句话的理解是,AI 的方向没错,但 AI 公司的筛选会非常残酷。 真正值得下注的公司,大概率不是最会喊 AGI、最会包装 Agent、最会把概念讲成未来学的那一批,而是能把模型能力塞进真实业务流程里,持续拿到数据,持续降低成本,持续让用户愿意付钱的那一批。 听着有点没那么热血,但可能更接近现实。 AI 本身像电力,像互联网,像云计算,会长期存在,也会继续改造产业。可历史上每一次基础设施革命,都不是所有站在风口上的公司都能留下来。铁路是真的,铁路公司死了一大片。互联网是真的,门户、团购、O2O 也都经历过大浪淘沙。 回到今天也是一样。 不要因为 AI 公司有泡沫,就否定 AI。也不要因为 AI 有未来,就相信所有 AI 公司都有未来。 这两个判断必须同时成立。 否则就很容易一边错过真正的技术浪潮,一边又被最热闹的故事收割。
Agent 真正的门槛,是入口不再只给人类设计
今天热点里,有几条放在一起看,很明显。Moxt 在讲多 Agent 编排,Claude 进团队协作流,Codex 上了手机,Cloudflare 给 Agent 开了临时部署入口。 单看每一条,都像是一个功能更新。连起来看,像是同一件事,软件世界开始给「机器用户」修门。 以前我们讨论 Agent,最容易盯着模型聪不聪明。会不会写代码,会不会拆任务,会不会自己检查。这个当然重要,但我觉得,真正卡住 Agent 的,往往不是脑子,而是门把手。 人类用系统,可以忍受很多摩擦。登录,验证码,OAuth,MFA,弹窗确认,复制 token,点部署。我们会烦,但能做。Agent 不一样,它一旦被这些面向人类注意力设计的入口卡住,长任务就断了。 所以 Cloudflare 这种临时账号和一行部署命令,重点不是省几步操作,而是承认了一件事,未来系统里会出现一种新用户,它不是人,但它真的要完成工作。 过去 SaaS 做增长,默认是在优化人的漏斗,按钮更醒目,表单更短,文案更清楚。接下来可能要多一层,给 Agent 的路径是不是稳定,可恢复,可授权,可审计。 听起来很工程化,但这可能就是 Agent 从玩具变成基础设施的分界线。 我理解很多人的警惕。让 Agent 更容易部署,更容易进系统,更容易调用工具,听上去就是把风险也放大了。出错时谁负责,权限怎么收回,日志能不能复盘,这些问题不轻。 但反过来看,拒绝给机器修入口,也不会让 Agent 消失。它只会继续假装成人,用浏览器点按钮,用脚本绕流程。那其实更危险。 我觉得更成熟的方向不是禁止 Agent 进入工作流,而是把它当成一种明确的操作者。它可以拿临时身份,被限制时间和权限,留下完整轨迹,在关键节点等人批准。 这有点像早期互联网从「网页给人看」变成「API 给系统用」。API 后来变成了软件商业的骨架。今天的 Agent 入口,可能也会走一遍类似的路。 问题是,谁会先认真设计这套入口? 不是把 ChatGPT 接进产品就完事了,也不是做一个更花哨的聊天框。有价值的地方,可能在那些很无聊的环节,权限、回滚、验证、审计。 大部分人看不到这些,因为它们不性感。但 Agent 能不能真的干活,恰恰取决于这些门。 所以我现在看这类更新,已经不太把它们当成单点新闻了。多 Agent、移动端审批、团队协作、临时部署入口,都是同一个方向的影子,AI 正在被软件世界接纳为一种新的工作主体。 未来我们到底是在使用工具,还是在管理一群系统承认的数字同事?