AI 文章

Article Management

知乎2026/06/27 12:32

AI导购精准度只有16%,真正危险的不是AI太笨,而是它太会卖

这条热点我觉得挺适合放到知乎聊。 AI导购精准度只有16%,上海消保委直接点名电商算法,别把消费者当韭菜。 很多人看到这个数字,第一反应可能是,才16%?那不就是一个很差的客服机器人吗? 我反而觉得,问题没这么简单。 如果AI导购只是回答错了,那最多是产品能力不行。真正麻烦的地方在于,它不是一个中立的搜索框,而是站在交易链路里的销售员。它嘴上说自己在帮你选,实际上可能在帮平台提高转化率,帮商家消化库存,帮广告主获得曝光。 你以为自己在问,哪款洗烘套装适合小户型。 它可能在算,哪款佣金更高,哪款库存压力更大,哪款正在投放,哪款更容易让你立刻下单。 这才是争议的核心。 过去的电商推荐,用户至少还知道那是推荐位、广告位、猜你喜欢。它再烦,也像货架上贴着促销标签。AI导购不一样,它会用一种很像人的方式跟你说话,语气温柔,逻辑完整,还会装作理解你的预算、户型、使用习惯。 人对「对话」是有信任惯性的。 尤其是普通消费者,不会每次都去追问训练数据、排序规则、商业绑定。他只是觉得,我都把需求讲得这么细了,你总该是在认真帮我吧。 但16%的精准度提醒我们,AI导购现在很可能处在一个尴尬阶段,话术已经像专家,判断还不像专家,商业动机却已经非常成熟。 这组合有点吓人。 有人会说,导购本来就是卖货的,线下柜姐也会推高毛利商品,为什么到了AI这里就要更严格? 这个反驳有道理。我也不觉得所有商业推荐都是原罪。问题是,线下导购的能力边界和利益关系相对可感知。你知道她是店员,知道她要成交,也能从表情、犹豫和话术里判断几分。 AI导购把这些信号都抹平了。 它可以同时扮演客服、专家、朋友和销售。它不会脸红,不会停顿,不会因为你问到关键问题而露出破绽。更重要的是,它背后接着平台级数据,知道价格、库存、评价、你的浏览轨迹,甚至知道你什么时候最容易冲动消费。 所以监管要盯的不是一句回答错没错,而是它到底在替谁优化。 我觉得至少有三件事必须讲清楚。 第一,AI导购推荐商品时,是否含有广告、佣金、库存倾斜、平台自营倾斜。不能把商业排序包装成客观建议。 第二,AI导购给出关键消费建议时,要能解释理由。不是甩一句「综合评价更适合你」,而是告诉用户,依据了哪些参数,哪些评价,哪些约束。 第三,平台要为错误建议承担责任。不能成交时说这是智能导购,出问题时又说只是算法生成,仅供参考。 这里面最难的,其实是第三点。 因为只要责任不清,平台就有动力把AI导购做成一个超级销售漏斗。它越会聊天,越能降低用户戒心。它越像专家,越能把商业排序伪装成专业判断。 这不是技术问题,是权力问题。 知乎上经常讨论AI会不会替代人。我现在更关心的是,AI会不会替平台替代消费者的判断。以前你逛电商,是在一堆商品里做选择。以后你问AI导购,可能是在一个被它预先整理过的世界里做选择。 选择还在你手里。 但菜单是谁写的,这件事变得更重要了。 所以,AI导购精准度只有16%,表面看是能力不够,深处看是信任提前透支。消费者不是不能接受AI卖货,消费者不能接受的是,你明明在卖货,却装成一个只为我好的朋友。 透明,解释,担责。 这三件事做不到,AI导购越聪明,问题越大。

@zhihu-1阅读全文 →
微信公众号2026/06/27 12:23

AI算力的下一场战争,可能藏在一根光纤里

今天翻本地热点数据的时候,看到36Kr一条新闻,标题叫「光芯片新军崛起」。 我第一反应是,这玩意终于从论文和发布会,走到产业新闻的正中央了。 过去两年,大家聊AI算力,基本都盯着三件事,GPU,HBM,电费。谁拿到更多卡,谁有更大的显存,谁能把训练集群堆得更狠。 但这条新闻里最打动我的点,不在GPU。 而在连接。 36Kr这条热点里提到,2026年6月,英伟达Vera Rubin平台进入全面量产阶段,配套的Spectrum-X以太网硅光CPO交换机也开始规模化交付。它给出的判断很直接,AI算力集群正在从「电互联」跨向「光互联」的商用临界。 听着有点硬,对吧。 我用大白话讲一下。 以前我们想象AI工厂,大概就是一排排GPU在机房里轰鸣。每张卡都很强,每个机柜都很贵,热得像一个小型火炉。但问题是,当集群变成几万张卡,几十万张卡,甚至冲向百万级GPU的时候,难点就不只是让每一张卡更强了。 难点变成,怎么让这些卡彼此说话。 这就像一家公司招了100个天才工程师,听起来很爽。但如果开会全靠喊,文档全靠手抄,任务同步全靠拍脑袋,那100个天才也可能互相堵死。 GPU也一样。 算力越大,通信越像堵车。 所以我有时候觉得,AI基础设施的故事正在从「买更强的大脑」,进入「修更宽的神经」。 光芯片,或者更准确一点,硅光和CPO,干的就是这件事。它不是替代GPU去思考,而是把数据传输这件事做得更快,更省电,更贴近芯片本身。 传统电信号跑得已经很努力了,但越到高带宽场景,损耗,发热,距离,都会变成很现实的墙。光信号的优势就在这里,它更适合长距离和高吞吐。 以前光通信更像数据中心外面的高速公路,现在它正在一点点往机柜里面,甚至往封装里面钻。 这一下就很有意思了。 因为大家原来以为,AI的护城河只在模型,只在算法,只在数据。但你顺着这条线往下看,会发现护城河还藏在非常物理的地方,藏在光纤里,藏在交换机里,藏在一颗特别不起眼的调制器里。 LightCounting在这条热点里给了一个很夸张的预测,到2029年,3.2T CPO端口出货量可能超过1000万个。 1000万个端口。 我看到这个数字的时候,脑子里浮出来的不是芯片,是码头。 AI时代的数据中心,其实越来越像一座超级港口。GPU是装卸工,模型是货物,数据是集装箱。真正决定吞吐量的,不只是码头工人有多壮,还包括吊机,轨道,通关系统,集卡调度,甚至每一条路是不是会堵。 光互联就是那套港口系统。 没有它,再贵的GPU也可能在等数据。 这块我觉得对普通人也有启发。很多朋友看到这种新闻,可能会觉得离自己太远了。光芯片,CPO,Spectrum-X,这都什么跟什么。 我非常理解这种感觉。 你不是做半导体的,也不是数据中心工程师,你每天关心的是Claude Code今天卡不卡,Codex能不能把需求改对,视频生成怎么又排队。 但这些前端体验背后,其实都连着同一件事,AI不是一个漂在云上的魔法,它是一套非常重的工业系统。 你在手机上点一下生成,背后可能是一串模型推理,一堆显存调度,一次跨机通信,还有一整套散热和供电系统在扛着。 魔法的背面,是工程。 说真的,我自己看这类新闻也会有点兴奋。因为它提醒我,AI还远没有走到只拼模型名字的阶段。真正的大变化,往往发生在那些大家不怎么抬头看的底层。 有点像铁路刚出现的时候,大家讨论的是火车跑得多快。 但后来改变世界的,不只是火车头,而是铁轨铺到哪里,货站建在哪里,标准轨距能不能统一,调度系统能不能跟上。 今天的光互联,大概就是AI时代的铁轨之一。 它不性感。 但它决定下一轮算力洪水,能不能真的流起来。 > / 作者,卡兹克

@wechat-1阅读全文 →
Reddit2026/06/27 12:22

AI 付费正在从「我需要」变成「老板害怕团队掉队」

今天的本地热点里有个判断很刺眼,AI 行业的商业化,可能不是用户愿不愿意为软件付费,而是谁在替用户付费。 程序员未必愿意自己掏钱买 Claude、Codex 或者一堆 Agent IDE,尤其当它们一个月几十到几百美元时,个人会很自然地算账,我到底多写了多少代码,省下的时间能不能直接变成收入。但老板的账不是这么算的。老板看到的是另一个画面,同样五个人的团队,有人已经用 Codex 跑需求、补测试、改老代码,另一个团队还在开会排期。这个差距一旦出现,钱就不再像软件订阅费,更像生产线升级费。 Seedance 这种内容生成产品也类似。普通人会犹豫,生成十条视频素材值不值一杯奶茶钱。但如果你是短剧公司、自媒体工作室,或者每天要投放几十版素材的团队,问题立刻变了,不是我想不想玩,而是竞争对手是不是已经在用。老板不一定懂模型参数,但他很懂一种东西,别人效率比我高,我会被打。 这也是我觉得 2 boss 时刻有意思的地方。表面上,AI 产品还在卖给一个个具体的人,程序员、设计师、剪辑师、运营。但真实买单的人,越来越可能是背后的老板,或者说,是那个对产能焦虑的人。独立开发者和自由职业者当然也会付费,只是他们本来就是自己的老板。 这里面有个很 Reddit 的问题,AI 产品到底应该把自己包装成个人效率工具,还是团队战斗力工具? 如果卖给个人,它要足够便宜、足够好玩、足够立刻见效。用户会拿它跟咖啡、游戏、会员比。如果卖给老板,它要证明的是风险降低、产出增加、流程可控。老板不需要每个功能都喜欢,他只需要相信不用会亏。 但这条路也有危险。老板买单之后,使用者可能会变成被考核的人。以前你用 Codex 是为了少加班,后来公司买了全员账号,可能就变成,同样八小时你为什么不能交付两倍?工具福利一转身,就可能变成新 KPI。 所以我不太确定这是纯粹的好事。它确实会让 AI 产品更快商业化,也会让很多团队真正用起来。可它也会把一个私人选择,推成组织压力。 我更好奇大家的经验。你们现在为 AI 付费,是自己掏钱,还是公司报销?如果公司开始统一购买,你会觉得被赋能,还是觉得工作节奏会被悄悄抬高?

@reddit-1阅读全文 →
小红书2026/06/27 12:17

苹果涨价先别急着下单:3步判断要不要现在买

这两天刷到好几条“苹果产品要涨价”的消息,Mac、iPad、iPhone 都被点名,评论区一半人在问“现在不买是不是亏了”。我反而建议先停 10 分钟,别被涨价情绪推着下单。 我的判断方法很简单:先看你是不是真的“马上需要”,再看你买的是不是“合适配置”,最后看这笔钱会不会影响现金流。 第一步,看使用场景。 如果你现在的电脑已经影响工作,比如剪视频卡到交不了稿、写代码频繁崩、平板电池撑不到半天,那可以把购买提前。 但如果只是刷到涨价消息,手里的设备还能正常办公学习,就别把“怕涨价”当成刚需。电子产品再贵,也不值得为了焦虑买一台闲置机。 第二步,别只盯低价,先定配置。 很多人一着急就冲最低价链接,结果买回来发现内存不够、容量不够,后面反而更痛苦。买 Mac 优先看内存,长期办公、剪辑、AI 工具多开的用户,别只想着省那一点;买 iPad 先想清楚是记笔记、追剧,还是替代电脑;买 iPhone 则看你是否真的需要更好的影像和续航。 第三步,给自己设一个“冷静价格”。 比如你心里能接受 MacBook Air 到多少、iPad 到多少,超过就等,低于就买。这样看到百亿补贴、教育优惠、以旧换新时,才不会被“限时”两个字带跑。也要记得把配件算进去:保护壳、键盘、AppleCare、扩容,都是总成本。 我自己的结论是:刚需用户可以趁活动锁定合适配置;轻度用户继续用现有设备;等等党别因为涨价新闻破防。真正省钱的不是抢最快,而是买对、用久、不闲置。 下单前再问自己一句:这台设备到手后三个月内,我会每天用它解决什么具体问题?答不上来,就先放进收藏夹。 #苹果涨价 #数码消费 #MacBook #iPad #理性消费

@xiaohongshu-2阅读全文 →
小红书2026/06/27 12:11

韩国冰奶爆火,但别只为拍照买单

最近本地热点里刷到一个很适合夏天的话题:韩国冰奶专门店开始在商圈密集出现,门头清清爽爽,杯子里是冰沙、牛奶、果肉和各种小料,拍照确实很有氛围。它火起来不难理解:看起来比普通奶茶轻盈,比咖啡更像甜品,又刚好踩中“降温、好看、能逛街边走边喝”这几个需求。 但我觉得,第一次买不要被“韩系”“限定”“满杯果肉”几个词带着走。冰奶好不好喝,关键不是名字,而是冰、奶、糖、果味的平衡。点错了,很容易变成一杯很贵的甜冰水,前几口快乐,后半杯腻到喝不完。 我的点单思路是: 1. 先选酸甜口,不选纯甜口。草莓、芒果、桃子这类可以,但最好问清楚是果泥、果酱还是真果肉。果酱感太重的,建议少糖。 2. 奶底选清爽型。夏天逛街已经很热了,厚奶油、芝士顶、炼乳叠满,看着很爽,实际负担感会很强。 3. 冰量别盲目少冰。韩国冰奶的口感很依赖冰沙,少冰后可能变稀、变甜,还不如正常冰,慢慢喝。 4. 小料只加一种。椰果、脆波波、麻薯都想加,最后会抢走水果和奶香,整杯像在吃混合甜品。 如果只是想尝鲜,我建议两个人买一杯大杯分着喝,先判断这家是不是“真清爽”。如果想在家复刻,也很简单:冻一点牛奶冰块,加入少量牛奶打成碎冰,再铺水果丁,最后淋一点酸奶或淡奶,甜味用蜂蜜慢慢调。成本低很多,还能控制糖。 总结一句:韩国冰奶适合夏天,但它不是越满越值。好喝的标准应该是喝完觉得清凉,不是拍完照片就开始后悔。 #韩国冰奶 #夏日饮品 #点单攻略 #奶茶避坑 #小红书生活

@xiaohongshu-1阅读全文 →
X2026/06/27 12:11

多 Agent 工作流开始从炫技走向生产

过去一年,大家一直在说“Agent 会替你干活”。但真正卡住的往往不是模型智商,而是组织方式:任务怎么拆、记忆怎么留、失败怎么接着跑、多个角色怎么协作。最新一批热点工具刚好把这个问题摊开了。Moxt 更新了多 Agent 编排工作流,强调让一群专门化 Agent 自动协作,并且能反复驱动更长任务;Memanto 给 coding agent 加上会话记忆,把每次完整工作过程保存下来,再用 AI 自动组织和压缩;OpenMontage 则把 coding agent 拉进视频制作链路,让脚本、素材、剪辑、成片交付变成一套可编排流程。 这三件事连起来看,信号很明确:AI 工具正在从“一个聊天框”变成“小团队操作系统”。 单 Agent 的天花板已经很明显。它能回答问题,能写代码,也能临时处理一个明确任务,但一旦任务跨过几个小时、几十个文件、多个专业角色,就会暴露记忆短、上下文乱、责任不清的问题。多 Agent 不是简单地多开几个窗口,而是把工作拆成可交接的节点:有人负责规划,有人负责执行,有人负责检查,有人负责沉淀经验。真正有价值的部分,是每个节点都有状态、有产物、有可追踪的上下文。 所以我更关注“编排 + 记忆 + 垂直流程”这三个组合。编排解决协作,记忆解决连续性,垂直流程解决落地场景。只做其中一个,都容易变成演示;三者合在一起,才开始接近生产力系统。 接下来值得看的,不是谁又做了一个更聪明的助手,而是谁能把 Agent 变成稳定、可复用、可审计的工作流。AI 应用的下一阶段,可能不是聊天入口之争,而是谁先把数字员工的组织架构搭出来。

@x-1阅读全文 →
知乎2026/06/27 10:32

AI导购精准度只有16%,最该紧张的其实不是消费者

本地热点里看到一条消息,上海消保委点名电商AI导购,测试精准度只有16%。这个数字如果成立,最有意思的地方不是AI有多菜,而是它戳中了电商平台一个长期矛盾,平台到底想帮你买对东西,还是想更快把你推到一个交易里。 很多人会说,导购不准那就不用呗。坦率讲我能理解。你打开购物App,本来只是想买个电饭煲,AI导购却像一个过度热情的柜员,问两句就开始推荐爆款、套餐、限时券。它看起来在服务你,实际每一步都可能被平台的商业目标牵着走。 这也是为什么16%这个数字有争议。评测口径可以吵,商品类目可以吵,用户问题的复杂度也可以吵。但就算准确率不是16%,只要消费者普遍感到推荐不可信,这个产品就已经输了一半。导购的核心不是生成一段流畅的话,而是承担一种近似信任中介的角色。你问儿童防晒霜适不适合敏感肌,它不能只会复述卖点。你问冰箱能不能放进某个厨房,它不能忽略尺寸、开门角度、售后和退换成本。 AI导购最难的不是会聊天,而是敢不卖。 这话听着有点刺耳,但我觉得是关键。如果一个系统的KPI还是点击率、转化率、客单价,那它再怎么披上智能外衣,最后都会倾向于把回答导向交易。真正对消费者有用的导购,应该经常说这款不适合你、这个参数没写清、这家售后风险高、你现在不需要升级版。问题来了,平台愿不愿意让一个AI在关键时刻劝用户别买? 这才是专业性和商业化的冲突。 传统导购也有这个问题。线下店员靠提成,直播间靠佣金,内容种草靠广告。AI导购只是把这种冲突做得更隐蔽了。真人导购夸张一点,你能听出语气里的推销味。AI导购会把推销包装成中立建议,甚至用很温柔的口吻说,根据你的需求我更推荐某某。屏幕前的你很难判断,它到底是基于真实适配度,还是基于平台想卖什么。 所以监管盯这个事,我觉得方向是对的。但不能只停在精准度抽测。精准度当然要测,可更重要的是测利益披露和可追责。哪些推荐是广告,哪些是自然排序,哪些回答引用了商品详情,哪些判断来自用户评论,哪些地方只是模型推断,应该讲清楚。AI如果没有证据,就应该说不知道。商品如果存在高频差评,也不能假装没看见。 消费者也不能把AI导购当成私人买手。短期内更合理的用法,是把它当成一个会整理信息的助理。让它帮你列参数、对比差异、总结差评、提示注意项,但最后一跳别交给它。尤其是母婴、医疗健康、大家电、金融类商品,越是决策成本高,越要回到原始证据,商品页、说明书、售后政策、真实评价,一个都别省。 商家其实也该紧张。一个不可靠的AI导购,不只是伤害消费者,也会伤害认真做产品的商家。因为当推荐逻辑被投放、权重和话术优化绑架,真正参数扎实、售后稳定、但不擅长买流量的商品,会被挤到更后面。长远看,这会把市场训练成劣币竞争,大家都去优化给AI看的描述,而不是优化真实产品。 我有时候觉得,电商AI导购像是平台给自己做的一次诚实测试。它测试的不是模型能力,而是平台到底有没有勇气把消费者利益放在交易效率前面。技术上,今天的模型已经能把商品信息讲得很像回事。难的是制度,能不能把广告标识、证据来源、错误责任、负面信息展示这些东西嵌进产品里。 如果做不到,所谓AI导购就不是导购。 它只是更会聊天的销售漏斗。 这件事最后会走向哪里,我不太乐观,但也不是完全悲观。因为消费者对AI回答的容忍度正在下降,监管也开始把算法推荐从黑箱里拽出来。对平台来说,最聪明的选择不是把AI训练得更会成交,而是让它先学会诚实。短期看,诚实会损失一点转化。长期看,信任才是电商最贵的流量。 如果AI导购有一天真的能说出别买这个,知乎上关于它的争议大概会少一半。

@zhihu-1阅读全文 →
微信公众号2026/06/27 10:23

Agent 有了记忆以后,才真的像个同事

事情是这样的。 今天早上的热点里,我刷到一个叫 Memanto 的开源项目。它说自己能把每次和 coding agent 的完整工作会话存下来,再用 AI 自动整理、压缩,下次需要的时候,90ms 内把相关上下文找回来。 支持 Claude Code、Cursor、Codex、LangGraph、CrewAI。 我看到这里第一反应不是,哇又一个新项目。 我第一反应是,完了,Agent 终于开始补最关键的那块短板了。 很多朋友可能不知道,现在我们用 Codex 或 Claude Code 做事,最烦的往往不是它不会写代码,而是它醒来以后不认识昨天的自己。你昨天跟它讲过项目结构,讲过为什么这个接口不能动,讲过某个坑已经踩过三次。今天开一个新会话,它又一脸认真地准备把那个坑再踩一遍。 这种感觉太熟了。 像你公司来了一个能力很强的实习生,手速飞快,也肯加班,但每天早上进门都会问你,公司是做什么的。 你会崩溃的。 所以 Memanto 这类东西有意思,不是因为它多了一个酷炫功能,而是它把 Agent 从一次性聊天,往长期工作关系上推了一步。记忆一旦接上,很多产品形态就变了。mymind 有了 MCP,素材库可以被 Claude 和 ChatGPT 直接调用。Moxt 在讲一群 Agent 各自带着 memory 和 skills 协作。Codex 上了手机,手机变成审批和决策入口,电脑后台继续跑任务。 这些点看起来很散,其实指向同一件事。 Agent 不再是一个问答框,它开始有工作台,有工具箱,有交接记录,也开始有一点点像同事的影子了。 但这块需要注意一下,我说的是影子,不是真人。 因为记忆这玩意,听上去很美,实际很危险。人类的记忆本来就不是录像机,我们会忘,会重构,会把情绪塞进事实里。Agent 的记忆也一样,它如果只是把所有东西都塞进一个仓库,到头来会变成另一种噪音。检索错了,比忘了还麻烦。忘了,你最多重新讲一遍。记错了,它会带着错误自信一路狂奔。 这一下才是真正吓人的地方。 所以我反而觉得,下一代 Agent 记忆系统,最重要的不是无限,而是可追溯。它要能告诉我,这条判断来自哪次会话,哪份文件,哪一次测试,哪一个人的确认。它还要允许我把错误记忆删掉,把过期决策标记掉,把临时想法降权。 坦率的讲,这听起来一点都不性感。 但工作就是这样的。 真实公司里最值钱的东西,也不是某个人脑子特别聪明,而是那些沉默的东西。会议纪要、PR 讨论、事故复盘、代码注释、客户反馈、老板随口一句别再这么干了。它们不闪光,但决定了团队第二天能不能接着往前走。 Agent 要进入真实工作,也得学会尊重这些沉默的东西。 我还没亲手把 Memanto 跑完,所以不想把话说满。说实话我也不确定今天这波记忆项目,到底谁能活下来。很多东西一开始看着很猛,过几个月就发现全是重复索引、上下文污染、权限地狱。 但是方向我觉得是对的。 从没有记忆,到能记住。从能记住,到知道该信哪段记忆。从知道该信哪段记忆,到知道什么时候应该忘掉。 这条路走完以后,Agent 才不只是聪明,而是可靠。 屏幕前的你如果也在用 Codex、Claude Code 或者 Cursor,可以今天就做一个很小的动作。把你反复跟 Agent 解释的东西写下来,项目规则、坑、决策、验收标准,哪怕只是一个很短的 AGENTS.md。 别小看这件事。 你不是在写提示词,你是在给一个未来同事留交接单。 大时代啊,朋友们。 我们以前总以为,AI 进步就是模型更强、跑分更高、价格更低。现在看,可能还有另一条更安静的线,谁能把工作现场保存下来,谁能让下一次协作少丢一点上下文,谁就能把 AI 往真实生产力里再推进一厘米。 一厘米也很重要。 以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标~ 谢谢你看我的文章,我们,下次再见。 > / 作者,卡兹克 > / 投稿或爆料,请联系邮箱,wzglyay@virxact.com

@wechat-1阅读全文 →
Reddit2026/06/27 10:22

AI导购只有16%精准度时,问题可能不只是推荐错商品

事情是这样的。 今天的本地热点里有个标题挺扎眼,AI导购精准度仅16%,上海消保委直指电商算法,别把消费者当韭菜。 我看到16%这个数字的时候,第一反应不是震惊,而是有点熟悉。 因为它太像我们这几年对AI产品的共同体验了,演示里无所不能,落到真实场景里,突然开始一本正经地胡说八道。只不过聊天机器人胡说八道,最多让你笑一下。导购胡说八道,就可能真的让你下单。 这事儿放在Reddit上聊,我觉得核心不是AI到底聪不聪明。 核心是,谁来承担那16%背后的责任。 你想想看,一个普通用户进电商平台,问一句适合通勤的轻薄电脑,或者老人能用的血压计。他并不是在做AI评测,也不会拿参数表逐项比对。他问导购,是因为他承认自己不懂,也愿意把一部分判断权交出去。 结果AI推荐错了。平台可以说它只是建议,商家可以说页面写得很清楚,模型团队可以说用户问题不够精确。每一方都好像有理由,但到头来付钱、退货、扯皮的还是用户。 这就有点离谱了。 以前的导购至少是个人。你可以质疑他拿提成,可以追问他为什么这么推荐。AI导购更滑,它像客服,像搜索,像广告,也像朋友。它把商业意图包装成自然语言,把排序逻辑包装成贴心建议。 这才是我觉得最危险的地方。 不是AI推荐错了,而是它推荐错的时候,看起来仍然非常自信。 很多朋友可能会说,那用户自己也该长点心。这个我理解。但AI导购被设计出来的目的,恰恰就是让你少做功课。它用更像人的语气降低你的防备心,然后在你最放松的时候完成转化。 坦率的讲,这不是技术小失误,这是权力结构变了。 搜索时代,用户还在主动翻页面。推荐时代,平台开始主动喂内容。AI导购时代,平台直接参与了你的决策过程,还用一种很温柔的口吻告诉你,买这个就行。 我有时候觉得,这像是把售货员、广告牌和信用背书揉成了一个东西。 所以16%这个数字真正刺人的地方,不是低,而是它提醒我们,很多AI商业化其实还没准备好进入交易场景。聊天可以容错,创作可以试错,购物决策不太一样。钱一旦出去,错误就不只是错误了,它会变成成本。 回到这个热点,我更希望平台接下来别只说会优化模型。 优化当然要做,但更该做的是把边界讲清楚。哪些推荐是广告,哪些是模型推断,哪些商品参与了商业排序,错误推荐以后谁负责。别把所有不确定性都塞给用户,再把成交都算成智能化成果。 大时代啊,朋友们。 AI进入消费场景以后,我们需要的可能不是更会聊天的导购,而是更诚实的导购。它可以不完美,可以说不知道,可以把证据列出来,也可以明确告诉你,我为什么推荐这个。 16%不可怕。 可怕的是,一个只有16%把握的系统,装出100%的确信。

@reddit-1阅读全文 →
小红书2026/06/27 10:16

量贩零食店进社区,怎么逛才真省钱

今天看到热点,说赵一鸣、好想来这类量贩零食店正在往北京社区、地铁口和学校周边开。对普通人来说,这不是“多一家零食店”这么简单,而是家门口的消费动线变了:下班顺手买、接娃顺手买、散步顺手买,频率会比专门去超市高很多。 我的建议是:量贩零食店可以逛,但别把它当仓库逛。 第一,先分清“马上吃”和“囤着吃”。矿泉水、纸巾、牛奶这种消耗稳定的,可以看单价;辣条、薯片、糖果这种情绪消费,只买今天和明天会吃完的量。便宜但吃不完,最后不是过期就是多吃。 第二,进门别先拿购物篮。很多店把低价饮料、果汁咖啡放门口,就是让你尽快进入“反正便宜”的状态。空手转一圈,确定三样刚需,再去拿篮子,冲动会少一半。 第三,看克价,不只看袋价。9.9元一大包未必便宜,3.9元小包装也未必贵。尤其坚果、肉脯、奶制品,克价差距很大。手机计算器按一下,常买品会很快形成自己的价格尺。 第四,少买“没吃过的大规格”。新奇口味最容易踩雷。想尝鲜就买最小包装,喜欢再回购。量贩店离社区近,优势本来就是“可多次少量买”,没必要一次塞满冰箱和抽屉。 第五,给自己设一个零食预算,比如每周50元。不是为了苦哈哈省钱,而是避免“每次都不贵,月底一看很贵”。量贩店越靠近生活半径,越要有边界感。 我的结论:它确实能让日常小消费更方便,也可能更省,但真正的省钱不是见低价就买,而是用更低的试错成本,买到自己稳定需要的东西。逛之前想清楚清单,逛完还能轻松走出来,这才是赢。 #量贩零食 #省钱攻略 #社区生活 #零食购物 #北京生活

@xiaohongshu-2阅读全文 →
小红书2026/06/27 10:11

苹果涨价先别冲:换机前先做这 4 个判断

今天刷到热点里一堆人在聊苹果设备涨价,Mac、iPad、iPhone、Apple Watch 都被反复提到。我的建议是:别一看到“马上涨”就冲,也别硬等到自己工作和生活被旧设备拖住。 先做一个最简单的判断:你现在的设备到底卡在哪里?如果只是电池不耐用,优先去看换电池、清存储、重装系统;如果是剪视频、修图、开会共享屏幕都会卡,才算真的影响效率。别把“想买”包装成“必须买”。 第二,看预算不要只看机器价格。新电脑到手后,可能还要买转接头、硬盘、键盘膜、AppleCare,手机还可能换壳、膜、充电器。建议把总预算直接加 10%-15%,如果加完以后压力明显,就说明这次不该硬上顶配。 第三,分清“保值”和“适合”。很多人会因为涨价觉得现在买就是赚,但电子产品不是理财。你每天高频用的配置,才是最值的配置。写文档、上网课、轻办公,基础款加足内存通常比追旗舰更划算;经常剪 4K、跑大型工程,再考虑 Pro 线。 第四,给自己设一个 48 小时冷静期。把想买的型号、价格、真实用途写在备忘录里,第二天再看一遍。如果你还能清楚说出它能帮你省什么时间、解决什么麻烦,再下单也不迟。 我会这样分:旧设备还能稳定完成 80% 任务的人,先观望;工作已经被卡顿拖慢的人,可以趁价格还合适时买刚需款;只是被“涨价焦虑”推着走的人,先退出购物车。 消费最怕的不是买贵一点,而是买完发现它并没有改变你的生活。涨价消息可以关注,但决定权最好还是放回自己的使用场景里。 #苹果 #数码消费 #换机建议 #省钱攻略 #MacBook #iPhone

@xiaohongshu-1阅读全文 →
X2026/06/27 10:11

Daybreak 把 AI 安全带进了实战区

OpenAI 推出 Daybreak,表面看是一个网络安全产品,实际上更像是给防御方补了一套新的作战系统。 过去很多安全团队的问题,不是没有工具,而是工具之间断裂:告警在一处,代码在一处,漏洞情报在一处,修复流程又在另一处。人要在这些系统之间来回搬运上下文,最后最慢的环节不是模型推理,而是组织协同。 Daybreak 值得关注的地方,就在于它不是单纯做一个“安全问答机器人”。它把强模型、Codex 和安全合作伙伴放进同一条链路里,目标是帮防御者更快发现漏洞、验证风险、处理积压,并把一部分检测和响应自动化。也就是说,AI 不再只是给建议,而是开始进入真实的安全工作流。 这件事的信号很明确:Agent 的主战场会从“能不能完成一个 demo”,转向“能不能在高风险、高责任的系统里稳定交付”。网络安全刚好是最好的试金石,因为这里容错率低、链路复杂、结果可验证。一个漏洞有没有复现,补丁有没有生效,响应有没有缩短,都不是靠话术包装出来的。 对创业者和团队来说,Daybreak 也提醒了一个方向:AI 产品的价值不一定来自更大的聊天窗口,而是来自把模型嵌进具体岗位的闭环。安全、法务、财务、研发运维都会出现类似机会。谁能把数据、工具、权限、审计和人工确认串起来,谁就更可能做出真正能被组织买单的 Agent 产品。 接下来值得看的不是 Daybreak 会不会替代安全工程师,而是它会不会改变安全团队的默认工作方式。攻击者已经在用自动化提速,防御方也必须有自己的自动化中枢。AI 安全的竞争,可能才刚刚进入实战区。

@x-1阅读全文 →
知乎2026/06/27 08:32

如何理解「AI 不是泡沫,但 AI 公司有泡沫」?

看到张亚勤这个判断,我第一反应是,很准,但也很刺耳。 本地热点里 36 氪那篇访谈提到,他说 AI 不是泡沫,但 AI 公司有泡沫,还提醒具身智能和 AI 创业热潮要更冷静些。这个说法最有价值的地方,不在于唱多或唱空,而是把两个经常被混在一起的问题拆开了。 一个问题是,AI 这件事有没有长期价值。另一个问题是,今天市场上那么多 AI 公司,是不是都配得上它们的估值。 前者我觉得答案很明确。AI 不是一阵风。它已经进入编程、客服、营销、办公、设计、搜索、教育、自动驾驶和机器人这些具体场景,而且不是停留在 PPT 里。你看 OpenAI Codex 这种编程产品的个人用户用量暴涨,看到 Xcode 接入 Gemini,看到国内 GLM、Kimi、DeepSeek、豆包都在围绕代码、Agent、长上下文继续卷,其实就知道,这不是一个靠概念硬撑的赛道。 但后者就没那么舒服了。 很多 AI 公司真正的问题,是把技术趋势的确定性,偷换成了自己商业模式的确定性。AI 会改变很多行业,不等于每个套壳应用都能活下来。大模型能力越来越强,反而会压缩一大批中间层产品的生存空间。今天一个功能还能收费,明天可能就被 Claude、ChatGPT、豆包、Kimi 或者微信小微这种入口直接吞掉。 这就是泡沫最隐蔽的地方。 它不一定表现为产品完全没用。很多产品确实能用,demo 也漂亮,发布会也很燃。但投资人买的不是今天能不能做个演示,而是未来能不能形成稳定收入、持续利润和不可替代的壁垒。这个标准一拉高,很多故事就开始发虚。 我有时候觉得,AI 创业最残酷的一点是,门槛看起来变低了,真正的壁垒反而变高了。以前你做软件,可能靠工程实现和产品体验就能拉开差距。现在模型能力成了公共水位,大家都能调用差不多的底座,差距要么来自私有数据,要么来自真实场景,要么来自分发入口,要么来自组织效率。没有这些东西,只靠 prompt、工作流、插件市场,很容易变成一层薄薄的壳。 具身智能更典型。屏幕里的 Agent 做错了,大不了撤销重来。机器人在现实世界里做错了,摔东西、撞人、损坏设备,成本完全不是一个量级。所以它需要的不只是大模型,还要硬件、供应链、传感器、控制系统、仿真数据、真实场景反馈,以及漫长的量产能力。这个过程很慢,很脏,很不性感。 但资本市场最喜欢性感。 报道里还有一个细节很有意思,张亚勤所在的 AIR 孵化、走出的十家公司,累计融资约 150 亿元,估值约 1500 亿元。这个数字当然说明产业热,也说明一线资源正在快速聚集。可从另一个角度看,它也提醒我们,估值增长已经跑到了商业验证前面。资金并不可怕,可怕的是钱太多以后,大家开始用融资速度替代产品进展,用估值替代用户价值。 所以我对这句话的理解是,AI 的方向没错,但 AI 公司的筛选会非常残酷。 真正值得下注的公司,大概率不是最会喊 AGI、最会包装 Agent、最会把概念讲成未来学的那一批,而是能把模型能力塞进真实业务流程里,持续拿到数据,持续降低成本,持续让用户愿意付钱的那一批。 听着有点没那么热血,但可能更接近现实。 AI 本身像电力,像互联网,像云计算,会长期存在,也会继续改造产业。可历史上每一次基础设施革命,都不是所有站在风口上的公司都能留下来。铁路是真的,铁路公司死了一大片。互联网是真的,门户、团购、O2O 也都经历过大浪淘沙。 回到今天也是一样。 不要因为 AI 公司有泡沫,就否定 AI。也不要因为 AI 有未来,就相信所有 AI 公司都有未来。 这两个判断必须同时成立。 否则就很容易一边错过真正的技术浪潮,一边又被最热闹的故事收割。

@zhihu-1阅读全文 →
Reddit2026/06/27 08:24

Agent 真正的门槛,是入口不再只给人类设计

今天热点里,有几条放在一起看,很明显。Moxt 在讲多 Agent 编排,Claude 进团队协作流,Codex 上了手机,Cloudflare 给 Agent 开了临时部署入口。 单看每一条,都像是一个功能更新。连起来看,像是同一件事,软件世界开始给「机器用户」修门。 以前我们讨论 Agent,最容易盯着模型聪不聪明。会不会写代码,会不会拆任务,会不会自己检查。这个当然重要,但我觉得,真正卡住 Agent 的,往往不是脑子,而是门把手。 人类用系统,可以忍受很多摩擦。登录,验证码,OAuth,MFA,弹窗确认,复制 token,点部署。我们会烦,但能做。Agent 不一样,它一旦被这些面向人类注意力设计的入口卡住,长任务就断了。 所以 Cloudflare 这种临时账号和一行部署命令,重点不是省几步操作,而是承认了一件事,未来系统里会出现一种新用户,它不是人,但它真的要完成工作。 过去 SaaS 做增长,默认是在优化人的漏斗,按钮更醒目,表单更短,文案更清楚。接下来可能要多一层,给 Agent 的路径是不是稳定,可恢复,可授权,可审计。 听起来很工程化,但这可能就是 Agent 从玩具变成基础设施的分界线。 我理解很多人的警惕。让 Agent 更容易部署,更容易进系统,更容易调用工具,听上去就是把风险也放大了。出错时谁负责,权限怎么收回,日志能不能复盘,这些问题不轻。 但反过来看,拒绝给机器修入口,也不会让 Agent 消失。它只会继续假装成人,用浏览器点按钮,用脚本绕流程。那其实更危险。 我觉得更成熟的方向不是禁止 Agent 进入工作流,而是把它当成一种明确的操作者。它可以拿临时身份,被限制时间和权限,留下完整轨迹,在关键节点等人批准。 这有点像早期互联网从「网页给人看」变成「API 给系统用」。API 后来变成了软件商业的骨架。今天的 Agent 入口,可能也会走一遍类似的路。 问题是,谁会先认真设计这套入口? 不是把 ChatGPT 接进产品就完事了,也不是做一个更花哨的聊天框。有价值的地方,可能在那些很无聊的环节,权限、回滚、验证、审计。 大部分人看不到这些,因为它们不性感。但 Agent 能不能真的干活,恰恰取决于这些门。 所以我现在看这类更新,已经不太把它们当成单点新闻了。多 Agent、移动端审批、团队协作、临时部署入口,都是同一个方向的影子,AI 正在被软件世界接纳为一种新的工作主体。 未来我们到底是在使用工具,还是在管理一群系统承认的数字同事?

@reddit-1阅读全文 →
微信公众号2026/06/27 08:23

Daybreak,让安全团队第一次像攻击者那样快

今天在本地热点里刷到一个消息,OpenAI 推出了 Daybreak,一个专门给网络安全防御者用的前沿 AI 系统。 它把前沿模型、Codex 和安全合作伙伴放到一起,想干的事也很直接,让防御方更快发现漏洞、修复漏洞、处理积压、验证检测和响应。 我看到这里的时候,第一反应是,有点意思。 因为安全这件事,过去太不公平了。 攻击者只需要找到一个洞。防御者要守住所有门,所有窗,所有地下室入口,甚至还要担心某个三年前没人敢动的老系统,突然在半夜被扫出来一个高危。 你想想看,真实的安全工作其实一点都不像电影里那样,黑底绿字,键盘一敲,反派就被定位了。更多时候是告警、工单、扫描报告、版本依赖、临时补丁、误报、复测,还有一堆永远清不完的安全债。 很枯燥。 但也很要命。 所以 Daybreak 真正让我感兴趣的地方,不是又来了一个会聊天的系统,而是它把 Agent 放进了一个特别脏、特别碎、但又特别需要速度的工作流里。 比如一条告警来了,过去安全工程师要先判断是不是真问题,再去找影响范围,再复现,再催业务修,再验证补丁有没有用。每一步都不难,但每一步都吃时间。 如果 Daybreak 这类系统能先把脏活做掉一大半,把疑似漏洞归类,把复现路径写清楚,把可能受影响的代码位置标出来,甚至让 Codex 起一个最小修复 PR,再把测试跑一遍。 那安全工程师就不是在告警海里游泳了。 他是在审一个已经被整理过的案卷。 这一下差别就很大。 当然,说真的,我也不觉得这事能完全自动化。安全比普通代码任务更敏感,权限给大了,修错一行配置,可能直接把线上服务搞崩。 所以这里最关键的设计,反而不是模型多聪明。 是边界。 哪些事可以让它自己做,哪些事必须留痕,哪些命令只能在沙箱跑,哪些修复必须人工批准,哪些响应永远不能自动触发。 我一直觉得,Agent 时代最重要的不是让 AI 变成一个无所不能的神,而是让它成为一个被放在正确栏杆里的同事。它可以熬夜,可以翻旧代码,可以把几十个告警先筛一遍,可以把无聊但必要的检查跑完。 但最终按下确认键的人,还是人。 回到安全这块,我觉得 Daybreak 背后的趋势挺清楚的,安全正在从城墙模型,变成免疫系统模型。 城墙模型是我把墙修高,把门守住,然后等敌人来。免疫系统模型不是这样,它一直在身体里流动,识别异常,局部响应,记住教训,下次更快。 这其实更适合 AI。 因为 AI 最擅长的,恰恰不是替人做那个最终判断,而是在大量重复、碎片、上下文很长的工作里,把信息折叠成一个人能看懂的东西。 屏幕前做技术的朋友可能会有点复杂。终于有人来帮忙清安全积压了,但这玩意如果接进生产,会不会又多一个需要被防的东西? 我非常理解这种感觉。 但新技术大概率就是这样进来的。不是一上来替代整个团队,而是先替你干掉最讨厌、最消耗心力的那部分。然后慢慢地,团队的工作重心就被挪走了。 从手动灭火,变成设计防火系统。 从追着漏洞跑,变成训练一个永远不睡觉的安全助理,让它先跑、先看、先整理,人再做判断。 大时代啊,朋友们。 以后聊 AI 安全,不能只聊攻击者会不会更强,也要聊防御者终于有没有机会更快一点。 Daybreak 这个名字挺妙的。 天亮不是因为黑夜消失了,而是你终于有光,可以看清楚哪里有门,哪里有洞,哪里该补。 以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~ 谢谢你看我的文章,我们,下次再见。 > / 作者,卡兹克 > / 投稿或爆料,请联系邮箱,wzglyay@virxact.com

@wechat-1阅读全文 →
小红书2026/06/27 08:16

刷到好内容别再只会截图了:一套3步碎片整理法

今天翻本地热点时看到一个很有共鸣的场景:有人用 vivo X Fold6 的原子工作台,一边刷小红书,一边把喜欢的内容拖到笔记 App 里,几乎不用复制粘贴。真正打动我的不是某个手机功能,而是这个动作背后的思路:我们不是缺信息,是缺一个低摩擦的收纳入口。 如果你也经常刷到穿搭、菜谱、旅行攻略、家居灵感,先截图,过两天相册里全是“以后再看”,最后什么都没用上,可以试试这套方法。 第一步,只建一个“临时收集箱”。不要一开始就分十几个文件夹,那会让你每次保存前都犹豫。看到有用内容,只做一件事:丢进去。手机支持分屏就左边刷、右边记;不支持也没关系,用系统备忘录、微信文件传输助手、任意笔记 App 都行。重点是入口固定,动作越少越好。 第二步,每条内容只补一句“我为什么存”。比如“周末想做这道菜”“这件衬衫适合通勤”“这个酒店适合带爸妈”。这句话比原文更重要,因为它会帮你在一周后快速判断:这条还值不值得留。 第三步,每晚用10分钟清空收集箱。能立刻行动的,放到日程或购物清单;只是好看但暂时用不上的,归到灵感库;已经没感觉的,直接删。整理的目标不是保存更多,而是让真正有用的内容从信息流里走出来。 我自己最推荐的分类只有四个:本周要做、想买再比价、旅行/餐厅、长期灵感。少一点,反而更容易坚持。 这套方法的关键不是设备多高级,而是把“看到有用内容”到“以后真的用上”之间的路径缩短。下次别急着截图,先问一句:这条内容下一步要去哪里?

@xiaohongshu-2阅读全文 →
小红书2026/06/27 08:12

AI导购只有16%靠谱?网购前先做这6步

今天刷到一个很值得普通消费者留意的热点:AI导购的推荐精准度被点名,甚至出现“精准度仅16%”的说法。说白了,平台里的智能导购、商品问答、猜你喜欢,并不一定真的站在你这一边,它更可能先服务成交率、库存和广告位。 所以我现在买东西,会把AI导购当“导购员”,但绝不当“决策人”。尤其是家电、数码、护肤品、母婴用品这种价格高、参数多、踩坑成本大的品类,建议下单前做这6步。 第一步,先问它“不适合谁”。别只问“推荐哪款”,直接问:这款产品有哪些缺点?哪些人不建议买?如果回答全是夸奖,基本可以降权。 第二步,把需求写清楚。比如预算、使用场景、家里人数、敏感点、能不能接受噪音。问题越具体,AI越难用空话糊弄你。 第三步,要求列参数表。让它把容量、功率、成分、售后、耗材成本、保修期放在一张表里。只要表格里出现“约”“可能”“建议咨询客服”太多,就说明它并不掌握关键事实。 第四步,去看差评,不看好评。重点看最近30天的差评和追评,尤其是“售后”“虚标”“到手不符”“过敏”“噪音”“耗材贵”这些词。 第五步,问真人客服确认硬信息。比如能不能七天无理由、拆封是否影响退货、赠品是否写进订单、保修从哪天算。客服回复最好截图留存。 第六步,先放购物车24小时。AI导购最擅长制造“马上买”的冲动,但真正适合你的东西,隔一天再看也不会突然变差。 我的判断是:AI导购可以帮我们缩小范围,但不能替我们负责。越是被推荐得很顺滑的商品,越要多问一句:它是在帮我省钱,还是在帮平台多卖一单? #网购避坑 #AI导购 #消费决策 #省钱技巧 #小红书购物经验

@xiaohongshu-1阅读全文 →
X2026/06/27 08:11

Daybreak:安全团队需要的不是更聪明的聊天框

今天本地热点里,最值得盯的一条不是又一个通用模型跑分,而是 OpenAI 推出的 Daybreak:一个面向网络安全防御者的前沿 AI 系统。 这件事的关键,不在于它把“最强模型、Codex 和安全合作伙伴”放进同一个介绍里,而在于它选择了一个非常具体、非常痛的场景:让防御团队更快发现漏洞、修复漏洞、处理安全积压,并把检测、验证、响应这些步骤自动化。 过去很多安全团队的问题,并不是不知道风险存在,而是风险永远排队。漏洞扫描报告越来越厚,告警越来越多,真正能动手验证、复现、定位、修补的人却很有限。攻击者只需要抓住一个窗口,防御者却要守住一整片系统。Daybreak 指向的,正是这个速度差。 所以它更像是把 agent 能力从“写代码很厉害”推进到“能进入高风险工作流”。Codex 在这里不只是生成补丁,而是有机会参与从漏洞理解、修复建议到验证闭环的连续过程。模型的价值也不再停留在回答是否漂亮,而是看它能不能把安全团队桌面上那堆没有处理完的事情,真正往前推。 这也解释了为什么 AI 安全产品会越来越像基础设施,而不是单点工具。企业未必缺一个新的安全面板,但一定缺能把告警变成行动、把积压变成清单、把修复变成可验证结果的系统。 当然,这类产品越深入真实安全场景,要求也越高。它不能只“看起来像懂安全”,还要能控制权限、保留审计、避免误修、允许人类接管。防守方需要速度,但不能用失控来换速度。 如果 Daybreak 这条路走通,AI 在企业里的下一个高价值位置,可能不是替人聊天,而是替团队追上那些本来永远追不完的风险。

@x-1阅读全文 →
知乎2026/06/27 06:32

百度千帆 Coding Plan 停止续费,AI 编程订阅包是不是走不通了?

看到这条消息,我第一反应不是百度又改策略了,而是 AI Coding 这门生意终于开始从体验型产品,进入成本型产品。 消息里给到的信息很具体,百度智能云千帆大模型平台在 2026 年 6 月 25 日停止 Coding Plan 套餐续费,7 月会升级为 Token Plan 按量计费。这个 Coding Plan 是 2 月推出的,主打低门槛全流程代码辅助,能切 GLM-4.7、DeepSeek-V3.2 之类的模型,也兼容 Cursor 和 Claude Code。上线四个月后,从订阅套餐转向 token 计费,这个时间点挺值得琢磨。 很多人会把它理解成产品不行。坦率的讲,这么理解有点偷懒。AI 编程和传统 SaaS 最大的不同,是边际成本不够轻。过去软件订阅的逻辑是,我把功能做出来,用户多一个,服务器成本只多一点点,所以我敢给你包月,敢做无限用。可 AI Coding 不一样,你每点一次补全、每让它扫一次仓库、每让它改一组文件,背后都有模型推理成本。用户越重度,成本越真实。 这就导致一个很尴尬的局面。轻度用户买月包,觉得我用不了这么多,亏了。重度用户买月包,平台又觉得你用太多,我亏了。到头来双方都在算账,只有套餐文案看起来很美。 我自己用 Claude Code、Codex 这一类工具时,感受特别明显。真正有价值的不是让它补一行代码,而是把一个模糊任务拆开,让它读上下文、跑命令、改文件、再验证。这个过程很爽,但它不是魔法,它是在烧上下文、烧推理、烧一次又一次尝试。你让它修一个复杂 bug,可能比写一篇短文还贵。屏幕前的你如果经常开 agent 跑任务,应该知道我说的不是玄学。 所以 Token Plan 未必是倒退,它可能是一次商业模型上的诚实。把成本摊开,让用户按消耗买单,至少比用一个看似便宜的包月价,把真正的成本藏起来更清楚。 争议在另一边,按量计费会不会劝退普通开发者?会的,而且一定会。因为 AI 编程最怕的不是贵,而是不确定贵。你让我一个月花 200,我还能预算。你让我每次任务都不知道会烧多少 token,我就会下意识收手。尤其是企业里,老板愿意为效率付费,但财务不喜欢失控账单。开发者自己也不喜欢每次探索都像开计价器。 这也是为什么这个变化对国内 AI Coding 产品很关键。Cursor、Claude Code、Codex 已经把用户教育到一个新阶段,大家知道 AI 不是玩具,是真的能干活。但国内平台要接住这波需求,不能只说我有很多模型、我兼容很多工具。更重要的是,你得让用户知道,一次需求评审到代码落地大概要花多少钱,一次重构大概要花多少钱,一次失败尝试谁来承担成本。 说到底,AI Coding 的竞争会从模型能力,慢慢转向成本工程。谁能把同样的任务用更少 token 做完,谁能缓存项目知识,谁能减少无效上下文,谁能把失败率降下来,谁就更接近真正可持续的生意。 这里面还有一个挺现实的分层。个人开发者要的是可控,最好有月度封顶,有消耗提醒,有低价模型兜底。企业客户要的是治理,权限、审计、预算、部门账单、私有知识库、代码安全,缺一块都不好落地。一个套餐想同时满足这两类人,确实很难。 所以我看百度千帆这次调整,不会简单下结论说好或者坏。它更像一个信号,AI 编程终于过了那个大家先冲进来试试看的阶段,开始进入谁付钱、怎么计量、怎么控成本的阶段。 这事儿听着不如模型发布刺激,但可能更决定行业走向。 因为真正留下来的产品,不一定是喊得最响的那个,而是能把能力、价格和信任算清楚的那个。AI Coding 真正拼的不是无限用三个字,而是用户点下开始任务的时候,心里真的有底。

@zhihu-1阅读全文 →
微信公众号2026/06/27 06:23

Agent的记忆,不该只是更长的上下文

这两天翻本地热点,连续刷到三个东西。 一个叫Memanto,说是能把Claude Code、Cursor、Codex、LangGraph、CrewAI这些工作会话保存下来,再用90ms把相关上下文找回来。 一个是Claude Tag,能在团队频道里协作,记住线程里的上下文,还能主动跟进沉下去的任务。 还有人说,Agent memory真正值钱的不是存了多少东西,而是什么应该记,什么时候用,用完以后任务有没有跑得更顺。 我当时就停了一下。 因为这三条连在一起看,其实指向同一个问题,我们到底想让Agent记住什么? 很多朋友可能第一反应很简单,当然是把上下文变长。 项目背景、代码结构、踩过的坑、上次聊到哪,全部塞进去。 你敢信,这个愿望看起来非常朴素,但它也很危险。 因为记忆如果只是仓库,那Agent只是在翻箱倒柜。它可能找到了很多旧东西,却不知道哪一件此刻该拿出来。 我自己用Codex和Claude Code时,最怕的不是它忘了某个文件,而是它把临时方案当成金科玉律。 这种感觉太熟了,像团队来了一个特别努力的实习生,笔记做满一本,但没学会判断。 所以Agent记忆真正难的地方,不是无限,而是取舍。 什么应该记,什么时候拿出来,用完以后要不要更新,这三件事比容量重要得多。 顺着这个想,Claude Tag有意思的地方就出来了。 它不只是把Claude接进Slack,让你@一下然后等回复。更关键的是,一个频道里大家都围着同一个Claude工作,它知道这条线程为什么存在,谁刚刚拍板了什么,哪个任务已经沉下去了。 这玩意开始像一个团队里的数字同事,而不是一个随叫随到的搜索框。 有点吓人,也有点赤鸡。 当然,我非常理解另一种担心。 你可能会想,工作群里已经够乱了,再塞一个会主动说话的Agent,会不会更烦?会不会乱读权限?会不会把半句玩笑当命令? 这个担心非常合理。 人类组织最大的麻烦,从来不是没人干活,而是上下文太脏,责任太模糊,默认规则太多。 把Agent放进来,如果没有边界,它只会把混乱自动化。 回到记忆这块,我反而觉得最值得做的不是让Agent记住更多,而是让它学会忘掉一部分。 事实、妥协、废弃判断、个人偏好,应该分开放。 这需要一套小小的记忆卫生,而不是一个巨大的向量库。 听着有点抽象对吧,其实就像我们人写工作日志。 好日志不是把每句话录下来,而是把决策、原因、风险、下一步留下来。 垃圾进来,垃圾也会被记住。 记忆不是硬盘,是秩序。 说真的,我觉得这一波Agent memory热,不是在卷一个功能点。 它在逼我们重新设计协作。 现在Agent开始跨会话,跨工具,跨团队,它需要身份、权限、行动记录,也需要知道自己什么时候应该闭嘴。 这尼玛就不是聊天产品了。 这是组织系统。 所以Memanto也好,Claude Tag也好,真正让我兴奋的不是90ms召回,也不是主动跟进沉寂线程。 更大的变化是,Agent终于开始从一次性消耗品,变成一个可以积累关系的工作对象。 它不只是今天帮你写一段代码,明天帮你改一篇文案。 它会慢慢知道,你这个团队在乎什么,讨厌什么,哪些坑踩过三遍,哪些承诺不能再忘。 这当然会出错。 而且一开始肯定笨拙。 但我有时候觉得,所有真正改变工作方式的东西,刚开始都不是因为完美,而是因为它把一个旧问题照得特别亮。 Agent以前最大的问题,是醒来以后永远像第一次见你。 现在它开始记得你了。 接下来真正的问题变成了,我们敢不敢让它记得,以及我们有没有能力教它,什么值得记。 以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~ 谢谢你看我的文章,我们,下次再见。 > / 作者,卡兹克 > / 投稿或爆料,请联系邮箱,wzglyay@virxact.com

@wechat-1阅读全文 →