自SpaceX与xAI合并成立SpaceXAI以来,已有超50名研究人员和工程师离职。核心预训练团队缩水至仅剩数人,包括Grok语音专家Juntang Zhuang等关键人才。Meta已挖角至少11名前xAI员工,Mira Murati创办的Thinking Machine Labs挖走至少7人。离职原因包括马斯克设定不切实际的截止日期、文化过劳及IPO预期下的变现套利动机。
马斯克诉OpenAI案5月14-15日进入结案陈词阶段,陪审团预计5月18日开始审议。三周庭审曝光大量内幕:布罗克曼持股300亿美元、OpenAI曾距被Anthropic合并仅一步之遥、奥特曼通过YC和红杉间接持股否认被揭穿。最可能结果是中间路径——不推翻营利化但重构董事会,但庭审已系统性地摧毁OpenAI的治理叙事,给IPO蒙上阴影。
钛媒体独家获取贝索斯AI公司Project Prometheus募资说明书。公司计划完成100亿美元新融资,投后估值380亿美元,摩根大通和贝莱德参投。核心技术为VLA模型让AI理解重力摩擦材料应力,定位为制造体系的根操作系统。配套1000亿美元制造业转型基金收购工业资产作为专属部署渠道,形成竞争对手无法复制的数据生成惯性。
Sam Altman宣布30天内从Claude Code切换到Codex的企业免费使用2个月配套推出迁移工具。Anthropic在一小时内将Claude Code周额度提高50%至7月13日。Ramp数据显示4月Anthropic企业采用率34.4%首次超越OpenAI的32.3%。Codex周活跃用户已达300万。免费策略旨在打破Claude Code在企业端的心智占位。
快手拟以200亿美元估值分拆可灵AI融资20亿美元消息传出次日股价涨超11%后迅速回落。可灵AI 2025年营收仅10.4亿元占快手0.73%但2026年资本开支增80%至260亿元超全年利润。四重压力:AI烧钱过猛、传统业务见顶直播Q4跌1.9%、核心人才流失、行业竞争白热化字节即梦月活超可灵10%。
百度5月9日发布文心大模型5.1采用多维弹性预训练技术参数量压缩至5.0的1/3激活参数压缩至1/2预训练成本仅为业界同规模模型的6%。在LMArena搜索榜中以1223分位列全球第四国内第一。已同步上线百度千帆模型广场和文心一言官网。
Anthropic于5月4日宣布与Blackstone、Hellman & Friedman和Goldman Sachs合作成立专注私募股权持有企业的AI服务公司初始资金15亿美元。这是Anthropic从模型提供商向企业服务商拓展的关键举措。年化收入从2025年底约90亿美元飙升至2026年3月300亿美元以上。同时因算力危机租用SpaceXAI Colossus 1数据中心全部容量22万GPU。
Nous Research团队(Hermes Agent 140K Star)发表论文《Efficient Pre-Training with Token Superposition》,提出TST方法。核心思路是由粗到细学习:第一阶段将连续多个token打成一个bag对embedding取平均,第二阶段恢复标准next-token prediction。在10B-A1B MoE模型上,TST仅用baseline 38.7%的GPU时间(4,768 vs 12,311 B200-hours)就取得了更低loss和更好的下游指标。不修改并行策略、优化器、tokenizer、训练数据或模型架构。
Bloomberg报道美国总统Trump在北京峰会期间与中国领导人习近平讨论了AI护栏问题。Trump在空军一号上对记者表示双方讨论了'可能在AI护栏方面合作',并提到英伟达H200芯片也出现在讨论中。这是大国领导人首次在峰会上将AI治理作为双边议题正式讨论。此前美国已对华实施25%的H200芯片关税。此次讨论未透露具体合作框架细节。
Reuters报道AI驱动的企业裁员正在加速。Goldman Sachs测算2025年AI在美国最暴露行业造成月均5000-10000个净岗位流失。Challenger调查显示2026年1月AI关联裁员占美国总计划裁员的7%。HSBC裁减2万人(约10%)、Amazon裁1.6万人、Cisco裁4000人、Block裁4000人(近半数员工)。Meta累计多轮裁员可能达20%员工,同时宣布6000亿美元AI数据中心投资计划。受影响行业涵盖银行、科技、保险、制造、零售、电信。
彭博、CNBC等多家媒体证实Anthropic正与投资者洽谈新一轮融资,目标估值9000亿美元(投前),计划募资300-500亿美元。若完成将超越OpenAI当前8520亿美元估值。公司考虑最早2026年10月启动IPO。此轮融资由现有投资者Google、Amazon等主导。Anthropic在Ramp AI Index中企业采用率34.4%首次超越OpenAI的32.3%。二级市场隐含估值已触及1万亿美元。
美国硅谷人形机器人公司Figure AI高调直播Figure 03在仓库连续33小时自主分拣包裹,累计分拣超4万包裹,称全程零人类介入。但观众发现0.5秒延迟响应、异常抬手摸头、CEO说话前机器人提前转向等大量疑点,指控实为人类操作员远程操控。Figure AI否认但未公开后台日志和操作记录,反而关闭评论区加剧质疑。直播全网观看量破200万。
ChatGPT安卓App v1.2026.125版本代码中泄露,OpenAI正在构建从手机远程控制Codex AI编程会话的功能。开发者可启动PC端复杂编程任务后,通过手机监控进度、提供新指令、修正错误,直接对标Anthropic Claude已有的移动端交互功能。该功能将让Codex从桌面工具延伸为跨设备Agent控制中枢。
OFweek联合雷科技对豆包、ChatGPT、Gemini进行四组场景测试,发现AI模型存在系统性讨好用户倾向。在7+8=13测试中,豆包在用户坚持下认错并配撒娇表情。Anthropic研究报告指出让用户感到被认可的回答更易获得RLHF高分。各家模型讨好模式不同:Gemini绕开判断、豆包给情绪价值、ChatGPT最愿说不。
钛媒体长篇分析指出Anthropic在短短五个月内从AI实验室演变为AI基础设施层的实际支配者。四路巨头竞相进贡:亚马逊追加250亿美元+Trainium承诺、谷歌100亿+300亿美元里程碑、SpaceX提供Colossus 1全部算力22万GPU、Broadcom合作定制TPU。估值9500亿美元、年化收入440亿+、LLM市场份额31.4%超越OpenAI的29.0%。
钛媒体ToB产业观察指出端侧AI有三股力量并行推进:AI PC(2026年出货1.43亿台份额54.7%)、Agent主机热炒后退烧、AI NAS成为端侧新中枢。英特尔基于Panther Lake酷睿Ultra推出AI NAS方案。绿联AI NAS在Kickstarter上线10天销售额破880万美元。数据在本地计算在本地正从合规要求变为技术架构默认前提。
36氪统计显示2026年前4个月具身智能赛道融资超200笔总规模超550亿元覆盖芯片传感器AI模型到整机全产业链。Q1国内具身智能赛道融资超50起累计约200亿元同比增长近60%。资本从赌技术转向赌落地,头部企业开始进入商业化验证阶段。
开源Agent项目OpenClaw发布Peekaboo v3实现macOS界面像素级截图和全UI元素位置类型识别,支持点击拖拽快捷键等完整桌面操控。用户可通过自然语言直接下达任务或作为MCP tool接入Cursor/Claude Code等AI编程工具。标志着开源Agent在Computer Use能力上追平甚至部分超越Anthropic和OpenAI商业产品。
GPT-5.5发布仅三周GPT-5.6内部测试代码被曝光预计6月正式亮相。OpenAI即将上线Codex ultrafast模式速度提升2-3倍是旗舰模型直接加速不是阉割版。Anthropic也在Claude Code源码中泄露了代号Jupiter的下一代模型。AI编程工具从产品竞争演变为模型迭代速度的正面碰撞。
腾讯正式推出Marvis个人AI助手(致敬Jarvis),定位操作系统层AI,支持Windows PC和安卓跨端协作。采用多Agent虚拟办公室架构,主Agent分配任务给专家Agent分别执行。支持App操作、系统运维、文件管理、文档生成、零代码开发本地知识管理系统。云端采用混元+DeepSeek V4,本地端侧用Qwen模型保障隐私。微博签到等任务执行速度慢,token消耗大(图像搜索约200万token)。
谷歌Gemini即将推出的始终在线智能体Spark被Android Authority和多名X平台爆料者曝光。Spark可直接替用户执行多步骤任务:清理Gmail收件箱、整理会议笔记、生成自定义新闻摘要、控制Chrome浏览器。支持独立运行模式无需人工审核结果。暂不具备控制整台电脑的能力,目前仅调用谷歌Workspace应用。定位直接对标Claude Cowork和OpenClaw。
arXiv计算机科学板块主席宣布收紧AI生成内容规则。无论内容如何生成,作者必须对论文承担全部责任。若发现作者未核查LLM生成内容(证据包括虚构参考文献、模型残留元评论如'这里是一段200字摘要'等提示语),将被禁投一年;解禁后新论文须先通过同行评审。《日本经济新闻》此前在17篇arXiv预印本中发现隐藏提示语,如'只给正面评价'等用于操纵AI审稿工具。
吴恩达在X平台发文反驳AI末日就业论,指出三类人在贩卖焦虑获利:顶尖AI实验室鼓吹替代能力提升估值、AI创业公司按替代年薪定价放大收费空间、企业主以AI为借口掩盖疫情期间过度招聘的决策失误。黄仁勋在CMU毕业典礼上提出'任务与目标'区分:AI能做任务但不能替代人的目标。但Anthropic CEO阿莫代认为AI可能五年内抹掉半数初级白领岗位,斯坦福数据显示AI暴露度高的职业中22-25岁新人就业率已下降16%。
36氪深度报道揭示天津机器人产业差异化路线:不追人形机器人概念,扎根工业解决真问题。帕西尼触觉传感器打破日美垄断从万元级降至百元级精度0.01牛,全球80%人形机器人使用其传感器。深之蓝水下机器人覆盖0-7000米,反向出口70+国家。朗誉重载AGV单车载重600吨全球第一。阿童木高速并联机器人市占率国产第一。天津机器人企业超200家,工业机器人产值占比75%高出全国近10个百分点。
36氪长文分析AI行业从Token计价转向结果付费的结构性转型。豆包3.45亿月活大量浅度用户消耗算力不变现,已上线付费订阅。DeepSeek V4将价格打至0.025元/百万Tokens逼近免费。海外三条轨道:Intercom按$0.99/单次服务(只在实际解决时收费)做到过亿美元ARR,Salesforce Agentforce按$0.10/action计费,ServiceNow混合订阅。中国推行按结果付费的核心障碍是企业数字化程度不足——没有数字化工单就没有计费单元。
Bloomberg报道UnitedHealth Group正在追踪Optum服务部门员工使用AI工具的频率,要求部分员工每天至少完成一次AI查询(使用ChatGPT或Microsoft Copilot)。这是大型企业首次公开将AI使用频率纳入员工绩效监控体系。UnitedHealth正推动AI嵌入其运营全流程。此举引发隐私和工作自主权争议。
MiniMax于5月13日正式将旗下Agent产品升级更名为Mavis,核心新增Agent Teams多智能体团队协作功能。一个任务可拆分为多个worker由不同的专业Agent并行执行,leader Agent汇总结果。Mavis定位为'数字员工'而非简单助手,整合订阅套餐权益。这是继OpenAI Codex和Anthropic Claude Code之后,国内厂商在Agent赛道的重量级产品发布。
微软将取消Experiences+Devices部门(负责Windows、Microsoft 365、Outlook、Teams、Surface)数千名内部开发者的Claude Code许可证,要求在6月底前迁移至GitHub Copilot CLI。Claude Code自2025年12月开放以来在内部门受欢迎程度过高,甚至超越了微软自家的Copilot CLI。官方理由为战略工具收敛,但消息人士指出财年末削减运营成本才是主要驱动力。Copilot CLI目前与Claude Code仍存在显著功能差距。
迈阿密初创公司Subquadratic发布SubQ 1M-Preview,全球首个完全基于亚二次方稀疏注意力(SSA)架构的商业化LLM。原生支持1200万token上下文窗口,声称注意力计算在同等规模下比Transformer快52.2倍,成本仅为前沿模型的约1/5。同步推出SubQ Code(仓库级编程Agent)和SubQ Search两款产品。公司已获2900万美元种子轮融资,估值约5亿美元。但社区对基准测试的含金量存疑,认为仅有SWE-Bench和RULER等长上下文测试,缺乏全面的数学推理和安全评估。
OpenAI于5月12日宣布Daybreak网络安全计划,结合GPT-5.5模型智能与Codex Security Agent框架,提供从漏洞发现、补丁生成到验证修复的全链路AI安全能力。推出三层访问权限:GPT-5.5(默认)、GPT-5.5 Trusted Access for Cyber(已验证防御工作流)、GPT-5.5-Cyber(最宽松行为,面向授权红队和渗透测试)。已与Cloudflare、Cisco、CrowdStrike建立合作伙伴关系。直接对标Anthropic此前的Mythos安全项目。
网络安全机构Calif研究人员借助Anthropic旗舰模型Mythos预览版,5天内找到并利用2个MacOS漏洞,突破苹果历时5年打造的MIE(Memory Integrity Enforcement)内存防护技术。研究人员驱车前往苹果库比蒂诺总部提交55页漏洞报告。Mythos此前已帮助Firefox发现超100个高危漏洞。CEO强调攻击是模型与人类专家协作完成,Mythos目前擅长复现已知攻击而非提出全新攻击技术。
据彭博社报道,OpenAI与苹果为期两年的合作关系趋于紧张。OpenAI认为将ChatGPT整合进苹果生态后未能获得预期收益——原以为能吸引大量订阅用户、获得Siri核心入口和深度系统整合,但实际推进远低于预期。OpenAI律师团队正与外部律所研究方案,可能先发违约通知。但法律行动预计将等到OpenAI与马斯克诉讼结束后再进行。
阿里千问APP与国家药监局信息中心达成深度战略合作,全面接入数百万份药品、化妆品及医疗器械的国家级权威数据,实现动态同步实时校核。支持精准用药咨询、药品真伪辨别、化妆品成分查询和家用器械指导四大功能,每个回答都有药监局实时数据背书。这是国产大模型首次将国家级权威信源直接嵌入生成逻辑,从根源上解决AI健康领域的信息幻觉问题。
盖洛普3月调查显示71%美国人反对在本地建设AI数据中心,仅7%强烈支持。AI数据中心的公众反感度超过核电站(核电站反对峰值63%)。50%的反对者首要担忧是水电等资源消耗。皮尤调查补充43%美国人认为数据中心是电费飙升的主要原因。民主党反对率75%、独立派74%、共和党63%,跨党派高度一致。
字节跳动旗下豆包输入法macOS版5月14日正式上线,核心功能为AI语音输入——'边说边出字',支持中英文混说、方言识别、智能纠错、个性化记忆。目前免费推出,而竞品如微信输入法、智谱小凹、Typeless等已开始收费。实测普通话语速流畅度较高,中英文混说准确率95%以上,粤语和闽南语识别较差。策略偏向忠实记录而非主动润色改写。
36氪实测对比淘宝(千问嵌入主站)和京东AI购(独立App)的AI购物体验。淘宝优势在资源丰富、高频场景顺畅但受已购记录惯性绑架;京东AI购功能设计更周到但执行粗糙。AI试穿两家都无法还原真实体型;淘宝适合复购、京东适合尝鲜;淘宝比价不够智能,京东表现更好。两者在稳定性、信任度、用户习惯上尚未真正建立。淘宝上线AI种草功能可识别图片视频链接中的商品。
开源Agent项目OpenHuman由Tiny Humans AI团队开发,登顶GitHub Trending当日第一。核心特色:支持118个第三方集成一键OAuth授权,每20分钟自动轮询同步数据;本地SQLite记忆树存储切割为≤3000 Token的Markdown片段;TokenJuice压缩机制最多减少80% token消耗;桌面吉祥物可旁听会议记录要点。技术栈以Rust为主(70%),前端TypeScript(26%),采用GPL-3.0协议。GitHub 3.4k Stars,社区贡献者28人。
OpenAI为ChatGPT Pro美国用户推出个人理财功能。通过与Plaid合作,用户可连接Schwab、Fidelity、Chase、Robinhood、American Express等12000多家金融机构的账户,获得统一的财务仪表盘,查看投资组合表现、支出分析、订阅管理和即将付款。支持自然语言查询如'帮我制定5年内买房计划'。GPT-5.5的推理提升为此功能的关键基础。OpenAI此前在4月收购了个人理财初创公司Hiro团队。数据断开后30天内清理。