2026年5月4日,AI圈五大爆点齐发:OpenAI Codex全面升级为办公助手,操作GUI速度首次媲美人类;xAI Grok 4.3 Beta上线,性能超越Claude Sonnet 4.6;OpenAI Stargate项目提前完成十吉瓦算力目标,GPT-5.5在此训练;小红书月活破4亿,成立AI一级部门Dots加速国际化;Google DeepMind发布AI co-clinician,在140项医疗评估中68项超越初级医生。
① OpenAI Codex重大更新:从开发者工具进化为全能办公助手
OpenAI对Codex进行全面升级,从编程助手扩展为面向所有日常办公场景的个人工作助手。新版本引入基于岗位角色的动态UI,支持连接Slack、Google Workspace、Microsoft 365等常用应用。Computer Use模式速度提升42%,整体操作提速约20%。OpenAI内部人员表示:“这是首次看到LLM操作GUI的速度与人类相当。” Codex CLI 0.128.0新增`/goal`命令,支持跨轮次持续追踪任务,结合GPT-5.5可长时间连续执行复杂任务。(第117期)
② xAI Grok 4.3 Beta发布:性能超越Claude Sonnet 4.6
xAI正式推出Grok 4.3 Beta模型,规模与Grok 4.20相当但架构有所改进,知识截止日期为2025年12月。在Artificial Analysis Intelligence Index上得分53分,表现略优于Muse Spark和Claude Sonnet 4.6。目前已向SuperGrok和Premium+订阅用户开放,API已同步上线。xAI在模型迭代速度上持续加码,Grok系列正逐步缩小与OpenAI、Anthropic旗舰模型的差距。(第117期)
③ OpenAI Stargate提前达标:十吉瓦算力基建落地
OpenAI更新Stargate项目进展:原承诺2029年在美国建成10GW基础设施,现已提前超额完成。过去90天新增超3GW容量,旗舰站点位于德克萨斯州阿比林,运行环境为Oracle Cloud Infrastructure,搭载NVIDIA GB200系统。最新模型GPT-5.5就是在该站点完成训练。OpenAI同步发布报告《Building the Compute Infrastructure for the Intelligence Age》,阐述算力基础设施的顶层设计。(第117期)
④ 小红书组织升级:成立AI一级部门Dots,月活破4亿
小红书宣布全面组织升级:成立AI一级部门Dots及企业智能部,从产品技术和组织两方面加大AI投入;成立海外业务部门Rednote,开启国际化新征程;设立Lab 1327探索新产品孵化机制。业务数据显示,小红书App月活用户已超过4亿。在AI重构内容社区的关键窗口期,小红书正通过组织升级和国际化布局,抢占下一代社交+AI生态的制高点。(第117期)
⑤ Google DeepMind AI co-clinician:AI进入临床团队
Google DeepMind宣布AI co-clinician研究计划,探索多模态Agent如何作为协作成员融入临床团队,在专家临床监督下辅助医疗工作及患者护理。基于Gemini与Project Astra的实时音视频能力,采用双Agent架构(Planner监控Talker)维持安全边界。与哈佛医学院和斯坦福医学院的模拟研究显示:在140项咨询技能评估中,68项达到或超过了初级保健医生的水平,在药物知识开放式问答(OpenFDA RxQA)中超越其他前沿模型。(第117期)
— AIDaily 每日AI资讯 第117期 —