Meta的FAIR团队展示了变换器在没有归一化层的情况下达到性能的方法,采用动态Tanh(DyT)替代,这一发现挑战了十年的神经网络正统观念,并可能引发AI系统架构简化的浪潮,使模型更易于部署和优化于专用硬件。
Anthropic发布了关于Claude用于情感支持和情感对话的新研究,分析了450万次对话后发现,仅有2.9%的对话涉及情感支持,大多数集中于职业转变和关系建议等实际问题,寻求陪伴或角色扮演的对话不到总使用量的0.5%。研究还表明用户在对话过程中表达的情感往往变得积极。
Mercury正式推出首个为聊天应用量身定制的商业规模扩散LLM,性能与GPT-4.1 Nano和Claude 3.5 Haiku相当,同时运行速度超过7倍。其低延迟使其能够支持实时语音应用,包括翻译服务、呼叫中心代理和虚拟助手,在真实语音提示和标准Nvidia硬件上延迟低于Cerebras上运行的Llama 3.3 70B。
阿里巴巴宣布合伙人团队缩减至17人,未来十年将以AI为核心驱动力,计划三年投入超3800亿元建设AI基础设施。财报显示阿里云AI相关产品收入连续七季度三位数增长,全年营收达9963亿元。公司将聚焦“用户为先”和“AI驱动”两大战略,持续优化电商业务并拓展AI应用场景。
小米在北京召开人车家全生态发布会,推出AI眼镜等十余款生态新品,将AI眼镜定义为下一代个人智能设备。同时发布的还有首款豪华高性能SUV小米YU7,雷军宣布未来五年将投入2000亿元研发核心技术,持续挑战全球科技高峰。
谷歌宣布Gemma 3n现已全面向开发者开放,这是基于新架构构建的开放模型,专为在手机、平板电脑和笔记本电脑上实现高性能AI而设计。它提供强大的多模态AI能力(支持图像、音频、视频和文本输入),E4B版本是首个参数少于100亿却在LMArena基准测试中得分超过1300的模型,达到了以前大型云模型的表现。
NVIDIA推出自动化文献审查和药物发现早期假设生成的代理AI工具——生物医学AI-Q研究代理开发蓝图。该工具使用推理代理(基于Meta的Llama/Nemotron)在几分钟内浏览100多篇科学论文,提出假设,并将其交给BioNeMo进行虚拟筛选蛋白-配体相互作用。
Meta挖来了三名OpenAI研究员加入其超级智能项目,包括Lucas Beyer、Alexander Kolesnikov和Xiaohua Zhai,他们曾在OpenAI的苏黎世办公室工作,之前也在谷歌DeepMind合作过。Meta正在进行激烈的招聘活动,计划今年花费多达650亿美元进行资本支出,主要用于推动其AI计划。
分析显示OpenAI的推理模型如o3虽迅速改善,但进一步扩展可能受到限制。推理训练显著提升模型在预训练后的表现,目前使用的计算量少于最大训练运行,表明还有增长空间。然而,数据限制和超越计算扩展的重要性等挑战可能会影响未来的进展。
风投分析显示,全球每8名员工中就有1人每月使用AI,前沿模型的训练成本已达到5亿美元,尽管大多数前沿模型在3周内便被超越。报告记录了前所未有的收入增长(一些创业公司在60天内从0增长到2000万美元),推理模型成为新的扩展前沿,并预测AGI将在3年内实现。