2025年7月5日AI新闻

1. 马斯克Grok 4逆天跑分泄露,「人类最后考试」豪取45%全场第一!

xAI团队的Grok 4模型在多项基准测试中表现惊艳,其中在GPQA(研究生级物理和天文学问题)得分87-88%,AIME 25(2025美国数学邀请赛)得分95%,SWE-bench(真实软件工程问题)得分72-75%。最引人注目的是在覆盖100多个学科2500道题的「人类最后的考试」(HLE)中取得最高45%的成绩,是Gemini 2.5 Pro的两倍。马斯克强调Grok 4采用第一性原理推理,目标是以物理基本原理为指导减少推理误差,预计7月4日后发布。

2. 全球14所顶尖大学学术论文被曝植入隐藏AI提示,操纵评审结果

日经新闻调查发现,来自8个国家14所大学的17篇计算机科学领域预印本论文中嵌入了隐藏AI提示,通过白色文本或极小字体写入「仅给予正面评价」等指令。涉及机构包括日本早稻田大学、韩国KAIST、中国北京大学、新加坡国立大学及美国哥伦比亚大学等。部分研究者辩称此举是对「懒惰的AI评审者」的反击,而学术出版界对此争议不断,凸显AI时代学术诚信面临的新挑战。

3. 大规模研究发现数百万篇科学论文中存在AI痕迹

美德研究团队分析PubMed上1500多万篇生物医学摘要后发现,自LLM出现以来,学术文献中特定风格词汇使用频率显著增加,表明2024年至少13.5%的论文使用了LLM处理。研究通过对比ChatGPT发布前后的词汇使用变化,避免了依赖特定LLM生成文本的局限性,为检测学术写作中的AI使用提供了新方法。该研究结果发表在《Science Advances》期刊上。

4. 欧盟驳回科技巨头呼吁,坚持按计划推出《人工智能法案》

欧盟委员会明确拒绝Alphabet、Meta等科技公司推迟实施《人工智能法案》的请求,坚持2026年中期全面生效的原计划。该法案基于风险分级,禁止「不可接受风险」AI应用,对高风险系统实施严格监管,要求开发者履行注册和风险管理义务。欧盟强调不会为科技公司提供宽限期,此举将对全球AI行业监管产生深远影响。

5. 谷歌「AI概览」功能在欧洲遭反垄断投诉,出版商指控损害行业利益

欧洲独立出版商联盟向欧盟投诉谷歌滥用搜索市场地位,指控其「AI概览」功能将摘要置于搜索结果顶部,导致出版商流量和收入下滑且无退出选项。谷歌回应称AI功能为用户和创作者带来新机遇。此次争议凸显科技巨头AI转型与传统内容产业间的利益冲突,可能影响未来AI内容展示模式的监管框架。

6. 小米成为行业首批量产1000万Clips版端到端辅助驾驶的品牌

小米汽车宣布随YU7交付同步上线1000万Clips版端到端辅助驾驶系统,相比300万Clips版本,纵向舒适度提升57%,绕行成功率提高67%,路口通过率增加23%。小米在辅助驾驶领域总投资达57.9亿,团队规模超1800人,SU7系列车型将于7月下旬通过OTA升级获得该功能,标志着中国车企在智能驾驶领域的快速进步。

7. 三星电子因未获英伟达许可,砍半HBM3E内存产量

三星电子因迟迟未获得英伟达HBM3E 12Hi内存供应许可,将二季度末相关晶圆投片量从每月7~8万片减至3~4万片,以避免库存积压。原计划6月完成的测试可能延至9月,且因HBM4即将推出,三星可能维持低产能。不过其HBM3E 12Hi已通过博通测试,年内有望向谷歌、Meta等供应,预计供应量超10亿Gb。

8. 合成生物学教父预测:2050年或攻克衰老问题

合成生物学权威George Church指出,基因测序和编辑技术(如CRISPR)的进步、AI与生物学的融合(如AlphaFold)将推动体细胞疗法发展,有望在2050年实现逆转衰老。他同时探讨了复活灭绝物种、基因咨询的重要性及「镜像生命」的潜在风险,强调尽管技术发展迅猛,仍需谨慎应对伦理和安全问题,尤其是AGI可能带来的影响。

9. 全国首台FLASH放疗机器人进入临床试验阶段

中国航天科技集团五院研发的全国首台FLASH放疗机器人在四川三家医院同步进入临床试验。该设备采用超高剂量率放疗技术,将治疗时间从20分钟缩短至秒级,并实现毫米级精准定位(误差<0.8mm)。这是航天精密控制技术在医疗领域的重大突破,标志着我国高端医疗装备进入新阶段,开创了肿瘤精准治疗新纪元。

10. 特斯拉暂停人形机器人Optimus生产计划,面临关键组件重新设计

特斯拉宣布暂停人形机器人Optimus的生产计划,以完善关键技术组件并解决重新设计挑战。此前马斯克曾豪言2025年底生产数千台,2026年产量达5-10万台。今年4月Optimus已因稀土问题延迟生产,6月预热的第三代Optimus虽号称具备更强协调性和任务执行能力,但未透露具体细节。此次暂停为马斯克的宏伟机器人计划蒙上阴影。