2025年7月5日AI新闻

1. 马斯克Grok 4逆天跑分泄露，「人类最后考试」豪取45%全场第一！

xAI团队的Grok 4模型在多项基准测试中表现惊艳，其中在GPQA（研究生级物理和天文学问题）得分87-88%，AIME 25（2025美国数学邀请赛）得分95%，SWE-bench（真实软件工程问题）得分72-75%。最引人注目的是在覆盖100多个学科2500道题的「人类最后的考试」（HLE）中取得最高45%的成绩，是Gemini 2.5 Pro的两倍。马斯克强调Grok 4采用第一性原理推理，目标是以物理基本原理为指导减少推理误差，预计7月4日后发布。

2. 全球14所顶尖大学学术论文被曝植入隐藏AI提示，操纵评审结果

日经新闻调查发现，来自8个国家14所大学的17篇计算机科学领域预印本论文中嵌入了隐藏AI提示，通过白色文本或极小字体写入「仅给予正面评价」等指令。涉及机构包括日本早稻田大学、韩国KAIST、中国北京大学、新加坡国立大学及美国哥伦比亚大学等。部分研究者辩称此举是对「懒惰的AI评审者」的反击，而学术出版界对此争议不断，凸显AI时代学术诚信面临的新挑战。

3. 大规模研究发现数百万篇科学论文中存在AI痕迹

美德研究团队分析PubMed上1500多万篇生物医学摘要后发现，自LLM出现以来，学术文献中特定风格词汇使用频率显著增加，表明2024年至少13.5%的论文使用了LLM处理。研究通过对比ChatGPT发布前后的词汇使用变化，避免了依赖特定LLM生成文本的局限性，为检测学术写作中的AI使用提供了新方法。该研究结果发表在《Science Advances》期刊上。

4. 欧盟驳回科技巨头呼吁，坚持按计划推出《人工智能法案》

欧盟委员会明确拒绝Alphabet、Meta等科技公司推迟实施《人工智能法案》的请求，坚持2026年中期全面生效的原计划。该法案基于风险分级，禁止「不可接受风险」AI应用，对高风险系统实施严格监管，要求开发者履行注册和风险管理义务。欧盟强调不会为科技公司提供宽限期，此举将对全球AI行业监管产生深远影响。

5. 谷歌「AI概览」功能在欧洲遭反垄断投诉，出版商指控损害行业利益

欧洲独立出版商联盟向欧盟投诉谷歌滥用搜索市场地位，指控其「AI概览」功能将摘要置于搜索结果顶部，导致出版商流量和收入下滑且无退出选项。谷歌回应称AI功能为用户和创作者带来新机遇。此次争议凸显科技巨头AI转型与传统内容产业间的利益冲突，可能影响未来AI内容展示模式的监管框架。

6. 小米成为行业首批量产1000万Clips版端到端辅助驾驶的品牌

小米汽车宣布随YU7交付同步上线1000万Clips版端到端辅助驾驶系统，相比300万Clips版本，纵向舒适度提升57%，绕行成功率提高67%，路口通过率增加23%。小米在辅助驾驶领域总投资达57.9亿，团队规模超1800人，SU7系列车型将于7月下旬通过OTA升级获得该功能，标志着中国车企在智能驾驶领域的快速进步。

7. 三星电子因未获英伟达许可，砍半HBM3E内存产量

三星电子因迟迟未获得英伟达HBM3E 12Hi内存供应许可，将二季度末相关晶圆投片量从每月7~8万片减至3~4万片，以避免库存积压。原计划6月完成的测试可能延至9月，且因HBM4即将推出，三星可能维持低产能。不过其HBM3E 12Hi已通过博通测试，年内有望向谷歌、Meta等供应，预计供应量超10亿Gb。

8. 合成生物学教父预测：2050年或攻克衰老问题

合成生物学权威George Church指出，基因测序和编辑技术(如CRISPR)的进步、AI与生物学的融合(如AlphaFold)将推动体细胞疗法发展，有望在2050年实现逆转衰老。他同时探讨了复活灭绝物种、基因咨询的重要性及「镜像生命」的潜在风险，强调尽管技术发展迅猛，仍需谨慎应对伦理和安全问题，尤其是AGI可能带来的影响。

9. 全国首台FLASH放疗机器人进入临床试验阶段

中国航天科技集团五院研发的全国首台FLASH放疗机器人在四川三家医院同步进入临床试验。该设备采用超高剂量率放疗技术，将治疗时间从20分钟缩短至秒级，并实现毫米级精准定位(误差<0.8mm)。这是航天精密控制技术在医疗领域的重大突破，标志着我国高端医疗装备进入新阶段，开创了肿瘤精准治疗新纪元。

10. 特斯拉暂停人形机器人Optimus生产计划，面临关键组件重新设计

特斯拉宣布暂停人形机器人Optimus的生产计划，以完善关键技术组件并解决重新设计挑战。此前马斯克曾豪言2025年底生产数千台，2026年产量达5-10万台。今年4月Optimus已因稀土问题延迟生产，6月预热的第三代Optimus虽号称具备更强协调性和任务执行能力，但未透露具体细节。此次暂停为马斯克的宏伟机器人计划蒙上阴影。

AI每日新闻