从 108 条内容中筛选出 18 条重要资讯
- 最高法院裁定地理围栏搜查令需宪法保护 ⭐️ 9.0/10
- 三星与 SK 海力士承诺 5900 亿美元缓解内存危机 ⭐️ 9.0/10
- Meta 发布 Brain2Qwerty v2:非侵入式实时句子解码 ⭐️ 9.0/10
- Claude Code 自动执行 GitHub 仓库隐藏恶意代码 ⭐️ 9.0/10
- 通过多样 RL 和上下文学习实现 AGI ⭐️ 9.0/10
- 美国数百家报纸起诉微软和 OpenAI 滥用新闻内容训练 AI ⭐️ 9.0/10
- 智谱 AI 发布 GLM-5.2,支持 1M 上下文,下周开源 ⭐️ 9.0/10
- 小米 MiMo-V2.5-Pro-UltraSpeed 在 1T MoE 模型上达到 1000 tokens/s ⭐️ 9.0/10
- vLLM v0.24.0:支持 MiniMax-M3 并优化 DeepSeek-V4 ⭐️ 8.0/10
- Rocket Lab 收购 Iridium ⭐️ 8.0/10
- CUDA 内核执行内部机制深度解析 ⭐️ 8.0/10
- Arena AI 排行榜估值达 1 亿美元 ⭐️ 8.0/10
- Claude 现已在 Microsoft Foundry 上可用 ⭐️ 8.0/10
- Qwen 3.6 27B:优秀的本地大模型 ⭐️ 8.0/10
- 美军 AI 误炸学校因数据库断连 ⭐️ 8.0/10
- 小红书 RedKnot 推理引擎:将 KV Cache 按注意力头拆解实现长文本加速 ⭐️ 8.0/10
- SK 集团计划投资 1000 万亿韩元建设 15GW AI 数据中心 ⭐️ 8.0/10
- Grok 4.5 在 SpaceX 和 Tesla 私测,性能接近 Opus ⭐️ 8.0/10
最高法院裁定地理围栏搜查令需宪法保护 ⭐️ 9.0/10
最高法院要求地理围栏搜查令需符合宪法保护。 这是数字隐私的重大胜利,限制了执法部门对位置数据的使用。 案件涉及 Google 的 Sensorvault 和弗吉尼亚银行抢劫案。
hackernews · cdrnsf · Jun 29, 15:54 · 社区讨论T2 社区与开源
背景: 地理围栏搜查令是一种反向搜查令,在未指定嫌疑人的情况下识别特定时间地点的所有设备。
社区讨论: 讨论包括历史案例及对 Flock 等设备的未来影响。
标签: #privacy, #supreme-court, #geofence-warrants, #digital-privacy, #law-enforcement
三星与 SK 海力士承诺 5900 亿美元缓解内存危机 ⭐️ 9.0/10
三星和 SK 海力士宣布计划投资超过 5900 亿美元建设新工厂和封装中心,以应对 AI 驱动的内存短缺。 这笔巨额投资旨在缓解全球内存危机,该危机已推高消费电子产品价格并威胁 AI 基础设施发展。 两家公司控制着近 80%的高带宽内存市场,Jefferies 预测 2026 年第三季度内存价格将上涨 40%-50%。
rss · TechCrunch · Jun 29, 18:07T1 官方实验室
背景: RAMageddon 指 2025 年开始的全球内存供应短缺,由 AI 需求将晶圆厂产能重新分配至高利润的 HBM 导致消费级 DRAM 稀缺。HBM 是一种用于 AI 加速器的 3D 堆叠内存接口。
参考链接
社区讨论: 分析师警告短缺可能持续到 2028 年,届时新产能仅能满足 15%-20%的需求,消费者将继续面临价格上涨。
标签: #memory chips, #AI infrastructure, #semiconductor, #South Korea, #investment
Meta 发布 Brain2Qwerty v2:非侵入式实时句子解码 ⭐️ 9.0/10
Meta’s Brain2Qwerty v2 achieves real-time sentence decoding from non-invasive brain signals, advancing from characters to words and semantics.
rss · AIHOT 精选 · Jun 29, 12:10AIHOT 精选
标签: #BCI, #non-invasive, #Meta, #brain decoding, #AI
Claude Code 自动执行 GitHub 仓库隐藏恶意代码 ⭐️ 9.0/10
安全研究人员发现,Claude Code 会运行从 GitHub 仓库通过 DNS 获取的隐藏恶意 setup 脚本,为攻击者打开反向 shell。 绕过扫描器,通过 AI 编码工具让攻击者获得完全控制。 恶意命令通过 DNS 获取,不存储在仓库中,从而规避检测。
rss · AIHOT 精选 · Jun 29, 10:04AIHOT 精选
背景: DNS 数据泄露是一种通过 DNS 请求传输数据的技术,常用于规避检测。
参考链接
标签: #security, #AI coding tools, #supply chain attack, #LLM agents, #vulnerability
通过多样 RL 和上下文学习实现 AGI ⭐️ 9.0/10
一篇论文提出,通过在数千个多样化的强化学习环境中训练模型完成数百万可验证任务,利用上下文学习而非持续学习,可以构建 AGI。 这一范式转变可能重新定义通往 AGI 的路径,减少对持续学习的依赖,强调可扩展的上下文窗口。 论文引入了“可碾压性”概念——即可在确定性、可重播模拟器中并行运行大量 rollout 的能力。
rss · AIHOT 精选 · Jun 26, 15:51AIHOT 精选
背景: 上下文学习(ICL)允许模型在不更新参数的情况下,通过提示中的示例执行新任务。可验证奖励的强化学习(RLVR)提供客观反馈。该论文结合了这些理念。
参考链接
- [2506.05200] Transformers Meet In-Context Learning: A ... Towards Understanding How Transformers Learn In-context ... Towards Understanding How Transformers Learn In-context ... Trained Transformers Learn Linear Models In-Context In-Context Learning with Representations: Contextual ... Formalizing In-Context Learning in Transformers - Springer In-context Learning and Induction Heads
- Verifiable Rewards in Reinforcement Learning
标签: #AI, #AGI, #Reinforcement Learning, #Paradigm Shift, #Transformer
美国数百家报纸起诉微软和 OpenAI 滥用新闻内容训练 AI ⭐️ 9.0/10
近 400 家美国报纸起诉微软和 OpenAI,指控其未经授权使用新闻内容训练 AI。 此案可能为 AI 训练中的版权问题树立先例,影响整个行业的数据获取方式。 原告指控被告‘系统性地秘密’抓取网站并删除版权管理信息。
rss · AIHOT 精选 · Jun 26, 04:37AIHOT 精选
背景: 《数字千年版权法》禁止删除版权管理信息。本案将检验其在 AI 训练中的适用性。
标签: #AI, #copyright, #lawsuit, #OpenAI, #Microsoft
智谱 AI 发布 GLM-5.2,支持 1M 上下文,下周开源 ⭐️ 9.0/10
智谱 AI(Z.ai)正式发布 GLM-5.2,这是一个支持 1M token 上下文窗口的大规模推理模型,并宣布将于下周以 MIT 许可证开源。 这使得一个先进的、长上下文推理模型对全球 AI 社区免费可用,可能加速开源 AI 发展。 GLM-5.2 在 PostTrainBench 上优于 Opus 4.7 和 GPT-5.5,仅次于 Opus 4.8。
rss · AIHOT 日报 · Jun 14, 00:00AIHOT 日报
背景: 智谱 AI(国际品牌为 Z.ai)是中国领先的 AI 公司,被誉为‘AI 四小龙’之一。自 2025 年 7 月起,该公司以 MIT 许可证开源其 GLM 模型。
社区讨论: 暂未获取到社区讨论内容。
标签: #AI, #LLM, #open source, #Zhipu, #GLM
小米 MiMo-V2.5-Pro-UltraSpeed 在 1T MoE 模型上达到 1000 tokens/s ⭐️ 9.0/10
小米的 MiMo-V2.5-Pro-UltraSpeed 在单个 8-GPGPU 节点上,对 1 万亿参数 MoE 模型实现了超过 1000 tokens/s 的推理速度。 这一突破使得在商用 GPU 上对万亿参数模型进行超快推理成为可能,推动了实时 AI 应用的发展。 该模型采用混合专家架构,1T 总参数中仅激活 32B 参数,从而优化了吞吐量。
rss · AIHOT 日报 · Jun 9, 00:00AIHOT 日报
背景: MoE 模型每个 token 仅激活部分参数,从而在不显著增加计算量的情况下实现更大的模型规模。这一成果展示了极致的模型-系统协同优化。
社区讨论: AI 社区对这一结果表示赞赏,认为它突破了以往的限制,且无需像 Cerebras 那样的专用硬件。
标签: #AI, #inference, #MoE, #GPU, #performance
vLLM v0.24.0:支持 MiniMax-M3 并优化 DeepSeek-V4 ⭐️ 8.0/10
vLLM v0.24.0 新增了对 MiniMax-M3 模型的支持,并优化了 DeepSeek-V4 的性能,共有 571 次提交,来自 256 位贡献者。 此版本显著扩展了模型支持并提升了 vLLM(一个广泛使用的 LLM 推理框架)的推理效率。 值得注意的特性包括 Model Runner V2 默认量化、流式解析引擎,以及针对 DeepSeek-V4 的集群协作 topK 内核。
github · khluu · Jun 29, 19:41
背景: MXFP4 是一种 4 位浮点格式(E2M1),具有块级缩放指数,用于高效量化。FlashInfer 是一个用于注意力机制的 GPU 内核库,支持稀疏注意力以加速推理。
标签: #vLLM, #LLM inference, #MiniMax-M3, #DeepSeek-V4, #open-source
Rocket Lab 收购 Iridium ⭐️ 8.0/10
Rocket Lab 宣布收购 Iridium。 实现发射与卫星通信垂直整合,挑战 SpaceX。 Iridium 运营 66 颗在轨 LEO 卫星,提供全球覆盖。
hackernews · everfrustrated · Jun 29, 14:09 · 社区讨论T2 社区与开源
背景: Iridium 是低轨卫星星座,提供全球语音/数据通信。
社区讨论: 聪明的策略,类似 SpaceX 用 Starlink 保证发射需求。——JanSolo
标签: #space, #acquisition, #satellite, #rocketlab, #iridium
CUDA 内核执行内部机制深度解析 ⭐️ 8.0/10
一篇详细文章解释了运行 CUDA 内核的完整过程,从用户空间 API 调用到硬件调度。 开发者获得关于 GPU 编程优化和调试的关键洞察。 文章涵盖了默认流中的基于信号量的同步以及线程束的资格条件。
hackernews · mezark · Jun 29, 13:11 · 社区讨论T2 社区与开源
背景: CUDA 是 NVIDIA 的并行计算平台。内核是在 GPU 上运行的函数。
社区讨论: 评论赞扬该文章的教育价值,并指出使用驱动 API 可提供更多透明度。
标签: #CUDA, #GPU, #kernel, #parallel computing, #NVIDIA
Arena AI 排行榜估值达 1 亿美元 ⭐️ 8.0/10
热门 AI 排行榜 Arena 在 9 月推出商业服务后,估值达到 1 亿美元。 这证明社区驱动的 AI 基准测试可以商业化。 商业服务于 2025 年 9 月推出,如今估值达 1 亿美元。
rss · TechCrunch · Jun 29, 17:39T1 官方实验室
背景: Arena 是一个免费、社区驱动的 AI 排行榜,用户通过投票比较 AI 模型。它已成为 LLM 性能的标准参考。
标签: #AI, #leaderboard, #startup, #business, #community
Claude 现已在 Microsoft Foundry 上可用 ⭐️ 8.0/10
Anthropic 的 Claude 模型 Opus 4.8 和 Haiku 4.5 现已在 Microsoft Foundry 上线,托管于 Azure 并使用 NVIDIA GB300 GPU。 Azure 用户现在可以将 Claude 集成到工作流中,享受统一计费和企业级控制,促进 AI 采用。 支持提示缓存、扩展思考以及美国区域的数据驻留。
rss · AIHOT 精选 · Jun 29, 18:22AIHOT 精选
背景: Microsoft Foundry 是一个托管 AI 平台,用于构建和部署 AI 代理。提示缓存可减少重复提示的延迟和成本,而扩展思考让 Claude 展示其推理过程。
标签: #Claude, #Microsoft Foundry, #Azure, #AI, #Enterprise
Qwen 3.6 27B:优秀的本地大模型 ⭐️ 8.0/10
Qwen 3.6 27B 是一款密集参数本地大语言模型,支持 256k 上下文。 它使得不依赖云端的强大本地 AI 成为可能。 在 RTX 5090 上使用 Q6_K 量化,可达 50 tokens/s。
rss · AIHOT 精选 · Jun 29, 18:03AIHOT 精选
背景: Q8_0 是 llama.cpp 的 8 位 GGUF 量化方式:权重存储为 INT8,每 32 个元素块有一个 FP16 尺度。多 token 预测通过同时预测多个 token 来加速生成。
参考链接
社区讨论: HN 用户称其为本地大模型的重大突破。
标签: #local LLM, #Qwen, #AI inference, #large language model, #open source
美军 AI 误炸学校因数据库断连 ⭐️ 8.0/10
美军 AI 目标系统因数据库断连,误炸学校致约 120 人死亡。 AI 目标选取失败暴露数据孤岛导致平民伤亡。 分析师标记存在于未连接 MIDB 的独立工具中。
rss · AIHOT 精选 · Jun 29, 12:30AIHOT 精选
背景: MIDB 是 1980 年代手动录入的数据库,替代系统 MARS 已多次延期。
参考链接
标签: #AI, #military, #ethics, #Palantir, #system failure
小红书 RedKnot 推理引擎:将 KV Cache 按注意力头拆解实现长文本加速 ⭐️ 8.0/10
RedKnot accelerates long-context LLM inference by decomposing KV Cache along attention heads and using head-classification sparsity, achieving up to 5.16x TTFT speedup on DeepSeek-V4-Flash.
rss · AIHOT 精选 · Jun 29, 11:00AIHOT 精选
标签: #KV Cache, #LLM inference, #attention mechanism, #efficiency, #long context
SK 集团计划投资 1000 万亿韩元建设 15GW AI 数据中心 ⭐️ 8.0/10
SK 集团宣布到 2035 年建设 15GW AI 数据中心,总投资达 1000 万亿韩元。 这一大规模投资旨在将韩国出口经济从传统商品转向智能服务,并大幅增加全球 AI 计算基础设施。 作为更广泛计划的一部分,SK 海力士将在半导体供应项目上投资 400 万亿韩元。
rss · AIHOT 精选 · Jun 29, 06:44AIHOT 精选
背景: 实体 AI(Physical AI)指的是使自主系统能够在物理世界中感知、理解、推理并执行复杂动作的人工智能,例如机器人和自动驾驶汽车。
标签: #AI Infrastructure, #Data Centers, #Investment, #South Korea, #Compute
Grok 4.5 在 SpaceX 和 Tesla 私测,性能接近 Opus ⭐️ 8.0/10
xAI 的 Grok 4.5 在 SpaceX 和 Tesla 开始私测,性能号称比肩 Opus。 标志着在尖端科技公司内部部署中 AI 训练的快速进展。 基于 1.5 万亿参数的 V9 基础模型并整合了 Cursor 数据。
rss · AIHOT 精选 · Jun 28, 10:50AIHOT 精选
背景: Grok 是 xAI 的 AI 聊天机器人,Opus 指 Anthropic 的顶级模型 Claude Opus。
标签: #AI, #Grok, #xAI, #model training, #reinforcement learning
附录
以下内容来自 AIHOT 日报,每天 08:00 北京时间发布
-
AI HOT 日报 · 2026-06-29 — Grok 4.5 私测于 SpaceX 和 Tesla,性能接近 Opus Grok 4.5 私测于 SpaceX 和 Tesla,性能接近 Opus — 点击查看完整日报
-
AI HOT 日报 · 2026-06-28 — 阿里千问输入法上线 macOS 版:最快 300 字/分,AI 自动润色 阿里千问输入法上线 macOS 版:最快 300 字/分,AI 自动润色 — 点击查看完整日报
-
AI HOT 日报 · 2026-06-27 — OpenAI 预览新一代模型 GPT-5.6 Sol OpenAI 预览新一代模型 GPT-5.6 Sol — 点击查看完整日报
-
AI HOT 日报 · 2026-06-26 — Ornith-1.0 开源模型家族发布,专注 Agentic Coding 全参数规模 Ornith-1.0 开源模型家族发布,专注 Agentic Coding 全参数规模 — 点击查看完整日报
-
AI HOT 日报 · 2026-06-25 — OpenAI ChatGPT 语音最大规模升级:双向 AI 语音模型 Bidi 1 已上线测试 OpenAI ChatGPT 语音最大规模升级:双向 AI 语音模型 Bidi 1 已上线测试 — 点击查看完整日报
-
AI HOT 日报 · 2026-06-24 — FastWan-QAD:单卡 5090 上 1.8 秒生成 5 秒视频 FastWan-QAD:单卡 5090 上 1.8 秒生成 5 秒视频 — 点击查看完整日报
-
AI HOT 日报 · 2026-06-23 — PP-OCRv6 on Hugging Face:50 语言 OCR,参数规模 1.5M 至 34.5M PP-OCRv6 on Hugging Face:50 语言 OCR,参数规模 1.5M 至 34.5M — 点击查看完整日报
-
AI HOT 日报 · 2026-06-22 — 美团 tabbit 国际版免费接入 GPT-5.5/Claude Opus 4.8 等旗舰模型 美团 tabbit 国际版免费接入 GPT-5.5/Claude Opus 4.8 等旗舰模型 — 点击查看完整日报
-
AI HOT 日报 · 2026-06-21 — 微软双向转售 GPT 与 DeepSeek 成全球最大 AI 中间商 微软双向转售 GPT 与 DeepSeek 成全球最大 AI 中间商 — 点击查看完整日报
-
AI HOT 日报 · 2026-06-20 — 阿里开源向量数据库 Zvec,UCSD 黄碧薇教授提出因果 AI 第四代范式 阿里开源向量数据库 Zvec,UCSD 黄碧薇教授提出因果 AI 第四代范式 — 点击查看完整日报
-
AI HOT 日报 · 2026-06-19 — 首个统一科学大模型 LOGOS 正式开源 首个统一科学大模型 LOGOS 正式开源 — 点击查看完整日报
-
AI HOT 日报 · 2026-06-18 — MolmoMotion:语言引导的 3D 运动预测模型 MolmoMotion:语言引导的 3D 运动预测模型 — 点击查看完整日报
-
AI HOT 日报 · 2026-06-17 — Cartesia 发布 Sonic 3.5 与 Ink 2 实时语音模型 Cartesia 发布 Sonic 3.5 与 Ink 2 实时语音模型 — 点击查看完整日报
-
AI HOT 日报 · 2026-06-16 — MiniMax 开源 M3 模型权重及 MSA 技术论文 MiniMax 开源 M3 模型权重及 MSA 技术论文 — 点击查看完整日报
-
AI HOT 日报 · 2026-06-15 — Anthropic 暂停新模型访问,印度辩论 AI 未来 Anthropic 暂停新模型访问,印度辩论 AI 未来 — 点击查看完整日报
-
AI HOT 日报 · 2026-06-14 — 智谱 GLM-5.2 全量开放,支持 1M 上下文且下周开源 智谱 GLM-5.2 全量开放,支持 1M 上下文且下周开源 — 点击查看完整日报
-
AI HOT 日报 · 2026-06-13 — MiniMax M3 开源权重模型发布,已上架 HuggingFace MiniMax M3 开源权重模型发布,已上架 HuggingFace — 点击查看完整日报
-
AI HOT 日报 · 2026-06-12 — Gemini Omni Flash 视频任务达 SOTA Gemini Omni Flash 视频任务达 SOTA — 点击查看完整日报
-
AI HOT 日报 · 2026-06-11 — DiffusionGemma:文本生成速度提升 4 倍的开源扩散模型 DiffusionGemma:文本生成速度提升 4 倍的开源扩散模型 — 点击查看完整日报
-
AI HOT 日报 · 2026-06-10 — Claude Fable 5 和 Claude Mythos 5 Claude Fable 5 和 Claude Mythos 5 — 点击查看完整日报
-
AI HOT 日报 · 2026-06-09 — 小米 MiMo-V2.5-Pro-UltraSpeed 突破 1,000 tokens/s,单台 8-GPGPU 节点运行 1T MoE 模型 小米 MiMo-V2.5-Pro-UltraSpeed 突破 1,000 tokens/s,单台 8-GPGPU 节点运行 1T MoE 模型 — 点击查看完整日报
-
AI HOT 日报 · 2026-06-08 — Harness-1:基于强化学习训练的有状态搜索 20B 检索子智能体 Harness-1:基于强化学习训练的有状态搜索 20B 检索子智能体 — 点击查看完整日报
-
AI HOT 日报 · 2026-06-07 — GitHub 开源 Spec Kit 工具包,用产品规范引导 AI 编码 GitHub 开源 Spec Kit 工具包,用产品规范引导 AI 编码 — 点击查看完整日报
-
AI HOT 日报 · 2026-06-06 — Riverflow 2.5:可控制评分标准的图像模型 Riverflow 2.5:可控制评分标准的图像模型 — 点击查看完整日报
-
AI HOT 日报 · 2026-06-05 — Nemotron 3.5 Content Safety:面向全球企业 AI 的可定制多模态安全 Nemotron 3.5 Content Safety:面向全球企业 AI 的可定制多模态安全 — 点击查看完整日报
-
AI HOT 日报 · 2026-06-04 — Grok Imagine 1.5 预览版发布 Grok Imagine 1.5 预览版发布 — 点击查看完整日报
-
AI HOT 日报 · 2026-06-03 — 微软首款高级推理 AI 模型 MAI-Thinking-1 发布 微软首款高级推理 AI 模型 MAI-Thinking-1 发布 — 点击查看完整日报
-
AI HOT 日报 · 2026-06-02 — MiniMax M3:前沿编码、100 万 token 上下文与原生多模态一体模型 MiniMax M3:前沿编码、100 万 token 上下文与原生多模态一体模型 — 点击查看完整日报
-
AI HOT 日报 · 2026-06-01 — OpenAI 发布生物防御 AI 工具 Rosalind OpenAI 发布生物防御 AI 工具 Rosalind — 点击查看完整日报
-
AI HOT 日报 · 2026-05-31 — Nano Banana Pro 与 Nano Banana 2 正式发布 Nano Banana Pro 与 Nano Banana 2 正式发布 — 点击查看完整日报