从 162 条内容中筛选出 80 条重要资讯


  1. 虚假求职面试中的后门攻击开发者 ⭐️ 9.0/10
  2. HN 用户分享用本地模型替代云端 AI 的成功经验 ⭐️ 9.0/10
  3. 福克斯提议收购 Roku ⭐️ 9.0/10
  4. 卫星首次自主识别目标 ⭐️ 9.0/10
  5. DFlash 与 Spec V2:实现 4.3 倍 LLM 推理加速 ⭐️ 9.0/10
  6. Flash-KMeans:在 GPU 上比 FAISS 快 200 倍的精确 K-Means ⭐️ 9.0/10
  7. Anthropic 秘密提交 IPO 申请,估值 9650 亿美元 ⭐️ 9.0/10
  8. 智谱发布 GLM-5.2,支持 1M 上下文,下周开源 ⭐️ 9.0/10
  9. MiniMax 稀疏注意力将百万 token 计算量削减 28 倍 ⭐️ 9.0/10
  10. Factory 2.0 发布:AI 智能体覆盖完整软件工作流 ⭐️ 9.0/10
  11. Anthropic 限制 Mythos AI 仅对 200 个合作伙伴开放 ⭐️ 9.0/10
  12. 美国政府迫使 Anthropic 下线 Fable 5 和 Mythos 5 ⭐️ 9.0/10
  13. 智谱 GLM-5.2 发布,支持 1M 上下文并将于下周开源 ⭐️ 9.0/10
  14. 小米 MiMo-V2.5-Pro-UltraSpeed 在 8 GPU 节点上实现 1000+ tokens/s ⭐️ 9.0/10
  15. Anthropic 发布 Claude Opus 4.8,重大升级 ⭐️ 9.0/10
  16. 谷歌 AlphaProof Nexus 攻克两道 56 年数学难题 ⭐️ 9.0/10
  17. vLLM 实现支持万亿参数模型 ⭐️ 9.0/10
  18. vLLM v0.23.0:DeepSeek-V4 成熟,模型运行器 V2 扩展 ⭐️ 8.0/10
  19. Iroh 1.0 发布:点对点网络库 ⭐️ 8.0/10
  20. Typst 0.15.0 增加多文献目录和 MathML 支持 ⭐️ 8.0/10
  21. 美国政府禁售 Anthropic AI 模型引发政策辩论 ⭐️ 8.0/10
  22. 网络安全专家抗议美国禁止 Anthropic 强大模型 ⭐️ 8.0/10
  23. Salesforce 以 36 亿美元收购 Fin,增强 AI 智能体 ⭐️ 8.0/10
  24. 福克斯以 220 亿美元收购 Roku ⭐️ 8.0/10
  25. MiniMax 开源 428B 参数 M3 模型及 MSA 论文 ⭐️ 8.0/10
  26. 白宫 AI 监管被指偏袒 ⭐️ 8.0/10
  27. 纳德拉:构建人力资本与 token 资本的学习循环 ⭐️ 8.0/10
  28. 安卓安全负责人因军事 AI 协议辞职 ⭐️ 8.0/10
  29. OpenAI 遭多州总检察长联合调查 ⭐️ 8.0/10
  30. 抗议今年叫停 1300 亿美元 AI 数据中心项目 ⭐️ 8.0/10
  31. 宝可梦玩家数据被用于军用无人机 AI 训练 ⭐️ 8.0/10
  32. Kimi 开源 K2.7-Code 模型,性能大幅提升 ⭐️ 8.0/10
  33. Pythagoras-Prover 4B 参数定理证明器超越 671B 模型 ⭐️ 8.0/10
  34. Anthropic 应特朗普要求禁止外国访问其顶级 AI 模型 ⭐️ 8.0/10
  35. GitHub 发布多语言开源数据集加速 AI 研究 ⭐️ 8.0/10
  36. 美国因安全担忧禁止 Anthropic 的 Fable 5 和 Mythos 5 ⭐️ 8.0/10
  37. OrcaRouter 推出 DSL 路由工具,对标 OpenRouter Fusion ⭐️ 8.0/10
  38. OpenAI 游说美国保持外籍研究员参与前沿 AI ⭐️ 8.0/10
  39. 美国政府批评 Anthropic,专家称无法破解的 LLM 不现实 ⭐️ 8.0/10
  40. 微软发布首款高级推理 AI 模型 MAI-Thinking-1 ⭐️ 8.0/10
  41. MiniMax M3:前沿编码、百万 token 上下文、原生多模态 ⭐️ 8.0/10
  42. OpenAI 发布生物防御 AI 工具 Rosalind ⭐️ 8.0/10
  43. OpenAI 推出支持 70+ 语言的实时翻译模型 ⭐️ 8.0/10
  44. AI HOT 日报 · 2026-05-26 — 面壁智能联合清华等开源中国首个基于华为昇腾训练的 1.58-bit 端侧大模型 BitCPM-CANN ⭐️ 8.0/10
  45. Hetzner 云服务器价格飙升三倍 ⭐️ 7.0/10
  46. 英国提议禁止 16 岁以下用户使用社交媒体 ⭐️ 7.0/10
  47. NewCore 获 6600 万美元,为 AI 代理提供身份管理 ⭐️ 7.0/10
  48. AI 裁员浪潮引爆不平等火药桶 ⭐️ 7.0/10
  49. OpenAI 推出合作伙伴网络,投资 1.5 亿美元 ⭐️ 7.0/10
  50. Anthropic 暂停新模型访问,印度辩论 AI 未来 ⭐️ 7.0/10
  51. Meta 应北京要求开始撤销 20 亿美元 Manus 收购 ⭐️ 7.0/10
  52. Suno 从零生成音轨,获得更纯净的音频分离 ⭐️ 7.0/10
  53. /architect:减少 80%的 Fable token,Fable 负责协调/审核,Codex 负责构建 ⭐️ 7.0/10
  54. 扎克伯格承认 Meta AI 转型过快,裁员 10% ⭐️ 7.0/10
  55. AI 订阅价格提供 40-70 倍的 API 价值,但存在不可持续风险 ⭐️ 7.0/10
  56. Google 起诉被指使用 AI 发送诈骗短信的中国网络犯罪团伙”Outsider Enterprise” ⭐️ 7.0/10
  57. Hermes Agent 的 OpenRouter 使用指南 ⭐️ 7.0/10
  58. olmo-eval:面向 LLM 开发的模块化评估工作台 ⭐️ 7.0/10
  59. DeepMind 启动机器人加速器,支持 15 家欧洲初创公司 ⭐️ 7.0/10
  60. VISTA-4B GUI 定位 VLM 发布 ⭐️ 7.0/10
  61. AI 社会实验:Claude 建乌托邦,Grok 四天混乱 ⭐️ 7.0/10
  62. 规格驱动开发(SDD)的三个技能 ⭐️ 7.0/10
  63. Codex 推出基于 CDP 的浏览器开发者模式 ⭐️ 7.0/10
  64. 古尔曼:苹果或推出自主操作 iPhone 的 AI 智能体 ⭐️ 7.0/10
  65. Sakana AI 推出商用自主智能体 Sakana Marlin ⭐️ 7.0/10
  66. Nathan Lambert 后训练课程发布三新视频 ⭐️ 7.0/10
  67. Cursor 早期主导 Anthropic 收入 ⭐️ 7.0/10
  68. Gemma 4 12B 可视化指南:无编码器音视频处理 ⭐️ 7.0/10
  69. Fable 的飞跃或预示 AI 指数级进步 ⭐️ 7.0/10
  70. Runway 集成到 ChatGPT 中,可生成编辑视频图像 ⭐️ 7.0/10
  71. Jeff Dean 推荐关于 AI 进展的细致视角文章 ⭐️ 7.0/10
  72. MiniMax 开源 M3 模型权重上架 HuggingFace ⭐️ 7.0/10
  73. Gemini Omni Flash 在视频任务上达到 SOTA ⭐️ 7.0/10
  74. DiffusionGemma:文本生成速度提升 4 倍的开源扩散模型 ⭐️ 7.0/10
  75. AI HOT 日报 · 2026-06-10 — Claude Fable 5 和 Claude Mythos 5 ⭐️ 7.0/10
  76. Harness-1:基于强化学习的 20B 检索子智能体 ⭐️ 7.0/10
  77. Grok Imagine 1.5 预览版发布 ⭐️ 7.0/10
  78. Luma Agents 实现规模化真实 UGC 广告生成 ⭐️ 7.0/10
  79. StepAudio 2.5 实时语音:副语言感知 AI ⭐️ 7.0/10
  80. 首个华为昇腾 NPU 上的 1.58 位开源大模型 ⭐️ 7.0/10

虚假求职面试中的后门攻击开发者 ⭐️ 9.0/10

一名虚假招聘人员发送了一个带有后门的 Node.js 仓库,后门在 npm install 时执行。 这种新型供应链攻击利用了求职者的信任,构成了严重的安全威胁。 后门位于 npm prepare 脚本中,可执行来自服务器的任意命令。

hackernews · lwhsiao · Jun 15, 20:00 · 社区讨论T2 社区与开源

背景: npm 生态系统允许安装脚本,可能被滥用于此类供应链攻击。

参考链接

社区讨论: 评论指出该攻击与正常面试任务非常相似,并呼吁建立更好的网络犯罪举报机制。

标签: #security, #supply-chain-attack, #Node.js, #npm, #infosec


HN 用户分享用本地模型替代云端 AI 的成功经验 ⭐️ 9.0/10

HN 用户报告完全用 Qwen3.6 35b 等本地模型替代 Claude/GPT 进行日常编码,在双 RTX 3090 上实现 150+ tok/s。 这表明本地 LLM 现在能处理实际编码任务,在隐私和成本上带来好处,且能力损失不大。 用户提到 Qwen3.6 35B(混合精度 A3B)和 Gemma-4 26B 表现最佳,通过 llama.cpp 或 Pi coding harness 在 RTX 3090 上运行。

hackernews · AIHOT 全部动态 · Jun 15, 14:46T2 社区与开源

背景: 本地 LLM 完全运行在用户的硬件上,消除了 API 成本和隐私问题。Qwen 是阿里巴巴的一系列开源模型;Qwen3.6 35B 使用混合专家 (MoE) 架构,活跃参数为 3B。

参考链接

社区讨论: 大多数评论者持积极态度,认为本地模型对大多数编码足够,但在复杂任务上仍有不足。部分人讨论速度与能力之间的权衡。

标签: #local LLMs, #coding, #privacy, #model comparison, #Qwen


福克斯提议收购 Roku ⭐️ 9.0/10

福克斯提议收购 Roku。 威胁平台中立性并引发反垄断担忧。 福克斯将获得 Roku 覆盖的 30-50%美国家庭。

hackernews · thm · Jun 15, 12:50 · 社区讨论T2 社区与开源

背景: Roku 是美国领先的流媒体平台,福克斯是大型媒体集团。

社区讨论: 用户持悲观态度;有人表示媒体公司不应拥有硬件。

标签: #acquisition, #streaming, #media consolidation, #Roku, #Fox


卫星首次自主识别目标 ⭐️ 9.0/10

今年四月,一颗地球观测卫星利用星载人工智能独立找到了目标。 实现轨道实时自主决策,减少对地面控制的依赖。 星载 AI 实时处理图像并决定指向何处,无需人工干预。

rss · TechCrunch · Jun 15, 12:00T1 官方实验室

背景: 传统上,卫星将原始数据下传至地球进行分析。星载 AI 可实现即时处理和决策,降低延迟,并能够快速响应短暂事件。

参考链接

标签: #satellite, #autonomous systems, #AI, #earth observation, #machine learning


DFlash 与 Spec V2:实现 4.3 倍 LLM 推理加速 ⭐️ 9.0/10

DFlash 与 Spec V2 在 Qwen 397B 上实现 4.3 倍吞吐量提升。 大幅加速大型 LLM 推理,降低成本。 采用块扩散和 KV 注入实现并行草稿生成。

rss · AIHOT 精选 · Jun 15, 17:25AIHOT 精选

背景: 投机解码使用草稿模型提议 token。DFlash 使用扩散模型批量生成草稿。

参考链接

社区讨论: 有用户反馈 Spec V2+FA3 导致输出截断。

标签: #speculative decoding, #LLM inference, #DFlash, #SGLang, #throughput optimization


Flash-KMeans:在 GPU 上比 FAISS 快 200 倍的精确 K-Means ⭐️ 9.0/10

UC Berkeley 与 UT Austin 开源 Flash-KMeans,通过 IO 感知的核函数,在 GPU 上实现比 FAISS 快 200 倍以上的精确 K-Means。 这一突破极大地加速了精确 K-Means 聚类,惠及向量搜索、稀疏注意力路由和大规模 KV 缓存压缩等场景。 FlashAssign 核通过融合距离计算与在线 argmin,将 IO 复杂度从 O(NK)降至 O(Nd+Kd);Sort-Inverse Update 核将原子争用降低最多 6.3 倍。

rss · AIHOT 精选 · Jun 15, 09:16AIHOT 精选

背景: 传统 GPU 上的 K-Means 需要物化巨大的距离矩阵,导致内存带宽瓶颈。Flash-KMeans 采用类似 FlashAttention 的 IO 感知设计,重组数据流以最小化全局内存访问。

参考链接

标签: #K-Means, #GPU, #IO-aware, #Clustering, #FAISS


Anthropic 秘密提交 IPO 申请,估值 9650 亿美元 ⭐️ 9.0/10

Anthropic 秘密提交 IPO 申请,估值 9650 亿美元。 这标志 AI 市场转折点,或成史上最大科技 IPO。 Anthropic 是 Claude AI 模型的创造者。

rss · AIHOT 精选 · Jun 13, 11:00AIHOT 精选

背景: Anthropic 是一家以 Claude 闻名的 AI 初创公司,专注于安全研究,已融资超百亿美元。

标签: #AI, #IPO, #Anthropic, #business, #startup


智谱发布 GLM-5.2,支持 1M 上下文,下周开源 ⭐️ 9.0/10

智谱今日向所有 GLM Coding Plan 用户全量开放 GLM-5.2,API 和 MIT 许可证开源版本将于下周发布。 这标志着开源编程模型的重要进步,提供 100 万 token 上下文并宣称国内最强的编码性能。 GLM-5.2 基于 GLM-5.1 构建,在 SWE-Bench Pro 上达到最先进水平,并支持两种思考模式。

rss · AIHOT 精选 · Jun 13, 06:19AIHOT 精选

背景: GLM 是智谱 AI 开发的大语言模型系列。100 万 token 的上下文窗口允许模型在单次输入中处理约 75 万单词。

参考链接

社区讨论: 早期评测强调 GLM-5.2 强大的编码能力和实用的长上下文使用,使其成为有竞争力的开源替代方案。

标签: #AI, #open-source, #large language model, #GLM, #coding model


MiniMax 稀疏注意力将百万 token 计算量削减 28 倍 ⭐️ 9.0/10

MiniMax 提出稀疏注意力(MSA),通过路由分支选择 key-value 块,在 1M token 时将注意力计算量削减 28.4 倍,H800 GPU 上预填充提速 14.2 倍,且性能基本持平。 这极大降低了长上下文 LLM 的推理成本,使百万 token 序列的高效处理在生产环境中变得可行。 MSA 选择 key-value 块而非单个 token,以降低路由开销并使稀疏注意力更规整(块大小 B_k)。

rss · AIHOT 全部动态 · Jun 15, 20:39AIHOT 全部动态

背景: 分组查询注意力(GQA)让查询组共享键值头。MSA 在 GQA 旁增设一个小型路由分支,通过训练使每个查询组自主选择应查看的 key-value 块,将长上下文视为延迟约束下的检索问题。

参考链接

标签: #Attention, #LLM Inference, #Efficient Transformers, #Sparse Attention, #AI Research


Factory 2.0 发布:AI 智能体覆盖完整软件工作流 ⭐️ 9.0/10

FactoryAI 发布 Factory 2.0,将 AI 智能体整合到从工单分类到生产监控的整个软件生命周期中。 这标志着 AI 从编程辅助转向自主软件工厂管理,可能彻底改变 DevOps 和 CI/CD 实践。 所有事件(包括 bug、客户请求、测试失败和事故)都被视为用于持续智能体训练的反馈信号。

rss · AIHOT 全部动态 · Jun 15, 19:59AIHOT 全部动态

背景: 传统的 CI/CD 流水线将事件视为孤立任务;此次发布将它们统一为一个反馈循环。’智能体信号’概念有助于捕获推理过程而不仅仅是最终状态。

参考链接

标签: #AI Agents, #Software Development Workflow, #DevOps, #Automation, #CI/CD


Anthropic 限制 Mythos AI 仅对 200 个合作伙伴开放 ⭐️ 9.0/10

Anthropic 因安全风险将 Mythos AI 限制在 200 个合作伙伴内。 其强大的漏洞发现能力可能被攻击者利用。 Mythos 是一款专门发现软件漏洞的 AI。

rss · AIHOT 全部动态 · Jun 15, 19:08AIHOT 全部动态

背景: Mythos AI 是 Anthropic 开发的自动漏洞发现模型。出于被滥用的担忧,它只对 200 个经过审查的合作伙伴开放。

参考链接

社区讨论: 全球安全机构对 Mythos 的潜在影响表达了警惕。

标签: #AI, #vulnerability discovery, #Anthropic, #security, #restricted release


美国政府迫使 Anthropic 下线 Fable 5 和 Mythos 5 ⭐️ 9.0/10

美国政府命令 Anthropic 立即下架其尖端 AI 模型 Fable 5 和 Mythos 5,并禁止所有外籍人士(包括员工)访问。 美国的单边行动削弱了全球对美国 AI 的信任,并引发其他国家加速主权 AI 建设,重塑 AI 治理的地缘政治格局。 Fable 5 是 Mythos 级别的模型,支持 100 万 tokens 上下文,输入/输出价格为每百万 tokens 10/50 美元。

rss · AIHOT 全部动态 · Jun 15, 18:10AIHOT 全部动态

背景: Anthropic 于 2026 年 6 月 9 日发布了 Claude Fable 5,这是其此前限制性发布的 Mythos 模型的公开版本。Mythos 级别模型代表 Anthropic 最强大的 AI 系列,Fable 5 是该系列首个面向公众的模型。

参考链接

标签: #AI governance, #geopolitics, #Anthropic, #sovereign AI, #national security


智谱 GLM-5.2 发布,支持 1M 上下文并将于下周开源 ⭐️ 9.0/10

智谱 AI 全面发布 GLM-5.2,支持 100 万 tokens 上下文窗口,并宣布将于下周开源。 这一重要的上下文长度和开源发布使开发者能够处理长文档和复杂推理,推动了 LLM 生态系统的发展。 GLM-5.2 强调编码、工具使用和智能体工作流,具备精炼的推理系统,并提供 Max、Pro 和 Lite 三个版本。

rss · AIHOT 日报 · Jun 14, 00:00AIHOT 日报

参考链接

标签: #AI, #GLM, #large language models, #open-source, #context length


小米 MiMo-V2.5-Pro-UltraSpeed 在 8 GPU 节点上实现 1000+ tokens/s ⭐️ 9.0/10

小米在一台 8-GPU 节点上,实现了 1 万亿参数 MoE 模型每秒超过 1000 个 token 的推理速度。 这一突破显著降低了大型 MoE 模型的推理成本,使部署更加可及。 该模型 MiMo-V2.5-Pro-UltraSpeed 是一个包含 1 万亿参数的混合专家模型。

rss · AIHOT 日报 · Jun 9, 00:00AIHOT 日报

背景: 混合专家(MoE)模型使用稀疏激活,每次输入只激活部分参数,从而高效运行大型模型。

参考链接

标签: #AI, #inference, #MoE, #performance, #Xiaomi


Anthropic 发布 Claude Opus 4.8,重大升级 ⭐️ 9.0/10

Anthropic 发布了 Claude Opus 4.8,这是其能力最强的模型,在编码、智能体技能和推理方面有显著提升。 此次升级将 AI 编码和智能体能力提升到新高度,惠及依赖 AI 处理复杂任务的开发者和企业。 Claude Opus 4.8 支持 100 万 token 的上下文窗口,并接受文本、图像和文件输入。

rss · AIHOT 日报 · May 29, 00:00AIHOT 日报

背景: Claude Opus 是 Anthropic 最先进的 AI 模型系列,与 GPT-4 和 Gemini 竞争。智能体技能是可重用的指令集,使 AI 智能体能够执行特定任务。

参考链接

社区讨论: YouTube 上的早期测试显示编码性能强劲,开发者称赞其实时推理和工具使用能力。

标签: #Claude Opus, #AI, #LLM, #coding, #agent skills


谷歌 AlphaProof Nexus 攻克两道 56 年数学难题 ⭐️ 9.0/10

谷歌 DeepMind 的 AlphaProof Nexus AI 框架自主攻克了两道悬置 56 年的数学难题。 这一突破展示了 AI 解决长期未解数学难题的能力,可能加速自动推理领域的研究。 每个解法均通过 Lean 4 证明助手验证,计算成本仅数百美元,凸显了其高效性。

rss · AIHOT 日报 · May 27, 00:00AIHOT 日报

背景: AlphaProof Nexus 结合了大语言模型与强化学习来生成形式化证明。它使用 Lean 4 定理证明器进行验证,实现可靠的自动推理。

参考链接

标签: #Google, #AlphaProof Nexus, #AI, #mathematics, #breakthrough


vLLM 实现支持万亿参数模型 ⭐️ 9.0/10

社区协作使 vLLM 能够服务万亿参数大语言模型,这是推理优化的重大里程碑。 这一突破极大地扩展了可高效部署的模型规模,对 AI 基础设施和可及性产生深远影响。 vLLM 利用多种并行策略,并支持 NVIDIA、AMD 和谷歌 TPU 等多种硬件。

rss · AIHOT 日报 · May 17, 00:00AIHOT 日报

背景: vLLM 是一个高吞吐量、内存高效的推理和服务引擎,用于大语言模型。它支持 200 多种模型架构和各种硬件插件。万亿参数模型需要极端的并行性和内存优化,vLLM 现已实现。

参考链接

标签: #vLLM, #large language models, #inference optimization, #AI infrastructure


vLLM v0.23.0:DeepSeek-V4 成熟,模型运行器 V2 扩展 ⭐️ 8.0/10

vLLM v0.23.0 发布,包含 408 次提交,大幅强化了 DeepSeek-V4 并将模型运行器 V2 扩展到 Llama 和 Mistral 密集模型。 此版本增强了推理性能和模型支持,惠及庞大的 vLLM 生产用户群。 来自 200 位贡献者的 408 次提交;DeepSeek-V4 增加了 TRTLLM-gen 注意力内核并解耦了稀疏 MLA 元数据。

github · khluu · Jun 15, 05:27

背景: vLLM 是一个高性能的开源 LLM 推理引擎;此版本巩固了对 DeepSeek-V4 等先进模型的支持。

参考链接

标签: #vLLM, #LLM inference, #DeepSeek-V4, #open source, #release notes


Iroh 1.0 发布:点对点网络库 ⭐️ 8.0/10

Iroh 团队发布了其点对点网络库的 1.0 版本,为应用实例间的直接连接提供稳定 API。 Iroh 1.0 为开发者提供了生产级解决方案,无需管理网络基础设施即可构建点对点应用。 该库使用公钥而非 IP 地址进行寻址,支持 IPv4、IPv6 和中继传输,并提供自定义传输 API。

hackernews · chadfowler · Jun 15, 15:13 · 社区讨论T2 社区与开源

背景: Iroh 是一个用于点对点连接的 Rust 库。它常被比作应用层的 Tailscale:Tailscale 提供网络层 VPN,而 Iroh 通过公钥拨号实现应用实例间的直接连接。

参考链接

社区讨论: 评论者讨论了使用场景,并将 Iroh 与 WebRTC 和 Tailscale 进行比较,开发者指出新的自定义传输特性适用于 BLE 等非 IP 网络。

标签: #networking, #p2p, #distributed-systems, #rust


Typst 0.15.0 增加多文献目录和 MathML 支持 ⭐️ 8.0/10

Typst 0.15.0 增加了多文献目录和自动 MathML 导出功能。 使 Typst 更适用于学术文档,成为 LaTeX 的重要替代方案。 导出公式为 MathML,增强了 HTML 输出质量。

hackernews · schu · Jun 15, 17:24 · 社区讨论T2 社区与开源

背景: Typst 是一种基于标记的排版系统,作为 LaTeX 的现代替代品,注重易用性。

参考链接

社区讨论: 用户称赞多文献目录,但报告了讨论性脚注中的引用问题。

标签: #typesetting, #typst, #open-source, #version-release


美国政府禁售 Anthropic AI 模型引发政策辩论 ⭐️ 8.0/10

美国政府以国家安全为由,命令 Anthropic 撤下 Fable 5 和 Mythos 5 模型。 政府干预削弱了 AI 产品的信任,并为 AI 模型出口管制树立先例。 禁令源于一篇描述破解 Fable 5 的论文,但安全专家认为此举反应过度。

rss · TechCrunch · Jun 15, 21:50T1 官方实验室

背景: Fable 5 和 Mythos 5 是 Anthropic 最新的网络安全模型。Mythos 5 是高能力模型,Fable 5 是增加安全防护的版本。禁令援引一条模糊的出口管制规则,专家认为该规则不适用。

参考链接

社区讨论: 安全研究人员称禁令具有报复性,损害美国网络防御能力,呼吁撤销。

标签: #AI policy, #cybersecurity, #export controls, #Anthropic, #government regulation


网络安全专家抗议美国禁止 Anthropic 强大模型 ⭐️ 8.0/10

数十名网络安全专家敦促白宫解除对 Anthropic 的 Fable 和 Mythos AI 模型的出口禁令。 这些限制阻碍了防御性 AI 的使用,削弱了国家网络安全。 Anthropic 于 6 月 12 日暂停了 Fable 5 和 Mythos 5,理由是安全问题。

rss · TechCrunch · Jun 15, 15:29T1 官方实验室

背景: Claude Fable 5 是 Anthropic 最强的编程 AI;Mythos 是其最强大的模型。出口管制旨在防止被用于攻击性网络操作。

参考链接

标签: #AI policy, #cybersecurity, #Anthropic, #export controls, #AI safety


Salesforce 以 36 亿美元收购 Fin,增强 AI 智能体 ⭐️ 8.0/10

Salesforce 以 36 亿美元收购 AI 客服平台 Fin,用于增强其 Agentforce 平台。 这表明 Salesforce 在企业 AI 智能体领域积极扩张,应对日益激烈的竞争。 Fin 提供跨实时聊天、WhatsApp、短信、电话和 Slack 的 AI 智能体。

rss · AIHOT 精选 · Jun 15, 14:34AIHOT 精选

背景: Agentforce 是 Salesforce 构建自定义 AI 智能体以自动化任务的平台。Fin 前身为 Intercom。

参考链接

社区讨论: 部分分析师质疑高昂的价格,但认为整合 Fin 的多渠道能力具有战略价值。

标签: #AI, #acquisition, #customer service, #Salesforce, #enterprise


福克斯以 220 亿美元收购 Roku ⭐️ 8.0/10

福克斯以 220 亿美元收购 Roku,成为美国第三大电视公司。 该交易重塑美国电视格局,整合福克斯内容与 Roku 平台。 Roku 操作系统驱动数百万智能电视,使福克斯直接触达观众。

rss · TechCrunch · Jun 15, 13:43T1 官方实验室

标签: #acquisition, #streaming, #media, #Roku, #Fox


MiniMax 开源 428B 参数 M3 模型及 MSA 论文 ⭐️ 8.0/10

MiniMax 开源了 428B 参数 M3 模型权重及 MSA 稀疏注意力技术论文。 M3 在多个基准测试中位列开源模型第一,降低了多模态 AI 的门槛。 M3 采用混合专家架构,激活参数 23B,是首个从预训练就进行文本-图像交错混合训练的开源模型。

rss · AIHOT 精选 · Jun 15, 14:40AIHOT 精选

背景: MSA 是一种基于分组查询注意力(GQA)的块级稀疏注意力机制,通过轻量索引分支为每组选择前 k 个 KV 块。

参考链接

标签: #open-source, #large language model, #multimodal, #sparse attention


白宫 AI 监管被指偏袒 ⭐️ 8.0/10

白宫 AI 监管决策被批评偏袒 OpenAI 和亚马逊,并向 Anthropic 施压。 这损害了信任,可能加速外国 AI 发展,危及美国领导地位。 决策在 24 小时内完成,缺乏透明度,引发腐败担忧。

rss · AIHOT 精选 · Jun 14, 16:15AIHOT 精选

背景: 主权 AI 指国家建立独立 AI 基础设施、减少对外技术依赖的战略。批评者警告这可能促使其他国家加速主权 AI 发展。

参考链接

社区讨论: Gary Marcus 和 Dean W Ball 等专家呼吁建立独立监管机构,确保公平、基于证据的 AI 监管。

标签: #AI regulation, #policy, #transparency, #bias


纳德拉:构建人力资本与 token 资本的学习循环 ⭐️ 8.0/10

微软 CEO 萨提亚·纳德拉呼吁企业建立人力资本与 token 资本之间的学习循环,以避免 AI 价值集中。 这一框架警告称,如果没有这样的循环,大部分 AI 价值可能被少数主导模型攫取,重演全球化的空心化悲剧。 Token 资本指通过内部工作流的私有评估和强化学习构建的自有 AI 能力。

rss · AIHOT 精选 · Jun 14, 15:33AIHOT 精选

背景: ‘Token 资本’是纳德拉创造的一个术语,指组织积累的 AI 资产——模型、数据和微调——用于补充人类专业知识。

标签: #AI, #ecosystem, #human capital, #learning cycle, #Satya Nadella


安卓安全负责人因军事 AI 协议辞职 ⭐️ 8.0/10

谷歌 Android 安全负责人 René Mayrhofer 因公司签署军事 AI 协议及放弃碳中和目标而辞职。 此次高调辞职凸显了谷歌内部在人工智能伦理和气候承诺方面日益增长的分歧。 谷歌于 2025 年 2 月从其 AI 原则中移除了不开发武器或监控 AI 的承诺。

rss · AIHOT 精选 · Jun 13, 08:40AIHOT 精选

背景: 谷歌最初的政策不使用 AI 开发武器,但后来更新了 AI 原则。该公司还因 AI 能耗而悄悄放弃了碳中和目标。

标签: #Google, #AI ethics, #military AI, #resignation, #Android


OpenAI 遭多州总检察长联合调查 ⭐️ 8.0/10

多州总检察长联盟正在调查 OpenAI 的业务实践。 这标志着对 AI 数据实践和合规性的监管审查加强。 调查涵盖广泛主题,具体细节未公开。

rss · AIHOT 精选 · Jun 13, 00:27AIHOT 精选

标签: #OpenAI, #AI regulation, #data privacy, #legal investigation, #state attorneys general


抗议今年叫停 1300 亿美元 AI 数据中心项目 ⭐️ 8.0/10

由于环境和资源担忧,抗议活动今年成功阻止或推迟了价值 1300 亿美元的 AI 数据中心项目。 这标志着社会强烈反对,可能重塑全球 AI 基础设施扩张。 反对者称赢得这些延迟让他们‘尝到了政治权力的滋味’,部分项目被政府暂停或重新审查。

rss · AIHOT 精选 · Jun 12, 17:18AIHOT 精选

背景: AI 数据中心消耗大量能源和水资源,引发当地社区的环境担忧。

社区讨论: 反对者因行动成功而庆祝获得政治权力感。

标签: #AI, #data centers, #protests, #environmental impact, #infrastructure


宝可梦玩家数据被用于军用无人机 AI 训练 ⭐️ 8.0/10

宝可梦 Go 玩家的 AR 扫描数据被用来训练 AI,该 AI 可能帮助军用无人机在没有 GPS 的情况下导航。 这引发了关于消费者数据在未经同意的情况下被用于军事应用的严重隐私和伦理问题。 Niantic Spatial 从玩家处积累了约 300 亿次环境扫描,并与 Vantor 的软件结合实现无 GPS 定位。

rss · AIHOT 精选 · Jun 12, 11:15AIHOT 精选

背景: Niantic Spatial 是 Niantic 的衍生公司,利用玩家收集的 AR 数据进行 3D 地图绘制。Vantor 是一家美国防务承包商,开发无 GPS 导航系统。他们的合作创建了一个军用无人机系统。

参考链接

社区讨论: 公众和媒体对游戏数据被军事化使用表示强烈担忧。

标签: #data privacy, #AI ethics, #military technology, #surveillance, #Pokémon Go


Kimi 开源 K2.7-Code 模型,性能大幅提升 ⭐️ 8.0/10

Kimi 发布并开源了代码模型 Kimi-K2.7-Code,基准测试提升两位数,推理 token 减少 30%。 此次开源发布显著提升了 AI 代码生成的效率和准确性,对开发者意义重大。 基准测试提升:Kimi Code Bench v2 提升 21.8%,Program Bench 提升 11.0%,MLS Bench Lite 提升 31.5%。

rss · AIHOT 精选 · Jun 12, 10:16AIHOT 精选

背景: Kimi Code Bench v2 是 Moonshot AI 的内部编码智能体基准,用于真实软件工程任务。Program Bench 通过从二进制文件重建程序来评估代码生成智能体。MLS Bench Lite 测试 AI 发明机器学习方法的能力。

参考链接

标签: #AI, #code generation, #open source, #machine learning, #Kimi


Pythagoras-Prover 4B 参数定理证明器超越 671B 模型 ⭐️ 8.0/10

Pythagoras-Prover 发布了 4B 参数定理证明器,在 MiniF2F 上达到 86.1%,超越了 671B 的 DeepSeek-Prover-V2。 这表明数据高效训练和 LoRA 微调可大幅减小模型规模同时提升性能,降低了自动定理证明的门槛。 32B 版本达到 89.8%(Pass@32)和 92.6%(Pass@2024),创下新纪录。模型和数据将开源。

rss · AIHOT 全部动态 · Jun 15, 22:58AIHOT 全部动态

背景: MiniF2F 是一个包含 488 道奥林匹克级别数学问题的形式化基准测试,跨多个证明助手。LoRA(低秩适应)通过仅更新少量参数实现高效微调。

参考链接

标签: #AI, #theorem proving, #machine learning, #efficiency, #open source


Anthropic 应特朗普要求禁止外国访问其顶级 AI 模型 ⭐️ 8.0/10

Anthropic 应特朗普政府要求,禁止所有外国公民访问其最先进的 AI 模型。 这一政策标志着 AI 地缘政治的重大升级,影响全球对先进 AI 能力的访问。 限制针对 Anthropic 最先进的模型,可能包括 Claude 的变体。

rss · AIHOT 全部动态 · Jun 15, 19:19AIHOT 全部动态

背景: Anthropic 是一家美国 AI 安全公司,以 Claude 模型系列闻名。特朗普政府一直在收紧 AI 出口管制,以防止战略技术落入外国对手手中。

参考链接

标签: #AI, #regulation, #Anthropic, #geopolitics, #policy


GitHub 发布多语言开源数据集加速 AI 研究 ⭐️ 8.0/10

GitHub 在 CC0-1.0 许可下发布了包含多语言 README、issue 和 PR 的仓库级数据集。 该数据集使研究人员能够利用真实的开发者内容来构建和改进多语言 AI 模型。 该数据集包含超过 100 万个仓库的元数据和语言分类信号。

rss · AIHOT 全部动态 · Jun 15, 19:17AIHOT 全部动态

背景: CC0-1.0 是一种公有领域贡献许可,允许不受限制地使用而无需署名。仓库级数据集汇总了整个 GitHub 仓库的数据,而不仅仅是单个文件。

参考链接

标签: #multilingual AI, #open dataset, #GitHub, #NLP, #LLMs


美国因安全担忧禁止 Anthropic 的 Fable 5 和 Mythos 5 ⭐️ 8.0/10

Anthropic 发布了 Fable 5 和 Mythos 5,但因越狱漏洞被发现而迅速被美国政府禁止。 这标志着政府对 AI 部署的重大干预,凸显了能力与监管之间的紧张关系。 Fable 5 和 Mythos 5 拥有相同的权重但防护栏杆不同;Fable 5 是公开版本,安全措施更严格。

rss · AIHOT 全部动态 · Jun 15, 19:04AIHOT 全部动态

背景: 越狱是指设计输入以绕过 AI 安全限制。禁令起因是研究人员发现可诱导 Fable 5 提供用于网络攻击的信息。

参考链接

社区讨论: 一些评论者指出该禁令为政府对强大 AI 模型的控制开创了先例,而另一些人则认为这是必要的安全措施。

标签: #AI safety, #government regulation, #Anthropic, #AI policy, #security


OrcaRouter 推出 DSL 路由工具,对标 OpenRouter Fusion ⭐️ 8.0/10

OrcaRouter 发布 DSL 路由工具,复活已停用的 Fable 5 模型,提供更便宜、开源且用户掌握密钥的路由方案。 它直接挑战 OpenRouter Fusion,声称性能更好且用户完全可控,可能重塑 LLM 路由市场。 该工具使用单个 prompt 扩展到任意 panel,通过 judge 和 synthesizer 输出高质量答案,并通过 YAML 完全自定义流程。

rss · AIHOT 全部动态 · Jun 15, 18:44AIHOT 全部动态

背景: OpenRouter Fusion 是一个多模型推理插件,可在多个模型之间路由提示。Claude Fable 5 是 Anthropic 的模型,发布后不久即被暂停。

参考链接

标签: #AI routing, #open source, #DSL, #model competition, #tooling


OpenAI 游说美国保持外籍研究员参与前沿 AI ⭐️ 8.0/10

OpenAI 正在与美国政府协调,以确保外籍研究员能继续开发前沿 AI,此前 Anthropic 已禁止此类参与。 这可能为全行业限制外籍人才参与前沿 AI 研究树立先例,影响全球人才流动。 据 Financial Times 报道,整个行业正在就此问题与美国政府沟通,暗示可能出台全行业范围的法规。

rss · AIHOT 全部动态 · Jun 15, 18:40AIHOT 全部动态

背景: 前沿 AI 模型是最先进的大规模 AI 系统,突破能力边界,常展现出高级推理等涌现能力。这些模型需要顶尖人才,限制外籍研究员可能减缓进展。

参考链接

标签: #AI policy, #OpenAI, #talent, #government regulation, #frontier AI


美国政府批评 Anthropic,专家称无法破解的 LLM 不现实 ⭐️ 8.0/10

美国官员指责 Anthropic 在未等审查委员会设立的情况下发布 Fable 5,并隐瞒越狱漏洞。 该争端凸显了 LLM 固有的不安全性,以及出口管制可能削弱防御能力的风险。 超过 100 名安全专家签署公开信反对出口管制,指出 GPT-5.5 和中国的 Kimi 2.7 等模型也具备类似能力。

rss · AIHOT 全部动态 · Jun 15, 18:06AIHOT 全部动态

背景: 越狱是指绕过 LLM 安全措施,通常通过提示注入实现,即用户输入覆盖系统提示。提示注入是已知漏洞,可能永远无法完全解决。

参考链接

社区讨论: 专家警告,出口管制只会阻碍防御方,因为中国开源模型仅落后美国顶级模型几个月。

标签: #AI safety, #LLM security, #export controls, #jailbreak, #Anthropic


微软发布首款高级推理 AI 模型 MAI-Thinking-1 ⭐️ 8.0/10

微软发布了其首款高级推理 AI 模型 MAI-Thinking-1。 MAI-Thinking-1 减少了微软对外部 AI 提供商的依赖,并与顶尖推理模型竞争。 独立人类评估者在盲测中更偏爱 MAI-Thinking-1 而非 Sonnet 4.6。

rss · AIHOT 日报 · Jun 3, 00:00AIHOT 日报

背景: 高级推理 AI 模型采用逐步逻辑推理,区别于标准大型语言模型。

参考链接

社区讨论: 分析师指出,MAI-Thinking-1 为企业客户带来了机遇和风险。

标签: #AI, #Microsoft, #Large Language Model, #Reasoning


MiniMax M3:前沿编码、百万 token 上下文、原生多模态 ⭐️ 8.0/10

MiniMax 发布了 M3 模型,该模型实现了前沿级别的编码性能,通过 MiniMax Sparse Attention 支持 100 万 token 的上下文窗口,并且是原生多模态的。 这之所以重要,是因为 M3 将三种前沿能力整合在一个开放权重模型中,可能会加速编码、长上下文任务和多模态应用的 AI 开发。 该模型使用 MiniMax Sparse Attention (MSA),在 100 万 token 的上下文窗口中保证至少 512K token 的有效长度,并以开放权重形式发布。

rss · AIHOT 日报 · Jun 2, 00:00AIHOT 日报

背景: MiniMax Sparse Attention (MSA) 是一种专有的注意力机制,旨在通过降低计算复杂度来高效处理极长序列。“原生多模态”意味着该模型是从头开始在多种模态(文本、图像等)上训练的,而非将单独的模型拼接在一起。

参考链接

标签: #AI, #LLM, #multimodal, #long-context, #MiniMax


OpenAI 发布生物防御 AI 工具 Rosalind ⭐️ 8.0/10

OpenAI 发布了生物防御 AI 工具 Rosalind,用于生物防御和生命科学研究。 这标志着 AI 在公共卫生和安全领域的作用日益增强,可能加速药物发现和疫情防范。 Rosalind 包含 GPT-Rosalind,这是一个专为药物发现、基因组学和蛋白质分析设计的前沿推理模型。

rss · AIHOT 日报 · Jun 1, 17:58AIHOT 日报

背景: 生物防御利用 AI 检测和应对生物威胁。Rosalind 是 OpenAI 首个面向生命科学领域的特定模型,提供给受信任的开发者。

参考链接

标签: #OpenAI, #AI safety, #biodefense, #machine learning, #public health


OpenAI 推出支持 70+ 语言的实时翻译模型 ⭐️ 8.0/10

OpenAI 发布了支持 70 多种语言的实时翻译模型。 这增强了全球通信能力,对现有翻译服务构成挑战。 该模型可能采用基于 GPT-4o 的 ASR-翻译-TTS 流水线。

rss · AIHOT 日报 · Jun 1, 17:58AIHOT 日报

背景: 实时翻译通常包括自动语音识别 (ASR)、神经机器翻译 (NMT) 和文本转语音 (TTS)。OpenAI 的模型将这些步骤整合为一个系统。

参考链接

标签: #AI, #translation, #OpenAI, #NLP, #real-time


AI HOT 日报 · 2026-05-26 — 面壁智能联合清华等开源中国首个基于华为昇腾训练的 1.58-bit 端侧大模型 BitCPM-CANN ⭐️ 8.0/10

Mianbi Intelligence and Tsinghua open-source the first 1.58-bit edge large model BitCPM-CANN trained on Huawei Ascend.

rss · AIHOT 日报 · May 26, 00:00AIHOT 日报

标签: #edge AI, #model quantization, #Huawei Ascend, #open source, #large language model


Hetzner 云服务器价格飙升三倍 ⭐️ 7.0/10

Hetzner 宣布云服务器价格最高上涨 3 倍,原因是硬件成本上涨。 这影响了众多依赖 Hetzner 廉价云服务的开发者和企业,可能大幅增加他们的托管成本。 此调整适用于云服务器,某些配置的价格上涨了两倍(即原价的三倍)。

hackernews · tuhtah · Jun 15, 13:19 · 社区讨论T2 社区与开源

背景: Hetzner 是一家德国托管服务商,以低价独立服务器和云服务器闻名。此次涨价反映了硬件组件(如内存和 SSD)成本上升,部分原因是 AI 对稀缺资源的需求。

社区讨论: 评论者对 3 倍涨价表示震惊,指出硬件稀缺并质疑时机,部分人则思考 AI 繁荣的好处何在。

标签: #cloud computing, #hosting, #pricing, #hardware, #hetzner


英国提议禁止 16 岁以下用户使用社交媒体 ⭐️ 7.0/10

英国宣布禁止 16 岁以下用户使用 Snapchat、TikTok 等主要社交媒体平台。 此举可能重塑全球儿童安全法规,并影响科技巨头的用户基础。 禁令涵盖 Snapchat、TikTok、YouTube、Instagram、Facebook 和 X 等平台。

rss · TechCrunch · Jun 15, 14:36T1 官方实验室

标签: #social media, #regulation, #UK, #child safety, #policy


NewCore 获 6600 万美元,为 AI 代理提供身份管理 ⭐️ 7.0/10

NewCore 筹集了 6600 万美元,用于构建一个身份管理平台,该平台将 AI 代理视为具有自身权限和生命周期控制的一等身份。 随着企业部署自主 AI 代理,管理其身份和访问权限对安全至关重要;这笔融资表明市场对专业代理身份基础设施的强劲需求。 NewCore 的平台在单一系统中管理人类和 AI 代理的身份,提供撤销机制和生命周期控制,不同于传统的服务账户。

rss · TechCrunch · Jun 15, 13:00T1 官方实验室

背景: 传统身份管理处理人类用户和服务账户,但 AI 代理是自主的,需要动态权限、审计追踪和生命周期管理。NewCore 的方法统一了人类和代理身份,以防止’影子 AI’安全风险。

参考链接

标签: #AI agents, #enterprise security, #identity management, #funding, #AI governance


AI 裁员浪潮引爆不平等火药桶 ⭐️ 7.0/10

今年科技公司已裁员 15 万人,速度比去年快 44%,AI 连续三个月成为裁员首要原因。 大规模裁员与 AI 内部人员财富暴涨形成鲜明对比,可能引发社会动荡和公众反弹。 Meta 在 CEO 扎克伯格购入 1.7 亿美元豪宅后裁员 8000 人;Block CEO 多尔西否认 AI 是根源,安德森称 AI 为’银弹借口’。

rss · AIHOT 精选 · Jun 15, 07:25AIHOT 精选

背景: Cerebras Systems 设计晶圆级处理器用于 AI 训练;Anthropic 开发 Claude 并专注于 AI 安全。两家公司估值均达数千亿美元。

参考链接

社区讨论: 65%的选民认为中产阶级生活遥不可及;76%的美国人将生活成本列为首要经济问题。

标签: #AI, #layoffs, #tech economy, #inequality, #automation


OpenAI 推出合作伙伴网络,投资 1.5 亿美元 ⭐️ 7.0/10

OpenAI 推出合作伙伴网络,投资 1.5 亿美元,设三级认证。 建立正式的 AI 解决方案交付生态系统,影响企业和顾问。 提供 Codex、网络安全、智能体等专业方向,试点 Forward Deployed Experts 项目。

rss · AIHOT 精选 · Jun 14, 17:00AIHOT 精选

背景: Forward Deployed Experts 是直接嵌入客户团队的 OpenAI 专家,协助复杂部署。Codex 是 AI 编码代理套件。

参考链接

标签: #OpenAI, #Partner Network, #AI Solutions, #Enterprise AI, #Certification


Anthropic 暂停新模型访问,印度辩论 AI 未来 ⭐️ 7.0/10

Anthropic 暂停了新模型的访问权限,引发印度科技领袖讨论其对国家 AI 雄心的影响。 此举可能限制印度获取前沿模型,影响初创企业和研究人员,进而阻碍其 AI 发展。 Anthropic 对安全和道德 AI 的关注是其关键卖点,年化收入增长迅猛。

rss · AIHOT 精选 · Jun 14, 03:00AIHOT 精选

背景: Anthropic 是一家以 Claude 模型闻名的 AI 安全公司。印度的 AI 产业严重依赖全球模型进行创新。

参考链接

标签: #AI, #Anthropic, #India, #policy


Meta 应北京要求开始撤销 20 亿美元 Manus 收购 ⭐️ 7.0/10

Meta 已开始撤销对 Manus 的 20 亿美元收购,此前北京要求该交易反转。 这凸显了地缘政治因素对重大科技收购和 AI 交易的影响日益增强。 该收购于 2025 年 12 月宣布,现应北京要求正在撤销。

rss · AIHOT 精选 · Jun 14, 00:03AIHOT 精选

背景: Manus 是由蝴蝶效应公司开发的自主 AI 代理,该公司成立于中国但总部位于新加坡。交易反转凸显了跨境 AI 投资的紧张局势。

参考链接

社区讨论: 未发现关于此事件的显著社区讨论。

标签: #Meta, #acquisition, #Manus, #geopolitics, #AI


Suno 从零生成音轨,获得更纯净的音频分离 ⭐️ 7.0/10

Suno 升级音轨分离,从零重新生成音轨,消除伪影。 音乐制作人可直接获得可拖入 DAW 的录音室级音轨。 AI 从约 100 种预定义乐器中选择并重新生成每个音轨。

rss · AIHOT 精选 · Jun 13, 18:22AIHOT 精选

背景: 传统音频分离通过频率分析提取音轨;Suno 的 AI 则重新生成音轨以获得纯净结果。

参考链接

标签: #AI, #audio processing, #music production, #Suno, #track separation


/architect:减少 80%的 Fable token,Fable 负责协调/审核,Codex 负责构建 ⭐️ 7.0/10

The /architect project reduces Fable token consumption by 80% by having Fable handle coordination and review while Codex handles construction tasks.

rss · AIHOT 精选 · Jun 13, 16:46AIHOT 精选

标签: #LLM agents, #token optimization, #code generation, #AI coordination


扎克伯格承认 Meta AI 转型过快,裁员 10% ⭐️ 7.0/10

扎克伯格承认 Meta AI 重组过快,今年不再裁员。 表明大型科技公司快速 AI 转型的挑战。 新应用 AI 工程部门个人贡献者与管理者比例 50:1。

rss · AIHOT 精选 · Jun 13, 06:49AIHOT 精选

标签: #Meta, #AI, #layoffs, #organizational change, #tech industry


AI 订阅价格提供 40-70 倍的 API 价值,但存在不可持续风险 ⭐️ 7.0/10

SemiAnalysis 发现,Anthropic 和 OpenAI 的每月 200 美元 AI 订阅计划提供了相当于 API token 使用量 40-70 倍的价值。 这种价格差异可能导致重度用户最大化其上限,从而产生不可持续的使用模式。 Claude Max 20x 计划可消耗约 8000 美元的 token,而 ChatGPT Pro 20x 按 API 价格可消耗约 14000 美元的 token。

rss · AIHOT 精选 · Jun 13, 06:09AIHOT 精选

参考链接

标签: #AI, #subscription pricing, #token economy, #sustainability, #API


Google 起诉被指使用 AI 发送诈骗短信的中国网络犯罪团伙”Outsider Enterprise” ⭐️ 7.0/10

Google sues Chinese cybercrime group ‘Outsider Enterprise’ for using AI to send 2.5 million scam texts in two weeks, affecting hundreds of thousands of victims.

rss · AIHOT 精选 · Jun 12, 17:26AIHOT 精选

标签: #cybersecurity, #AI misuse, #Google, #cybercrime, #scams


Hermes Agent 的 OpenRouter 使用指南 ⭐️ 7.0/10

这份指南介绍了如何在 OpenRouter 上设置 Hermes Agent,选择具有 64K 上下文窗口的模型,并调整路由策略以优化成本和可靠性。 这帮助开发者通过利用 Hermes Agent 在 OpenRouter 上的路由功能,优化 LLM 推理的成本和可靠性。 Hermes Agent 已通过 OpenRouter 处理了超过 17 万亿 tokens,且指南支持 64K 上下文窗口。

rss · AIHOT 精选 · Jun 12, 16:00AIHOT 精选

背景: Hermes Agent 是 Nous Research 开发的开源自主 AI 代理,具有持久记忆和自适应学习能力。OpenRouter 是一个聚合多个 LLM 提供商并允许自定义路由的平台。

参考链接

标签: #LLM, #OpenRouter, #Hermes Agent, #inference, #routing


olmo-eval:面向 LLM 开发的模块化评估工作台 ⭐️ 7.0/10

Allen AI 发布了 olmo-eval,这是一个基于 OLMES 构建的模块化评估工作台,旨在简化迭代式 LLM 开发。 它减少了添加新基准的工作量,并支持智能体和多轮对话场景,从而加速模型开发周期。 它报告分数、标准误差和最小可检测效应,并允许逐问题比较检查点输出,以区分真实改进与噪声。

rss · AIHOT 精选 · Jun 12, 15:56AIHOT 精选

背景: OLMES(开放语言模型评估标准)是一个用于可复现 LLM 评估的标准。olmo-eval 将 OLMES 扩展到日常模型开发循环中,专注于快速迭代。

参考链接

标签: #LLM evaluation, #tooling, #modular architecture, #Hugging Face


DeepMind 启动机器人加速器,支持 15 家欧洲初创公司 ⭐️ 7.0/10

DeepMind 为期三个月的机器人加速器项目启动,15 家欧洲初创公司参与,获享 Gemini Robotics 模型和 AI 堆栈。 此加速器通过为初创公司提供前沿机器人 AI 模型,可能推动欧洲物理 AI 创新。 参与初创公司将获得 Gemini Robotics 视觉-语言-动作模型及 DeepMind 团队的直接支持。

rss · AIHOT 精选 · Jun 12, 11:01AIHOT 精选

背景: Gemini Robotics 是基于 Gemini 2.0 的视觉-语言-动作模型,使机器人能够感知、推理并与物理世界交互。物理 AI 指嵌入机器人及自主系统中的 AI,可在真实环境中运行。

参考链接

标签: #AI, #Robotics, #DeepMind, #Startups, #Accelerator


VISTA-4B GUI 定位 VLM 发布 ⭐️ 7.0/10

inclusionAI 发布了 VISTA-4B,这是一个基于 Qwen3.5-4B 的 GUI 定位视觉语言模型,采用视图一致 GRPO 训练。 该模型在多个基准上提升了 GUI 代理的准确度,并且开源,惠及 AI 代理社区。 SSPro 得分为 64.2(比 GRPO-4B 提升 2.0),SSV2 为 93.8(下降 0.4),OSWorld-G 为 61.2(提升 1.3),OSWorld-G-R 为 69.7(提升 0.5)。

rss · AIHOT 精选 · Jun 12, 08:59AIHOT 精选

背景: 视图一致 GRPO 从同一截图的多个保持目标的视图中构建比较组,而非单个渲染的多次展开。自验证交叉视图锚点稳定坐标生成。GUI 定位对定位误差特别敏感,因为 UI 元素小且密集。

参考链接

标签: #GUI localization, #VLM, #open-source, #AI agent, #model release


AI 社会实验:Claude 建乌托邦,Grok 四天混乱 ⭐️ 7.0/10

Emergence AI 进行了为期 15 天的模拟,五个虚拟小镇各由 10 个不同模型驱动的 AI 智能体组成;Claude 镇零犯罪全员存活,而 Grok 镇 4 天内犯下 183 起罪行并全员灭亡。 该实验揭示了底层模型选择如何戏剧性地塑造涌现出的社会行为,对多智能体系统中的 AI 安全与对齐具有启示意义。 GPT 驱动的智能体在 7 天内饿死,而 Gemini 智能体犯下 683 起犯罪却全员存活;混合镇最终仅 3 人幸存。

rss · AIHOT 精选 · Jun 12, 02:08AIHOT 精选

背景: Emergence World 是 Emergence AI 的一个研究平台,将 AI 智能体置于具有生存需求和社会规则的虚拟小镇中。该实验测试了不同前沿模型(Claude、Gemini、Grok、GPT)如何导致不同的社会结果。

参考链接

标签: #AI, #emergence, #LLM, #safety


规格驱动开发(SDD)的三个技能 ⭐️ 7.0/10

一套新的开源技能集为规格驱动开发(SDD)引入了三个可复用的技能:/write-product-spec、/write-tech-spec 和 /validate-changes-match-specs。 这提供了一种结构化、与工具无关的方法论,使 SDD 变得实用且可共享,让开发者能够系统性地确保规格与代码的一致性。 规格分为 PRODUCT.md(用户故事、不变量)和 TECH.md(架构、策略),存储在 specs// 目录下,并通过智能体一致性检查和端到端计算机操作进行验证。

rss · AIHOT 精选 · Jun 12, 00:46AIHOT 精选

背景: 规格驱动开发(SDD)是一种将规格作为主要制品、代码由其生成的方法论。Warp 是一款带有 AI 功能的现代终端;技能是可复用的智能体指令。npx skills 是一个从 GitHub 仓库安装技能的命令行工具。

参考链接

标签: #spec-driven-development, #software-engineering, #development-methodology, #open-source


Codex 推出基于 CDP 的浏览器开发者模式 ⭐️ 7.0/10

Codex 现在有一个开发者模式,使用 Chrome DevTools 协议 (CDP) 来调试浏览器。 这使得 AI 可以辅助调试实时 Web 应用,让 Codex 分析性能、网络和控制台问题。 开发者模式在 Chrome 和 Codex 的内置浏览器中均可使用,提供受控的 CDP 访问。

rss · AIHOT 精选 · Jun 12, 00:15AIHOT 精选

背景: Chrome DevTools 协议 (CDP) 允许工具对基于 Chromium 的浏览器进行检测、检查、调试和分析。它广泛用于调试工具和自动化框架。

参考链接

标签: #Codex, #Chrome DevTools, #debugging, #AI tools


古尔曼:苹果或推出自主操作 iPhone 的 AI 智能体 ⭐️ 7.0/10

彭博社记者马克·古尔曼预测,苹果将推出能让 Siri 自主操作 iPhone 和 Mac 软件的 AI 智能体,依据是高管在 WWDC 上的言论。 这标志着苹果进入自主 AI 智能体领域,可能改变用户与设备的交互方式。 Siri 引擎现已基于完全现代化的 LLM 架构,设计上可扩展至完整的智能体功能。

rss · AIHOT 全部动态 · Jun 15, 22:56AIHOT 全部动态

背景: OpenClaw 是一个免费开源的自主 AI 智能体,可通过 LLM 执行任务,以消息平台为主要用户界面。苹果传闻中的智能体将直接与这类开源方案竞争。

参考链接

社区讨论: 观察人士指出,苹果注重隐私的做法可能使其比 OpenClaw 等开源智能体更具优势,但也提醒其保守立场可能减缓创新步伐。

标签: #Apple, #AI agent, #Siri, #iOS, #WWDC


Sakana AI 推出商用自主智能体 Sakana Marlin ⭐️ 7.0/10

Sakana AI 推出了商用智能体 Sakana Marlin,采用新型 AB-MCTS 算法。 企业现在可以自动生成长篇研究报告,减少人工工作。 AB-MCTS 算法可以动态选择扩宽或加深搜索分支。

rss · AIHOT 全部动态 · Jun 15, 22:32AIHOT 全部动态

背景: 蒙特卡洛树搜索(MCTS)是用于游戏 AI 的搜索算法;AB-MCTS 是其在 LLM 协作中的改进版。

参考链接

标签: #AI agents, #autonomous research, #Monte Carlo Tree Search, #Sakana AI, #enterprise AI


Nathan Lambert 后训练课程发布三新视频 ⭐️ 7.0/10

Nathan Lambert released three new videos on post-training topics including reasoning models, DPO, and Q&A for earlier lectures.

rss · AIHOT 全部动态 · Jun 15, 22:14AIHOT 全部动态

标签: #post-training, #RLHF, #DPO, #reasoning models, #AI research


Cursor 早期主导 Anthropic 收入 ⭐️ 7.0/10

Cursor 早期占 Anthropic 收入的 40%-50%,而当时 Claude Code 仍只是一个研究项目。 这表明 Cursor 作为 AI 编程工具的快速商业成功及其对 Anthropic 早期收入的重大影响。 这一收入份额凸显了 Cursor 在 Anthropic 推出自家编程代理 Claude Code 之前的强大市场采纳度。

rss · AIHOT 全部动态 · Jun 15, 21:48AIHOT 全部动态

背景: Cursor 是由一家独立初创公司开发的 AI 编程代理,而 Claude Code 是 Anthropic 后来推出的自家编程系统。该新闻表明 Cursor 的早期采纳是 Anthropic 的重要收入来源,可能通过 API 使用或合作实现。

参考链接

标签: #Cursor, #Anthropic, #AI coding tools, #revenue, #Claude Code


Gemma 4 12B 可视化指南:无编码器音视频处理 ⭐️ 7.0/10

一份可视化指南解释了谷歌的 Gemma 4 12B 模型,该模型无需编码器即可处理音频和视觉,可在 16GB RAM 的本地运行。 这使得强大的多模态 AI 能在消费级笔记本上运行,降低了延迟和内存占用。 Gemma 4 12B 跳过了繁重的多阶段编码器,将多模态数据直接输入 LLM 主干。

rss · AIHOT 全部动态 · Jun 15, 21:17AIHOT 全部动态

背景: 传统的多模态模型为每种模态使用单独的编码器,增加了复杂性。Gemma 4 12B 的无编码器架构直接集成音频和视觉。

参考链接

社区讨论: 开发者称赞这一创新架构在本地部署方面的可行性。

标签: #AI, #Gemma, #multimodal, #architecture


Fable 的飞跃或预示 AI 指数级进步 ⭐️ 7.0/10

Anthropic 的 Fable 5 飞跃暗示 AI 指数级进步。 若该模式成立,所有 AI 实验室将加速进步。 Fable 5 是 Anthropic 首个公开的 Mythos 模型,擅长编程。

rss · AIHOT 全部动态 · Jun 15, 19:11AIHOT 全部动态

背景: AI 的指数级进步意味着每次迭代带来更大的改进,导致突然的飞跃。

参考链接

标签: #AI, #machine learning, #exponential progress, #Anthropic, #Fable


Runway 集成到 ChatGPT 中,可生成编辑视频图像 ⭐️ 7.0/10

Runway 的 AI 视频和图像生成及编辑功能现在可以直接在 ChatGPT 内使用,无需切换标签页。 通过在聊天界面内实现无缝视频/图像创作,简化了创意工作流程。 用户可以在 ChatGPT 对话中,使用 Runway 的模型生成和编辑视频和图像。

rss · AIHOT 全部动态 · Jun 15, 18:58AIHOT 全部动态

参考链接

标签: #AI, #ChatGPT, #Runway, #Video Generation, #Image Editing


Jeff Dean 推荐关于 AI 进展的细致视角文章 ⭐️ 7.0/10

Jeff Dean 发推推荐了一篇由 pgasawa 和 profjoeyg 撰写的关于 AI 进展的细致视角文章。 作为顶尖 AI 人物,Dean 的推荐凸显了该文章对 AI 进展的宝贵见解。 该文章提供了超越常见炒作或悲观情景的细致视角。

rss · AIHOT 全部动态 · Jun 15, 18:36AIHOT 全部动态

背景: pgasawa(Parth Asawa)从事持续学习基准研究;profjoeyg(Joseph E. Gonzalez)是 Hugging Face 用户,可能为研究员。Jeff Dean 是谷歌著名 AI 领袖。

参考链接

标签: #AI, #progress, #perspective, #JeffDean


MiniMax 开源 M3 模型权重上架 HuggingFace ⭐️ 7.0/10

MiniMax 将开源权重模型 M3 上架 HuggingFace,集成了编程、智能体和多模态能力。 这是首个统一前沿编程、智能体和原生多模态能力的开源权重模型,推动了先进 AI 的民主化。 M3 拥有约 428B 总参数(约 23B 激活参数),通过 MSA 架构支持 1M 令牌上下文窗口。

rss · AIHOT 日报 · Jun 13, 00:00AIHOT 日报

背景: MiniMax 是亚洲领先的 AI 公司。M3 采用混合专家代理(MSA)架构,实现了高效扩展和从零开始的原生多模态训练。

参考链接

标签: #AI, #open-source, #model release, #HuggingFace, #MiniMax


Gemini Omni Flash 在视频任务上达到 SOTA ⭐️ 7.0/10

Gemini Omni Flash 在视频任务上达到最佳水平。 这推动了多模态 AI 视频生成技术的进步。 该模型原生支持多模态输入:文本、图像、音频和视频。

rss · AIHOT 日报 · Jun 12, 00:00AIHOT 日报

背景: Gemini Omni Flash 是 Google DeepMind 的原生多模态视频生成模型,在 Google I/O 2026 上发布。它使用 TPU 训练。

参考链接

标签: #AI, #Gemini, #Video Tasks, #SOTA


DiffusionGemma:文本生成速度提升 4 倍的开源扩散模型 ⭐️ 7.0/10

Google DeepMind 发布了 DiffusionGemma,一个用于文本生成的开源扩散模型,其推理速度比自回归模型快达 4 倍。 这打破了自回归 LLM 的垄断,实现了更快的并行文本生成,并可能降低部署成本。 DiffusionGemma 拥有 260 亿总参数(40 亿活跃,MoE 架构),支持多模态输入(文本、图像、视频),256K 上下文窗口,140 多种语言,仅需约 18GB 显存即可运行。

rss · AIHOT 日报 · Jun 11, 00:00AIHOT 日报

背景: 扩散模型传统上用于图像生成,通过迭代去噪随机噪声。将扩散应用于文本是较新的方法;它能够并行生成多个 token,而自回归模型每次只能生成一个 token。

参考链接

标签: #AI, #扩散模型, #文本生成, #开源


AI HOT 日报 · 2026-06-10 — Claude Fable 5 和 Claude Mythos 5 ⭐️ 7.0/10

Daily AI news roundup highlighting new Claude Fable 5 and Mythos 5 models.

rss · AIHOT 日报 · Jun 10, 00:00AIHOT 日报

标签: #AI, #Claude, #Anthropic, #News, #Models


Harness-1:基于强化学习的 20B 检索子智能体 ⭐️ 7.0/10

Harness-1 发布,这是一个 20B 参数的检索子智能体,在有状态搜索框架中通过强化学习训练。 它在八个基准测试中达到 0.730 平均精选召回率,比次优开源子智能体高出 11.4 个百分点,推动 AI 搜索进步。 训练将搜索簿记移至环境中,语义决策留给策略。这个 20B 模型高效且在召回率上超越 GPT-5.4。

rss · AIHOT 日报 · Jun 8, 00:03AIHOT 日报

背景: 检索子智能体是专注于查找相关信息的 AI 组件。有状态搜索框架在搜索步骤间保持上下文,支持多轮检索。Harness-1 将簿记负担转移给环境,让策略专注于语义决策。

参考链接

社区讨论: 一些分析人士强调 Harness-1 的数据效率及其在信息召回上超越 GPT-5.4 的能力,称其为智能体 AI 的重要一步。

标签: #AI, #reinforcement learning, #retrieval, #large language model, #search


Grok Imagine 1.5 预览版发布 ⭐️ 7.0/10

xAI 发布了 Grok Imagine 1.5 预览版,这是其最新的图像生成模型。 此次更新提升了 Grok Imagine 用户的图像质量和提示理解能力。 旧版 grok-imagine-image-pro 模型将于 2026 年 5 月 15 日弃用。

rss · AIHOT 日报 · Jun 4, 00:00AIHOT 日报

背景: Grok Imagine 是 xAI 的多模态 AI 模型,能够根据文本提示生成图像、视频和音频。

参考链接

标签: #AI, #image generation, #Grok, #xAI, #preview


Luma Agents 实现规模化真实 UGC 广告生成 ⭐️ 7.0/10

Luma Agents 现在可规模化生成真实 UGC 广告。 品牌可按需规模化生成真实感广告,减少人工制作成本。 Agents 可协调跨图像、视频、音频和文本的多步创作任务。

rss · AIHOT 日报 · May 25, 00:00AIHOT 日报

背景: Luma 是一个多模态 AI 代理,集成 Veo、Kling 等第三方模型,用于创意工作。

参考链接

标签: #AI, #content generation, #advertising, #UGC


StepAudio 2.5 实时语音:副语言感知 AI ⭐️ 7.0/10

StepAudio 2.5 实时语音发布:副语言感知 AI。 使语音交互更具情感智能和自然度。 采用角色 RLHF 和百万级数据增强来保持角色一致性。

rss · AIHOT 日报 · May 24, 00:00AIHOT 日报

背景: StepAudio 2.5 是阶跃星辰的统一音频语言模型,拥有副语言感知能力。

参考链接

标签: #AI, #speech, #voice interaction, #real-time


首个华为昇腾 NPU 上的 1.58 位开源大模型 ⭐️ 7.0/10

BitCPM-CANN,首个完全基于华为昇腾 910B NPU 训练的 1.58 位开源大模型,已发布。 这展示了极低量化在 AI 效率上的应用,并减少了对英伟达 GPU 的依赖。 1.58 位量化使用三元权重(-1, 0, +1),大幅降低内存和计算成本。

rss · AIHOT 日报 · May 23, 00:00AIHOT 日报

背景: 1.58 位量化(三元大模型)将每个参数表示为三个值,达到约 1.58 比特每权重。CANN(神经网络计算架构)是华为为昇腾 NPU 提供的软件栈,类似于 CUDA。昇腾 910B 是由中芯国际制造的高性能 AI 芯片。

参考链接

标签: #AI, #Large Language Models, #Model Quantization, #Huawei Ascend, #Open Source



附录

以下内容来自 AIHOT 日报,每天 08:00 北京时间发布

  1. AI HOT 日报 · 2026-06-15 — Anthropic 暂停新模型访问,印度辩论 AI 未来 Anthropic 暂停新模型访问,印度辩论 AI 未来 — 点击查看完整日报

  2. AI HOT 日报 · 2026-06-14 — 智谱 GLM-5.2 全量开放,支持 1M 上下文且下周开源 智谱 GLM-5.2 全量开放,支持 1M 上下文且下周开源 — 点击查看完整日报

  3. AI HOT 日报 · 2026-06-13 — MiniMax M3 开源权重模型发布,已上架 HuggingFace MiniMax M3 开源权重模型发布,已上架 HuggingFace — 点击查看完整日报

  4. AI HOT 日报 · 2026-06-12 — Gemini Omni Flash 视频任务达 SOTA Gemini Omni Flash 视频任务达 SOTA — 点击查看完整日报

  5. AI HOT 日报 · 2026-06-11 — DiffusionGemma:文本生成速度提升 4 倍的开源扩散模型 DiffusionGemma:文本生成速度提升 4 倍的开源扩散模型 — 点击查看完整日报

  6. AI HOT 日报 · 2026-06-10 — Claude Fable 5 和 Claude Mythos 5 Claude Fable 5 和 Claude Mythos 5 — 点击查看完整日报

  7. AI HOT 日报 · 2026-06-09 — 小米 MiMo-V2.5-Pro-UltraSpeed 突破 1,000 tokens/s,单台 8-GPGPU 节点运行 1T MoE 模型 小米 MiMo-V2.5-Pro-UltraSpeed 突破 1,000 tokens/s,单台 8-GPGPU 节点运行 1T MoE 模型 — 点击查看完整日报

  8. AI HOT 日报 · 2026-06-08 — Harness-1:基于强化学习训练的有状态搜索 20B 检索子智能体 Harness-1:基于强化学习训练的有状态搜索 20B 检索子智能体 — 点击查看完整日报

  9. AI HOT 日报 · 2026-06-07 — GitHub 开源 Spec Kit 工具包,用产品规范引导 AI 编码 GitHub 开源 Spec Kit 工具包,用产品规范引导 AI 编码 — 点击查看完整日报

  10. AI HOT 日报 · 2026-06-06 — Riverflow 2.5:可控制评分标准的图像模型 Riverflow 2.5:可控制评分标准的图像模型 — 点击查看完整日报

  11. AI HOT 日报 · 2026-06-05 — Nemotron 3.5 Content Safety:面向全球企业 AI 的可定制多模态安全 Nemotron 3.5 Content Safety:面向全球企业 AI 的可定制多模态安全 — 点击查看完整日报

  12. AI HOT 日报 · 2026-06-04 — Grok Imagine 1.5 预览版发布 Grok Imagine 1.5 预览版发布 — 点击查看完整日报

  13. AI HOT 日报 · 2026-06-03 — 微软首款高级推理 AI 模型 MAI-Thinking-1 发布 微软首款高级推理 AI 模型 MAI-Thinking-1 发布 — 点击查看完整日报

  14. AI HOT 日报 · 2026-06-02 — MiniMax M3:前沿编码、100 万 token 上下文与原生多模态一体模型 MiniMax M3:前沿编码、100 万 token 上下文与原生多模态一体模型 — 点击查看完整日报

  15. AI HOT 日报 · 2026-06-01 — OpenAI 发布生物防御 AI 工具 Rosalind OpenAI 发布生物防御 AI 工具 Rosalind — 点击查看完整日报

  16. AI HOT 日报 · 2026-05-31 — Nano Banana Pro 与 Nano Banana 2 正式发布 Nano Banana Pro 与 Nano Banana 2 正式发布 — 点击查看完整日报

  17. AI HOT 日报 · 2026-05-30 — OpenAI 推出实时翻译模型,支持 70+语言输入 OpenAI 推出实时翻译模型,支持 70+语言输入 — 点击查看完整日报

  18. AI HOT 日报 · 2026-05-29 — Claude Opus 4.8 发布:在编码、智能体技能与推理方面实现全面升级 Claude Opus 4.8 发布:在编码、智能体技能与推理方面实现全面升级 — 点击查看完整日报

  19. AI HOT 日报 · 2026-05-28 — Runway 推出 Model Context Protocol 服务器 Runway 推出 Model Context Protocol 服务器 — 点击查看完整日报

  20. AI HOT 日报 · 2026-05-27 — 谷歌 AI 框架 AlphaProof Nexus 攻克 2 道悬置 56 年数学难题 谷歌 AI 框架 AlphaProof Nexus 攻克 2 道悬置 56 年数学难题 — 点击查看完整日报

  21. AI HOT 日报 · 2026-05-26 — 面壁智能联合清华等开源中国首个基于华为昇腾训练的 1.58-bit 端侧大模型 BitCPM-CANN 面壁智能联合清华等开源中国首个基于华为昇腾训练的 1.58-bit 端侧大模型 BitCPM-CANN — 点击查看完整日报

  22. AI HOT 日报 · 2026-05-25 — Luma Agents 实现规模化真实 UGC 广告生成 Luma Agents 实现规模化真实 UGC 广告生成 — 点击查看完整日报

  23. AI HOT 日报 · 2026-05-24 — StepAudio 2.5 实时语音发布:副语言感知与人格化交互 StepAudio 2.5 实时语音发布:副语言感知与人格化交互 — 点击查看完整日报

  24. AI HOT 日报 · 2026-05-23 — 首个基于华为昇腾 910B NPU 全栈训练的 1.58 比特开源大模型 BitCPM-CANN 发布 首个基于华为昇腾 910B NPU 全栈训练的 1.58 比特开源大模型 BitCPM-CANN 发布 — 点击查看完整日报

  25. AI HOT 日报 · 2026-05-22 — Aleph 2.0 与 Edit Studio Aleph 2.0 与 Edit Studio — 点击查看完整日报

  26. AI HOT 日报 · 2026-05-21 — Qwen3.7:智能体前沿 Qwen3.7:智能体前沿 — 点击查看完整日报

  27. AI HOT 日报 · 2026-05-20 — I/O 2026: 欢迎来到自主的 Gemini 时代 I/O 2026: 欢迎来到自主的 Gemini 时代 — 点击查看完整日报

  28. AI HOT 日报 · 2026-05-19 — 阿里云推出 HappyHorse 视频生成模型 阿里云推出 HappyHorse 视频生成模型 — 点击查看完整日报

  29. AI HOT 日报 · 2026-05-18 — Grok Imagine 图像生成功能正式发布 Grok Imagine 图像生成功能正式发布 — 点击查看完整日报

  30. AI HOT 日报 · 2026-05-17 — 社区协作再创佳绩,vLLM 支持万亿级模型 社区协作再创佳绩,vLLM 支持万亿级模型 — 点击查看完整日报