从 148 条内容中筛选出 67 条重要资讯


  1. 微软发布 MAI-Thinking-1 MoE 模型 ⭐️ 9.0/10
  2. OpenAI 发布生物防御 AI 工具 Rosalind ⭐️ 9.0/10
  3. 谷歌 AlphaProof Nexus 攻克 56 年未解数学难题 ⭐️ 9.0/10
  4. Adafruit 收到 Flux.ai 的法律要求函 ⭐️ 8.0/10
  5. 微软 Aurora 将天气预报速度提升 5000 倍 ⭐️ 8.0/10
  6. Google DeepMind 开源科学智能体工具包 ⭐️ 8.0/10
  7. Claude Code 新增动态工作流,支持多智能体协作 ⭐️ 8.0/10
  8. Alphabet 融资 800 亿美元,Anthropic 提交 IPO ⭐️ 8.0/10
  9. Claude Code 团队:智能体编程重塑工程流程 ⭐️ 8.0/10
  10. OpenAI Codex 发布 Python SDK ⭐️ 8.0/10
  11. Anthropic 将 Project Glasswing 扩展至 150 多个组织 ⭐️ 8.0/10
  12. Anthropic 区分因果相似特征 ⭐️ 8.0/10
  13. 金融业拥抱交易基础模型 ⭐️ 8.0/10
  14. Meta AI 聊天机器人漏洞可致 Instagram 账号被劫持 ⭐️ 8.0/10
  15. 佛罗里达州起诉 OpenAI 与 Altman,指控 ChatGPT 关联谋杀案 ⭐️ 8.0/10
  16. 美国 AI 政策里程碑:新行政令 ⭐️ 8.0/10
  17. Cerebras 晶圆级芯片实现近 100% 良率 ⭐️ 8.0/10
  18. 微软 Project Solara:面向 AI 智能体的 Android 操作系统 ⭐️ 8.0/10
  19. 微软 Fairwater:垂直 AI 超级计算机 ⭐️ 8.0/10
  20. OpenAI 推出实时翻译模型 ⭐️ 8.0/10
  21. 中国首个基于华为昇腾的 1.58 比特端侧大模型开源 ⭐️ 8.0/10
  22. Google I/O 2026:自主 Gemini 时代开启 ⭐️ 8.0/10
  23. vLLM 实现万亿参数模型支持 ⭐️ 8.0/10
  24. Hy3 预览版登陆 GMI,领跑开源模型 ⭐️ 8.0/10
  25. Claude Opus 4.7 快速模式研究预览 ⭐️ 8.0/10
  26. ERNIE 5.1 发布:预训练成本仅 6% ⭐️ 8.0/10
  27. 微软发布 137B 参数代码模型 MAI-Code-1-Flash ⭐️ 7.0/10
  28. 为什么 systemd 定时器优于 cron ⭐️ 7.0/10
  29. Travelers 部署基于 OpenAI 的 AI 理赔助手 ⭐️ 7.0/10
  30. Holo3.1:快速本地计算机使用智能体 ⭐️ 7.0/10
  31. NVIDIA DGX Station 搭载 GB300 开始发货 ⭐️ 7.0/10
  32. GitHub Copilot 应用:智能体原生的桌面体验 ⭐️ 7.0/10
  33. 商汤开源 SenseNova-Skills AI 办公技能套件 ⭐️ 7.0/10
  34. Gemini Spark:令人惊叹又不安的 AI ⭐️ 7.0/10
  35. 阿里云发布 AgentScope Java 1.1 ⭐️ 7.0/10
  36. SK 海力士计划五年内晶圆产能翻倍 ⭐️ 7.0/10
  37. 开源 AI 磁盘清理工具超越 CleanMyMac ⭐️ 7.0/10
  38. 阶跃星辰发布高效推理模型 Step 3.7 Flash ⭐️ 7.0/10
  39. NVIDIA JetPack 7.2 提升边缘 AI 智能体内存效率 ⭐️ 7.0/10
  40. 开放权重模型在 OpenRouter 上占据 69.1%的 Token 份额 ⭐️ 7.0/10
  41. Google AI Studio 新增 Gmail、Drive、Sheets 集成 ⭐️ 7.0/10
  42. Replit:一个提示词构建完整业务 ⭐️ 7.0/10
  43. AI 解释科学优于预测科学 ⭐️ 7.0/10
  44. 前 DOGE 员工创办 AI 削减成本公司 ⭐️ 7.0/10
  45. 微软研究院发布端侧智能体 MagenticLite ⭐️ 7.0/10
  46. Runway 推出模型上下文协议服务器 ⭐️ 7.0/10
  47. Luma Agents 实现规模化 UGC 广告生成 ⭐️ 7.0/10
  48. 阿里云发布 HappyHorse 视频生成模型 ⭐️ 7.0/10
  49. Ollama v0.30.1-rc0 新增 Cline CLI 自动安装和 Qwen 代码集成 ⭐️ 6.0/10
  50. 西雅图监控设施步行导览 ⭐️ 6.0/10
  51. OpenAI 提议设立国际青少年 AI 安全研究所 ⭐️ 6.0/10
  52. Claude Code 自我检查反馈闭环技巧 ⭐️ 6.0/10
  53. NVIDIA NemoClaw 部署 Hermes 智能体 ⭐️ 6.0/10
  54. Karpathy 分享学习方法论 ⭐️ 6.0/10
  55. Nous Research 发布跨平台 Hermes 桌面应用 ⭐️ 6.0/10
  56. Claude 模型迭代放缓,内部工具未能加速 ⭐️ 6.0/10
  57. Mollick 批评“全能”AI 应用 ⭐️ 6.0/10
  58. 传闻:Mythos 的 FLOPs 与 Gemini 3.1 Pro 相当 ⭐️ 6.0/10
  59. NVIDIA MGX 在 GTC 台北展示模块化 AI 工厂 ⭐️ 6.0/10
  60. MiniMax M2.7 模型上线 OrcaRouter 平台 ⭐️ 6.0/10
  61. StepAudio 2.5 发布,支持语音克隆 ⭐️ 6.0/10
  62. Nathan Lambert 离开 Ai2,结束 2.5 年任期 ⭐️ 5.0/10
  63. ChatGPT 新增全屏编辑与保存长文功能 ⭐️ 5.0/10
  64. Claude Code v2.1.161:OTEL 标签、智能体进度、MCP 修复 ⭐️ 5.0/10
  65. Kim 发起 AI 内容质量投票 ⭐️ 5.0/10
  66. 旧金山编程智能体基准测试活动 ⭐️ 5.0/10
  67. OpenCode x Ring 2.6 1T 限时免费 ⭐️ 5.0/10

微软发布 MAI-Thinking-1 MoE 模型 ⭐️ 9.0/10

微软发布了 MAI-Thinking-1,这是一个总参数 1T、活跃参数 35B 的 MoE 模型,从零开始在 30T tokens 上训练。 这标志着微软首个自研推理大模型,减少对 OpenAI 的依赖,与顶级模型竞争。 在 AIME 2025 上获得 97.0%,在 LiveCodeBench v6 上获得 87.7%,在 SWE-Bench Pro 上获得 52.8%。

rss · AIHOT 全部动态 · Jun 2, 20:51AIHOT 全部动态

背景: MoE(混合专家)使用门控网络每次只激活部分参数,从而实现更大的总参数量和更低的计算量。AIME 2025 和 SWE-Bench Pro 分别是数学推理和软件工程任务的基准测试。

参考链接

社区讨论: 社区注意到微软从头训练模型且未使用蒸馏,这是一项重要的技术成就。

标签: #AI, #Microsoft, #MoE, #Large Language Model, #Benchmark


OpenAI 发布生物防御 AI 工具 Rosalind ⭐️ 9.0/10

OpenAI 发布了 Rosalind 生物防御计划,为经过审查的开发者提供 GPT-Rosalind 的赞助访问,用于构建防御性生物安全工具。 该计划将前沿 AI 交到抗疫人员手中,有望加强全球应对生物威胁的准备。 GPT-Rosalind 是一个前沿推理模型,针对生物学、药物发现和转化医学进行了优化,改进了工具使用以及对化学、蛋白质工程和基因组学的理解。

rss · AIHOT 日报 · Jun 1, 17:58AIHOT 日报

参考链接

社区讨论: 此次发布被视为对 AI 安全问题的一个具体回答:谁可以使用强大的生物 AI,以及在什么条件下使用。

标签: #OpenAI, #AI, #biodefense, #health, #security


谷歌 AlphaProof Nexus 攻克 56 年未解数学难题 ⭐️ 9.0/10

谷歌 DeepMind 的 AlphaProof Nexus 框架攻克了两道悬置 56 年的数学难题。 这展示了 AI 在形式推理和纯数学领域日益增强的能力。 AlphaProof Nexus 结合了 Gemini 3.1 Pro 和 Lean 证明助手来生成和验证证明。

rss · AIHOT 日报 · May 27, 00:00AIHOT 日报

背景: 这些难题来自 Paul Erdős 的集合,部分已悬置超过 50 年。该系统以每个几百美元的成本解决了其中九个问题。

参考链接

社区讨论: 研究人员对此印象深刻,但指出 AlphaProof Nexus 仍不是 AGI,因为它仅在形式数学领域运作。

标签: #AI, #mathematics, #breakthrough, #Google, #AlphaProof


Adafruit 收到 Flux.ai 的法律要求函 ⭐️ 8.0/10

Adafruit 收到了代表 Flux.ai 的 Fenwick 律师事务所发出的要求函,引发了社区的强烈反应。 这凸显了一家获得投资的初创公司与备受尊敬的创客公司之间,因产品批评和法律威胁而产生的紧张关系。 Fenwick & West 是一家著名的硅谷律师事务所,专注于技术和生命科学领域。

hackernews · semanser · Jun 2, 10:00 · 社区讨论T2 社区与开源

背景: Flux.ai 是一款基于浏览器的 AI 驱动 PCB 设计工具,用户评价褒贬不一。

参考链接

社区讨论: 许多用户批评 Flux.ai 的产品质量和计费方式,同时支持 Adafruit 的评测权利。

标签: #legal, #open-source hardware, #startup, #community drama, #PCB design


微软 Aurora 将天气预报速度提升 5000 倍 ⭐️ 8.0/10

微软研究院的 Aurora AI 模型比传统超算快数千倍进行天气预报。 这一突破实现了更快、更便宜的天气预报,提升了灾害应对和气候建模能力。 Aurora 以传统方法的一小部分成本,提供高达 5000 倍速度的预报。

rss · AIHOT 精选 · Jun 2, 21:45AIHOT 精选

背景: 传统天气预报依赖在超算上运行的数值天气预报模型,计算成本高且速度慢。Aurora 是一个基于大气数据训练的 AI 基础模型,能够实现快速预测。

参考链接

标签: #AI, #weather forecasting, #Microsoft Research, #high-performance computing, #Aurora


Google DeepMind 开源科学智能体工具包 ⭐️ 8.0/10

Google DeepMind 在 GitHub 上开源了 Science Skills,这是一个用于构建科学发现 AI 智能体的工具包。 它提升了 token 效率并加速科学工作流,使 AI 智能体在研究中更实用。 该工具包旨在与 Co-Scientist 多智能体系统配合使用,后者利用 Gemini 生成和辩论假设。

rss · AIHOT 精选 · Jun 2, 21:34AIHOT 精选

背景: Token 效率指减少 AI 模型消耗的 token(文本单位)数量,从而降低成本与延迟。Science Skills 为科学任务提供了预构建模块。

参考链接

标签: #AI, #开源, #科学发现, #智能体, #DeepMind


Claude Code 新增动态工作流,支持多智能体协作 ⭐️ 8.0/10

Claude Code 现在允许模型在运行时通过 JavaScript 编排脚本动态创建和协调子智能体。 这使得 Claude 能够处理超出单上下文限制的复杂多步骤任务,提高了可靠性和可扩展性。 该功能执行一个 JavaScript 文件,可启动数十到数百个并行子智能体,每个子智能体拥有独立的上下文窗口。

rss · AIHOT 精选 · Jun 2, 21:16AIHOT 精选

背景: 子智能体是具有独立上下文的专用 AI 实例,只向编排器返回相关结果,减少上下文污染。

参考链接

社区讨论: 开发者对非技术任务的潜力感到兴奋,认为这是自技能和子智能体以来最大的升级。

标签: #AI, #Claude Code, #multi-agent, #workflows, #software engineering


Alphabet 融资 800 亿美元,Anthropic 提交 IPO ⭐️ 8.0/10

Alphabet 宣布通过股权融资 800 亿美元用于 AI 基础设施,Anthropic 已秘密提交 IPO 申请。 这些举动表明大量资本涌入 AI 领域,Anthropic 可能先于 OpenAI 上市。 伯克希尔·哈撒韦作为 Alphabet 交易的一部分投资了 100 亿美元;Anthropic 目标在 2026 年 10 月上市。

rss · AIHOT 精选 · Jun 2, 18:39AIHOT 精选

参考链接

标签: #AI, #IPO, #Infrastructure, #Finance, #Tech Industry


Claude Code 团队:智能体编程重塑工程流程 ⭐️ 8.0/10

Claude Code 工程团队分享了将智能体编程设为默认后,规划转向 JIT、上下文收集变为 AI 优先、代码审查聚焦人类专业判断。 这为转向 AI 原生工作流的工程团队提供了具体蓝图,凸显了验证和安全方面的新瓶颈。 在新范式下,工程瓶颈从编写代码转向验证、审查与安全维护。

rss · AIHOT 精选 · Jun 2, 16:45AIHOT 精选

背景: 像 Claude Code 这样的智能体编码工具能自主规划、编写、测试和修改代码,几乎无需人工干预,可读取整个代码库并执行命令。JIT 规划意味着在正确的时间做适量的规划,类似于 JIT 编译。

参考链接

社区讨论: 讨论可能集中在实际采用挑战以及开发者角色从编码者向验证者的转变。

标签: #AI-assisted development, #engineering workflow, #agentic programming, #code review, #Claude Code


OpenAI Codex 发布 Python SDK ⭐️ 8.0/10

OpenAI 发布了 Codex 的 Python SDK,允许开发者将编程和图像生成代理集成到自己的应用中。 该 SDK 简化了将 AI 编程代理嵌入应用的过程,可能加速开发工作流。 该 SDK 支持登录状态复用,用户在应用内使用 Codex 时无需重新认证。

rss · AIHOT 精选 · Jun 2, 16:25AIHOT 精选

背景: Codex 是 OpenAI 的 AI 编程代理套件,可自动化软件工程任务。Python SDK 通过 JSON-RPC 实现对 Codex 线程的程序化控制。

参考链接

社区讨论: 宣布 SDK 的推文讨论有限,但开发者社区可能对实际集成示例感兴趣。

标签: #OpenAI, #Codex, #Python SDK, #AI, #Developer Tools


Anthropic 将 Project Glasswing 扩展至 150 多个组织 ⭐️ 8.0/10

Anthropic 将 Project Glasswing 扩展至 15 个国家的 150 多个组织,利用 Claude Mythos Preview 扫描并修复关键基础设施漏洞。 此次扩展应对了电力、水务、医疗等关键领域面临的 AI 驱动网络威胁,可能保护超过 1 亿人。 Anthropic 还推出了基于 Claude Opus 4.8 的 Claude Security 产品,用于代码扫描和补丁建议。

rss · AIHOT 精选 · Jun 2, 13:28AIHOT 精选

背景: Project Glasswing 是 Anthropic 的一项计划,利用前沿 AI 模型进行防御性网络安全。Claude Mythos Preview 是专用于漏洞检测的模型,出于安全考虑未公开发布。

参考链接

标签: #AI security, #cybersecurity, #critical infrastructure, #Anthropic, #vulnerability detection


Anthropic 区分因果相似特征 ⭐️ 8.0/10

Anthropic 提出一种方法,利用下游连接和 TWERA 权重来区分激活相似但因果效应不同的特征。 这解决了机械可解释性中的一个关键挑战,能够更准确地识别变压器中的因果组件。 TWERA 权重基于共激活统计,对连接进行排序以预测特征影响。

rss · AIHOT 精选 · Jun 2, 09:52AIHOT 精选

背景: 机械可解释性旨在逆向工程神经网络。TWERA(临时加权边排名分析)是本文引入的一种新加权方案。

标签: #interpretability, #mechanistic interpretability, #transformers, #causal inference, #Anthropic


金融业拥抱交易基础模型 ⭐️ 8.0/10

金融机构正采用基于 Transformer 的交易基础模型,Revolut、Mastercard、Adyen 和 Stripe 是典型案例。 这一转变统一了各业务线的 AI,提升了欺诈检测和客户洞察,同时打破了数据孤岛。 Revolut 的 PRAGMA 模型系列在 240 亿事件上训练,在信用评分等领域超越特定任务模型。

rss · AIHOT 精选 · Jun 2, 06:00AIHOT 精选

背景: 交易基础模型是在数十亿金融事件(支付、转账等)上预训练的大规模 AI 系统,学习金融行为的通用表示。它们不同于 FinBERT 等以文本为中心的金融模型。

参考链接

社区讨论: NVIDIA 博客强调,65%的金融机构已使用 AI,近 90%正在部署或评估。

标签: #AI, #Finance, #Foundation Models, #Transformers, #NVIDIA


Meta AI 聊天机器人漏洞可致 Instagram 账号被劫持 ⭐️ 8.0/10

Meta 的 AI 聊天机器人存在安全漏洞,攻击者可通过该机器人请求更改邮箱来劫持 Instagram 账号。 该漏洞绕过了标准安全检查,使数百万 Instagram 用户面临账号被接管的风险。 该利用无需验证,AI 聊天机器人直接处理账户恢复操作。

rss · AIHOT 精选 · Jun 1, 19:20AIHOT 精选

背景: 具有过度权限的 AI 智能体可以在没有适当认证的情况下执行敏感操作,这是 AI 系统设计中的一个已知风险。

参考链接

社区讨论: 安全研究人员批评 Meta 在未设置防护措施的情况下给予聊天机器人过多自主权。

标签: #AI security, #Meta, #Instagram, #vulnerability, #chatbot


佛罗里达州起诉 OpenAI 与 Altman,指控 ChatGPT 关联谋杀案 ⭐️ 8.0/10

佛罗里达州总检察长 James Uthmeier 对 OpenAI 及其 CEO Sam Altman 提起诉讼,指控多起谋杀案与 ChatGPT 有关,并称 Altman 完全漠视人命。 此案可能为 AI 法律责任树立先例,或将使公司对用户使用其模型的方式承担刑事责任。 该诉讼源于对一起大规模枪击案的调查,调查中审查了 ChatGPT 与嫌疑枪手之间的聊天记录。

rss · AIHOT 精选 · Jun 1, 18:52AIHOT 精选

背景: 此案引发了对 AI 公司是否需为用户受其模型影响的行为承担责任的疑问。此前法律案例主要关注 AI 生成内容的版权和平台责任。

参考链接

社区讨论: 讨论中观点分歧:有人认为 OpenAI 必须为不安全的设计负责,也有人警告这可能会扼杀 AI 创新。

标签: #AI safety, #legal, #OpenAI, #ChatGPT, #liability


美国 AI 政策里程碑:新行政令 ⭐️ 8.0/10

特朗普于 2026 年 6 月 2 日签署了修订后的 AI 行政令,标志着从之前放手态度的转变。 该行政令标志着美国监管的重大转向,要求对强大 AI 模型进行自愿的 30 天预发布审查。 该行政令要求公司在公开发布前 30 天将强大新模型提交给政府进行自愿审查。

rss · AIHOT 全部动态 · Jun 2, 21:14AIHOT 全部动态

背景: 上一届政府采取不干预的 AI 政策。该行政令引入了自愿审查流程,是此前 90 天草案的折中方案。

社区讨论: 评论者指出该行政令缺乏实质内容,一些人认为这是迈向对开源模型实施强制限制的一步。

标签: #AI policy, #regulation, #US government, #Gary Marcus


Cerebras 晶圆级芯片实现近 100% 良率 ⭐️ 8.0/10

Cerebras 在 46,225 平方毫米的晶圆级芯片上实现了近 100% 的良率,该芯片拥有 90 万个核心和 44 GB SRAM,并计划通过混合键合堆叠 DRAM 晶圆。 这一突破使晶圆级集成在商业上可行,能够制造出拥有前所未有核心数和内存带宽的大规模 AI 处理器。 该芯片采用定制逐批次光罩和每芯片冗余来绕过缺陷核心,实现了近乎完美的可用晶圆面积。

rss · AIHOT 全部动态 · Jun 2, 21:00AIHOT 全部动态

背景: 晶圆级集成(WSI)利用整个硅晶圆制造单个巨型芯片,避免了封装和片外通信。历史上,由于缺陷导致的良率问题,WSI 被认为不可行。

参考链接

标签: #wafer-scale integration, #semiconductor, #AI hardware, #Cerebras, #yield


微软 Project Solara:面向 AI 智能体的 Android 操作系统 ⭐️ 8.0/10

微软宣布 Project Solara,一个专为 AI 智能体而非传统应用设计的 Android 操作系统。 这标志着从以应用为中心向以智能体为中心的移动计算战略转变,可能重塑行业格局。 Project Solara 是与高通合作开发的芯片到云平台,面向智能体优先的设备。

rss · AIHOT 全部动态 · Jun 2, 20:47AIHOT 全部动态

背景: 智能体操作系统为 AI 智能体提供自主运行的基础设施,无需传统应用界面即可处理任务。

参考链接

标签: #Microsoft, #Android, #AI agents, #operating system, #mobile


微软 Fairwater:垂直 AI 超级计算机 ⭐️ 8.0/10

微软发布了 Fairwater,一个采用垂直双层设计、密集 3D 机架部署和近乎零水冷却的 AI 数据中心。 该设计实现了更高的计算密度和可持续性,为大规模 AI 基础设施树立了新标准。 冷却系统采用闭环液体设计,可循环用水,日耗水量仅相当于一家餐厅。

rss · AIHOT 全部动态 · Jun 2, 20:35AIHOT 全部动态

背景: 传统数据中心使用开环水冷却,耗水量大。Fairwater 的闭环系统消除了蒸发损失。

参考链接

标签: #AI infrastructure, #data center, #cooling, #Microsoft, #hardware


OpenAI 推出实时翻译模型 ⭐️ 8.0/10

OpenAI 发布了一款支持 70 多种语言的实时翻译模型。 这推动了多语言通信的发展,并为全球用户提供了更便捷的 AI 服务。 该模型支持 70 多种语言的低延迟实时翻译。

rss · AIHOT 日报 · Jun 1, 17:58AIHOT 日报

标签: #OpenAI, #real-time translation, #AI model, #NLP


中国首个基于华为昇腾的 1.58 比特端侧大模型开源 ⭐️ 8.0/10

面壁智能与清华大学开源了 BitCPM-CANN,这是中国首个基于华为昇腾 NPU 训练的 1.58 比特端侧大模型。 这标志着国产硬件上边缘 AI 的突破,大幅降低了内存和计算需求。 该模型使用三值权重(-1, 0, +1),每个参数仅 1.58 比特,相比 FP16 节省超过 90%内存。

rss · AIHOT 日报 · May 26, 00:00AIHOT 日报

背景: 1.58 比特量化将每个权重表示为三个值,大幅减小模型尺寸同时保持性能。华为昇腾 NPU 是国产 AI 加速器,这是首次在其上完成此类模型的全栈训练。

参考链接

标签: #edge AI, #model quantization, #Huawei Ascend, #open source, #China AI


Google I/O 2026:自主 Gemini 时代开启 ⭐️ 8.0/10

Google I/O 2026 宣布进入自主 Gemini 时代,推出 Gemini Spark 和 Omni 模型。 这标志着向可独立行动的自主 AI 代理的重大转变,影响开发者与企业。 Gemini Spark 是用于设备端 AI 的轻量级模型,Omni 则是处理复杂任务的多模态代理。

rss · AIHOT 日报 · May 20, 00:00AIHOT 日报

背景: Gemini 是 Google 的 AI 模型系列,此前专注于生成式 AI。“自主”时代意味着代理可以规划和执行任务,无需人类持续指导。

参考链接

社区讨论: 此新闻暂无评论。

标签: #AI, #Google I/O, #Gemini, #autonomous AI


vLLM 实现万亿参数模型支持 ⭐️ 8.0/10

vLLM 现已支持万亿参数模型的推理,这是社区协作达成的里程碑。 这使得高效服务最大规模的 LLM 成为可能,推动了 AI 推理的边界。 该支持利用了 PagedAttention 和跨多 GPU 的分布式推理。

rss · AIHOT 日报 · May 17, 00:00AIHOT 日报

背景: vLLM 是一个开源推理引擎,最初来自 UC Berkeley,以 PagedAttention 内存管理著称。

参考链接

标签: #vLLM, #LLM inference, #large-scale models, #community collaboration


Hy3 预览版登陆 GMI,领跑开源模型 ⭐️ 8.0/10

Hy3 预览版已在 GMI 平台发布,号称最强开源模型。 此次发布可能为开源 AI 模型树立新标杆,影响开发者和研究人员。 提供的内容中没有关于 Hy3 的具体技术细节。

rss · AIHOT 日报 · May 14, 00:00AIHOT 日报

背景: GMI 是一个模型托管和部署平台,但其确切性质从搜索结果中尚不明确。Hy3 可能是一个新的 AI 模型,但未找到可靠信息。

标签: #AI, #open-source, #model release, #GMI


Claude Opus 4.7 快速模式研究预览 ⭐️ 8.0/10

Anthropic 发布了 Claude Opus 4.7 的快速模式研究预览,以更高价格提供更快输出速度。 这使开发者能够为延迟敏感的应用使用最新旗舰模型的更快变体。 快速模式价格为每百万输入 token 30 美元、每百万输出 token 150 美元,是标准 Opus 4.7 的 6 倍。

rss · AIHOT 日报 · May 13, 00:00AIHOT 日报

参考链接

标签: #AI, #Claude, #Anthropic, #LLM, #research preview


ERNIE 5.1 发布:预训练成本仅 6% ⭐️ 8.0/10

百度发布 ERNIE 5.1,声称预训练成本仅为对标模型的 6%。 这一显著的成本降低可能使大模型训练更普及,并颠覆 AI 行业。 ERNIE 5.1 总参数约 8000 亿,仅为 ERNIE 5.0 的三分之一,但在多数基准测试上表现更优。

rss · AIHOT 日报 · May 10, 00:00AIHOT 日报

参考链接

社区讨论: 未发现显著的社区讨论。

标签: #AI, #large language model, #ERNIE, #cost efficiency, #Baidu


微软发布 137B 参数代码模型 MAI-Code-1-Flash ⭐️ 7.0/10

微软推出了 MAI-Code-1-Flash,一个 137B 参数的 MoE 代码模型,作为七个新 MAI 模型之一。 它巩固了微软在 AI 编程助手市场的地位,与 Claude Haiku 和 Qwen 等模型竞争。 该模型具有 256K 上下文长度,在超过 10T tokens 上训练,最初在 GitHub Copilot for VS Code 中可用。

hackernews · EvanZhouDev · Jun 2, 18:47 · 社区讨论T2 社区与开源

背景: MAI-Code-1-Flash 使用自适应解决方案长度控制,根据任务复杂度调整响应深度。

参考链接

社区讨论: 评论质疑其性能与更便宜的替代品(如 Qwen3.6-35B-A3B)相比,并批评微软的网站设计。

标签: #AI, #coding, #Microsoft, #model release, #code generation


为什么 systemd 定时器优于 cron ⭐️ 7.0/10

一篇文章主张 systemd 定时器在弹性调度和可预测执行方面优于 cron。 Linux 管理员和 DevOps 可以使用 systemd 定时器提高计划任务的可靠性。 systemd 定时器支持单调和日历事件,并能在系统停机后补回错过的运行。

hackernews · yacin · Jun 2, 09:34 · 社区讨论T2 社区与开源

背景: cron 是使用 crontab 文件的传统 Linux 任务调度器。systemd 定时器是与 systemd 集成的现代替代方案,提供更好的日志记录和依赖管理。

参考链接

社区讨论: 用户称赞定时器处理笔记本休眠和错过运行的能力,而一些人在讨论 PATH 处理上的差异。

标签: #systemd, #cron, #linux, #devops, #scheduling


Travelers 部署基于 OpenAI 的 AI 理赔助手 ⭐️ 7.0/10

Travelers 推出了基于 OpenAI 构建的 AI 理赔助手,用于自动化理赔提交并提供全天候支持。 这标志着 LLM 在保险行业的重大实际部署,在高峰期提升了可扩展性和客户体验。 该助手处理首次损失通知(FNOL),并在高流量期间扩展运营。

rss · OpenAI Blog · Jun 2, 12:00T1 官方实验室

参考链接

标签: #AI, #Insurance, #Customer Service, #OpenAI, #LLM


Holo3.1:快速本地计算机使用智能体 ⭐️ 7.0/10

Holo3.1 是基于 Qwen 模型的计算机使用智能体系列,提供 0.8B 到 35B-A3B 多种尺寸及量化检查点。 它在 AndroidWorld 上达到 79.3% 的得分,并通过 NVFP4 量化实现 1.74 倍吞吐量提升,支持高效本地推理。 与 BF16 相比,NVFP4 量化在 DGX Spark 上将平均步骤时间从 6.8 秒缩短至 3.3 秒。

rss · AIHOT 精选 · Jun 2, 14:13AIHOT 精选

背景: NVFP4 是 NVIDIA 的 4 位浮点格式,用于高效低精度推理。AndroidWorld 是 Android 设备上自主智能体的基准测试。

参考链接

标签: #AI agents, #computer use, #quantization, #local inference, #Qwen


NVIDIA DGX Station 搭载 GB300 开始发货 ⭐️ 7.0/10

搭载 GB300 的 NVIDIA DGX Station 系统现已从多个合作伙伴发货给开发者和研究人员。 这使数据中心级 AI 性能进入桌面,支持本地开发大型模型。 该系统提供高达 20 petaFLOPS 的 AI 算力和 748 GB 统一一致性内存。

rss · AIHOT 精选 · Jun 2, 20:15AIHOT 精选

背景: DGX Station 是一款桌面级 AI 超级计算机,采用 NVIDIA GB300 Grace Blackwell Ultra Desktop Superchip,支持高达 1 万亿参数的模型。

参考链接

标签: #NVIDIA, #DGX Station, #GB300, #AI hardware, #deep learning


GitHub Copilot 应用:智能体原生的桌面体验 ⭐️ 7.0/10

在微软 Build 2026 大会上,GitHub 发布了 Copilot 应用,作为智能体原生的桌面体验,让开发者从单一视图管理多个 AI 智能体。 这将 Copilot 从编码助手转变为 AI 智能体的指挥中心,将 AI 深度集成到开发者工作流中。 该应用提供“我的工作”视图,显示跨连接仓库的活动会话、问题、拉取请求和后台自动化。

rss · AIHOT 精选 · Jun 2, 17:30AIHOT 精选

参考链接

标签: #GitHub Copilot, #AI agents, #developer tools, #Microsoft Build


商汤开源 SenseNova-Skills AI 办公技能套件 ⭐️ 7.0/10

商汤开源了 SenseNova-Skills,这是一个为 OpenClaw 和 HermesAgent 等兼容智能体设计的 AI 办公技能套件。 它提供了实用的模块化办公能力(图表生成、数据分析、PPT 创建、深度研究),可在不同智能体框架中复用。 该套件包含四大核心技能:图像图表生成、多表数据分析、可编辑 PPT 创建以及跨多源深度研究。

rss · AIHOT 精选 · Jun 2, 14:48AIHOT 精选

背景: OpenClaw 和 HermesAgent 是开源智能体运行时,允许 AI 模型执行技能。SenseNova-Skills 为这些智能体扩展了具体的办公工作流。

参考链接

标签: #AI, #Open Source, #Office Automation, #SenseTime


Gemini Spark:令人惊叹又不安的 AI ⭐️ 7.0/10

Google DeepMind 的 Gemini Spark AI 模型提供了令人印象深刻却又令人不安的用户体验。 这凸显了先进 AI 的双重性:强大的能力和潜在的风险。 Gemini Spark 是一个自主 AI 代理,可以全天候代表用户采取行动。

rss · AIHOT 精选 · Jun 2, 12:38AIHOT 精选

参考链接

标签: #AI, #Google DeepMind, #Gemini Spark, #user experience, #ethics


阿里云发布 AgentScope Java 1.1 ⭐️ 7.0/10

阿里云发布了 AgentScope Java 1.1,包含自进化智能体、Claw 本地 Shell 访问和 Builder 多租户平台。 这使 Java 开发者能够构建和部署具有自进化和本地执行能力的 AI 智能体。 Claw 为智能体提供本地 Shell 访问,Builder 是一个零代码多租户平台。

rss · AIHOT 精选 · Jun 2, 09:43AIHOT 精选

背景: AgentScope 是一个面向 JVM 的开源智能体框架,支持 ReAct 推理和多智能体编排。

参考链接

标签: #AgentScope, #AI Agents, #Java, #Alibaba Cloud


SK 海力士计划五年内晶圆产能翻倍 ⭐️ 7.0/10

SK 海力士计划在未来五年内将整体晶圆产能提高一倍,以满足 AI 驱动的存储需求。 这一大规模扩产计划表明存储供应紧张可能持续至 2030 年,影响 AI 硬件供应链。 新建晶圆厂至少需要三年时间,SK 海力士市值已突破 1 万亿美元。

rss · AIHOT 精选 · Jun 2, 08:31AIHOT 精选

参考链接

标签: #semiconductors, #AI hardware, #memory, #SK Hynix, #industry news


开源 AI 磁盘清理工具超越 CleanMyMac ⭐️ 7.0/10

一款开源 AI 磁盘清理工具,支持 Mac/Windows,生成交互式 HTML 报告并安全释放空间,表现优于 CleanMyMac。 提供了付费清理工具(如 CleanMyMac)的免费透明替代方案,可回收更多空间(120GB 对比 15.8GB)。 使用 Codex AI 进行只读存储分析,并通过颜色编码安全等级(绿/黄/红)指导文件删除决策。

rss · AIHOT 精选 · Jun 2, 04:42AIHOT 精选

背景: CleanMyMac 是一款流行的 macOS 维护工具,可扫描垃圾文件但常遗漏深层缓存。Codex 是 OpenAI 的 AI 编程代理,可分析文件系统。

参考链接

社区讨论: 该工具的透明度和 AI 驱动建议受到称赞,用户指出它发现的垃圾文件是 CleanMyMac 的 8 倍。

标签: #open-source, #AI, #disk-cleanup, #macOS, #Windows


阶跃星辰发布高效推理模型 Step 3.7 Flash ⭐️ 7.0/10

阶跃星辰发布 Step 3.7 Flash,196B MoE 模型,采用多矩阵分解注意力和解耦注意力-FFN,通过 Fireworks AI 提供,采用 Apache 2.0 许可。 该模型 KV-cache 成本仅为 DeepSeek 的 22%,开源后可用于构建高效的智能体应用。 多矩阵分解注意力(MFA)通过低秩分解减少 KV 缓存;解耦注意力-FFN 实现硬件优化服务。

rss · AIHOT 精选 · Jun 2, 03:45AIHOT 精选

背景: MoE(混合专家)是一种将计算拆分为多个专家子网络的架构,可在不按比例增加计算成本的情况下提升模型容量。多矩阵分解注意力(MFA)通过低秩矩阵分解查询-键交互,减少内存使用。

参考链接

标签: #AI/ML, #LLM, #Model Optimization, #Open Source


NVIDIA JetPack 7.2 提升边缘 AI 智能体内存效率 ⭐️ 7.0/10

NVIDIA JetPack 7.2 支持一键部署 NemoClaw 堆栈,并引入 Jetson 智能体技能,优化边缘 AI 智能体的内存使用。 此更新加速了在 Jetson 等边缘设备上安全部署智能体 AI,将开发时间从数周缩短至数天。 NemoClaw 为 OpenClaw 增加了隐私和安全控制,智能体技能可自动完成 Linux 定制、内存优化和模型基准测试。

rss · AIHOT 精选 · Jun 2, 02:00AIHOT 精选

背景: NemoClaw 是一个开源参考堆栈,用于在沙箱中安全运行 AI 智能体。OpenClaw 是一个用于构建 AI 智能体的开源平台。

参考链接

标签: #NVIDIA, #JetPack, #Edge AI, #AI Agents, #Memory Optimization


开放权重模型在 OpenRouter 上占据 69.1%的 Token 份额 ⭐️ 7.0/10

开放权重模型现在占 OpenRouter 上 Token 使用量的 69.1%,较 2025 年初的少数份额大幅增长。 这标志着开发者偏好向开放模型的重大转变,挑战了闭源模型的主导地位。 领导地位频繁更迭:DeepSeek 被 MiniMax 和 Kimi 超越,随后又被 MiMo、Qwen 等模型取代。

rss · AIHOT 精选 · Jun 2, 00:00AIHOT 精选

背景: 开放权重模型允许用户访问和微调模型权重,而闭源模型只能通过 API 访问。OpenRouter 是一个统一 API 平台,提供数百种大语言模型。

参考链接

社区讨论: 开发者注意到竞争节奏加快,以及中国开放权重模型的成本优势推动了采用。

标签: #open models, #AI ecosystem, #market analysis, #open source


Google AI Studio 新增 Gmail、Drive、Sheets 集成 ⭐️ 7.0/10

Google AI Studio 现在支持在平台内直接构建连接 Gmail、Drive 和 Sheets 的应用,测试人员分享和公开分享功能即将推出。 开发者无需离开 IDE 即可快速原型化 AI 驱动的工作流,简化了与 Google 服务的集成。 该功能允许在 AI Studio 内部直接调用 Gmail、Drive 和 Sheets 的 API,无需外部认证设置。

rss · AIHOT 精选 · Jun 1, 21:59AIHOT 精选

背景: Google AI Studio 是一个基于网页的集成开发环境,用于使用 Google 的 Gemini 模型进行原型开发,于 2023 年 12 月与 Gemini API 一同发布。

参考链接

标签: #Google AI Studio, #Gmail, #Drive, #Sheets, #AI development


Replit:一个提示词构建完整业务 ⭐️ 7.0/10

Replit 宣布用户现在可以通过单个提示词构建完整业务,包括网站、移动应用、幻灯片和视频,并集成支付、会计和运营工具。 这降低了非技术用户创建和运营业务的门槛,可能使软件开发和创业更加民主化。 集成了 Stripe、Atlas、QuickBooks、Mercury 和 Doola,用于支付、会计和业务运营。

rss · AIHOT 精选 · Jun 1, 19:46AIHOT 精选

背景: Replit 是一个在线 IDE,现在包含一个 AI 代理,能够根据自然语言提示生成完整应用程序。新的 Canvas 功能提供了一个带有实时预览的空间 UI 设计工具。

参考链接

社区讨论: 用户对这一潜力感到兴奋,但一些人质疑 AI 生成的业务应用在现实世界中的可靠性和质量。

标签: #AI-assisted development, #no-code, #Replit, #business automation, #prompt engineering


AI 解释科学优于预测科学 ⭐️ 7.0/10

一项对 4760 个科学事件的研究表明,AI 擅长解释科学,但在预测科学进展方面表现不佳,准确率接近随机猜测。 这揭示了 AI 在科学预测方面的根本局限性,影响 AI 研究和科学政策。 该研究引入了 CUSP(截止条件未知科学进展),一个多学科基准,用于评估 AI 的科学预见能力。

rss · AIHOT 全部动态 · Jun 2, 21:48AIHOT 全部动态

背景: CUSP 是一个基准测试,在受控知识约束下评估 AI 的可行性、机制推理、生成式解决方案设计和结果预测能力。

参考链接

标签: #AI, #scientific forecasting, #machine learning, #research


前 DOGE 员工创办 AI 削减成本公司 ⭐️ 7.0/10

两名前 DOGE 员工成立公司,通过收购企业并利用 AI 削减浪费,将政府效率策略应用于私营领域。 这可能将激进的成本削减方法引入私人并购,重塑企业效率管理方式。 该公司模仿 DOGE 的方法,利用 AI 识别并消除收购中的低效环节。

rss · AIHOT 全部动态 · Jun 2, 20:41AIHOT 全部动态

背景: DOGE(政府效率部)是美国 DOGE 服务下属的临时组织,由埃隆·马斯克领导,旨在削减政府浪费,并非正式的联邦部门。

参考链接

标签: #AI, #cost-cutting, #private sector, #efficiency, #government


微软研究院发布端侧智能体 MagenticLite ⭐️ 7.0/10

微软研究院推出了 MagenticLite,一种由本地运行的小型模型驱动的端侧智能体体验。 这使得在个人设备上实现私密、低延迟的 AI 智能体成为可能,无需依赖云端。 MagenticLite 是 Magentic-UI 的下一代版本,专为小型模型重新设计,可跨浏览器和本地文件系统工作。

rss · AIHOT 全部动态 · Jun 2, 20:30AIHOT 全部动态

参考链接

标签: #AI agents, #on-device AI, #Microsoft Research, #small models


Runway 推出模型上下文协议服务器 ⭐️ 7.0/10

Runway 发布了模型上下文协议(MCP)服务器,实现标准化的 AI 工具集成。 这简化了 AI 模型与外部数据和工具的连接,提升了开发效率。 该 MCP 服务器通过 Runway API 支持 Aleph 2.0 视频编辑,可处理最长 30 秒的 1080p 片段。

rss · AIHOT 日报 · May 28, 00:00AIHOT 日报

背景: MCP 是 Anthropic 提出的开放标准,用于 AI 系统与工具共享数据,解决模型碎片化问题。

参考链接

标签: #AI, #Model Context Protocol, #Runway, #infrastructure


Luma Agents 实现规模化 UGC 广告生成 ⭐️ 7.0/10

Luma Agents 现在支持规模化生成真实的用户生成内容(UGC)广告。 这使得品牌能够大规模制作看起来真实的广告,从而改变 AI 驱动的营销方式。 Luma Agents 是一个多模态 AI,可在统一工作流中生成文本、图像、视频和音频。

rss · AIHOT 日报 · May 25, 00:00AIHOT 日报

背景: UGC 广告模仿真实客户内容,通常更受消费者信任。Luma Agents 自动化了这一创意过程。

参考链接

标签: #AI, #UGC, #advertising, #content generation


阿里云发布 HappyHorse 视频生成模型 ⭐️ 7.0/10

阿里云发布了名为 HappyHorse 的 AI 视频生成模型。 它扩展了阿里云的 AI 产品线,瞄准商业视频制作场景。 HappyHorse 1.0 拥有 150 亿参数,支持原生音视频联合生成。

rss · AIHOT 日报 · May 19, 00:00AIHOT 日报

参考链接

社区讨论: 未发现显著的社区讨论。

标签: #AI, #视频生成, #阿里云, #模型发布


Ollama v0.30.1-rc0 新增 Cline CLI 自动安装和 Qwen 代码集成 ⭐️ 6.0/10

Ollama v0.30.1-rc0 引入了 Cline CLI 的自动安装功能,并集成了 Qwen 代码以增强编码辅助。 此版本通过自动安装 Cline CLI 和添加 Qwen 代码支持,简化了 AI 驱动的编码工作流程,使使用 Ollama 的开发者受益。 该更新还包括 llama.cpp 版本更新、Radeon 8060S iGPU 支持以及各种错误修复。

github · github-actions[bot] · Jun 2, 20:44

背景: Cline CLI 是一个智能编码工具,帮助开发者理解代码库并自动化任务。Qwen Code 是一个针对 Qwen 模型优化的开源 AI 编码代理。

参考链接

标签: #ollama, #llm, #release, #open-source


西雅图监控设施步行导览 ⭐️ 6.0/10

一次详细的可视化导览,展示西雅图的监控摄像头和传感器,并探讨其社会影响。 它突显了日益增长的监控基础设施及其对隐私和公民自由的影响。 导览包括摄像头、车牌读取器和其他传感器,并对其设计和用途进行评论。

hackernews · eustoria · Jun 2, 13:24 · 社区讨论T2 社区与开源

社区讨论: 评论者就隐私与安全之间的权衡展开辩论,一些人认为监控对控制犯罪是必要的。

标签: #surveillance, #privacy, #civic technology, #Seattle


OpenAI 提议设立国际青少年 AI 安全研究所 ⭐️ 6.0/10

OpenAI 呼吁成立一个国际研究所,为青少年 AI 安全制定标准和保障措施。 这可能影响全球未成年人 AI 安全政策,改变企业为青少年设计 AI 产品的方式。 该提案将在即将于法国埃维昂举行的 G7 峰会上讨论。

rss · OpenAI Blog · Jun 2, 07:00T1 官方实验室

背景: OpenAI CEO Sam Altman 强调 AI 必须始终处于人类控制之下,并批评了关于就业毁灭的末日论调。

参考链接

标签: #AI safety, #youth, #policy, #OpenAI


Claude Code 自我检查反馈闭环技巧 ⭐️ 6.0/10

一种编码手动检查的技术,让 Claude Code 在完成前自主验证输出。 通过无需人工干预的反馈闭环提升 AI 代码生成质量。 利用 Claude Code 的 Stop 钩子和 PostToolUse 反馈注入实现三层验证循环(语法、意图、回归)。

rss · AIHOT 精选 · Jun 2, 19:59AIHOT 精选

背景: Claude Code 是一个代理式编码系统,能读取代码库、进行更改、运行测试并交付已提交的代码。Ralph Wiggum 技术实现了迭代自引用循环。

参考链接

社区讨论: 开发者认为该技术有助于减少手动审查负担,但有人指出需要精心设计提示词。

标签: #AI-assisted coding, #Claude Code, #feedback loop, #code quality


NVIDIA NemoClaw 部署 Hermes 智能体 ⭐️ 6.0/10

NVIDIA 发布了使用 NemoClaw 和 OpenShell 部署 NousResearch Hermes Agent 的教程。 它展示了如何构建跨部署保留技能的持久化 AI 智能体。 该智能体可连接 Slack、Outlook、GitHub 和 NVIDIA 论坛,并从聊天纠正中学习。

rss · AIHOT 精选 · Jun 2, 17:12AIHOT 精选

背景: NemoClaw 是一个开源栈,用于在 OpenShell 沙箱中安全运行 AI 智能体。Hermes Agent 是一个自我改进的开源智能体。

参考链接

标签: #NVIDIA, #AI agents, #tutorial, #deployment


Karpathy 分享学习方法论 ⭐️ 6.0/10

Andrej Karpathy 在社交媒体上分享了他的学习方法,强调实践。 他的见解可能影响 AI 从业者的自学方式。 该帖子缺乏具体技术细节或示例。

rss · AIHOT 精选 · Jun 2, 00:12AIHOT 精选

标签: #learning, #methodology, #AI, #education


Nous Research 发布跨平台 Hermes 桌面应用 ⭐️ 6.0/10

Nous Research 发布了适用于 macOS、Windows 和 Linux 的 Hermes 桌面应用。 它将自我改进的 AI 代理带到桌面用户,无需使用终端。 该应用包含聊天、流式工具输出、并排预览、文件浏览器、语音和设置功能。

rss · AIHOT 全部动态 · Jun 2, 22:57AIHOT 全部动态

背景: Hermes Agent 是一个开源自主 AI 代理,具有持久记忆和内置学习循环,由 Nous Research 于 2026 年 2 月发布。

参考链接

标签: #AI, #desktop app, #Nous Research, #cross-platform


Claude 模型迭代放缓,内部工具未能加速 ⭐️ 6.0/10

一条推文批评 Claude Opus 4.7 和 4.8 在提价且拥有 Mythos 等内部工具的情况下,性能未见提升甚至下降。 这引发了对 Anthropic AI 模型开发速度的担忧,影响用户和投资者。 推文称 Claude 模型已停滞 4 个月,仍维持约半年一次重大更新的节奏。

rss · AIHOT 全部动态 · Jun 2, 22:14AIHOT 全部动态

背景: Mythos 是 Anthropic 内部用于利用 LLM 发现软件漏洞的工具,并非通用开发加速器。

参考链接

标签: #Claude, #AI models, #model stagnation, #development pace


Mollick 批评“全能”AI 应用 ⭐️ 6.0/10

Ethan Mollick 指出当前“全能”AI 应用只是聊天机器人和 IDE 的混合体,并非为通用知识工作而构建。 这凸显了 AI 工具在设计上未能满足知识工作者对非线性、集成研究的工作流程的需求。 Mollick 指出这些应用假设线性流程,将最终输出视为唯一目标,缺乏与研究连接和引导。

rss · AIHOT 全部动态 · Jun 2, 22:03AIHOT 全部动态

背景: IDE(集成开发环境)是用于代码编辑、调试和版本控制的软件应用。IDE 中的 AI 集成(如 GitHub Copilot)帮助开发者进行代码补全和生成。

参考链接

标签: #AI, #productivity, #knowledge work, #user experience


传闻:Mythos 的 FLOPs 与 Gemini 3.1 Pro 相当 ⭐️ 6.0/10

一条推文声称 Mustafa 的 Mythos 模型训练 FLOPs 与 Gemini 3.1 Pro 相似。 如果属实,Mythos 的计算量将远超预期,引发成本和安全性担忧。 该说法未经证实;Mythos 是 Anthropic 未发布的漏洞检测模型。

rss · AIHOT 全部动态 · Jun 2, 20:29AIHOT 全部动态

背景: FLOPs(浮点运算次数)衡量训练或运行模型的计算成本。更高的 FLOPs 通常意味着模型能力更强但成本更高。

参考链接

社区讨论: 该推文引发了讨论,但尚未有官方确认或详细分析。

标签: #AI, #LLM, #FLOPs, #rumor


NVIDIA MGX 在 GTC 台北展示模块化 AI 工厂 ⭐️ 6.0/10

NVIDIA MGX 与 80 多家合作伙伴在 GTC 台北展出,作为面向智能体 AI 时代的模块化 AI 基础设施解决方案。 这标志着 NVIDIA 推动 AI 工厂设计标准化,为合作伙伴构建智能体 AI 系统缩短上市时间。 MGX 生态系统利用 NVIDIA Vera Rubin、800 VDC 电源架构和合作伙伴系统,实现可扩展的 AI 工厂。

rss · AIHOT 全部动态 · Jun 2, 20:28AIHOT 全部动态

背景: NVIDIA MGX 是一种开放模块化参考架构,用于构建加速服务器和机架级 AI 工厂,可降低工程成本并确保多代兼容性。

参考链接

标签: #NVIDIA, #AI infrastructure, #MGX, #GTC


MiniMax M2.7 模型上线 OrcaRouter 平台 ⭐️ 6.0/10

MiniMax M2.7 模型已在 OrcaRouter 平台上架。 这通过统一 API 路由器扩大了对 MiniMax 最新模型的访问。 OrcaRouter 是一个零加价的开源 LLM API 路由器。

rss · AIHOT 日报 · May 16, 00:00AIHOT 日报

背景: OrcaRouter 是一个 LLM 统一 API 路由器,无需管理多个密钥即可访问众多模型。

参考链接

标签: #AI, #model release, #MiniMax, #OrcaRouter


StepAudio 2.5 发布,支持语音克隆 ⭐️ 6.0/10

StepAudio 2.5 Realtime 发布,这是一个端到端语音模型,具备副语言理解和零样本语音克隆能力。 这使得高度逼真、具有情感感知的 AI 语音交互成为可能,模糊了真实语音与合成语音的界限。 该模型支持超过一万种人格预设,并可组合出数百万种独特的语音特征。

rss · AIHOT 日报 · May 6, 16:43AIHOT 日报

背景: 副语言学指的是语调、音高、语速等非语言声音线索,它们传达超越词语本身的情感和意图。

参考链接

标签: #AI, #voice cloning, #technology


Nathan Lambert 离开 Ai2,结束 2.5 年任期 ⭐️ 5.0/10

Ai2 研究员 Nathan Lambert 宣布离职,他在职 2.5 年期间主导了 OLMo 和 Tulu 等开源模型项目。 他的离开可能影响 Ai2 在开源 AI 开发上的势头,因为他是完全透明模型的关键推动者。 Lambert 表示将暂时休息,但会继续深耕开源模型与开放科学领域。

rss · AIHOT 精选 · Jun 2, 14:13AIHOT 精选

背景: Ai2(艾伦人工智能研究所)是由保罗·艾伦创立的非营利研究机构。OLMo 和 Tulu 是完全开源的语言模型系列,提供训练数据和方法的完全透明。

参考链接

标签: #AI research, #open-source models, #personnel change, #Ai2


ChatGPT 新增全屏编辑与保存长文功能 ⭐️ 5.0/10

ChatGPT 现在支持全屏编辑长文,并可保存到个人资料库。 这改善了用户在 ChatGPT 内撰写长内容的写作体验。 保存功能允许用户稍后从资料库继续编辑。

rss · AIHOT 精选 · Jun 1, 22:11AIHOT 精选

社区讨论: Hacker News 上的评论不相关,讨论的是 Chrome AI 弹窗和使用 LLM 写邮件。

标签: #ChatGPT, #feature update, #writing tools


Claude Code v2.1.161:OTEL 标签、智能体进度、MCP 修复 ⭐️ 5.0/10

Claude Code v2.1.161 将 OTEL 资源属性作为指标标签,显示智能体任务进度,改进 MCP 连接器列表,并修复并行工具调用和终端渲染问题。 开发者现在可以通过 OTEL 标签按团队或代码库监控使用情况,并更清晰地了解智能体任务完成进度。 此次更新还确保单个 Bash 命令失败不再取消其他并行工具调用,提高了可靠性。

rss · AIHOT 全部动态 · Jun 2, 21:58AIHOT 全部动态

背景: OTEL_RESOURCE_ATTRIBUTES 是 OpenTelemetry 中的一个环境变量,包含用于标识产生遥测数据的资源的键值对(如 service.name)。MCP(模型上下文协议)连接器允许 Claude 与外部工具和数据源交互。

参考链接

社区讨论: /fork 命令的更新(现在在后台运行智能体并保留完整上下文)被认为是工作流灵活性的重要改进。

标签: #Claude Code, #release notes, #developer tools, #bug fixes


Kim 发起 AI 内容质量投票 ⭐️ 5.0/10

Kim 发起投票活动,区分 AI 生成的“氛围感”内容和垃圾内容。 这一社区驱动的努力应对日益严重的低质量 AI 内容问题。 投票在 X(原 Twitter)上进行,邀请公众参与。

rss · AIHOT 全部动态 · Jun 2, 20:27AIHOT 全部动态

社区讨论: 评论关注浏览器和邮件中的 AI 垃圾内容,未直接讨论该投票。

标签: #AI, #content quality, #community


旧金山编程智能体基准测试活动 ⭐️ 5.0/10

Artificial Analysis 宣布将于 6 月 11 日在旧金山举办编程智能体基准测试活动,包含闪电演讲和小组讨论。 该活动汇聚顶尖 AI 研究人员和开发者,共同评估编程智能体,影响 AI 辅助软件工程的未来。 该活动与 OpenAI 的 Codex 智能体相关,Codex 周活跃用户超 500 万,非开发者占 20%且增速是开发者的 3 倍以上。

rss · AIHOT 全部动态 · Jun 2, 20:08AIHOT 全部动态

背景: 像 OpenAI Codex 这样的编程智能体是自动化软件工程任务的 AI 工具。SWE-bench 等基准测试衡量其实际性能。

参考链接

标签: #coding agents, #benchmark, #AI, #event


OpenCode x Ring 2.6 1T 限时免费 ⭐️ 5.0/10

OpenCode 与 Ring 2.6 1T 模型限时免费,提供 1 万亿 tokens。 开发者可免费使用万亿参数推理模型,进行复杂任务实验。 该模型支持 256K 上下文、推理和纯文本输入,通过 OpenCode Zen API 最多可输出 66K tokens。

rss · AIHOT 日报 · May 11, 00:00AIHOT 日报

背景: Ring-1T 是首个开源万亿参数思维模型,由蚂蚁集团的 Inclusion AI 团队开发。它采用 MoE 架构,专为复杂推理任务设计。

参考链接

社区讨论: X 上的公告有 45 条回复,用户对免费层和模型能力表示兴趣。

标签: #AI, #OpenCode, #Ring, #free trial



附录

以下内容来自 AIHOT 日报,每天 08:00 北京时间发布

  1. AI HOT 日报 · 2026-06-02 — MiniMax M3:前沿编码、100 万 token 上下文与原生多模态一体模型 MiniMax M3:前沿编码、100 万 token 上下文与原生多模态一体模型 — 点击查看完整日报

  2. AI HOT 日报 · 2026-06-01 — OpenAI 发布生物防御 AI 工具 Rosalind OpenAI 发布生物防御 AI 工具 Rosalind — 点击查看完整日报

  3. AI HOT 日报 · 2026-05-31 — Nano Banana Pro 与 Nano Banana 2 正式发布 Nano Banana Pro 与 Nano Banana 2 正式发布 — 点击查看完整日报

  4. AI HOT 日报 · 2026-05-30 — OpenAI 推出实时翻译模型,支持 70+语言输入 OpenAI 推出实时翻译模型,支持 70+语言输入 — 点击查看完整日报

  5. AI HOT 日报 · 2026-05-29 — Claude Opus 4.8 发布:在编码、智能体技能与推理方面实现全面升级 Claude Opus 4.8 发布:在编码、智能体技能与推理方面实现全面升级 — 点击查看完整日报

  6. AI HOT 日报 · 2026-05-28 — Runway 推出 Model Context Protocol 服务器 Runway 推出 Model Context Protocol 服务器 — 点击查看完整日报

— From rss — Aleph 2.0 现已通过 Runway API 提供。将精准视频编辑直接集成到您的应用、产品和平台中。支持在多镜头序列中编辑最长 30 秒、1080p 分辨率的视频,仅修改您想要的部分。

请通过以下链接开始使用。

  1. AI HOT 日报 · 2026-05-27 — 谷歌 AI 框架 AlphaProof Nexus 攻克 2 道悬置 56 年数学难题 谷歌 AI 框架 AlphaProof Nexus 攻克 2 道悬置 56 年数学难题 — 点击查看完整日报

  2. AI HOT 日报 · 2026-05-26 — 面壁智能联合清华等开源中国首个基于华为昇腾训练的 1.58-bit 端侧大模型 BitCPM-CANN 面壁智能联合清华等开源中国首个基于华为昇腾训练的 1.58-bit 端侧大模型 BitCPM-CANN — 点击查看完整日报

— From rss — 首个基于华为昇腾 910B NPU 全栈训练的 1.58 比特开源大模型 BitCPM-CANN 发布 — 点击查看完整日报

  1. AI HOT 日报 · 2026-05-25 — Luma Agents 实现规模化真实 UGC 广告生成 Luma Agents 实现规模化真实 UGC 广告生成 — 点击查看完整日报

— From rss — 从单张图像构建实时视频智能体:Runway Characters 技术解析 — 点击查看完整日报

  1. AI HOT 日报 · 2026-05-24 — StepAudio 2.5 实时语音发布:副语言感知与人格化交互 StepAudio 2.5 实时语音发布:副语言感知与人格化交互 — 点击查看完整日报

— From rss — 通过 API 中的新模型推进语音智能 — 点击查看完整日报

  1. AI HOT 日报 · 2026-05-23 — 首个基于华为昇腾 910B NPU 全栈训练的 1.58 比特开源大模型 BitCPM-CANN 发布 首个基于华为昇腾 910B NPU 全栈训练的 1.58 比特开源大模型 BitCPM-CANN 发布 — 点击查看完整日报

  2. AI HOT 日报 · 2026-05-22 — Aleph 2.0 与 Edit Studio Aleph 2.0 与 Edit Studio — 点击查看完整日报

  3. AI HOT 日报 · 2026-05-21 — Qwen3.7:智能体前沿 Qwen3.7:智能体前沿 — 点击查看完整日报

  4. AI HOT 日报 · 2026-05-20 — I/O 2026: 欢迎来到自主的 Gemini 时代 I/O 2026: 欢迎来到自主的 Gemini 时代 — 点击查看完整日报

  5. AI HOT 日报 · 2026-05-19 — 阿里云推出 HappyHorse 视频生成模型 阿里云推出 HappyHorse 视频生成模型 — 点击查看完整日报

— From rss — Grok Imagine 图像生成功能正式发布 — 点击查看完整日报

  1. AI HOT 日报 · 2026-05-18 — Grok Imagine 图像生成功能正式发布 Grok Imagine 图像生成功能正式发布 — 点击查看完整日报

  2. AI HOT 日报 · 2026-05-17 — 社区协作再创佳绩,vLLM 支持万亿级模型 社区协作再创佳绩,vLLM 支持万亿级模型 — 点击查看完整日报

  3. AI HOT 日报 · 2026-05-16 — MiniMax M2.7 模型上线 OrcaRouter 平台 MiniMax M2.7 模型上线 OrcaRouter 平台 — 点击查看完整日报

— From rss — MiniMax M3 模型通过 Live Session 分享了核心信息。其 MSA 技术采用块级 Top-K 选择,保持真实、未压缩的 KV 缓存,使 1M token 上下文窗口高效运行。该技术将长上下文生成的注意力内核解码时间从约 30%降至约 5%,效率提升显著。M3 是原生多模态模型,支持图像视频输入,可处理长程智能体任务及桌面操作,并具备视觉自评估迭代能力。模型在金融任务中展现出初级分析师水平。未来版本将聚焦更复杂的长程任务,并扩展金融、法律与生物领域。Together AI 为其提供推理服务。

— From rss — MiniMax-M3 在 @ValsAI 排名中位列第六

新的开源权重 SOTA 🚀

— From rss — MiniMax M3:前沿编码、100 万 token 上下文与原生多模态一体模型 — 点击查看完整日报

— From rss — @togethercompute 团队对 MiniMax M3 生产部署的精彩深度解析。

M3 凭借其 1M 上下文、原生多模态和 MiniMax Sparse Attention,需要在分页解码、索引评分和多模态预处理方面进行大量工作才能实现高效运行。

这就是前沿合作的样子🤝。

  1. AI HOT 日报 · 2026-05-15 — SenseNova U1 技术报告发布,基于 MoE 架构开放模型权重 SenseNova U1 技术报告发布,基于 MoE 架构开放模型权重 — 点击查看完整日报

  2. AI HOT 日报 · 2026-05-14 — Hy3 预览版登陆 GMI,开源最强模型领跑 Hy3 预览版登陆 GMI,开源最强模型领跑 — 点击查看完整日报

  3. AI HOT 日报 · 2026-05-13 — Claude Opus 4.7 快速模式开放研究预览 Claude Opus 4.7 快速模式开放研究预览 — 点击查看完整日报

  4. AI HOT 日报 · 2026-05-12 — SenseNova U1 图像生成模型登陆 ComfyUI 平台 SenseNova U1 图像生成模型登陆 ComfyUI 平台 — 点击查看完整日报

  5. AI HOT 日报 · 2026-05-11 — OpenCode x Ring 2.6 1T 限时免费开放 OpenCode x Ring 2.6 1T 限时免费开放 — 点击查看完整日报

— From rss — Ring-2.6-1T 发布:万亿参数思维模型专为复杂任务设计 — 点击查看完整日报

  1. AI HOT 日报 · 2026-05-10 — ERNIE 5.1 发布,预训练成本仅需对标模型 6% ERNIE 5.1 发布,预训练成本仅需对标模型 6% — 点击查看完整日报

  2. AI HOT 日报 · 2026-05-09 — Ring-2.6-1T 发布:万亿参数思维模型专为复杂任务设计 Ring-2.6-1T 发布:万亿参数思维模型专为复杂任务设计 — 点击查看完整日报

  3. AI HOT 日报 · 2026-05-08 — 通过 API 中的新模型推进语音智能 通过 API 中的新模型推进语音智能 — 点击查看完整日报

  4. AI HOT 日报 · 2026-05-07 — SenseNova-U1 开源 8 步蒸馏 LoRA,推理速度大幅提升 SenseNova-U1 开源 8 步蒸馏 LoRA,推理速度大幅提升 — 点击查看完整日报

  5. AI HOT 日报 · 2026-05-06 — GPT-5.5 Instant:更智能、更清晰、更个性化 GPT-5.5 Instant:更智能、更清晰、更个性化 — 点击查看完整日报

  6. AI HOT 日报 · 2026-05-05 — 语音克隆技术上线 真假难辨 语音克隆技术上线 真假难辨 — 点击查看完整日报

— From rss — StepAudio 2.5 实时语音发布:副语言感知与人格化交互 — 点击查看完整日报

— From rss — 通过 API 中的新模型推进语音智能 — 点击查看完整日报

  1. AI HOT 日报 · 2026-05-04 — 从单张图像构建实时视频智能体:Runway Characters 技术解析 从单张图像构建实时视频智能体:Runway Characters 技术解析 — 点击查看完整日报