From 57 items, 37 important content pieces were selected


  1. 谷歌用 AI 答案改造搜索框 ⭐️ 9.0/10
  2. CISA 承包商在 GitHub 泄露 AWS GovCloud 密钥 ⭐️ 9.0/10
  3. Google I/O 2026:让人工智能惠及每个人 ⭐️ 9.0/10
  4. DeepSeek-V4 预览版:百万上下文,开源发布 ⭐️ 9.0/10
  5. OpenAI GPT-5.5:成本降至 1/35,效率提升 50 倍 ⭐️ 9.0/10
  6. Forge 将 8B 模型准确率从 53% 提升至 99% ⭐️ 8.0/10
  7. 苹果在辅助功能中首次引入代理式 AI ⭐️ 8.0/10
  8. Andrej Karpathy 加入 Anthropic 预训练团队 ⭐️ 8.0/10
  9. 谷歌 Gemini Omni:视频惊艳,物理仍存缺陷 ⭐️ 8.0/10
  10. vLLM 现已支持万亿参数模型 ⭐️ 8.0/10
  11. SenseNova U1 技术报告发布,采用 MoE 架构并开放权重 ⭐️ 8.0/10
  12. Hy3 预览版登陆 GMI,领跑开源模型 ⭐️ 8.0/10
  13. Claude Opus 4.7 快速模式研究预览 ⭐️ 8.0/10
  14. ERNIE 5.1 将预训练成本降至对标模型的 6% ⭐️ 8.0/10
  15. Ring-2.6-1T:万亿参数思维模型发布 ⭐️ 8.0/10
  16. Runway Characters:单张图像生成实时视频智能体 ⭐️ 8.0/10
  17. 小米开源 MiMo-V2.5,支持百万上下文 ⭐️ 8.0/10
  18. 谷歌发布 Gemini 3.5 Flash,价格大幅上涨 ⭐️ 7.0/10
  19. 虚拟操作系统博物馆上线,收录 570 多个系统 ⭐️ 7.0/10
  20. 明尼苏达州率先禁止预测市场 ⭐️ 7.0/10
  21. 特斯拉锂精炼厂每日排放 23.1 万加仑污染废水 ⭐️ 7.0/10
  22. OpenAI 提升 AI 内容溯源能力 ⭐️ 7.0/10
  23. OlmoEarth v1.1:更高效的地理空间 AI 模型 ⭐️ 7.0/10
  24. Hugging Face 发布 Ettin 重排序模型系列 ⭐️ 7.0/10
  25. 阿里云推出 HappyHorse 视频生成模型 ⭐️ 7.0/10
  26. Mistral AI 发布 Medium 3.5 模型和 Vibe 智能体 ⭐️ 7.0/10
  27. 高斯泼溅草莓演示走红 ⭐️ 6.0/10
  28. 迪士尼关闭 FiveThirtyEight ⭐️ 6.0/10
  29. 语音克隆技术上线,真假难辨 ⭐️ 6.0/10
  30. llama.cpp 仓库新分支创建 ⭐️ 5.0/10
  31. 谷歌 AI 模式搜索洞察 ⭐️ 5.0/10
  32. Grok Imagine 图像生成功能发布 ⭐️ 5.0/10
  33. MiniMax M2.7 模型上线 OrcaRouter 平台 ⭐️ 5.0/10
  34. OpenCode x Ring 2.6 1T 限时免费开放 ⭐️ 5.0/10
  35. 通过 API 推出新语音 AI 模型 ⭐️ 5.0/10
  36. LLaDA2.0-Uni:统一多模态 dLLM-MoE 模型 ⭐️ 5.0/10
  37. inclusionAI 发布 DR-Venus-4B-RL 模型 ⭐️ 5.0/10

谷歌用 AI 答案改造搜索框 ⭐️ 9.0/10

谷歌宣布对其搜索框进行重大改造,集成由 Gemini 2.0 驱动的 AI 生成答案。 这一转变可能大幅减少外部网站的流量,因为用户直接在谷歌上获得答案。 AI 模式使用 Gemini 3 的下一代智能,具备高级推理和多模态理解能力。

hackernews · Google AI Blog · May 19, 18:34 · 社区讨论T2 社区与开源

背景: 谷歌之前推出的 AI 概览已经使某些网站的流量减少了高达 50%。新的 AI 模式更进一步,用对话式 AI 答案取代了传统的搜索结果列表。

参考链接

社区讨论: 评论者对 LLM 生成的事实表示不信任,担心失去主要来源和网络流量,一些人提到了“谷歌零流量”。

标签: #Google, #search, #AI, #LLM, #web


CISA 承包商在 GitHub 泄露 AWS GovCloud 密钥 ⭐️ 9.0/10

一名 CISA 承包商在公共 GitHub 仓库中泄露了 AWS GovCloud 密钥和内部密码。 此次泄露危及美国政府云安全,并暴露出凭证管理方面的系统性失败。 该仓库还包含一个 CSV 文件,其中列出了数十个 CISA 内部系统的明文密码。

hackernews · LelouBil · May 19, 07:45 · 社区讨论T2 社区与开源

背景: AWS GovCloud 是专为美国政府工作负载设计的区域,满足合规要求。CISA 是美国网络安全和基础设施安全局。

参考链接

社区讨论: 评论者对响应迟缓表示震惊,并指出 AI 训练数据可能吸收泄露的机密。

标签: #security, #government, #cloud, #data breach, #CISA


Google I/O 2026:让人工智能惠及每个人 ⭐️ 9.0/10

Google I/O 2026 宣布了一系列 AI 功能和工具,旨在让 AI 对每个人都更有帮助。 此次活动为谷歌的 AI 战略定下了方向,并影响全球数百万开发者和用户。 该公告包括新的开发者工具以及跨谷歌产品的集成。

rss · Google AI Blog · May 19, 17:45T1 官方实验室

标签: #Google I/O, #AI, #announcements, #technology


DeepSeek-V4 预览版:百万上下文,开源发布 ⭐️ 9.0/10

DeepSeek 发布了 V4 预览版模型,支持百万 token 上下文窗口,并开源了权重。 这一里程碑使超长上下文对全体开发者可用,与顶级闭源模型竞争。 该模型原生集成了文本、图像和视频生成,据称在智能体基准上可与 GPT-5.5 媲美。

rss · AIHOT 日报 · May 6, 16:43AIHOT 日报

背景: 百万 token 的上下文窗口可容纳约 75 万单词或 2500 页文本,支持分析整个代码库或长文档。

参考链接

社区讨论: 开发者对开源权重感到兴奋,但指出在完整上下文长度下推理成本仍然很高。

标签: #AI, #DeepSeek, #open-source, #large language model, #context window


OpenAI GPT-5.5:成本降至 1/35,效率提升 50 倍 ⭐️ 9.0/10

OpenAI 发布 GPT-5.5,Token 成本降至 1/35,每兆瓦输出提升 50 倍。 这使得先进 AI 的成本和能耗大幅降低,推动更广泛的应用。 GPT-5.5 输入价格每百万 token 5 美元,输出每百万 token 30 美元,上下文窗口达 105 万 token。

rss · AIHOT 日报 · May 6, 16:43AIHOT 日报

参考链接

社区讨论: 有分析指出,长提示词下完成 token 减少 19-34%,部分抵消了价格上涨。

标签: #AI, #OpenAI, #GPT-5.5, #cost reduction, #efficiency


Forge 将 8B 模型准确率从 53% 提升至 99% ⭐️ 8.0/10

Forge 是一个开源可靠性层,通过领域无关的护栏将 8B 模型在多步代理任务上的准确率从 53% 提升至 99%。 这表明小型本地模型在可靠性上可媲美前沿 API,降低了代理系统的成本。 Forge 增加了五层护栏:重试提示、步骤强制、错误恢复、救援解析和上下文压缩。

hackernews · zambelli · May 19, 12:23 · 社区讨论T2 社区与开源

背景: 护栏是基于规则或 AI 辅助的机制,用于约束 LLM 的输入和输出,确保安全性和可靠性。代理任务涉及多步工具调用,每步错误会累积。

参考链接

社区讨论: 社区成员指出结构性护栏对小型模型至关重要,有些人独立观察到了类似结果。

标签: #LLM, #guardrails, #agentic tasks, #open-source, #reliability


苹果在辅助功能中首次引入代理式 AI ⭐️ 8.0/10

苹果宣布推出由代理式 AI 驱动的新辅助功能,包括增强的 VoiceOver、放大器和语音控制。 这标志着苹果首次公开部署代理式 AI,可能预示着更广泛的 AI 整合战略。 这些功能利用 Apple Intelligence 实现自主操作,如实时描述周围环境和转录语音。

hackernews · interpol_p · May 19, 12:04 · 社区讨论T2 社区与开源

背景: 代理式 AI 指能在限定范围内自主追求目标并采取行动的 AI 系统。苹果此举值得关注,因为它在一个低风险、高影响力的领域测试这项技术。

参考链接

社区讨论: 评论者指出苹果通过辅助功能悄悄测试新技术的模式,并称赞 LLM 在帮助人类方面的实际应用。

标签: #accessibility, #Apple, #AI, #agentic AI, #technology


Andrej Karpathy 加入 Anthropic 预训练团队 ⭐️ 8.0/10

Andrej Karpathy 已加入 Anthropic 的预训练团队,负责 Claude 的核心能力开发。 Karpathy 的跳槽标志着 AI 领域重大人才流动,可能加速 Claude 的发展。 据 Anthropic 称,Karpathy 将专注于利用 Claude 加速预训练研究。

hackernews · dmarcos · May 19, 15:07 · 社区讨论T2 社区与开源

背景: 预训练是大语言模型从海量数据中学习以获取通用知识和能力的阶段。Karpathy 是 OpenAI 联合创始人,曾任特斯拉 AI 总监。

参考链接

社区讨论: 评论指出 Karpathy 此前已暗示这一举动,并对 Anthropic 日益增长的影响力表示担忧。

标签: #AI, #Anthropic, #Karpathy, #industry news, #hiring


谷歌 Gemini Omni:视频惊艳,物理仍存缺陷 ⭐️ 8.0/10

谷歌发布了 Gemini Omni,这是一个能从任意输入生成视频的多模态模型,但在空间一致性和物理模拟方面仍有不足。 这凸显了 AI 视频生成的一个根本局限:缺乏真正的 3D 世界理解。 社区测试显示,物体在被遮挡时会变形或消失,表明模型没有持久空间记忆。

hackernews · meetpateltech · May 19, 17:46 · 社区讨论T2 社区与开源

背景: 视频生成中的空间一致性指在帧间保持物体身份和几何形状,即使物体离开视野。当前模型常在此失败,在物体重新出现时生成不同内容。

参考链接

社区讨论: 专家指出,刚体接触本质上是非连续的,这使得神经网络难以学习逼真的物理效果。

标签: #AI, #video generation, #Google, #physics simulation, #spatial understanding


vLLM 现已支持万亿参数模型 ⭐️ 8.0/10

开源 LLM 推理框架 vLLM 通过社区协作,现已支持万亿参数模型。 这一里程碑使得高效服务最大规模 AI 模型成为可能,降低了企业的推理成本。 该支持利用了 PagedAttention 和多节点分布式推理技术。

rss · AIHOT 日报 · May 17, 00:00AIHOT 日报

背景: vLLM 是加州大学伯克利分校最初开发的开源库,用于高效 LLM 服务。万亿参数模型需要大量内存和计算资源。

参考链接

社区讨论: 社区称赞这一成就,认为这是向大规模 AI 推理民主化迈出的关键一步。

标签: #vLLM, #LLM inference, #large-scale models, #community collaboration


SenseNova U1 技术报告发布,采用 MoE 架构并开放权重 ⭐️ 8.0/10

SenseNova U1 技术报告及模型权重发布,采用 MoE 架构并开源 8 步蒸馏 LoRA,推理速度大幅提升。 这标志着领先公司在 AI 民主化方面迈出重要一步,使更多人能使用先进的多模态 AI。 该模型采用 NEO-unify 架构,并包含 8 步蒸馏 LoRA 以加速推理。

rss · AIHOT 日报 · May 15, 00:00AIHOT 日报

背景: MoE(混合专家)是一种每次输入仅激活部分参数的架构,可提高效率。LoRA 是一种低秩适应方法,可用极少的参数微调大模型。

参考链接

标签: #AI, #MoE, #open-source, #SenseNova, #technical report


Hy3 预览版登陆 GMI,领跑开源模型 ⭐️ 8.0/10

腾讯的 Hy3 预览版(295B MoE 模型)现已登陆 GMI 平台。 这标志着开源 AI 的新里程碑,提供了一个强大且高效的模型。 Hy3 预览版拥有 21B 活跃参数和 3.8B MTP 层参数。

rss · AIHOT 日报 · May 14, 00:00AIHOT 日报

背景: GMI 是一个全球交易清算平台,但此处可能指模型托管服务。Hy3 是腾讯开发的混合专家模型。

参考链接

社区讨论: Hugging Face 页面显示下载活跃,反响积极。

标签: #AI, #开源模型, #Hy3, #GMI


Claude Opus 4.7 快速模式研究预览 ⭐️ 8.0/10

Anthropic 发布了 Claude Opus 4.7 快速模式的研究预览。 该预览可能为研究人员和开发者提供更快的推理速度或新功能。 该预览仅限于研究访问;完整细节见日报。

rss · AIHOT 日报 · May 13, 00:00AIHOT 日报

标签: #AI, #Claude, #大模型, #研究预览


ERNIE 5.1 将预训练成本降至对标模型的 6% ⭐️ 8.0/10

百度发布 ERNIE 5.1,预训练成本仅为对标模型的 6%。 这一突破大幅降低了训练大语言模型的门槛,推动 AI 更广泛应用。 总参数减少至 ERNIE 5.0 的约 1/3,激活参数减少至约 1/2。

rss · AIHOT 日报 · May 10, 00:00AIHOT 日报

背景: ERNIE 是百度的大语言模型系列。成本降低通过“一次训练,多次使用”方法实现,从大模型中提取最优子模型。

参考链接

社区讨论: 未提供社区讨论内容。

标签: #AI, #large language models, #pretraining, #efficiency, #ERNIE


Ring-2.6-1T:万亿参数思维模型发布 ⭐️ 8.0/10

AntLingAGI 在 Hugging Face 上开源了万亿参数思维模型 Ring-2.6-1T。 该模型推动了面向复杂任务的开源推理模型的前沿。 它拥有 1 万亿总参数,63B 活跃参数,采用 MoE 架构,上下文窗口为 262k tokens。

rss · AIHOT 日报 · May 9, 00:00AIHOT 日报

参考链接

社区讨论: 未提供社区讨论。

标签: #AI, #large language model, #trillion parameters, #model release


Runway Characters:单张图像生成实时视频智能体 ⭐️ 8.0/10

Runway 发布了 Characters 系统,能从单张图像生成实时对话视频化身,帧率 24fps,端到端延迟约 1.75 秒。 这为应用和网站带来了实时交互式 AI 化身,标志着从离线视频生成向实时交互的转变。 无需微调;支持逼真人类、卡通吉祥物和幻想生物。

rss · AIHOT 日报 · May 6, 16:43AIHOT 日报

背景: 传统视频生成模型离线运行,每段剪辑需数秒到数分钟,不适合实时交互。Runway Characters 实现了实时性能,保持身份一致性并对语音和情感做出响应。

参考链接

标签: #AI, #video generation, #Runway, #real-time, #computer vision


小米开源 MiMo-V2.5,支持百万上下文 ⭐️ 8.0/10

小米开源了 MiMo-V2.5 系列,包含 1.02T 参数的 MoE 模型(支持百万上下文)和 310B 参数的基座模型。 这为开发者提供了一个强大且可商用的开源模型,具备超长上下文能力,对标国际顶尖水平。 Pro 模型总参数 1.02T,激活参数 42B,支持百万上下文;权重采用 MIT 协议开源。

rss · AIHOT 日报 · May 6, 16:43AIHOT 日报

参考链接

社区讨论: 早期反馈强调 MIT 协议和百万上下文是 Agent 开发的主要优势。

标签: #AI, #开源, #大模型, #小米


谷歌发布 Gemini 3.5 Flash,价格大幅上涨 ⭐️ 7.0/10

谷歌发布了 Gemini 3.5 Flash,一款定价远高于前代的新 AI 模型。 相比 Gemini 2.5 Flash 价格翻了三倍,影响使用谷歌 AI API 的开发者与企业。 定价:每百万输入 token 1.50 美元,每百万输出 token 9.00 美元。

hackernews · Google AI Blog · May 19, 17:43 · 社区讨论T2 社区与开源

社区讨论: 社区评论指出价格大幅上涨,并与前代模型进行性能对比。

标签: #AI, #Google, #Gemini, #LLM, #pricing


虚拟操作系统博物馆上线,收录 570 多个系统 ⭐️ 7.0/10

一个包含从 1948 年至今 570 多个操作系统的虚拟博物馆已发布,所有系统均预配置好,以 Linux 虚拟机形式提供。 它为开发者和历史学家提供了一种前所未有的便捷方式来探索和保存计算历史。 该虚拟机包含一个独立于模拟器的自定义启动器,支持 QEMU、VirtualBox 和 UTM。

hackernews · andreww591 · May 19, 15:53 · 社区讨论T2 社区与开源

参考链接

社区讨论: 评论者称赞了策展工作,但指出缺少 Pick 和 TempleOS 等系统,并就某些操作系统的版本选择进行了讨论。

标签: #operating systems, #retro computing, #curation, #emulation, #history


明尼苏达州率先禁止预测市场 ⭐️ 7.0/10

明尼苏达州成为美国首个禁止预测市场的州,针对 Kalshi 和 Polymarket 等平台。 这为各州监管预测市场开创先例,引发关于联邦优先权和赌博定义的讨论。 该禁令涵盖所有事件合约,包括选举和体育类,但某些对冲用途除外。

hackernews · ortusdux · May 19, 19:13 · 社区讨论T2 社区与开源

背景: 预测市场是用户交易基于现实结果的事件合约的平台,类似于期货但没有基础资产。它们由 CFTC 作为商品期货监管。

参考链接

社区讨论: 评论者讨论该禁令能否经受联邦优先权挑战,并将预测市场与体育博彩进行比较。

标签: #prediction markets, #regulation, #gambling, #law, #politics


特斯拉锂精炼厂每日排放 23.1 万加仑污染废水 ⭐️ 7.0/10

特斯拉得克萨斯锂精炼厂每天向无名沟渠排放多达 23.1 万加仑处理过的废水,但排水区未获通知。 这引发了对一家大公司水污染和许可合规性的环境和法律担忧。 废水中含有六价铬(0.0104 mg/L)和砷(0.0025 mg/L),铬略高于报告限值。

hackernews · atombender · May 19, 19:52 · 社区讨论T2 社区与开源

背景: 得克萨斯污染物排放消除系统(TPDES)许可允许排放,但未授予使用公共或私人财产进行输送的权利。

参考链接

社区讨论: 评论者指出,法律焦点在于未经许可使用县属沟渠,而不仅仅是废水质量。

标签: #environment, #regulation, #Tesla, #water pollution, #lithium


OpenAI 提升 AI 内容溯源能力 ⭐️ 7.0/10

OpenAI 推出 Content Credentials、SynthID 和验证工具,用于识别 AI 生成的内容。 这有助于用户信任和验证 AI 生成的内容,打击虚假信息。 Content Credentials 使用 C2PA 加密签名;SynthID 添加不可见水印。

rss · OpenAI Blog · May 19, 10:45T1 官方实验室

背景: Content Credentials 是数字元数据(C2PA),追踪内容来源和编辑,类似营养标签。SynthID 是 Google DeepMind 的 AI 输出水印技术。

参考链接

社区讨论: 讨论强调需要全行业采用,并警告可能被规避。

标签: #AI safety, #content provenance, #AI ethics, #OpenAI, #deepfakes


OlmoEarth v1.1:更高效的地理空间 AI 模型 ⭐️ 7.0/10

Allen AI 发布了 OlmoEarth v1.1,一个更高效的地球观测基础模型系列。 这提升了地理空间 AI 的性能和资源效率,使卫星数据分析更易普及。 v1.1 模型采用了名为 LatentMIMLite 的新训练方法,提高了效率。

rss · Hugging Face Blog · May 19, 18:38T1 官方实验室

背景: OlmoEarth 是一个多模态、时空基础模型,专为地球观测数据设计,这类数据既像图像一样具有空间性,又像视频一样具有序列性。它采用自监督学习实现了最先进的性能。

参考链接

标签: #AI/ML, #model efficiency, #OlmoEarth, #Hugging Face, #Allen AI


Hugging Face 发布 Ettin 重排序模型系列 ⭐️ 7.0/10

Hugging Face 宣布推出 Ettin 重排序模型系列,用于改进搜索和检索排序。 这为开发者提供了高效、高性能的重排序器,可提升 RAG 和搜索系统的检索准确性。 模型包括 68M 和 150M 参数版本,基于 Ettin 编码器,序列长度 512 token。

rss · Hugging Face Blog · May 19, 00:00T1 官方实验室

背景: 重排序是检索的第二阶段,对初始搜索结果重新排序以提高相关性,常用于 RAG 流程。

参考链接

标签: #NLP, #Information Retrieval, #Reranker, #Hugging Face, #Machine Learning


阿里云推出 HappyHorse 视频生成模型 ⭐️ 7.0/10

阿里云推出了 HappyHorse 视频生成模型,这是一个基于 Transformer、拥有 150 亿参数的 AI 模型。 这标志着主流云服务商进入竞争激烈的 AI 视频生成领域,对现有领先者构成挑战。 HappyHorse 1.0 采用单流 40 层 Transformer 架构,约 150 亿参数,支持文生视频和图生视频。

rss · AIHOT 日报 · May 19, 00:00AIHOT 日报

背景: 阿里云此前开发了 Wan 系列(如 Wan2.2)用于视频生成。HappyHorse 似乎是一个独立的开源模型。

参考链接

标签: #AI, #video generation, #Alibaba Cloud, #machine learning


Mistral AI 发布 Medium 3.5 模型和 Vibe 智能体 ⭐️ 7.0/10

Mistral AI 发布了 Mistral Medium 3.5(128B 密集多模态模型)和远程编程智能体 Vibe。 这巩固了 Mistral 在开放权重前沿模型和 AI 辅助编程领域的地位。 Medium 3.5 拥有 256k 上下文窗口,并取代了 Le Chat 中的 Medium 3.1 和 Magistral。

rss · AIHOT 日报 · May 6, 16:43AIHOT 日报

参考链接

标签: #AI, #Mistral, #model release, #programming agent


高斯泼溅草莓演示走红 ⭐️ 6.0/10

一位用户在 Show HN 上分享了一个交互式高斯泼溅草莓重建。 它展示了高斯泼溅的梦幻退化效果,引发了社区讨论。 该演示使用 WebGL,允许用户交互式探索 3D 场景。

hackernews · danybittel · May 19, 10:38 · 社区讨论T2 社区与开源

背景: 高斯泼溅是一种体积渲染技术,直接渲染点云而无需转换为表面。

参考链接

社区讨论: 用户称赞了这种美学退化,并分享了其他美丽的场景。

标签: #Gaussian Splatting, #3D Reconstruction, #Computer Graphics, #WebGL


迪士尼关闭 FiveThirtyEight ⭐️ 6.0/10

迪士尼关闭了数据新闻网站 FiveThirtyEight,将其域名重定向至 ABC 新闻。 此次关闭标志着一个知名数据新闻品牌的终结,凸显了媒体收购的脆弱性。 创始人 Nate Silver 于 2023 年离开,将其预测模型带到了自己的网站 Silver Bulletin。

hackernews · 7777777phil · May 19, 18:56 · 社区讨论T2 社区与开源

社区讨论: 评论者对企业收购表示失望,并指出 Silver 在 2016 年大选中的报道损害了该网站的声誉。

标签: #media, #corporate, #data journalism, #FiveThirtyEight, #Nate Silver


语音克隆技术上线,真假难辨 ⭐️ 6.0/10

一项新的语音克隆技术上线,能生成难以分辨的假声音。 这引发了关于音频深度伪造及其在欺诈和虚假信息中潜在滥用的严重担忧。 该技术分析语音模式以创建逼真的合成声音,使检测变得困难。

rss · AIHOT 日报 · May 6, 16:43AIHOT 日报

背景: 语音克隆利用 AI 从少量音频样本中模仿人的声音。它在娱乐和无障碍领域有应用,但也存在冒充诈骗的风险。

参考链接

标签: #AI, #voice cloning, #deepfake, #technology


llama.cpp 仓库新分支创建 ⭐️ 5.0/10

在 GitHub 的 ggml-org/llama.cpp 仓库中创建了一个新分支。 这表明一个流行的开源 LLM 推理库正在持续开发中。 新闻中未提供具体分支名称或目的。

github · ggerganov · May 19, 17:21

背景: llama.cpp 是一个开源 C/C++ 库,用于在各种硬件上本地运行大型语言模型。

参考链接

标签: #llama.cpp, #LLM, #C/C++, #open-source


谷歌 AI 模式搜索洞察 ⭐️ 5.0/10

谷歌分享了美国用户如何采用由 Gemini 2.0 驱动的 AI 模式进行搜索的洞察。 这揭示了 AI 搜索的早期用户行为趋势,影响谷歌核心产品的演进方向。 AI 模式支持文本、语音或图像查询,并提供带有网页链接的 AI 生成回答。

rss · Google AI Blog · May 19, 17:45T1 官方实验室

参考链接

标签: #AI, #search, #user behavior, #Google


Grok Imagine 图像生成功能发布 ⭐️ 5.0/10

xAI 发布了 Grok Imagine,一款 AI 图像和视频生成工具。 它将 Grok 的能力扩展到多模态内容创作领域。 支持文本生成图像、图像编辑以及动画生成短视频。

rss · AIHOT 日报 · May 18, 00:00AIHOT 日报

参考链接

标签: #AI, #image generation, #Grok


MiniMax M2.7 模型上线 OrcaRouter 平台 ⭐️ 5.0/10

MiniMax M2.7,一个 230B 参数的文本到文本 AI 模型,现已上线 OrcaRouter 平台。 开发者可通过新的开放 LLM 路由器,以零加价方式访问强大的编码和推理模型。 M2.7 在编码、推理和办公任务方面表现出色,并支持代理团队和动态工具搜索。

rss · AIHOT 日报 · May 16, 00:00AIHOT 日报

背景: OrcaRouter 是 Continuum AI 于 2026 年 5 月推出的开源 LLM API 路由器,提供超过 100 个模型的零加价访问。

参考链接

标签: #AI, #model release, #MiniMax


OpenCode x Ring 2.6 1T 限时免费开放 ⭐️ 5.0/10

OpenCode AI 编码代理限时免费提供 Ring 2.6 1T 模型。 开发者可免费使用 1 万亿参数推理模型,降低 AI 编码成本。 Ring 2.6 1T 是一个开放权重的推理模型,上下文窗口为 262K。

rss · AIHOT 日报 · May 11, 00:00AIHOT 日报

背景: OpenCode 是一个开源 AI 编码代理,在 GitHub 上拥有超过 16 万星标。Ring 2.6 1T 是 InclusionAI 推出的 1 万亿参数模型。

参考链接

标签: #AI, #OpenCode, #Ring, #promotion


通过 API 推出新语音 AI 模型 ⭐️ 5.0/10

每日 AI 新闻更新宣布通过 API 提供新的语音智能模型。 这使得开发者能够轻松地将先进的语音功能集成到应用中。 简短更新中未披露具体模型和 API 细节。

rss · AIHOT 日报 · May 8, 00:00AIHOT 日报

标签: #AI, #voice intelligence, #API


LLaDA2.0-Uni:统一多模态 dLLM-MoE 模型 ⭐️ 5.0/10

inclusionAI 发布了 LLaDA2.0-Uni,一个统一的多模态理解与生成的扩散 LLM-MoE 模型。 它通过一个模型和单一训练范式统一了多模态理解与生成,简化了多模态 AI。 采用掩码标记预测范式和 SigLIP-VQ 处理离散视觉输入。

rss · AIHOT 日报 · May 6, 16:43AIHOT 日报

背景: dLLM 指扩散大语言模型,利用扩散过程生成文本。MoE(混合专家)仅激活模型相关部分以提高效率。

参考链接

标签: #AI, #news, #model release


inclusionAI 发布 DR-Venus-4B-RL 模型 ⭐️ 5.0/10

inclusionAI 发布了 DR-Venus-4B-RL,一个基于开放数据并通过强化学习训练的 4B 参数深度研究智能体。 该模型在边缘规模上实现了前沿性能,可运行于单个消费级 GPU,并缩小了与更大 30B 级系统的差距。 DR-Venus-4B-RL 在 BrowseComp 上得分为 29.1,几乎是 WebExplorer-8B-RL(15.7)的两倍,并支持多达 200 个工具调用步骤和 256K 上下文。

rss · AIHOT 日报 · May 5, 15:44AIHOT 日报

参考链接

标签: #AI, #model release, #reinforcement learning



附录

以下内容来自 AIHOT 日报,每天 08:00 北京时间发布

  1. AI HOT 日报 · 2026-05-19 — 阿里云推出 HappyHorse 视频生成模型 阿里云推出 HappyHorse 视频生成模型 — 点击查看完整日报

  2. AI HOT 日报 · 2026-05-18 — Grok Imagine 图像生成功能正式发布 Grok Imagine 图像生成功能正式发布 — 点击查看完整日报

  3. AI HOT 日报 · 2026-05-17 — 社区协作再创佳绩,vLLM 支持万亿级模型 社区协作再创佳绩,vLLM 支持万亿级模型 — 点击查看完整日报

  4. AI HOT 日报 · 2026-05-16 — MiniMax M2.7 模型上线 OrcaRouter 平台 MiniMax M2.7 模型上线 OrcaRouter 平台 — 点击查看完整日报

  5. AI HOT 日报 · 2026-05-15 — SenseNova U1 技术报告发布,基于 MoE 架构开放模型权重 SenseNova U1 技术报告发布,基于 MoE 架构开放模型权重 — 点击查看完整日报

— From rss — SenseNova-U1 开源 8 步蒸馏 LoRA,推理速度大幅提升 — 点击查看完整日报

— From rss — SenseNova U1 图像生成模型登陆 ComfyUI 平台 — 点击查看完整日报

  1. AI HOT 日报 · 2026-05-14 — Hy3 预览版登陆 GMI,开源最强模型领跑 Hy3 预览版登陆 GMI,开源最强模型领跑 — 点击查看完整日报

  2. AI HOT 日报 · 2026-05-13 — Claude Opus 4.7 快速模式开放研究预览 Claude Opus 4.7 快速模式开放研究预览 — 点击查看完整日报

  3. AI HOT 日报 · 2026-05-12 — SenseNova U1 图像生成模型登陆 ComfyUI 平台 SenseNova U1 图像生成模型登陆 ComfyUI 平台 — 点击查看完整日报

  4. AI HOT 日报 · 2026-05-11 — OpenCode x Ring 2.6 1T 限时免费开放 OpenCode x Ring 2.6 1T 限时免费开放 — 点击查看完整日报

  5. AI HOT 日报 · 2026-05-10 — ERNIE 5.1 发布,预训练成本仅需对标模型 6% ERNIE 5.1 发布,预训练成本仅需对标模型 6% — 点击查看完整日报

  6. AI HOT 日报 · 2026-05-09 — Ring-2.6-1T 发布:万亿参数思维模型专为复杂任务设计 Ring-2.6-1T 发布:万亿参数思维模型专为复杂任务设计 — 点击查看完整日报

— From rss — AntLingAGI 开源 Ling-2.6-1T 模型,登陆 Hugging Face 平台 — 点击查看完整日报

  1. AI HOT 日报 · 2026-05-08 — 通过 API 中的新模型推进语音智能 通过 API 中的新模型推进语音智能 — 点击查看完整日报

  2. AI HOT 日报 · 2026-05-07 — SenseNova-U1 开源 8 步蒸馏 LoRA,推理速度大幅提升 SenseNova-U1 开源 8 步蒸馏 LoRA,推理速度大幅提升 — 点击查看完整日报

  3. AI HOT 日报 · 2026-05-06 — GPT-5.5 Instant:更智能、更清晰、更个性化 GPT-5.5 Instant:更智能、更清晰、更个性化 — 点击查看完整日报

  4. AI HOT 日报 · 2026-05-05 — 语音克隆技术上线 真假难辨 语音克隆技术上线 真假难辨 — 点击查看完整日报

  5. AI HOT 日报 · 2026-05-04 — 从单张图像构建实时视频智能体:Runway Characters 技术解析 从单张图像构建实时视频智能体:Runway Characters 技术解析 — 点击查看完整日报

  6. AI HOT 日报 · 2026-05-03 — 模型别名新增”-latest”指向最新版本 模型别名新增”-latest”指向最新版本 — 点击查看完整日报

  7. AI HOT 日报 · 2026-05-02 — GPT-5.5 发布一周创营收新高 GPT-5.5 发布一周创营收新高 — 点击查看完整日报

  8. AI HOT 日报 · 2026-05-01 — AntLingAGI 开源 Ling-2.6-1T 模型,登陆 Hugging Face 平台 AntLingAGI 开源 Ling-2.6-1T 模型,登陆 Hugging Face 平台 — 点击查看完整日报

  9. AI HOT 日报 · 2026-04-30 — 旗舰指令模型快速高效执行的秘诀:可靠基础设施与优化 旗舰指令模型快速高效执行的秘诀:可靠基础设施与优化 — 点击查看完整日报

  10. AI HOT 日报 · 2026-04-29 — Mistral AI 发布 Mistral Medium 3.5 模型及 Vibe 远程编程智能体 Mistral AI 发布 Mistral Medium 3.5 模型及 Vibe 远程编程智能体 — 点击查看完整日报

— From rss — Mistral AI 发布 Workflows 公开预览版,为企业 AI 工作流提供编排支持 — 点击查看完整日报

  1. AI HOT 日报 · 2026-04-28 — 小米开源 MiMo-V2.5 双模型,支持百万上下文与商用 小米开源 MiMo-V2.5 双模型,支持百万上下文与商用 — 点击查看完整日报

  2. AI HOT 日报 · 2026-04-27 — Mistral AI 发布 Workflows 公开预览版,为企业 AI 工作流提供编排支持 Mistral AI 发布 Workflows 公开预览版,为企业 AI 工作流提供编排支持 — 点击查看完整日报

  3. AI HOT 日报 · 2026-04-26 — DeepSeek V4 模型限时 2.5 折优惠 DeepSeek V4 模型限时 2.5 折优惠 — 点击查看完整日报

  4. AI HOT 日报 · 2026-04-25 — 迈入百万上下文普惠时代:DeepSeek-V4 模型预览版正式上线并同步开源 迈入百万上下文普惠时代:DeepSeek-V4 模型预览版正式上线并同步开源 — 点击查看完整日报

  5. AI HOT 日报 · 2026-04-24 — OpenAI 最智能 AI 模型:GPT-5.5 登场,Token 成本降至 1/35、每兆瓦输出提升 50 倍 OpenAI 最智能 AI 模型:GPT-5.5 登场,Token 成本降至 1/35、每兆瓦输出提升 50 倍 — 点击查看完整日报

— From rss — GPT-5.5 发布一周创营收新高 — 点击查看完整日报

— From rss — GPT-5.5 Instant:更智能、更清晰、更个性化 — 点击查看完整日报

  1. AI HOT 日报 · 2026-04-23 — inclusionAI/LLaDA2.0-Uni inclusionAI/LLaDA2.0-Uni — 点击查看完整日报

  2. AI HOT 日报 · 2026-04-22 — inclusionAI/DR-Venus-4B-RL 发布 inclusionAI/DR-Venus-4B-RL 发布 — 点击查看完整日报