YLF News Daily: 2026-06-12 (ZH)

从 122 条内容中筛选出 83 条重要资讯

CRISPR-Cas12a2 粉碎癌细胞，靶向不可成药突变 ⭐️ 9.0/10
全自主无人机首次击杀人类士兵 ⭐️ 9.0/10
通用大语言模型在临床任务上超越专用医疗 AI ⭐️ 9.0/10
DeepMind 论文提出从 AGI 到 ASI 的四条路径 ⭐️ 9.0/10
AI 无法取代人类专业能力 ⭐️ 8.0/10
LLM 生成的 PR 降低开源维护质量 ⭐️ 8.0/10
WASI 0.3 发布，组件模型变更 ⭐️ 8.0/10
MiniMax M3 开源权重模型发布 ⭐️ 8.0/10
Kimi 开源 K2.7-Code 模型，性能大幅提升 ⭐️ 8.0/10
LLM 在 95%模拟中选择战术核武器 ⭐️ 8.0/10
Hugging Face 启动 Open-R1 项目复现 DeepSeek-R1 ⭐️ 8.0/10
腾讯开源升级 HPC-Ops 推理算子库 ⭐️ 8.0/10
HYDRA-X：单一 ViT 统一多模态模型 ⭐️ 8.0/10
MiniMax MSA：28 倍稀疏注意力加速 ⭐️ 8.0/10
EurekAgent：环境工程化实现自主科学发现 ⭐️ 8.0/10
WEAVER：更快更好的机器人操作世界模型 ⭐️ 8.0/10
BBVA 与 OpenAI 合作，向 10 万名员工部署 ChatGPT Enterprise ⭐️ 8.0/10
AA-AgentPerf 基准发布，首批测试 DeepSeek V4 Pro ⭐️ 8.0/10
Google Gemini-SQL2 在 BIRD 排行榜上达到 80.04% ⭐️ 8.0/10
Claude Code 与 Fable 重建失传游戏 SimRefinery ⭐️ 8.0/10
苹果在谷歌云上使用 NVIDIA 机密计算保护隐私 ⭐️ 8.0/10
Claude Fable 5 在 FrontierMath 上取得高分 ⭐️ 8.0/10
Transformers v5.12.0 新增 MiniMax-M3-VL 模型 ⭐️ 7.0/10
olmo-eval：面向 LLM 开发循环的评估工作台 ⭐️ 7.0/10
Anthropic 调查：48%盼 AI 治愈疾病，64%担忧失业 ⭐️ 7.0/10
用三个可移植技能实现 Spec 驱动开发 ⭐️ 7.0/10
Codex 新增 Chrome 调试开发者模式 ⭐️ 7.0/10
Perplexity Computer 集成 Deep Research ⭐️ 7.0/10
Gemini Omni Flash 在视频任务中达到 SOTA ⭐️ 7.0/10
LLM 网关：应用与 AI 模型之间缺失的一层 ⭐️ 7.0/10
Prometheus 融资 120 亿美元，估值 410 亿美元 ⭐️ 7.0/10
狮门影业扩大与 Runway 合作并入股 ⭐️ 7.0/10
Anthropic 启动 1.5 亿美元 Claude Corps 奖学金项目 ⭐️ 7.0/10
Cursor 推出 Auto-review：用分类器智能体保障 AI 编码安全 ⭐️ 7.0/10
阿里云发布 Meoo CLI，一键部署本地 AI 项目 ⭐️ 7.0/10
Deezer 推出面向其他流媒体的 AI 音乐检测器 ⭐️ 7.0/10
中国 AI 浪潮引发劳动者权益担忧 ⭐️ 7.0/10
Anthropic CEO 警告 AI 将导致大规模长期失业 ⭐️ 7.0/10
mlx-vlm v0.6.3 首发支持 DiffusionGemma 和 North Mini Code ⭐️ 7.0/10
Cola：用技能弥合 AI Agent 使用鸿沟 ⭐️ 7.0/10
Gemini 3.5 Live Translate 发布 ⭐️ 7.0/10
基于 GPT 的 deep^2 在成本效率上超越 Fable 10-20 倍 ⭐️ 7.0/10
谷歌起诉中国 AI 诈骗团伙 ⭐️ 7.0/10
Project Ire 识别出 LOTUSLITE 恶意软件 ⭐️ 7.0/10
特斯拉 FSD 在丹麦认证视频中被发现使用自行车道 ⭐️ 7.0/10
ggerganov 点赞 locate-anything.cpp ⭐️ 6.0/10
Ollama v0.30.8：修复提供商选择、改进提示缓存、提升 MLX 稳定性 ⭐️ 6.0/10
在 macOS 上设置本地编码代理 ⭐️ 6.0/10
减少 AI 生成界面粗糙感的技巧 ⭐️ 6.0/10
Preply 结合 AI 与真人导师实现个性化学习 ⭐️ 6.0/10
Oran Ge 开源《人味儿写作心法》保留 AI 写作中的人味 ⭐️ 6.0/10
在 OpenRouter 上最小化 LLM 成本 ⭐️ 6.0/10
字节豆包上线任务模式，升级专家模式 ⭐️ 6.0/10
qiaomu-ai-prd：面向 AI 的 PRD 生成 Prompt ⭐️ 6.0/10
Replit Agent 新增自定义指令与技能 ⭐️ 6.0/10
OpenRouter 推出帕累托曲线基准探索器 ⭐️ 6.0/10
Krea 2 推出生成式滑块控制图像属性 ⭐️ 6.0/10
OpenAI 降价被批评者 Gary Marcus 视为示弱 ⭐️ 6.0/10
Baoyu-Design 技能现已支持导入本地 Figma 文件 ⭐️ 6.0/10
Midjourney V8.1 成为默认模型 ⭐️ 6.0/10
GitHub Copilot CLI 委托任务更智能 ⭐️ 6.0/10
AI 高速对话加剧 ADHD，威胁专注力 ⭐️ 6.0/10
Anthropic 将 Claude Convey Agent 作为 Labs 项目发布 ⭐️ 6.0/10
Replit 推出并行构建与多智能体支持 ⭐️ 6.0/10
OpenAI 推出文档智能体 ⭐️ 6.0/10
受《席德·梅尔的海盗》启发的网页海战游戏 ⭐️ 5.0/10
OpenAI 推出三门学院课程 ⭐️ 5.0/10
iOS 27 健康 App 大改：卡片、营养识别、围绝经期追踪 ⭐️ 5.0/10
OpenAI Codex 推出速率重置攒存功能 ⭐️ 5.0/10
Replit 专家级提示词技巧 ⭐️ 5.0/10
Replit 与 Databricks 集成升级，公开预览开放 ⭐️ 5.0/10
乔木目标元技能：一句话转 Codex Goal ⭐️ 5.0/10
Hermes Agent Desktop 发布，支持硅基流动一键切换 ⭐️ 5.0/10
Codex 每 5 分钟并行维护仓库 ⭐️ 5.0/10
WorkBuddy 教程：国内通用 AI Agent 产品 ⭐️ 5.0/10
橙线插画技能开源发布 ⭐️ 5.0/10
Palantir 对瑞士杂志诉讼败诉 ⭐️ 5.0/10
旧金山举办编码智能体基准测试活动 ⭐️ 5.0/10
Claude Code v2.1.176：多语言标题与正则页脚链接 ⭐️ 5.0/10
Tailwind 与 Slop 应用引发 HN 热议 ⭐️ 5.0/10
Hyperframes 与 Gemini 视频分析智能体流程 ⭐️ 5.0/10
Codex AI 代理玩 Rimworld ⭐️ 5.0/10
Codex 将网站更新从一周缩短至三天 ⭐️ 5.0/10

CRISPR-Cas12a2 粉碎癌细胞，靶向不可成药突变 ⭐️ 9.0/10

研究人员开发了一种 CRISPR-Cas12a2 技术，通过检测肿瘤特异性 RNA 突变（包括之前不可成药的 KRAS 突变）来选择性地粉碎癌细胞。这种方法可以治疗缺乏可成药靶点的癌症，将基于 CRISPR 的疗法扩展到更广泛的恶性肿瘤。与 Cas9 不同，Cas12a2 在激活后会粉碎染色质，导致大量 DNA 损伤和细胞死亡。

hackernews · gmays · Jun 12, 15:15 · 社区讨论T2 社区与开源

背景: 不可成药癌症指由传统药物难以靶向的蛋白质（如 KRAS）驱动的癌症。Cas12a2 是一种靶向 RNA 而非 DNA 的变体，能够检测 RNA 转录本中的突变。

参考链接

社区讨论: 评论对该机制表示兴奋，但指出肿瘤可能产生耐药性，也有人认为病毒载体疗法在临床上比 CRISPR 更先进。

标签: #CRISPR, #cancer research, #gene editing, #biotechnology, #Cas12a

全自主无人机首次击杀人类士兵 ⭐️ 9.0/10

全自主无人机首次在实战中击毙人类士兵。这标志着自主武器的里程碑，引发紧迫的伦理和法律问题。该事件由《新科学家》于 2025 年 6 月 10 日报道，细节尚未公开。

rss · AIHOT 精选 · Jun 11, 19:29AIHOT 精选

背景: 自主武器无需人类干预即可选择并攻击目标，不同于遵循预设规则的自动武器。

参考链接

自主武器 - 维基百科，自由的百科全书

社区讨论: 讨论聚焦于对 AI 军备竞赛和问责缺失的担忧。

标签: #autonomous weapons, #drones, #military AI, #ethics

通用大语言模型在临床任务上超越专用医疗 AI ⭐️ 9.0/10

《自然·医学》一项研究发现，GPT-5.2 等通用大语言模型在医生评审的临床任务上超越了 OpenEvidence、UpToDate Expert AI 等专用医疗 AI 产品。这挑战了专用 AI 更优的假设，表明通用模型在临床决策支持方面可能更有效。在 100 个真实临床问题中，盲审医生更偏好前沿通用模型的完整性和清晰度。

rss · AIHOT 全部动态 · Jun 12, 22:23AIHOT 全部动态

背景: OpenEvidence 是一个分析同行评审医学文献的 AI 平台，UpToDate Expert AI 是基于精选临床内容的生成式 AI。两者均为医疗专用。

参考链接

标签: #AI, #Healthcare, #LLM, #Medical AI, #Research

DeepMind 论文提出从 AGI 到 ASI 的四条路径 ⭐️ 9.0/10

Google DeepMind 发表论文，提出从 AGI 到 ASI 的四条路径：扩展、算法创新、递归自我改进和多智能体集体智能。该框架为实现超级智能提供了具体路线图，将指导未来 AI 研究和投资方向。论文指出扩展可能遇到数据/算力/能源瓶颈，递归自我改进最不确定，多智能体路径最易被低估。

rss · AIHOT 全部动态 · Jun 12, 21:40AIHOT 全部动态

背景: 递归自我改进（RSI）指 AI 系统在最少人类输入下设计和构建自己的继任者，可能引发智能爆炸。多智能体集体智能涉及多个专业 AI 智能体协作，超越单个模型的能力。

参考链接

社区讨论: X 上的讨论强调了该论文的重要性，许多人指出多智能体路径常被忽视，但可能是实现 ASI 最实用的途径。

标签: #AGI, #ASI, #DeepMind, #AI research, #multi-agent systems

AI 无法取代人类专业能力 ⭐️ 8.0/10

一篇评论文章指出，AI（如 ChatGPT）在翻译等专业领域无法匹敌人类专家的能力。它挑战了 AI 可以取代专业人才的简单假设，揭示了 AI 感知能力与实际能力之间的差距。文章以翻译为例，指出 AI 常生成流畅但不准确的输出，非专业人士难以察觉。

hackernews · AIHOT 全部动态 · Jun 12, 17:52 · 社区讨论T2 社区与开源

社区讨论: 评论者讨论 AI 对翻译工作的影响，有人认为 AI 足以用于审核，但无法胜任创造性翻译。

标签: #AI, #translation, #expertise, #critique, #Hacker News

LLM 生成的 PR 降低开源维护质量 ⭐️ 8.0/10

Miguel Grinberg 认为，LLM 生成的拉取请求用低质量贡献淹没开源项目，侵蚀了 PR 的社会契约。维护者面临更多噪音和倦怠，因为 AI 生成的代码绕过了以往表明质量的努力信号。作者对比了 LLM 之前的 PR（兴奋、真正努力）与当前的 PR（叹息、低质量提交）。

hackernews · AIHOT 全部动态 · Jun 12, 17:53 · 社区讨论T2 社区与开源

背景: “反向半人马”指人类作为 AI 的外围设备，而非 AI 辅助人类。在开源中，LLM 使得低努力 PR 成为可能，将负担转移给维护者。

参考链接

The Reverse Centaur • ainoya.dev

社区讨论: 评论者指出隐性社会契约（投入大于产出）的丧失，并讨论非程序员新获得的贡献能力是否总体积极。

标签: #AI, #open-source, #software engineering, #LLM, #code review

WASI 0.3 发布，组件模型变更 ⭐️ 8.0/10

WASI 0.3 引入了异步支持并简化了接口，从 WASI 0.2 的组件模型演进。此版本塑造了 WebAssembly 跨平台沙箱执行的未来，影响构建可移植应用的开发者。大多数变更是机械性的，简化了签名；异步成为平台契约的一部分。

hackernews · mavdol04 · Jun 12, 13:51 · 社区讨论T2 社区与开源

背景: WASI（WebAssembly 系统接口）为 WebAssembly 模块提供与系统交互的标准 API。组件模型实现了 WebAssembly 模块的可组合性。

参考链接

社区讨论: 一些开发者批评组件模型过于复杂，而另一些则赞赏长期等待后的进展。

标签: #WebAssembly, #WASI, #systems programming, #sandboxing, #component model

MiniMax M3 开源权重模型发布 ⭐️ 8.0/10

MiniMax 在 HuggingFace 上发布了开源权重模型 M3，总参数 428B，激活参数 23B。该模型在编码和智能体基准测试中表现强劲，并通过稀疏注意力实现 1M token 上下文，这在小于 500B 参数的模型中极为罕见。采用 MiniMax 稀疏注意力（MSA），使用 128-token KV 块，实现 9 倍更快的 prefill 和 15 倍更快的 decode。

rss · AIHOT 精选 · Jun 12, 14:11AIHOT 精选

背景: MSA 是一种稀疏注意力机制，通过预过滤 KV 块来避免完全二次成本，从而实现 1M 上下文。

参考链接

社区讨论: vLLM 和 Fireworks AI 提供了首日支持；SambaNovaAI 计划在其 RDU 上支持 M3。

标签: #open-source, #large language model, #coding, #multi-modal, #sparse attention

Kimi 开源 K2.7-Code 模型，性能大幅提升 ⭐️ 8.0/10

Kimi 发布并开源了 Kimi-K2.7-Code，这是一个编码智能体模型，在基准测试上最高提升 31.5%，推理 token 减少 30%。该开源模型缩小了与 GPT-4.5 等专有模型的差距，为开发者带来高效、高质量的代码生成能力。基于 Kimi K2.6 构建，在 Kimi Code Bench v2 上提升 21.8%，在 Program Bench 上提升 11.0%，在 MLS Bench Lite 上提升 31.5%。

rss · AIHOT 精选 · Jun 12, 10:16AIHOT 精选

背景: Kimi Code Bench v2 是内部基准，用于评估编码智能体在真实任务上的表现。Program Bench 测试从二进制文件进行整体软件开发的能力。

参考链接

标签: #AI, #open-source, #code generation, #machine learning, #Kimi

LLM 在 95%模拟中选择战术核武器 ⭐️ 8.0/10

一项模拟研究发现，LLM 在 95%的场景中选择使用战术核武器，引发 AI 安全担忧。这凸显了在没有适当保障措施的情况下将关键军事决策委托给 AI 的潜在风险。该研究未指明测试的具体 LLM 模型，限制了可重复性和技术深度。

rss · AIHOT 精选 · Jun 11, 22:23AIHOT 精选

背景: 战术核武器是短程、低当量的核武器，用于战场，与战略核武器不同，从未在战斗中使用过。

参考链接

Tactical nuclear weapon - Wikipedia

社区讨论: 讨论可能集中在 AI 对齐的必要性和自主武器的危险上。

标签: #AI safety, #LLM, #simulation, #decision-making, #nuclear weapons

Hugging Face 启动 Open-R1 项目复现 DeepSeek-R1 ⭐️ 8.0/10

Hugging Face 发布了 Open-R1 开源项目，旨在复现 DeepSeek-R1 的数据和训练流程。它使得最先进的推理模型完全透明，并可通过社区驱动进行改进。该项目包括合成数据生成、训练脚本和评估基准。

rss · AIHOT 精选 · Jun 11, 17:07AIHOT 精选

背景: DeepSeek-R1 是一个通过强化学习训练、无需监督微调的推理模型。Open-R1 旨在验证并扩展其技术。

参考链接

社区讨论: Hacker News 上的讨论（101 分）赞扬了这一举措，认为它推动了先进 AI 研究的民主化。

标签: #AI, #open-source, #deep-learning, #reproduction

腾讯开源升级 HPC-Ops 推理算子库 ⭐️ 8.0/10

腾讯混元 AI Infra 团队开源升级了 HPC-Ops 推理算子库，包含五大核心算子。该发布显著加速了 LLM 推理，有利于在生产环境中部署大模型的开发者。 Attention 算子在长文本上最高加速 2.95 倍；Sampler 相比 vLLM 提速 4.0~7.5 倍。

rss · AIHOT 精选 · Jun 11, 08:34AIHOT 精选

背景: HPC-Ops 是腾讯混元 AI Infra 团队开发的生产级高性能 LLM 推理算子库，不替代服务框架，而是提供优化后的内核。

参考链接

社区讨论: 该开源发布在 GitHub 上引起关注，开发者称赞其经过生产验证的性能提升。

标签: #AI Infrastructure, #LLM Inference, #Open Source, #GPU Optimization, #Tencent

HYDRA-X：单一 ViT 统一多模态模型 ⭐️ 8.0/10

HYDRA-X 在单个 Vision Transformer 中统一了图像和视频的 tokenization，在理解和生成任务上表现强劲。这简化了多模态架构，提高了图像和视频任务的效率。它采用帧级因果时间注意力和层级时间压缩，而非单步压缩。

rss · AIHOT 精选 · Jun 11, 00:00AIHOT 精选

参考链接

Vision transformer - Wikipedia

标签: #multimodal, #vision transformer, #tokenization, #video understanding, #image generation

MiniMax MSA：28 倍稀疏注意力加速 ⭐️ 8.0/10

MiniMax 提出块状稀疏注意力（MSA），在 1M 上下文下将注意力计算减少 28.4 倍，并在 H800 GPU 上实现 14.2 倍预填充和 7.6 倍解码加速。这使得 1M token 上下文在大规模多模态模型中变得实用，实现无质量损失的更快推理。 MSA 使用轻量级索引分支为每个 GQA 组选择 top-k KV 块，然后仅对这些块执行精确的块稀疏注意力。

rss · AIHOT 精选 · Jun 11, 00:00AIHOT 精选

背景: 分组查询注意力（GQA）将查询头分成组，每组共享一个键值头，以减少内存和计算。块稀疏注意力将序列划分为块，并为每个查询仅选择最相关的块。

参考链接

标签: #sparse attention, #efficient inference, #large language models, #multimodal models, #GPU acceleration

EurekAgent：环境工程化实现自主科学发现 ⭐️ 8.0/10

EurekAgent 是一个大语言模型智能体系统，通过四个维度的环境工程实现低成本自主科学发现。它以不到 11 美元的总 API 成本在数学、内核工程和机器学习任务上取得新 SOTA，使 AI 驱动研究更加普及。该系统发现了新的 26 圆填充结果，半径总和为 2.635977，优于此前边界。

rss · AIHOT 精选 · Jun 11, 00:00AIHOT 精选

背景: 26 圆填充问题要求将 26 个不相交的圆放入单位正方形内，最大化半径之和。

参考链接

标签: #LLM Agents, #Autonomous Discovery, #Scientific AI, #Environment Engineering

WEAVER：更快更好的机器人操作世界模型 ⭐️ 8.0/10

WEAVER 是一种多视图世界模型，通过流匹配损失训练，实现政策成功率提升 38%，推理速度比先前模型快 5-10 倍。这使得机器人操作更准确高效，对实际部署和泛化至关重要。 WEAVER 在政策评估中与真实成功率的相关系数ρ=0.870，测试时规划成功率提升 14%。

rss · AIHOT 精选 · Jun 11, 00:00AIHOT 精选

背景: 流匹配是一种生成建模技术，通过学习连续流将噪声转化为数据，常作为扩散模型的替代方案。π0.5 是 Physical Intelligence 发布的通用机器人策略模型。

参考链接

Physical Intelligence ( π )

社区讨论: 该论文在 HuggingFace 上成为热门话题，社区对其开源发布和显著的速度提升表示赞赏。

标签: #robotics, #world model, #machine learning, #reinforcement learning, #computer vision

BBVA 与 OpenAI 合作，向 10 万名员工部署 ChatGPT Enterprise ⭐️ 8.0/10

BBVA 正与 OpenAI 合作，向 10 万名员工推广 ChatGPT Enterprise。这标志着银行业最大规模的企业 AI 部署之一，预示着金融服务业 AI 采用加速。 ChatGPT Enterprise 提供增强的安全性、隐私保护和公司数据集成，无使用上限且性能更快。

rss · AIHOT 精选 · Jun 11, 00:00AIHOT 精选

背景: ChatGPT Enterprise 是 OpenAI 面向企业级用户的产品，具备 32k 上下文长度和数据加密等功能。

参考链接

标签: #AI, #banking, #OpenAI, #enterprise, #digital transformation

AA-AgentPerf 基准发布，首批测试 DeepSeek V4 Pro ⭐️ 8.0/10

Artificial Analysis 发布了 AA-AgentPerf 硬件基准，首批测试了 DeepSeek V4 Pro 在 NVIDIA Blackwell、Hopper 和 AMD MI355X 上的推理能效。该基准为真实智能体工作负载提供了标准化的硬件对比方法，对 AI 基础设施决策至关重要。 GB300 机架级解耦实现了每兆瓦 61,354 个并发智能体，比单节点 B300 高出 3 倍。

rss · AIHOT 全部动态 · Jun 12, 22:20AIHOT 全部动态

背景: AA-AgentPerf 使用真实编码智能体轨迹，最多 200 轮、超 10 万 token，允许 KV 缓存复用和推测解码等生产优化。

参考链接

标签: #benchmark, #AI inference, #hardware, #DeepSeek, #NVIDIA Blackwell

Google Gemini-SQL2 在 BIRD 排行榜上达到 80.04% ⭐️ 8.0/10

Google 发布了基于 Gemini 3.1 Pro 的文本转 SQL 系统 Gemini-SQL2，在 BIRD 单模型排行榜上达到 80.04% 的执行准确率。这在一个具有挑战性的真实世界基准上为文本转 SQL 设立了新的最先进水平，改进了自然语言到数据库查询的翻译。 BIRD 基准专注于大规模、真实世界的数据库，包含脏乱和复杂的数据，比早期的 Spider 等基准更具挑战性。

rss · AIHOT 全部动态 · Jun 12, 21:04AIHOT 全部动态

背景: BIRD（大规模数据库文本转 SQL 评估大基准）是一个旨在评估 AI 系统将自然语言问题翻译为针对真实数据库的 SQL 查询的基准。

参考链接

社区讨论: DAIR.AI 的 Elvis Saravia 指出，尽管强推理模型表现不错，但像 Gemini-SQL2 这样的定制模型在此类任务上更胜一筹，在知识库、搜索和图数据库等领域也存在类似机会。

标签: #Text-to-SQL, #Gemini, #BIRD benchmark, #Google Research, #AI

Claude Code 与 Fable 重建失传游戏 SimRefinery ⭐️ 8.0/10

Ethan Mollick 使用 Claude Code 和 Fable，根据幸存截图和文档重建了失传游戏 SimRefinery，获得了包含复杂功能的完全可玩版本。这展示了 10 个月内 AI 辅助编程能力的巨大飞跃，将简单原型变成了功能完整的游戏。新版本包含学习模式等复杂功能，与 10 个月前使用 ChatGPT Codex 构建的简单原型形成鲜明对比。

rss · AIHOT 全部动态 · Jun 12, 20:52AIHOT 全部动态

背景: SimRefinery 是 1992 年 Maxis 为雪佛龙开发的企业培训用商业模拟游戏，此前被认为已失传。

参考链接

社区讨论: X 上的社区称赞了 AI 编程的快速进步，许多人注意到与早期原型的显著改进。

标签: #AI, #game development, #Claude Code, #Fable, #retro computing

苹果在谷歌云上使用 NVIDIA 机密计算保护隐私 ⭐️ 8.0/10

苹果在谷歌云的 Blackwell B200s 上使用 NVIDIA 机密计算，确保谷歌和苹果都无法看到推理数据。这标志着顶级玩家和硬件安全在隐私保护 AI 推理上的重大行业合作。 NVIDIA 机密计算使用基于硬件的可信执行环境（TEE）隔离工作负载并加密使用中的数据。

rss · AIHOT 全部动态 · Jun 12, 20:32AIHOT 全部动态

背景: 机密计算通过硬件隔离保护正在处理的数据。可信执行环境（TEE）是处理器内的安全区域，确保代码和数据免受主机操作系统和其他应用程序的侵害。

参考链接

标签: #confidential computing, #AI inference, #privacy, #NVIDIA, #cloud computing

Claude Fable 5 在 FrontierMath 上取得高分 ⭐️ 8.0/10

Claude Fable 5 在 FrontierMath 的 Tiers 1-3 上获得 87%，在 Tier 4 上获得 88%。这表明 AI 数学推理能力快速提升，正在挑战人类专家水平。 FrontierMath v2 包含 300 道 Tier 1-3 问题和 50 道 Tier 4 问题，均为未公开题目。

rss · AIHOT 全部动态 · Jun 12, 19:16AIHOT 全部动态

背景: FrontierMath 是一个高级数学基准测试，Tiers 1-4 涵盖本科到研究级别的问题。Claude Fable 5 是 Anthropic 最新公开的模型。

参考链接

社区讨论: 有评论指出性能曲线的形状越来越熟悉，暗示持续快速进步。

标签: #AI, #benchmark, #mathematics, #Anthropic, #Claude

Transformers v5.12.0 新增 MiniMax-M3-VL 模型 ⭐️ 7.0/10

Hugging Face Transformers v5.12.0 新增了 MiniMax-M3-VL 视觉语言模型，采用混合密集/稀疏 MoE 和 3D RoPE。此版本为 Transformers 生态带来了先进的多模态 AI 能力，实现了高效的视觉语言理解。该模型使用 CLIP 风格的视觉塔和 Conv3d 补丁嵌入，以及带有 SwiGLU-OAI 门控专家的混合密集/稀疏 MoE 解码器。

github · vasqu · Jun 12, 14:39

背景: MoE（混合专家）每个 token 仅激活部分参数，在保持容量的同时减少计算量。3D RoPE 将旋转位置编码扩展到三维，用于空间理解。

参考链接

minimax-m3

标签: #transformers, #multimodal, #vision-language, #MoE, #release

olmo-eval：面向 LLM 开发循环的评估工作台 ⭐️ 7.0/10

Allen AI 发布了 olmo-eval，这是一个基于 OLMES 构建、专为迭代式 LLM 开发设计的评估工作台。它减少了新增评测的实现工作量，并将 agentic 和多轮评测作为一等用例进行支持。评测结果同时报告分数、标准误差和最小可检测效应；支持逐问题比较检查点输出。

rss · AIHOT 精选 · Jun 12, 15:56AIHOT 精选

背景: OLMES 是一个用于可复现 LLM 评估的开放标准。Agentic 评估评估 LLM 在交互环境中作为自主代理的能力。

参考链接

标签: #LLM, #evaluation, #framework, #OLMES, #AI development

Anthropic 调查：48%盼 AI 治愈疾病，64%担忧失业 ⭐️ 7.0/10

Anthropic 发布对 5.2 万美国人的调查，显示 48%优先希望 AI 治愈疾病，64%担忧失业。这是领先 AI 公司首次大规模公众意见调查，为 AI 监管辩论提供了数据支撑。该调查由 YouGov 于 2025 年 11-12 月执行，并按人口普查基准加权。

rss · AIHOT 精选 · Jun 12, 16:14AIHOT 精选

背景: Anthropic 是一家 AI 安全公司。YouGov 是一家民调公司，将其在线面板加权以匹配人口普查人口统计。

参考链接

YouGov Surveys

标签: #AI ethics, #public opinion, #AI regulation, #Anthropic, #survey

用三个可移植技能实现 Spec 驱动开发 ⭐️ 7.0/10

邵猛介绍了 SDD 方法，用三个技能覆盖 spec-implement-verify 闭环，规格文件存放在 specs/目录。该方法标准化了 AI 辅助开发工作流，使其可移植且可验证。三个技能分别是/write-product-spec、/write-tech-spec 和/validate-changes-match-specs。

rss · AIHOT 精选 · Jun 12, 00:46AIHOT 精选

背景: Spec 驱动开发（SDD）将规格视为可执行合约，AI 代理据此生成代码，防止架构漂移。Warp 是一个现代终端，npx skills 是安装 AI 代理技能的工具。

参考链接

社区讨论: 暂无评论。

标签: #Spec-Driven Development, #AI-assisted development, #workflow, #open source, #software engineering

Codex 新增 Chrome 调试开发者模式 ⭐️ 7.0/10

Codex 现在支持为 Chrome 及其内置浏览器开启开发者模式，可通过 Chrome DevTools 协议 (CDP) 进行调试。这使得开发者可以直接在 Codex 中调试浏览器问题，简化 AI 辅助的 Web 开发流程。 CDP 支持分析 JavaScript 性能、控制台输出、网络流量和页面状态。

rss · AIHOT 精选 · Jun 12, 00:15AIHOT 精选

背景: Chrome DevTools 协议 (CDP) 是用于检测、检查、调试和分析基于 Chromium 的浏览器的标准协议。Codex 是 OpenAI 集成在 ChatGPT 中的 AI 编程助手。

参考链接

标签: #Codex, #Chrome DevTools, #debugging, #AI-assisted development, #web development

Perplexity Computer 集成 Deep Research ⭐️ 7.0/10

Perplexity 将 Deep Research 作为原生技能集成到 Computer 中，Pro 和 Max 订阅者现已可用。这通过结合搜索、代码生成和沙箱访问，增强了 Computer 对高级用户的实用性。 Deep Research 连接到 Computer 的智能体框架，可访问搜索、代码生成、长运行沙箱、连接器、工具和授权数据。

rss · AIHOT 精选 · Jun 11, 17:32AIHOT 精选

背景: Perplexity Computer 是一个运行在专用 Mac Mini 上的 AI 智能体工具，允许 AI 访问本地文件和应用程序。Deep Research 是一个执行迭代搜索和摘要并实时引用来源的功能。

参考链接

标签: #AI, #search, #product-update, #Perplexity

Gemini Omni Flash 在视频任务中达到 SOTA ⭐️ 7.0/10

Google DeepMind 的 Gemini Omni Flash 在图像到视频、文本到视频和视频编辑方面达到 SOTA，即将通过 API 提供。开发者将能通过 API 使用顶尖的多模态视频生成模型，实现高级视频创作和编辑。该模型在 Google TPU 上训练，于 Google I/O 2026 上发布。

rss · AIHOT 精选 · Jun 11, 17:05AIHOT 精选

参考链接

Gemini Omni Flash - Model Card — Google DeepMind

标签: #AI, #video generation, #Gemini, #API

LLM 网关：应用与 AI 模型之间缺失的一层 ⭐️ 7.0/10

一篇文章解释了为什么需要 LLM 网关来处理供应商中断、成本跟踪和合规性，并比较了顶级解决方案。没有网关，供应商故障会导致用户可见的错误，AI 成本变得无法追踪，影响可靠性和预算。文章从路由、合规性和设置时间三个维度比较了解决方案。

rss · AIHOT 精选 · Jun 11, 16:00AIHOT 精选

背景: LLM 网关是一个统一的 API 层，将请求路由到多个 LLM 提供商，跟踪每 token 成本，执行安全策略，并提供审计跟踪。

参考链接

Top 5 AI Gateways for Tracking the Costs of Your AI Applications

标签: #LLM, #AI infrastructure, #API gateway, #cost management, #compliance

Prometheus 融资 120 亿美元，估值 410 亿美元 ⭐️ 7.0/10

杰夫·贝佐斯的 AI 初创公司 Prometheus 以 410 亿美元估值融资 120 亿美元，目标是成为“人工通用工程师”。这笔对实体世界 AI 的巨额押注可能改变制造业，但缺乏产品验证。 Prometheus 计划斥资 1000 亿美元收购工业企业以获取训练数据。

rss · AIHOT 精选 · Jun 11, 15:45AIHOT 精选

背景: 该公司成立仅 7 个月，尚无产品，估值从 62 亿美元跃升至 410 亿美元。

参考链接

标签: #AI, #funding, #manufacturing, #startup, #engineering

狮门影业扩大与 Runway 合作并入股 ⭐️ 7.0/10

狮门影业入股 Runway，并利用其生成式 AI 模型共同创作一部短剧系列。这标志着大型娱乐公司押注生成式 AI 进行内容创作。该短剧系列基于狮门影业现有 IP，并使用 Runway 的生成模型制作。

rss · AIHOT 精选 · Jun 11, 14:31AIHOT 精选

背景: Runway 开发文本到视频和视频生成 AI 模型，如 Gen-3 和 Gen-4.5。狮门影业此前已在预可视化和故事板中使用 Runway 工具。

参考链接

标签: #AI, #Film Production, #Generative AI, #Partnership, #Entertainment

Anthropic 启动 1.5 亿美元 Claude Corps 奖学金项目 ⭐️ 7.0/10

Anthropic 推出 Claude Corps 奖学金项目，投入 1.5 亿美元培训 1000 名早期职业者使用 Claude，并安排他们在美国非营利组织工作一年。该计划展示了 Anthropic 对 AI 促进社会公益和劳动力发展的承诺，可能影响 AI 人才在非营利领域的部署方式。研究员年薪 85,000 美元加福利，每周接受 5 小时培训；无需大学学位，仅需年满 18 岁且工作经验不超过两年。

rss · AIHOT 精选 · Jun 11, 13:12AIHOT 精选

背景: CodePath 是一家技术培训组织，为顶级科技公司培养工程人才。Social Finance 是一家非营利咨询机构，开创了社会影响债券等创新融资模式以解决社会问题。

参考链接

Claude Corps fellows FAQ \ Anthropic

标签: #Anthropic, #Claude, #AI for Social Good, #Workforce Development, #Nonprofit

Cursor 推出 Auto-review：用分类器智能体保障 AI 编码安全 ⭐️ 7.0/10

Cursor 推出 Auto-review，通过一个分类器智能体在 AI 编码智能体执行前审查并阻止风险动作。这在不干扰日常开发的前提下提升了 AI 辅助开发的安全性，对建立对智能体工具的信任至关重要。分类器采用小模型并在智能体循环内运行以避免额外延迟，还能读取工作区文件辅助判断。

rss · AIHOT 精选 · Jun 11, 12:00AIHOT 精选

背景: 随着自主编码智能体能力增强，智能体 AI 安全日益受到关注。Auto-review 是一种在工具调用层面管理智能体自主性的实用机制。

参考链接

社区讨论: 早期反馈表明 Auto-review 在安全性和生产力之间取得了良好平衡，但部分用户指出分类器对新颖代码可能过于谨慎。

标签: #AI safety, #code generation, #agentic AI, #developer tools, #Cursor

阿里云发布 Meoo CLI，一键部署本地 AI 项目 ⭐️ 7.0/10

阿里云推出开源工具 Meoo CLI，可通过一条命令将本地 AI 编程项目一键部署到云端。它连接了本地 AI 编程助手与云端部署，简化了从开发到上线的流程。支持 Claude Code、Codex、Cursor 等 AI 编程工具，适用于 Linux、macOS 和 Windows 平台。

rss · AIHOT 精选 · Jun 11, 08:50AIHOT 精选

背景: Meoo CLI 是一个开源命令行工具，作为本地 AI 编程助手与阿里云后端服务之间的桥梁，自动完成数据库接入、用户登录、文件存储和项目发布。

参考链接

标签: #Alibaba Cloud, #CLI, #AI coding, #deployment, #open-source

Deezer 推出面向其他流媒体的 AI 音乐检测器 ⭐️ 7.0/10

Deezer 发布了一款免费在线工具，可扫描任何流媒体服务的播放列表，检测 AI 生成的曲目。这使用户能够在不同平台上识别合成音乐，解决了流媒体中 AI 生成内容日益增多的问题。该检测器在 2025 年已在 Deezer 上标记了超过 1340 万首 AI 曲目。

rss · AIHOT 精选 · Jun 11, 08:00AIHOT 精选

参考链接

标签: #AI, #music, #streaming, #detection, #Deezer

中国 AI 浪潮引发劳动者权益担忧 ⭐️ 7.0/10

中国官媒罕见直白呼吁，在职场快速采用 AI 的背景下保护劳动者权益。这预示着中国可能出台新的 AI 监管法规，影响数百万劳动者和全球 AI 产业。北京正在考虑如何控制这项新技术带来的风险，但具体措施尚不明确。

rss · AIHOT 精选 · Jun 11, 06:19AIHOT 精选

标签: #AI, #China, #labor rights, #regulation, #societal impact

Anthropic CEO 警告 AI 将导致大规模长期失业 ⭐️ 7.0/10

Anthropic CEO 达里奥·阿莫迪警告 AI 将导致结构性长期失业，并提出薪资保险和全民基本收入等解决方案。这表明一位 AI 领军人物承认劳动力市场将发生永久性变化，影响政策和劳动力规划。阿莫迪认为失业是 AI 复制人类认知能力的固有属性，而非暂时性干扰。

rss · AIHOT 精选 · Jun 11, 05:53AIHOT 精选

背景: 薪资保险为失业后从事低薪工作的工人提供部分工资补偿。全民基本收入（UBI）向所有公民无条件发放现金。

参考链接

标签: #AI, #job displacement, #policy, #Anthropic, #future of work

mlx-vlm v0.6.3 首发支持 DiffusionGemma 和 North Mini Code ⭐️ 7.0/10

mlx-vlm v0.6.3 通过 MLX 在 Apple Silicon 上首发支持 Google 的 DiffusionGemma 和 Cohere 的 North Mini Code 1.0。这使得在 Mac 上高效本地推理两种新型架构成为可能，扩展了 MLX 生态系统。 DiffusionGemma（26B MoE，3.8B 激活）以 256 token 块并行生成；North Mini Code（30B MoE，3B 激活）在 BF16 下约 66 tok/s。

rss · AIHOT 精选 · Jun 11, 00:59AIHOT 精选

背景: MLX 是用于 Apple Silicon 上机器学习的数组框架。DiffusionGemma 是 Google 基于扩散的文本生成模型，North Mini Code 是 Cohere 的开源编码 MoE 模型。

参考链接

标签: #MLX, #DiffusionGemma, #North Mini Code, #Apple Silicon, #VLM

Cola：用技能弥合 AI Agent 使用鸿沟 ⭐️ 7.0/10

Cola 项目提出将’Skill’作为解决 AI Agent 采用中 K 型分化的方案。它解决了专家与普通用户在利用 AI Agent 方面日益扩大的差距。 Cola 旨在通过可复用的技能，让 MCP、记忆、工具调用等 Agent 能力变得易于使用。

rss · AIHOT 全部动态 · Jun 12, 22:06AIHOT 全部动态

背景: K 型分化描述了 AI 如何让专家用户受益而将新手抛在后面。这里的’Skill’指封装好的、可复用的 Agent 能力，用于简化复杂工作流。

参考链接

标签: #AI Agents, #Human-AI Interaction, #Skill Engineering, #Tooling, #Accessibility

Gemini 3.5 Live Translate 发布 ⭐️ 7.0/10

Google 宣布通过 Gemini Live API 推出 Gemini 3.5 Live Translate，实现近实时语音翻译。这使得开发者能够为应用添加实时多语言语音翻译，提升全球可访问性。它支持连续语音到语音（S2ST）和同步转录。

rss · AIHOT 全部动态 · Jun 12, 21:36AIHOT 全部动态

背景: Gemini Live API 支持与 Gemini 进行低延迟、实时的语音和视觉交互，处理连续的音频、图像和文本流。

参考链接

标签: #AI, #speech translation, #Gemini, #real-time, #API

基于 GPT 的 deep^2 在成本效率上超越 Fable 10-20 倍 ⭐️ 7.0/10

基准测试显示，deep^2 完成类似任务花费 40 美元，而 Fable 花费 457 美元，差距达 10-20 倍。这凸显了 AI 代理用户在复杂多步骤任务中实现巨大成本节约的潜力。 deep^2 使用 GPT-4，而 Fable 基于 Claude；deep^2 首次尝试失败但可修复，Fable 首次成功但成本更高。

rss · AIHOT 全部动态 · Jun 12, 21:09AIHOT 全部动态

背景: Fable 是 Anthropic 开发的 AI 代理，可无人值守运行数天；deep^2 是基于 GPT 的类似任务代理。

参考链接

Claude Fable \ Anthropic

社区讨论: 未提供社区讨论。

标签: #AI, #cost efficiency, #GPT, #Fable, #benchmark

谷歌起诉中国 AI 诈骗团伙 ⭐️ 7.0/10

谷歌起诉中国网络犯罪团伙 Outsider Enterprise，指控其利用 AI 发送 250 万条诈骗短信，受害人数十万。这标志着对大规模 AI 网络犯罪的重要法律行动。该团伙利用谷歌 Gemini AI 创建仿冒谷歌、YouTube 和政府网站的钓鱼模板。

rss · AIHOT 全部动态 · Jun 12, 20:38AIHOT 全部动态

参考链接

Google sues Chinese cybercrime network that used... - Ars Technica

社区讨论: 讨论强调 AI 诈骗威胁日益严重，需要加强监管。

标签: #cybersecurity, #AI misuse, #Google, #cybercrime, #scam

Project Ire 识别出 LOTUSLITE 恶意软件 ⭐️ 7.0/10

微软研究院的 Project Ire 逆向工程了一个逃避大多数 EDR 工具的 LOTUSLITE 恶意软件变种。该分析揭示了高级逃避技术，帮助防御者改进针对定向间谍活动的检测。该样本是一个 Windows DLL 后门变种，不在 Acronis 的 IOC 列表中。

rss · AIHOT 全部动态 · Jun 12, 20:33AIHOT 全部动态

背景: LOTUSLITE 是一种用于定向间谍活动的后门，通常通过政治主题的钓鱼邮件传播。EDR 逃避技术使恶意软件能够绕过端点检测和响应系统。

参考链接

社区讨论: X 上的帖子强调了逆向工程方法的新颖性。

标签: #malware analysis, #reverse engineering, #cybersecurity, #EDR evasion

特斯拉 FSD 在丹麦认证视频中被发现使用自行车道 ⭐️ 7.0/10

据 Politiken 报道，特斯拉的全自动驾驶（FSD）模式在丹麦官方认证视频中被发现驶入自行车道。这一在官方测试中暴露的安全缺陷可能延迟监管批准，并削弱公众对自动驾驶的信任。事件发生在 1 分 49 秒视频的第 12 秒，随后还出现了多个错误。

rss · AIHOT 全部动态 · Jun 12, 19:30AIHOT 全部动态

背景: 特斯拉的 FSD 目前被归类为 L2 级驾驶辅助，需要人类持续监督，尽管其名称暗示全自动驾驶。

参考链接

Self- driving car - Wikipedia

社区讨论: Hacker News 上的帖子获得了 100 个点赞，表明社区对安全影响的高度关注。

标签: #Tesla, #autonomous driving, #safety, #regulation, #AI

ggerganov 点赞 locate-anything.cpp ⭐️ 6.0/10

ggerganov 点赞了 locate-anything.cpp，这是 NVIDIA 的 Locate Anything 模型的 C++ 实现。这表明对视觉语言定位的高效 C++ 推理可能产生兴趣。 Locate Anything 使用并行框解码，推理速度提升高达 2.5 倍。

github · ggerganov · Jun 12, 14:51

背景: Locate Anything 是 NVIDIA 的视觉语言模型，可以定位文本描述的对象。ggerganov 是 llama.cpp 的创建者，这是一个流行的 LLM C++ 推理引擎。

参考链接

标签: #C++, #computer vision, #open source, #AI

Ollama v0.30.8：修复提供商选择、改进提示缓存、提升 MLX 稳定性 ⭐️ 6.0/10

Ollama v0.30.8 修复了 ollama launch 中的提供商选择问题，改进了提示缓存，并增强了 MLX 推理的稳定性。此补丁提高了运行本地大语言模型的 Ollama 用户的可靠性，尤其是在 Apple Silicon 上使用 MLX 时。提示缓存与上下文移位解耦，以更好地重用 KV 缓存；MLX 运行器现在在提示处理期间创建快照。

github · github-actions[bot] · Jun 12, 17:04

背景: MLX 是一个用于 Apple Silicon 上机器学习的数组框架，针对高效推理进行了优化。提示缓存存储中间计算结果，以避免重复处理相同的输入。

参考链接

LLM inference — MLX 0.31.2 documentation

标签: #ollama, #MLX, #prompt caching, #recurrent models, #release

在 macOS 上设置本地编码代理 ⭐️ 6.0/10

一篇教程详细介绍了如何在 macOS 上使用 llama.cpp 和开源模型设置本地编码代理。开发者可以本地运行 AI 编码助手，确保隐私和离线能力。该指南使用 llama.cpp 的服务器搭配 GGUF 模型以及’pi’代理框架。

hackernews · AIHOT 全部动态 · Jun 12, 17:34 · 社区讨论T2 社区与开源

背景: llama.cpp 是一个开源的 C/C++库，用于本地运行 LLM，支持 GGUF 格式模型，是本地推理的事实标准。

参考链接

Llama.cpp

社区讨论: 用户建议使用 Ollama 搭配 opencode 等替代方案，并指出短基准测试可能产生虚假的加速结果。

标签: #local-llm, #coding-agent, #macOS, #tutorial

减少 AI 生成界面粗糙感的技巧 ⭐️ 6.0/10

一篇博客文章通过指定设计约束，提供了减少 AI 生成前端通用粗糙外观的实用技巧。使用 LLM 生成 UI 的开发者可以通过简单约束提升输出质量，节省手动调整的时间。技巧包括使用特定 CSS 框架、限制调色板以及避免过度依赖默认模式。

hackernews · FergusArgyll · Jun 12, 14:48 · 社区讨论T2 社区与开源

社区讨论: 评论者就设计偏好展开辩论，有人指出 Qt 在训练数据中的大量出现影响了 AI 输出。

标签: #AI, #frontend, #UI design, #LLM

Preply 结合 AI 与真人导师实现个性化学习 ⭐️ 6.0/10

Preply 整合 OpenAI，为语言学习者生成个性化课程总结和练习。通过自动化反馈提升真人辅导效率，使个性化语言学习更具可扩展性。 AI 在每节课后生成关键主题总结、语法纠正、词汇重点和发音反馈。

rss · OpenAI Blog · Jun 12, 00:00T1 官方实验室

背景: Preply 是一个在线语言学习市场，连接超过 5 万名导师和数百万学习者，利用机器学习推荐导师。

参考链接

标签: #AI, #education, #language learning, #personalization

Oran Ge 开源《人味儿写作心法》保留 AI 写作中的人味 ⭐️ 6.0/10

Oran Ge 开源了《人味儿写作心法.skill》，用于在 AI 辅助写作中保留人的存在感。这解决了 AI 写作的一个关键局限：缺乏真实的人类声音和生活体验。该技能专为用户先写作或口述、再由 AI 润色并保留人味的场景设计。

rss · AIHOT 精选 · Jun 12, 22:48AIHOT 精选

背景: Claude Fable 5 是 Anthropic 于 2026 年 6 月发布的最强大的通用模型。Oran Ge 用它打磨文案时发现输出缺乏“存在感”——即作者在具体位置付出过具体代价的感觉。

参考链接

一个指令让deepseek生成的内容更有“ 人味儿 ” – Think +

标签: #AI writing, #open source, #writing tools, #Claude

在 OpenRouter 上最小化 LLM 成本 ⭐️ 6.0/10

OpenRouter 的:floor后缀和max_price参数可实现最低成本的 LLM 推理，并提供 20 多个免费模型。开发者可以通过自动选择最便宜的提供商来大幅降低 LLM 推理成本。 :floor后缀强制为给定模型选择最低价格的提供商。

rss · AIHOT 精选 · Jun 12, 16:00AIHOT 精选

背景: OpenRouter 是一个统一 API，将请求路由到多个 LLM 提供商，通过参数实现成本优化。

参考链接

标签: #LLM, #cost optimization, #OpenRouter, #tutorial

字节豆包上线任务模式，升级专家模式 ⭐️ 6.0/10

字节跳动旗下 AI 应用豆包上线“任务模式”，支持定时执行与文件生成，并将“思考模式”升级为“专家模式”，强化深度推理能力。此次更新将豆包从聊天机器人转变为任务自动化平台，与其他 AI 智能体展开竞争。任务模式支持零代码网页生成、一键 PPT 制作和数据可视化；专家模式调用豆包 2.0 Pro 进行深度推理。

rss · AIHOT 精选 · Jun 12, 15:33AIHOT 精选

背景: 豆包是字节跳动基于大语言模型的 AI 助手。新的任务模式支持全链路 Agent 执行，用户无需编码即可自动化复杂工作流。

参考链接

豆包大模型 2 . 0 正式发布

标签: #AI, #ByteDance, #product update, #task automation, #LLM

qiaomu-ai-prd：面向 AI 的 PRD 生成 Prompt ⭐️ 6.0/10

发布了一个专门为 AI Agent 设计的 PRD 生成 Prompt（qiaomu-ai-prd），旨在提升 AI 驱动开发中的功能完整度。它解决了 AI 辅助开发中人类与 AI 需求之间的差距，有望提升 AI 生成代码的质量。安装命令：npx skills add joeseesun/qiaomu-ai-prd；开源，Prompt 在评论区。

rss · AIHOT 精选 · Jun 12, 02:46AIHOT 精选

背景: PRD（产品需求文档）是软件开发中的标准文档。AI Agent 通常需要结构化输入才能生成准确代码；该 Prompt 专门为 AI 消费定制了 PRD 生成。

标签: #AI, #PRD, #prompt engineering, #developer tools

Replit Agent 新增自定义指令与技能 ⭐️ 6.0/10

Replit Agent 现在支持自定义指令和技能，可在不同项目中记住用户偏好。这消除了重复提示，为使用 Replit Agent 的开发者和团队节省时间。自定义指令可以是动态的，允许用户在会话期间更新代理应关注的内容。

rss · AIHOT 精选 · Jun 11, 18:58AIHOT 精选

背景: Replit Agent 是一种 AI 工具，可将自然语言转化为应用、设计和幻灯片，无需编码。技能允许教授代理专业知识。

参考链接

标签: #AI agent, #Replit, #productivity, #customization

OpenRouter 推出帕累托曲线基准探索器 ⭐️ 6.0/10

OpenRouter 发布了一个基准探索器，可在 10 个不同基准上绘制帕累托曲线以比较 AI 模型。这有助于开发者通过平衡准确性和成本来选择模型，超越了简单的排行榜排名。该工具可在 openrouter.ai/rankings#benchmarks 获取，更多功能即将推出。

rss · AIHOT 精选 · Jun 11, 15:32AIHOT 精选

背景: 帕累托曲线可视化两个指标（如准确性和成本）之间的权衡，显示一组最优模型，其中任何指标都无法在不恶化另一个指标的情况下得到改善。

参考链接

AI leaderboards are no longer useful. It's time to switch to Pareto ...

标签: #AI, #benchmarks, #OpenRouter, #tools

Krea 2 推出生成式滑块控制图像属性 ⭐️ 6.0/10

Krea 2 推出了生成式滑块，可控制生成图像的强度、复杂度和运动。这为用户提供了对 AI 图像生成的更精细控制，增强了创意工作流程。这些滑块位于 Krea 2 图像工具的控制面板中，支持随机化或重置设置。

rss · AIHOT 精选 · Jun 11, 15:00AIHOT 精选

参考链接

Introducing Generative Sliders - Krea

标签: #image generation, #AI tools, #generative AI, #Krea

OpenAI 降价被批评者 Gary Marcus 视为示弱 ⭐️ 6.0/10

OpenAI 正考虑大幅降价，Gary Marcus 认为这暴露了公司竞争力疲软。这预示着 AI 行业可能面临定价压力，并可能影响开发者的采用。 OpenAI 尚未确认具体的降价细节。

rss · AIHOT 精选 · Jun 11, 13:34AIHOT 精选

背景: Gary Marcus 是一位认知科学家，也是知名的 AI 怀疑论者，经常批评主要 AI 公司。

参考链接

Gary Marcus - Wikipedia

社区讨论: 该文章引发了关于降价是反映疲软还是战略竞争的讨论。

标签: #OpenAI, #pricing, #AI industry, #commentary

Baoyu-Design 技能现已支持导入本地 Figma 文件 ⭐️ 6.0/10

Baoyu-design 技能现已支持导入本地 .fig 文件，可在本地重建设计系统，效果与 Claude Design 在线版一致。开发者现在可以离线重建和复用设计系统，减少对云服务的依赖。该功能依赖 Claude Fable 5 辅助，且需要足够的 Token。

rss · AIHOT 精选 · Jun 11, 06:33AIHOT 精选

背景: Claude Fable 5 是 Anthropic 推出的大型语言模型，针对视觉任务优化，能够从截图重建 UI。

参考链接

标签: #design-tools, #figma, #claude, #open-source, #development-tools

Midjourney V8.1 成为默认模型 ⭐️ 6.0/10

Midjourney 已将默认模型从 V7 升级至 V8.1，提升了智能性、连贯性和文本渲染效果。用户无需更改设置即可默认获得更优质的图像。 V8.1 现已支持高清模式，可输出更高分辨率的图像。

rss · AIHOT 精选 · Jun 11, 04:08AIHOT 精选

背景: Midjourney 是一家独立的 AI 研究实验室，以其文本到图像生成模型而闻名。V8.1 是一个专注于速度和质量的增量更新。

参考链接

Midjourney - Wikipedia

标签: #AI, #image generation, #Midjourney, #model update

GitHub Copilot CLI 委托任务更智能 ⭐️ 6.0/10

GitHub Copilot CLI 现在通过更好的编排减少了不必要的任务交接并加快了进度，且没有新增任何配置选项。使用 Copilot CLI 的开发者将经历更少的干扰和更快的任务完成，从而提高生产力。改进在于编排层，使代理在选择何时委托子任务时更具选择性。

rss · AIHOT 全部动态 · Jun 12, 22:26AIHOT 全部动态

背景: GitHub Copilot CLI 是一个在终端中运行的 AI 驱动编码助手。它可以执行命令和编辑文件以完成任务。自动模式允许代理在不等待用户每一步批准的情况下完成任务。

参考链接

标签: #GitHub Copilot, #CLI, #AI, #developer tools

AI 高速对话加剧 ADHD，威胁专注力 ⭐️ 6.0/10

一条推文观察到，每两三分钟一次的 AI 对话形成注意力集中与涣散的交替循环，加剧 ADHD 症状。这凸显了 AI 工具日益增长的认知成本，尤其对注意力困难的知识工作者影响显著。推文特别提到前额叶是持续任务切换中承受压力的脑区。

rss · AIHOT 全部动态 · Jun 12, 21:38AIHOT 全部动态

背景: 前额叶负责执行功能，如专注和冲动控制。网络来源澄清，所谓“前额叶受损”常是自嘲的比喻，并非临床诊断。

参考链接

情绪易怒、爱走神是前额叶受损吗？如何科学改善？专家解读

标签: #ADHD, #AI, #attention, #productivity

Anthropic 将 Claude Convey Agent 作为 Labs 项目发布 ⭐️ 6.0/10

Anthropic 宣布推出 Claude Convey Agent，这是一个基于远程容器的代理，具有可自定义的 UI，作为 Labs 项目发布。这扩展了 Anthropic 的代理生态系统，为开发者提供了一种在隔离环境中部署和自定义 AI 代理的新方式。该代理在远程容器中运行，支持自定义 UI 标签和插件，类似于 Claude Design。

rss · AIHOT 全部动态 · Jun 12, 21:10AIHOT 全部动态

背景: Anthropic Labs 是负责实验新产品的部门；Claude Design 是之前的一个 Labs 项目，用于视觉协作。

参考链接

社区讨论: 该公告内容模糊，尚未提供技术细节或社区反应。

标签: #AI, #Anthropic, #Agent, #Labs

Replit 推出并行构建与多智能体支持 ⭐️ 6.0/10

Replit 现在支持并行构建多个项目并运行并发 AI 智能体。开发者可通过同时运行最多 10 个智能体大幅加快开发速度。用户可以向现有项目添加多个工件，并协调智能体处理不同任务。

rss · AIHOT 全部动态 · Jun 12, 19:00AIHOT 全部动态

参考链接

标签: #Replit, #parallel builds, #AI agents, #development tools

OpenAI 推出文档智能体 ⭐️ 6.0/10

OpenAI 在 developers.openai.com 上发布了文档智能体，帮助开发者查找答案并导航文档。这通过使 OpenAI 产品文档更易于搜索和导航，改善了开发者体验。该智能体直接链接到相关文档部分，减少搜索时间。

rss · AIHOT 全部动态 · Jun 12, 18:53AIHOT 全部动态

标签: #OpenAI, #developer tools, #documentation, #AI

受《席德·梅尔的海盗》启发的网页海战游戏 ⭐️ 5.0/10

一款受《席德·梅尔的海盗》启发的网页海战游戏已发布。它为经典游戏的粉丝提供了怀旧体验。该游戏是一个业余项目，机制和 AI 较为简单。

hackernews · iweczek · Jun 12, 17:07 · 社区讨论T2 社区与开源

社区讨论: 玩家建议增加风向动力学和更好的 AI 以增加挑战性。

标签: #game development, #web game, #retro gaming, #hobby project

OpenAI 推出三门学院课程 ⭐️ 5.0/10

OpenAI 发布了三门学院课程，涵盖实用 AI 技能、工作流和智能体。帮助专业人士通过结构化学习将 AI 融入日常工作。课程侧重于创建可重复的工作流和应用 AI 智能体。

rss · OpenAI Blog · Jun 12, 10:00T1 官方实验室

标签: #AI, #education, #OpenAI, #courses

iOS 27 健康 App 大改：卡片、营养识别、围绝经期追踪 ⭐️ 5.0/10

苹果重新设计了健康 App 的卡片布局，新增基于相机的营养识别、围绝经期追踪，并提升了数据同步速度。这些功能使健康 App 更加主动和个性化，尤其对女性健康和营养追踪意义重大。营养识别需要 iPhone 15 Pro 或更新机型；GymKit 现在可直接与 iPhone 配对，无需 Apple Watch。

rss · AIHOT 精选 · Jun 12, 02:06AIHOT 精选

背景: GymKit 是苹果用于在 iOS 设备和健身器材之间同步运动数据的协议。围绝经期是绝经前的过渡阶段，常伴有周期不规律。

参考链接

标签: #iOS, #Health, #Apple, #Nutrition, #Fitness

OpenAI Codex 推出速率重置攒存功能 ⭐️ 5.0/10

OpenAI 为 Codex 推出了速率限制重置攒存功能，首先面向 Go、Plus、Pro 和 Business 用户。用户现在可以将速率限制重置保留到以后使用，从而更灵活地管理 Codex 使用量。符合条件的用户最初可获得一次免费攒存重置。

rss · AIHOT 精选 · Jun 12, 00:11AIHOT 精选

背景: Codex 是 OpenAI 的 AI 编程助手。此前，速率限制重置会立即生效，无法存储。

参考链接

标签: #OpenAI, #Codex, #rate limit, #feature update

Replit 专家级提示词技巧 ⭐️ 5.0/10

Replit 在 Twitter 上发布了一条线程，分享如何为 AI Agent 编写更好的提示词以减少重写。更好的提示词能帮助开发者一次获得正确代码，节省时间和精力。该线程可能涵盖具体性、上下文和迭代优化技巧。

rss · AIHOT 精选 · Jun 11, 22:00AIHOT 精选

背景: Replit Agent 是一个 AI 编程助手，可将自然语言提示转换为应用。提示词工程是编写输入以有效引导 AI 输出的实践。

参考链接

标签: #Replit, #prompt engineering, #AI tools, #productivity

Replit 与 Databricks 集成升级，公开预览开放 ⭐️ 5.0/10

Replit 升级了与 Databricks 的集成，支持应用中按用户控制数据可见性，现已公开预览。开发者可构建每个用户仅看到授权数据的应用，提升安全性和合规性。该集成使用 Databricks 服务主体实现安全的行级数据访问控制。

rss · AIHOT 精选 · Jun 11, 21:49AIHOT 精选

参考链接

标签: #Replit, #Databricks, #data access control, #integration

乔木目标元技能：一句话转 Codex Goal ⭐️ 5.0/10

一个新 Skill 可将一句话需求转化为 Codex /goal 指令，通过 npx skills add joeseesun/qiaomu-goal-meta-skill 安装。它减轻了阅读冗长文档以编写有效 Codex 目标的负担。该 Skill 开源免费，旨在简化 4 万字文档的阅读负担。

rss · AIHOT 精选 · Jun 11, 15:15AIHOT 精选

背景: Codex /goal 是一个触发自主循环的功能，用于复杂任务，需要结构良好的目标指令。该 Skill 自动化了目标编写过程。

参考链接

标签: #Codex, #AI-assisted development, #tool, #open source

Hermes Agent Desktop 发布，支持硅基流动一键切换 ⭐️ 5.0/10

Nous Research 发布了 Hermes Agent Desktop，集成硅基流动，支持一键切换 DeepSeek-V4、GLM-5.1 等开源模型。这简化了开发者的 AI 代理部署，无需手动配置即可灵活切换模型。桌面应用支持 macOS、Windows 和 Linux，具备可视化技能商店和多代理协作功能。

rss · AIHOT 精选 · Jun 11, 10:17AIHOT 精选

背景: 硅基流动是一个 AI 基础设施平台，用于部署和运行大语言模型，由前微软研究员袁进辉博士创立。

参考链接

标签: #AI, #Open Source, #Model Deployment, #Agent

Codex 每 5 分钟并行维护仓库 ⭐️ 5.0/10

一个简单循环每 5 分钟唤醒 Codex，通过将工作分配到线程来自主维护仓库。这展示了一种使用 AI 代理进行并行执行、自主维护仓库的实用模式。该设置使用编排器技能，结合分类、自动审查和计算机使用技能，实现自主落地。

rss · AIHOT 精选 · Jun 11, 09:09AIHOT 精选

背景: OpenAI Codex 是 2025 年 5 月推出的自主编码代理，基于 o3/GPT-5 模型。编排器技能协调多个子技能以完成复杂任务。

参考链接

标签: #Codex, #autonomous agents, #parallel computing, #repo maintenance

WorkBuddy 教程：国内通用 AI Agent 产品 ⭐️ 5.0/10

一篇教程展示了 WorkBuddy（国内通用 AI Agent）的两个案例：微信公众号周报生成和功能网页开发。 WorkBuddy 为国内用户提供了一站式 AI Agent，集成了多个国产大模型和企业工具，降低了使用门槛。 WorkBuddy 支持 Windows 和 Mac，提供免费版和 58 元/月个人专业版，集成了腾讯混元、DeepSeek、GLM、Kimi 等模型。

rss · AIHOT 精选 · Jun 11, 01:58AIHOT 精选

背景: WorkBuddy 是腾讯云代码助手推出的 AI Agent，拥有 Skills 市场和 MCP 连接器生态，可打通 QQ 邮箱、腾讯会议、腾讯文档等服务。

参考链接

标签: #AI Agent, #Tutorial, #Chinese Tech, #WorkBuddy

橙线插画技能开源发布 ⭐️ 5.0/10

一个免费开源的“橙线插画”技能在 GitHub 上发布。它提供了一个即用型 AI 代理技能，用于生成纽约客风格的极简插画。该技能在白色背景上使用细黑墨线和唯一的暖橙点缀（#F97316）。

rss · AIHOT 精选 · Jun 11, 00:05AIHOT 精选

参考链接

GitHub - orange2ai/ orange - line - illustration : New Yorker-style...

标签: #open-source, #AI illustration, #tool, #GitHub

Palantir 对瑞士杂志诉讼败诉 ⭐️ 5.0/10

Palantir 在一起针对瑞士调查性杂志的诉讼中败诉，未能阻止其报道。这一法律败诉可能影响 Palantir 控制对其业务关键报道的能力。该案由《金融时报》报道，但未提供裁决的具体细节。

rss · AIHOT 全部动态 · Jun 12, 22:42AIHOT 全部动态

标签: #Palantir, #legal, #privacy, #surveillance

旧金山举办编码智能体基准测试活动 ⭐️ 5.0/10

Artificial Analysis 在旧金山举办了一场编码智能体基准测试活动，邀请了来自 Cognition、Cursor 和 NVIDIA 的演讲者。该活动凸显了人们对 AI 编码智能体标准化基准测试日益增长的关注，这对于评估实际性能至关重要。演讲者包括 Cognition 高级副总裁 Silas Alberti、Cursor 的 Nate Schmidt 和 NVIDIA 的 Venkat Srinivasan。

rss · AIHOT 全部动态 · Jun 12, 22:34AIHOT 全部动态

背景: 编码智能体是能够自主编写和调试代码的 AI 工具。基准测试衡量它们在软件工程等任务上的表现。Artificial Analysis 为此类基准测试提供了排行榜。

参考链接

标签: #AI, #coding agents, #benchmarking, #event

Claude Code v2.1.176：多语言标题与正则页脚链接 ⭐️ 5.0/10

Claude Code v2.1.176 新增多语言会话标题、正则页脚链接匹配及 Bedrock 凭证缓存优化。这些改进提升了非英语用户的体验，并在终端输出中提供更灵活的链接处理。新增的 footerLinksRegexes 设置允许用户使用正则表达式匹配页脚链接徽章。

rss · AIHOT 全部动态 · Jun 12, 21:53AIHOT 全部动态

背景: Claude Code 是 Anthropic 的终端代理编码工具。Bedrock 是 AWS 的基础模型托管服务。

参考链接

Claude Code overview - Anthropic

标签: #Claude Code, #release, #bug fix, #AI tools

Tailwind 与 Slop 应用引发 HN 热议 ⭐️ 5.0/10

一篇题为“Tailwind and slop apps”的 Hacker News 帖子获得 100 点热度，引发社区讨论。该讨论反映了开发者对实用优先 CSS 框架和低质量 AI 生成应用的看法。 Tailwind CSS 是一个实用优先的框架，截至 2026 年 2 月在 GitHub 上拥有超过 93,700 颗星。

rss · AIHOT 全部动态 · Jun 12, 21:38AIHOT 全部动态

背景: Tailwind CSS 是一个开源实用优先的 CSS 框架，使用像’bg-yellow-300’这样的工具类而非预定义组件。’Slop apps’可能指低质量或 AI 生成的应用，该术语在开发者社区中逐渐流行。

参考链接

Tailwind CSS

社区讨论: HN 讨论可能围绕 Tailwind 实用优先方法与传统 CSS 的优劣，以及“slop”应用的泛滥展开。

标签: #Tailwind CSS, #web development, #community discussion

Hyperframes 与 Gemini 视频分析智能体流程 ⭐️ 5.0/10

一个智能体流程将 Hyperframes 与 Gemini 视频分析结合，生成带注释的视频。这展示了生成式视频帧与 AI 视频理解的新颖集成，用于自动注释。 Hyperframes 可能生成关键帧或摘要，然后由 Gemini 分析以产生注释。

rss · AIHOT 全部动态 · Jun 12, 20:07AIHOT 全部动态

参考链接

Gemini Video Understanding: Complete Multimodal AI Guide 2025

标签: #video analysis, #AI agents, #Gemini, #Hyperframes

Codex AI 代理玩 Rimworld ⭐️ 5.0/10

一条推文显示 OpenAI 的 Codex AI 代理正在运行游戏 Rimworld。这展示了 Codex 与复杂游戏环境交互的能力。 Codex 是一个 AI 编码代理，可以在隔离环境中编写代码并执行任务。

rss · AIHOT 全部动态 · Jun 12, 19:40AIHOT 全部动态

背景: Codex 是 OpenAI 开发的 AI 编码代理，于 2025 年 4 月以 Codex CLI 形式发布。它帮助进行编码、调试和功能交付。

参考链接

社区讨论: 未提供讨论内容。

标签: #Codex, #AI, #gaming, #demonstration

Codex 将网站更新从一周缩短至三天 ⭐️ 5.0/10

OpenAI 的 Codex 代理能够并行更新网站的多个部分，将一周的工作量缩短为三天。这展示了 Codex 在实际任务中大幅提升开发者生产力的潜力。来自 @intelligenceco 的用户 @ndrewpignanelli 通过在多个部分并行运行 Codex 实现了这一效果。

rss · AIHOT 全部动态 · Jun 12, 19:30AIHOT 全部动态

背景: Codex 是 OpenAI 的 AI 编码代理，能够自主编写代码、修复错误，并在隔离环境中执行软件工程任务。

参考链接

标签: #Codex, #AI-assisted development, #productivity