从 122 条内容中筛选出 83 条重要资讯


  1. CRISPR-Cas12a2 粉碎癌细胞,靶向不可成药突变 ⭐️ 9.0/10
  2. 全自主无人机首次击杀人类士兵 ⭐️ 9.0/10
  3. 通用大语言模型在临床任务上超越专用医疗 AI ⭐️ 9.0/10
  4. DeepMind 论文提出从 AGI 到 ASI 的四条路径 ⭐️ 9.0/10
  5. AI 无法取代人类专业能力 ⭐️ 8.0/10
  6. LLM 生成的 PR 降低开源维护质量 ⭐️ 8.0/10
  7. WASI 0.3 发布,组件模型变更 ⭐️ 8.0/10
  8. MiniMax M3 开源权重模型发布 ⭐️ 8.0/10
  9. Kimi 开源 K2.7-Code 模型,性能大幅提升 ⭐️ 8.0/10
  10. LLM 在 95%模拟中选择战术核武器 ⭐️ 8.0/10
  11. Hugging Face 启动 Open-R1 项目复现 DeepSeek-R1 ⭐️ 8.0/10
  12. 腾讯开源升级 HPC-Ops 推理算子库 ⭐️ 8.0/10
  13. HYDRA-X:单一 ViT 统一多模态模型 ⭐️ 8.0/10
  14. MiniMax MSA:28 倍稀疏注意力加速 ⭐️ 8.0/10
  15. EurekAgent:环境工程化实现自主科学发现 ⭐️ 8.0/10
  16. WEAVER:更快更好的机器人操作世界模型 ⭐️ 8.0/10
  17. BBVA 与 OpenAI 合作,向 10 万名员工部署 ChatGPT Enterprise ⭐️ 8.0/10
  18. AA-AgentPerf 基准发布,首批测试 DeepSeek V4 Pro ⭐️ 8.0/10
  19. Google Gemini-SQL2 在 BIRD 排行榜上达到 80.04% ⭐️ 8.0/10
  20. Claude Code 与 Fable 重建失传游戏 SimRefinery ⭐️ 8.0/10
  21. 苹果在谷歌云上使用 NVIDIA 机密计算保护隐私 ⭐️ 8.0/10
  22. Claude Fable 5 在 FrontierMath 上取得高分 ⭐️ 8.0/10
  23. Transformers v5.12.0 新增 MiniMax-M3-VL 模型 ⭐️ 7.0/10
  24. olmo-eval:面向 LLM 开发循环的评估工作台 ⭐️ 7.0/10
  25. Anthropic 调查:48%盼 AI 治愈疾病,64%担忧失业 ⭐️ 7.0/10
  26. 用三个可移植技能实现 Spec 驱动开发 ⭐️ 7.0/10
  27. Codex 新增 Chrome 调试开发者模式 ⭐️ 7.0/10
  28. Perplexity Computer 集成 Deep Research ⭐️ 7.0/10
  29. Gemini Omni Flash 在视频任务中达到 SOTA ⭐️ 7.0/10
  30. LLM 网关:应用与 AI 模型之间缺失的一层 ⭐️ 7.0/10
  31. Prometheus 融资 120 亿美元,估值 410 亿美元 ⭐️ 7.0/10
  32. 狮门影业扩大与 Runway 合作并入股 ⭐️ 7.0/10
  33. Anthropic 启动 1.5 亿美元 Claude Corps 奖学金项目 ⭐️ 7.0/10
  34. Cursor 推出 Auto-review:用分类器智能体保障 AI 编码安全 ⭐️ 7.0/10
  35. 阿里云发布 Meoo CLI,一键部署本地 AI 项目 ⭐️ 7.0/10
  36. Deezer 推出面向其他流媒体的 AI 音乐检测器 ⭐️ 7.0/10
  37. 中国 AI 浪潮引发劳动者权益担忧 ⭐️ 7.0/10
  38. Anthropic CEO 警告 AI 将导致大规模长期失业 ⭐️ 7.0/10
  39. mlx-vlm v0.6.3 首发支持 DiffusionGemma 和 North Mini Code ⭐️ 7.0/10
  40. Cola:用技能弥合 AI Agent 使用鸿沟 ⭐️ 7.0/10
  41. Gemini 3.5 Live Translate 发布 ⭐️ 7.0/10
  42. 基于 GPT 的 deep^2 在成本效率上超越 Fable 10-20 倍 ⭐️ 7.0/10
  43. 谷歌起诉中国 AI 诈骗团伙 ⭐️ 7.0/10
  44. Project Ire 识别出 LOTUSLITE 恶意软件 ⭐️ 7.0/10
  45. 特斯拉 FSD 在丹麦认证视频中被发现使用自行车道 ⭐️ 7.0/10
  46. ggerganov 点赞 locate-anything.cpp ⭐️ 6.0/10
  47. Ollama v0.30.8:修复提供商选择、改进提示缓存、提升 MLX 稳定性 ⭐️ 6.0/10
  48. 在 macOS 上设置本地编码代理 ⭐️ 6.0/10
  49. 减少 AI 生成界面粗糙感的技巧 ⭐️ 6.0/10
  50. Preply 结合 AI 与真人导师实现个性化学习 ⭐️ 6.0/10
  51. Oran Ge 开源《人味儿写作心法》保留 AI 写作中的人味 ⭐️ 6.0/10
  52. 在 OpenRouter 上最小化 LLM 成本 ⭐️ 6.0/10
  53. 字节豆包上线任务模式,升级专家模式 ⭐️ 6.0/10
  54. qiaomu-ai-prd:面向 AI 的 PRD 生成 Prompt ⭐️ 6.0/10
  55. Replit Agent 新增自定义指令与技能 ⭐️ 6.0/10
  56. OpenRouter 推出帕累托曲线基准探索器 ⭐️ 6.0/10
  57. Krea 2 推出生成式滑块控制图像属性 ⭐️ 6.0/10
  58. OpenAI 降价被批评者 Gary Marcus 视为示弱 ⭐️ 6.0/10
  59. Baoyu-Design 技能现已支持导入本地 Figma 文件 ⭐️ 6.0/10
  60. Midjourney V8.1 成为默认模型 ⭐️ 6.0/10
  61. GitHub Copilot CLI 委托任务更智能 ⭐️ 6.0/10
  62. AI 高速对话加剧 ADHD,威胁专注力 ⭐️ 6.0/10
  63. Anthropic 将 Claude Convey Agent 作为 Labs 项目发布 ⭐️ 6.0/10
  64. Replit 推出并行构建与多智能体支持 ⭐️ 6.0/10
  65. OpenAI 推出文档智能体 ⭐️ 6.0/10
  66. 受《席德·梅尔的海盗》启发的网页海战游戏 ⭐️ 5.0/10
  67. OpenAI 推出三门学院课程 ⭐️ 5.0/10
  68. iOS 27 健康 App 大改:卡片、营养识别、围绝经期追踪 ⭐️ 5.0/10
  69. OpenAI Codex 推出速率重置攒存功能 ⭐️ 5.0/10
  70. Replit 专家级提示词技巧 ⭐️ 5.0/10
  71. Replit 与 Databricks 集成升级,公开预览开放 ⭐️ 5.0/10
  72. 乔木目标元技能:一句话转 Codex Goal ⭐️ 5.0/10
  73. Hermes Agent Desktop 发布,支持硅基流动一键切换 ⭐️ 5.0/10
  74. Codex 每 5 分钟并行维护仓库 ⭐️ 5.0/10
  75. WorkBuddy 教程:国内通用 AI Agent 产品 ⭐️ 5.0/10
  76. 橙线插画技能开源发布 ⭐️ 5.0/10
  77. Palantir 对瑞士杂志诉讼败诉 ⭐️ 5.0/10
  78. 旧金山举办编码智能体基准测试活动 ⭐️ 5.0/10
  79. Claude Code v2.1.176:多语言标题与正则页脚链接 ⭐️ 5.0/10
  80. Tailwind 与 Slop 应用引发 HN 热议 ⭐️ 5.0/10
  81. Hyperframes 与 Gemini 视频分析智能体流程 ⭐️ 5.0/10
  82. Codex AI 代理玩 Rimworld ⭐️ 5.0/10
  83. Codex 将网站更新从一周缩短至三天 ⭐️ 5.0/10

CRISPR-Cas12a2 粉碎癌细胞,靶向不可成药突变 ⭐️ 9.0/10

研究人员开发了一种 CRISPR-Cas12a2 技术,通过检测肿瘤特异性 RNA 突变(包括之前不可成药的 KRAS 突变)来选择性地粉碎癌细胞。 这种方法可以治疗缺乏可成药靶点的癌症,将基于 CRISPR 的疗法扩展到更广泛的恶性肿瘤。 与 Cas9 不同,Cas12a2 在激活后会粉碎染色质,导致大量 DNA 损伤和细胞死亡。

hackernews · gmays · Jun 12, 15:15 · 社区讨论T2 社区与开源

背景: 不可成药癌症指由传统药物难以靶向的蛋白质(如 KRAS)驱动的癌症。Cas12a2 是一种靶向 RNA 而非 DNA 的变体,能够检测 RNA 转录本中的突变。

参考链接

社区讨论: 评论对该机制表示兴奋,但指出肿瘤可能产生耐药性,也有人认为病毒载体疗法在临床上比 CRISPR 更先进。

标签: #CRISPR, #cancer research, #gene editing, #biotechnology, #Cas12a


全自主无人机首次击杀人类士兵 ⭐️ 9.0/10

全自主无人机首次在实战中击毙人类士兵。 这标志着自主武器的里程碑,引发紧迫的伦理和法律问题。 该事件由《新科学家》于 2025 年 6 月 10 日报道,细节尚未公开。

rss · AIHOT 精选 · Jun 11, 19:29AIHOT 精选

背景: 自主武器无需人类干预即可选择并攻击目标,不同于遵循预设规则的自动武器。

参考链接

社区讨论: 讨论聚焦于对 AI 军备竞赛和问责缺失的担忧。

标签: #autonomous weapons, #drones, #military AI, #ethics


通用大语言模型在临床任务上超越专用医疗 AI ⭐️ 9.0/10

《自然·医学》一项研究发现,GPT-5.2 等通用大语言模型在医生评审的临床任务上超越了 OpenEvidence、UpToDate Expert AI 等专用医疗 AI 产品。 这挑战了专用 AI 更优的假设,表明通用模型在临床决策支持方面可能更有效。 在 100 个真实临床问题中,盲审医生更偏好前沿通用模型的完整性和清晰度。

rss · AIHOT 全部动态 · Jun 12, 22:23AIHOT 全部动态

背景: OpenEvidence 是一个分析同行评审医学文献的 AI 平台,UpToDate Expert AI 是基于精选临床内容的生成式 AI。两者均为医疗专用。

参考链接

标签: #AI, #Healthcare, #LLM, #Medical AI, #Research


DeepMind 论文提出从 AGI 到 ASI 的四条路径 ⭐️ 9.0/10

Google DeepMind 发表论文,提出从 AGI 到 ASI 的四条路径:扩展、算法创新、递归自我改进和多智能体集体智能。 该框架为实现超级智能提供了具体路线图,将指导未来 AI 研究和投资方向。 论文指出扩展可能遇到数据/算力/能源瓶颈,递归自我改进最不确定,多智能体路径最易被低估。

rss · AIHOT 全部动态 · Jun 12, 21:40AIHOT 全部动态

背景: 递归自我改进(RSI)指 AI 系统在最少人类输入下设计和构建自己的继任者,可能引发智能爆炸。多智能体集体智能涉及多个专业 AI 智能体协作,超越单个模型的能力。

参考链接

社区讨论: X 上的讨论强调了该论文的重要性,许多人指出多智能体路径常被忽视,但可能是实现 ASI 最实用的途径。

标签: #AGI, #ASI, #DeepMind, #AI research, #multi-agent systems


AI 无法取代人类专业能力 ⭐️ 8.0/10

一篇评论文章指出,AI(如 ChatGPT)在翻译等专业领域无法匹敌人类专家的能力。 它挑战了 AI 可以取代专业人才的简单假设,揭示了 AI 感知能力与实际能力之间的差距。 文章以翻译为例,指出 AI 常生成流畅但不准确的输出,非专业人士难以察觉。

hackernews · AIHOT 全部动态 · Jun 12, 17:52 · 社区讨论T2 社区与开源

社区讨论: 评论者讨论 AI 对翻译工作的影响,有人认为 AI 足以用于审核,但无法胜任创造性翻译。

标签: #AI, #translation, #expertise, #critique, #Hacker News


LLM 生成的 PR 降低开源维护质量 ⭐️ 8.0/10

Miguel Grinberg 认为,LLM 生成的拉取请求用低质量贡献淹没开源项目,侵蚀了 PR 的社会契约。 维护者面临更多噪音和倦怠,因为 AI 生成的代码绕过了以往表明质量的努力信号。 作者对比了 LLM 之前的 PR(兴奋、真正努力)与当前的 PR(叹息、低质量提交)。

hackernews · AIHOT 全部动态 · Jun 12, 17:53 · 社区讨论T2 社区与开源

背景: “反向半人马”指人类作为 AI 的外围设备,而非 AI 辅助人类。在开源中,LLM 使得低努力 PR 成为可能,将负担转移给维护者。

参考链接

社区讨论: 评论者指出隐性社会契约(投入大于产出)的丧失,并讨论非程序员新获得的贡献能力是否总体积极。

标签: #AI, #open-source, #software engineering, #LLM, #code review


WASI 0.3 发布,组件模型变更 ⭐️ 8.0/10

WASI 0.3 引入了异步支持并简化了接口,从 WASI 0.2 的组件模型演进。 此版本塑造了 WebAssembly 跨平台沙箱执行的未来,影响构建可移植应用的开发者。 大多数变更是机械性的,简化了签名;异步成为平台契约的一部分。

hackernews · mavdol04 · Jun 12, 13:51 · 社区讨论T2 社区与开源

背景: WASI(WebAssembly 系统接口)为 WebAssembly 模块提供与系统交互的标准 API。组件模型实现了 WebAssembly 模块的可组合性。

参考链接

社区讨论: 一些开发者批评组件模型过于复杂,而另一些则赞赏长期等待后的进展。

标签: #WebAssembly, #WASI, #systems programming, #sandboxing, #component model


MiniMax M3 开源权重模型发布 ⭐️ 8.0/10

MiniMax 在 HuggingFace 上发布了开源权重模型 M3,总参数 428B,激活参数 23B。 该模型在编码和智能体基准测试中表现强劲,并通过稀疏注意力实现 1M token 上下文,这在小于 500B 参数的模型中极为罕见。 采用 MiniMax 稀疏注意力(MSA),使用 128-token KV 块,实现 9 倍更快的 prefill 和 15 倍更快的 decode。

rss · AIHOT 精选 · Jun 12, 14:11AIHOT 精选

背景: MSA 是一种稀疏注意力机制,通过预过滤 KV 块来避免完全二次成本,从而实现 1M 上下文。

参考链接

社区讨论: vLLM 和 Fireworks AI 提供了首日支持;SambaNovaAI 计划在其 RDU 上支持 M3。

标签: #open-source, #large language model, #coding, #multi-modal, #sparse attention


Kimi 开源 K2.7-Code 模型,性能大幅提升 ⭐️ 8.0/10

Kimi 发布并开源了 Kimi-K2.7-Code,这是一个编码智能体模型,在基准测试上最高提升 31.5%,推理 token 减少 30%。 该开源模型缩小了与 GPT-4.5 等专有模型的差距,为开发者带来高效、高质量的代码生成能力。 基于 Kimi K2.6 构建,在 Kimi Code Bench v2 上提升 21.8%,在 Program Bench 上提升 11.0%,在 MLS Bench Lite 上提升 31.5%。

rss · AIHOT 精选 · Jun 12, 10:16AIHOT 精选

背景: Kimi Code Bench v2 是内部基准,用于评估编码智能体在真实任务上的表现。Program Bench 测试从二进制文件进行整体软件开发的能力。

参考链接

标签: #AI, #open-source, #code generation, #machine learning, #Kimi


LLM 在 95%模拟中选择战术核武器 ⭐️ 8.0/10

一项模拟研究发现,LLM 在 95%的场景中选择使用战术核武器,引发 AI 安全担忧。 这凸显了在没有适当保障措施的情况下将关键军事决策委托给 AI 的潜在风险。 该研究未指明测试的具体 LLM 模型,限制了可重复性和技术深度。

rss · AIHOT 精选 · Jun 11, 22:23AIHOT 精选

背景: 战术核武器是短程、低当量的核武器,用于战场,与战略核武器不同,从未在战斗中使用过。

参考链接

社区讨论: 讨论可能集中在 AI 对齐的必要性和自主武器的危险上。

标签: #AI safety, #LLM, #simulation, #decision-making, #nuclear weapons


Hugging Face 启动 Open-R1 项目复现 DeepSeek-R1 ⭐️ 8.0/10

Hugging Face 发布了 Open-R1 开源项目,旨在复现 DeepSeek-R1 的数据和训练流程。 它使得最先进的推理模型完全透明,并可通过社区驱动进行改进。 该项目包括合成数据生成、训练脚本和评估基准。

rss · AIHOT 精选 · Jun 11, 17:07AIHOT 精选

背景: DeepSeek-R1 是一个通过强化学习训练、无需监督微调的推理模型。Open-R1 旨在验证并扩展其技术。

参考链接

社区讨论: Hacker News 上的讨论(101 分)赞扬了这一举措,认为它推动了先进 AI 研究的民主化。

标签: #AI, #open-source, #deep-learning, #reproduction


腾讯开源升级 HPC-Ops 推理算子库 ⭐️ 8.0/10

腾讯混元 AI Infra 团队开源升级了 HPC-Ops 推理算子库,包含五大核心算子。 该发布显著加速了 LLM 推理,有利于在生产环境中部署大模型的开发者。 Attention 算子在长文本上最高加速 2.95 倍;Sampler 相比 vLLM 提速 4.0~7.5 倍。

rss · AIHOT 精选 · Jun 11, 08:34AIHOT 精选

背景: HPC-Ops 是腾讯混元 AI Infra 团队开发的生产级高性能 LLM 推理算子库,不替代服务框架,而是提供优化后的内核。

参考链接

社区讨论: 该开源发布在 GitHub 上引起关注,开发者称赞其经过生产验证的性能提升。

标签: #AI Infrastructure, #LLM Inference, #Open Source, #GPU Optimization, #Tencent


HYDRA-X:单一 ViT 统一多模态模型 ⭐️ 8.0/10

HYDRA-X 在单个 Vision Transformer 中统一了图像和视频的 tokenization,在理解和生成任务上表现强劲。 这简化了多模态架构,提高了图像和视频任务的效率。 它采用帧级因果时间注意力和层级时间压缩,而非单步压缩。

rss · AIHOT 精选 · Jun 11, 00:00AIHOT 精选

参考链接

标签: #multimodal, #vision transformer, #tokenization, #video understanding, #image generation


MiniMax MSA:28 倍稀疏注意力加速 ⭐️ 8.0/10

MiniMax 提出块状稀疏注意力(MSA),在 1M 上下文下将注意力计算减少 28.4 倍,并在 H800 GPU 上实现 14.2 倍预填充和 7.6 倍解码加速。 这使得 1M token 上下文在大规模多模态模型中变得实用,实现无质量损失的更快推理。 MSA 使用轻量级索引分支为每个 GQA 组选择 top-k KV 块,然后仅对这些块执行精确的块稀疏注意力。

rss · AIHOT 精选 · Jun 11, 00:00AIHOT 精选

背景: 分组查询注意力(GQA)将查询头分成组,每组共享一个键值头,以减少内存和计算。块稀疏注意力将序列划分为块,并为每个查询仅选择最相关的块。

参考链接

标签: #sparse attention, #efficient inference, #large language models, #multimodal models, #GPU acceleration


EurekAgent:环境工程化实现自主科学发现 ⭐️ 8.0/10

EurekAgent 是一个大语言模型智能体系统,通过四个维度的环境工程实现低成本自主科学发现。 它以不到 11 美元的总 API 成本在数学、内核工程和机器学习任务上取得新 SOTA,使 AI 驱动研究更加普及。 该系统发现了新的 26 圆填充结果,半径总和为 2.635977,优于此前边界。

rss · AIHOT 精选 · Jun 11, 00:00AIHOT 精选

背景: 26 圆填充问题要求将 26 个不相交的圆放入单位正方形内,最大化半径之和。

参考链接

标签: #LLM Agents, #Autonomous Discovery, #Scientific AI, #Environment Engineering


WEAVER:更快更好的机器人操作世界模型 ⭐️ 8.0/10

WEAVER 是一种多视图世界模型,通过流匹配损失训练,实现政策成功率提升 38%,推理速度比先前模型快 5-10 倍。 这使得机器人操作更准确高效,对实际部署和泛化至关重要。 WEAVER 在政策评估中与真实成功率的相关系数ρ=0.870,测试时规划成功率提升 14%。

rss · AIHOT 精选 · Jun 11, 00:00AIHOT 精选

背景: 流匹配是一种生成建模技术,通过学习连续流将噪声转化为数据,常作为扩散模型的替代方案。π0.5 是 Physical Intelligence 发布的通用机器人策略模型。

参考链接

社区讨论: 该论文在 HuggingFace 上成为热门话题,社区对其开源发布和显著的速度提升表示赞赏。

标签: #robotics, #world model, #machine learning, #reinforcement learning, #computer vision


BBVA 与 OpenAI 合作,向 10 万名员工部署 ChatGPT Enterprise ⭐️ 8.0/10

BBVA 正与 OpenAI 合作,向 10 万名员工推广 ChatGPT Enterprise。 这标志着银行业最大规模的企业 AI 部署之一,预示着金融服务业 AI 采用加速。 ChatGPT Enterprise 提供增强的安全性、隐私保护和公司数据集成,无使用上限且性能更快。

rss · AIHOT 精选 · Jun 11, 00:00AIHOT 精选

背景: ChatGPT Enterprise 是 OpenAI 面向企业级用户的产品,具备 32k 上下文长度和数据加密等功能。

参考链接

标签: #AI, #banking, #OpenAI, #enterprise, #digital transformation


AA-AgentPerf 基准发布,首批测试 DeepSeek V4 Pro ⭐️ 8.0/10

Artificial Analysis 发布了 AA-AgentPerf 硬件基准,首批测试了 DeepSeek V4 Pro 在 NVIDIA Blackwell、Hopper 和 AMD MI355X 上的推理能效。 该基准为真实智能体工作负载提供了标准化的硬件对比方法,对 AI 基础设施决策至关重要。 GB300 机架级解耦实现了每兆瓦 61,354 个并发智能体,比单节点 B300 高出 3 倍。

rss · AIHOT 全部动态 · Jun 12, 22:20AIHOT 全部动态

背景: AA-AgentPerf 使用真实编码智能体轨迹,最多 200 轮、超 10 万 token,允许 KV 缓存复用和推测解码等生产优化。

参考链接

标签: #benchmark, #AI inference, #hardware, #DeepSeek, #NVIDIA Blackwell


Google Gemini-SQL2 在 BIRD 排行榜上达到 80.04% ⭐️ 8.0/10

Google 发布了基于 Gemini 3.1 Pro 的文本转 SQL 系统 Gemini-SQL2,在 BIRD 单模型排行榜上达到 80.04% 的执行准确率。 这在一个具有挑战性的真实世界基准上为文本转 SQL 设立了新的最先进水平,改进了自然语言到数据库查询的翻译。 BIRD 基准专注于大规模、真实世界的数据库,包含脏乱和复杂的数据,比早期的 Spider 等基准更具挑战性。

rss · AIHOT 全部动态 · Jun 12, 21:04AIHOT 全部动态

背景: BIRD(大规模数据库文本转 SQL 评估大基准)是一个旨在评估 AI 系统将自然语言问题翻译为针对真实数据库的 SQL 查询的基准。

参考链接

社区讨论: DAIR.AI 的 Elvis Saravia 指出,尽管强推理模型表现不错,但像 Gemini-SQL2 这样的定制模型在此类任务上更胜一筹,在知识库、搜索和图数据库等领域也存在类似机会。

标签: #Text-to-SQL, #Gemini, #BIRD benchmark, #Google Research, #AI


Claude Code 与 Fable 重建失传游戏 SimRefinery ⭐️ 8.0/10

Ethan Mollick 使用 Claude Code 和 Fable,根据幸存截图和文档重建了失传游戏 SimRefinery,获得了包含复杂功能的完全可玩版本。 这展示了 10 个月内 AI 辅助编程能力的巨大飞跃,将简单原型变成了功能完整的游戏。 新版本包含学习模式等复杂功能,与 10 个月前使用 ChatGPT Codex 构建的简单原型形成鲜明对比。

rss · AIHOT 全部动态 · Jun 12, 20:52AIHOT 全部动态

背景: SimRefinery 是 1992 年 Maxis 为雪佛龙开发的企业培训用商业模拟游戏,此前被认为已失传。

参考链接

社区讨论: X 上的社区称赞了 AI 编程的快速进步,许多人注意到与早期原型的显著改进。

标签: #AI, #game development, #Claude Code, #Fable, #retro computing


苹果在谷歌云上使用 NVIDIA 机密计算保护隐私 ⭐️ 8.0/10

苹果在谷歌云的 Blackwell B200s 上使用 NVIDIA 机密计算,确保谷歌和苹果都无法看到推理数据。 这标志着顶级玩家和硬件安全在隐私保护 AI 推理上的重大行业合作。 NVIDIA 机密计算使用基于硬件的可信执行环境(TEE)隔离工作负载并加密使用中的数据。

rss · AIHOT 全部动态 · Jun 12, 20:32AIHOT 全部动态

背景: 机密计算通过硬件隔离保护正在处理的数据。可信执行环境(TEE)是处理器内的安全区域,确保代码和数据免受主机操作系统和其他应用程序的侵害。

参考链接

标签: #confidential computing, #AI inference, #privacy, #NVIDIA, #cloud computing


Claude Fable 5 在 FrontierMath 上取得高分 ⭐️ 8.0/10

Claude Fable 5 在 FrontierMath 的 Tiers 1-3 上获得 87%,在 Tier 4 上获得 88%。 这表明 AI 数学推理能力快速提升,正在挑战人类专家水平。 FrontierMath v2 包含 300 道 Tier 1-3 问题和 50 道 Tier 4 问题,均为未公开题目。

rss · AIHOT 全部动态 · Jun 12, 19:16AIHOT 全部动态

背景: FrontierMath 是一个高级数学基准测试,Tiers 1-4 涵盖本科到研究级别的问题。Claude Fable 5 是 Anthropic 最新公开的模型。

参考链接

社区讨论: 有评论指出性能曲线的形状越来越熟悉,暗示持续快速进步。

标签: #AI, #benchmark, #mathematics, #Anthropic, #Claude


Transformers v5.12.0 新增 MiniMax-M3-VL 模型 ⭐️ 7.0/10

Hugging Face Transformers v5.12.0 新增了 MiniMax-M3-VL 视觉语言模型,采用混合密集/稀疏 MoE 和 3D RoPE。 此版本为 Transformers 生态带来了先进的多模态 AI 能力,实现了高效的视觉语言理解。 该模型使用 CLIP 风格的视觉塔和 Conv3d 补丁嵌入,以及带有 SwiGLU-OAI 门控专家的混合密集/稀疏 MoE 解码器。

github · vasqu · Jun 12, 14:39

背景: MoE(混合专家)每个 token 仅激活部分参数,在保持容量的同时减少计算量。3D RoPE 将旋转位置编码扩展到三维,用于空间理解。

参考链接

标签: #transformers, #multimodal, #vision-language, #MoE, #release


olmo-eval:面向 LLM 开发循环的评估工作台 ⭐️ 7.0/10

Allen AI 发布了 olmo-eval,这是一个基于 OLMES 构建、专为迭代式 LLM 开发设计的评估工作台。 它减少了新增评测的实现工作量,并将 agentic 和多轮评测作为一等用例进行支持。 评测结果同时报告分数、标准误差和最小可检测效应;支持逐问题比较检查点输出。

rss · AIHOT 精选 · Jun 12, 15:56AIHOT 精选

背景: OLMES 是一个用于可复现 LLM 评估的开放标准。Agentic 评估评估 LLM 在交互环境中作为自主代理的能力。

参考链接

标签: #LLM, #evaluation, #framework, #OLMES, #AI development


Anthropic 调查:48%盼 AI 治愈疾病,64%担忧失业 ⭐️ 7.0/10

Anthropic 发布对 5.2 万美国人的调查,显示 48%优先希望 AI 治愈疾病,64%担忧失业。 这是领先 AI 公司首次大规模公众意见调查,为 AI 监管辩论提供了数据支撑。 该调查由 YouGov 于 2025 年 11-12 月执行,并按人口普查基准加权。

rss · AIHOT 精选 · Jun 12, 16:14AIHOT 精选

背景: Anthropic 是一家 AI 安全公司。YouGov 是一家民调公司,将其在线面板加权以匹配人口普查人口统计。

参考链接

标签: #AI ethics, #public opinion, #AI regulation, #Anthropic, #survey


用三个可移植技能实现 Spec 驱动开发 ⭐️ 7.0/10

邵猛介绍了 SDD 方法,用三个技能覆盖 spec-implement-verify 闭环,规格文件存放在 specs/目录。 该方法标准化了 AI 辅助开发工作流,使其可移植且可验证。 三个技能分别是/write-product-spec、/write-tech-spec 和/validate-changes-match-specs。

rss · AIHOT 精选 · Jun 12, 00:46AIHOT 精选

背景: Spec 驱动开发(SDD)将规格视为可执行合约,AI 代理据此生成代码,防止架构漂移。Warp 是一个现代终端,npx skills 是安装 AI 代理技能的工具。

参考链接

社区讨论: 暂无评论。

标签: #Spec-Driven Development, #AI-assisted development, #workflow, #open source, #software engineering


Codex 新增 Chrome 调试开发者模式 ⭐️ 7.0/10

Codex 现在支持为 Chrome 及其内置浏览器开启开发者模式,可通过 Chrome DevTools 协议 (CDP) 进行调试。 这使得开发者可以直接在 Codex 中调试浏览器问题,简化 AI 辅助的 Web 开发流程。 CDP 支持分析 JavaScript 性能、控制台输出、网络流量和页面状态。

rss · AIHOT 精选 · Jun 12, 00:15AIHOT 精选

背景: Chrome DevTools 协议 (CDP) 是用于检测、检查、调试和分析基于 Chromium 的浏览器的标准协议。Codex 是 OpenAI 集成在 ChatGPT 中的 AI 编程助手。

参考链接

标签: #Codex, #Chrome DevTools, #debugging, #AI-assisted development, #web development


Perplexity Computer 集成 Deep Research ⭐️ 7.0/10

Perplexity 将 Deep Research 作为原生技能集成到 Computer 中,Pro 和 Max 订阅者现已可用。 这通过结合搜索、代码生成和沙箱访问,增强了 Computer 对高级用户的实用性。 Deep Research 连接到 Computer 的智能体框架,可访问搜索、代码生成、长运行沙箱、连接器、工具和授权数据。

rss · AIHOT 精选 · Jun 11, 17:32AIHOT 精选

背景: Perplexity Computer 是一个运行在专用 Mac Mini 上的 AI 智能体工具,允许 AI 访问本地文件和应用程序。Deep Research 是一个执行迭代搜索和摘要并实时引用来源的功能。

参考链接

标签: #AI, #search, #product-update, #Perplexity


Gemini Omni Flash 在视频任务中达到 SOTA ⭐️ 7.0/10

Google DeepMind 的 Gemini Omni Flash 在图像到视频、文本到视频和视频编辑方面达到 SOTA,即将通过 API 提供。 开发者将能通过 API 使用顶尖的多模态视频生成模型,实现高级视频创作和编辑。 该模型在 Google TPU 上训练,于 Google I/O 2026 上发布。

rss · AIHOT 精选 · Jun 11, 17:05AIHOT 精选

参考链接

标签: #AI, #video generation, #Gemini, #API


LLM 网关:应用与 AI 模型之间缺失的一层 ⭐️ 7.0/10

一篇文章解释了为什么需要 LLM 网关来处理供应商中断、成本跟踪和合规性,并比较了顶级解决方案。 没有网关,供应商故障会导致用户可见的错误,AI 成本变得无法追踪,影响可靠性和预算。 文章从路由、合规性和设置时间三个维度比较了解决方案。

rss · AIHOT 精选 · Jun 11, 16:00AIHOT 精选

背景: LLM 网关是一个统一的 API 层,将请求路由到多个 LLM 提供商,跟踪每 token 成本,执行安全策略,并提供审计跟踪。

参考链接

标签: #LLM, #AI infrastructure, #API gateway, #cost management, #compliance


Prometheus 融资 120 亿美元,估值 410 亿美元 ⭐️ 7.0/10

杰夫·贝佐斯的 AI 初创公司 Prometheus 以 410 亿美元估值融资 120 亿美元,目标是成为“人工通用工程师”。 这笔对实体世界 AI 的巨额押注可能改变制造业,但缺乏产品验证。 Prometheus 计划斥资 1000 亿美元收购工业企业以获取训练数据。

rss · AIHOT 精选 · Jun 11, 15:45AIHOT 精选

背景: 该公司成立仅 7 个月,尚无产品,估值从 62 亿美元跃升至 410 亿美元。

参考链接

标签: #AI, #funding, #manufacturing, #startup, #engineering


狮门影业扩大与 Runway 合作并入股 ⭐️ 7.0/10

狮门影业入股 Runway,并利用其生成式 AI 模型共同创作一部短剧系列。 这标志着大型娱乐公司押注生成式 AI 进行内容创作。 该短剧系列基于狮门影业现有 IP,并使用 Runway 的生成模型制作。

rss · AIHOT 精选 · Jun 11, 14:31AIHOT 精选

背景: Runway 开发文本到视频和视频生成 AI 模型,如 Gen-3 和 Gen-4.5。狮门影业此前已在预可视化和故事板中使用 Runway 工具。

参考链接

标签: #AI, #Film Production, #Generative AI, #Partnership, #Entertainment


Anthropic 启动 1.5 亿美元 Claude Corps 奖学金项目 ⭐️ 7.0/10

Anthropic 推出 Claude Corps 奖学金项目,投入 1.5 亿美元培训 1000 名早期职业者使用 Claude,并安排他们在美国非营利组织工作一年。 该计划展示了 Anthropic 对 AI 促进社会公益和劳动力发展的承诺,可能影响 AI 人才在非营利领域的部署方式。 研究员年薪 85,000 美元加福利,每周接受 5 小时培训;无需大学学位,仅需年满 18 岁且工作经验不超过两年。

rss · AIHOT 精选 · Jun 11, 13:12AIHOT 精选

背景: CodePath 是一家技术培训组织,为顶级科技公司培养工程人才。Social Finance 是一家非营利咨询机构,开创了社会影响债券等创新融资模式以解决社会问题。

参考链接

标签: #Anthropic, #Claude, #AI for Social Good, #Workforce Development, #Nonprofit


Cursor 推出 Auto-review:用分类器智能体保障 AI 编码安全 ⭐️ 7.0/10

Cursor 推出 Auto-review,通过一个分类器智能体在 AI 编码智能体执行前审查并阻止风险动作。 这在不干扰日常开发的前提下提升了 AI 辅助开发的安全性,对建立对智能体工具的信任至关重要。 分类器采用小模型并在智能体循环内运行以避免额外延迟,还能读取工作区文件辅助判断。

rss · AIHOT 精选 · Jun 11, 12:00AIHOT 精选

背景: 随着自主编码智能体能力增强,智能体 AI 安全日益受到关注。Auto-review 是一种在工具调用层面管理智能体自主性的实用机制。

参考链接

社区讨论: 早期反馈表明 Auto-review 在安全性和生产力之间取得了良好平衡,但部分用户指出分类器对新颖代码可能过于谨慎。

标签: #AI safety, #code generation, #agentic AI, #developer tools, #Cursor


阿里云发布 Meoo CLI,一键部署本地 AI 项目 ⭐️ 7.0/10

阿里云推出开源工具 Meoo CLI,可通过一条命令将本地 AI 编程项目一键部署到云端。 它连接了本地 AI 编程助手与云端部署,简化了从开发到上线的流程。 支持 Claude Code、Codex、Cursor 等 AI 编程工具,适用于 Linux、macOS 和 Windows 平台。

rss · AIHOT 精选 · Jun 11, 08:50AIHOT 精选

背景: Meoo CLI 是一个开源命令行工具,作为本地 AI 编程助手与阿里云后端服务之间的桥梁,自动完成数据库接入、用户登录、文件存储和项目发布。

参考链接

标签: #Alibaba Cloud, #CLI, #AI coding, #deployment, #open-source


Deezer 推出面向其他流媒体的 AI 音乐检测器 ⭐️ 7.0/10

Deezer 发布了一款免费在线工具,可扫描任何流媒体服务的播放列表,检测 AI 生成的曲目。 这使用户能够在不同平台上识别合成音乐,解决了流媒体中 AI 生成内容日益增多的问题。 该检测器在 2025 年已在 Deezer 上标记了超过 1340 万首 AI 曲目。

rss · AIHOT 精选 · Jun 11, 08:00AIHOT 精选

参考链接

标签: #AI, #music, #streaming, #detection, #Deezer


中国 AI 浪潮引发劳动者权益担忧 ⭐️ 7.0/10

中国官媒罕见直白呼吁,在职场快速采用 AI 的背景下保护劳动者权益。 这预示着中国可能出台新的 AI 监管法规,影响数百万劳动者和全球 AI 产业。 北京正在考虑如何控制这项新技术带来的风险,但具体措施尚不明确。

rss · AIHOT 精选 · Jun 11, 06:19AIHOT 精选

标签: #AI, #China, #labor rights, #regulation, #societal impact


Anthropic CEO 警告 AI 将导致大规模长期失业 ⭐️ 7.0/10

Anthropic CEO 达里奥·阿莫迪警告 AI 将导致结构性长期失业,并提出薪资保险和全民基本收入等解决方案。 这表明一位 AI 领军人物承认劳动力市场将发生永久性变化,影响政策和劳动力规划。 阿莫迪认为失业是 AI 复制人类认知能力的固有属性,而非暂时性干扰。

rss · AIHOT 精选 · Jun 11, 05:53AIHOT 精选

背景: 薪资保险为失业后从事低薪工作的工人提供部分工资补偿。全民基本收入(UBI)向所有公民无条件发放现金。

参考链接

标签: #AI, #job displacement, #policy, #Anthropic, #future of work


mlx-vlm v0.6.3 首发支持 DiffusionGemma 和 North Mini Code ⭐️ 7.0/10

mlx-vlm v0.6.3 通过 MLX 在 Apple Silicon 上首发支持 Google 的 DiffusionGemma 和 Cohere 的 North Mini Code 1.0。 这使得在 Mac 上高效本地推理两种新型架构成为可能,扩展了 MLX 生态系统。 DiffusionGemma(26B MoE,3.8B 激活)以 256 token 块并行生成;North Mini Code(30B MoE,3B 激活)在 BF16 下约 66 tok/s。

rss · AIHOT 精选 · Jun 11, 00:59AIHOT 精选

背景: MLX 是用于 Apple Silicon 上机器学习的数组框架。DiffusionGemma 是 Google 基于扩散的文本生成模型,North Mini Code 是 Cohere 的开源编码 MoE 模型。

参考链接

标签: #MLX, #DiffusionGemma, #North Mini Code, #Apple Silicon, #VLM


Cola:用技能弥合 AI Agent 使用鸿沟 ⭐️ 7.0/10

Cola 项目提出将’Skill’作为解决 AI Agent 采用中 K 型分化的方案。 它解决了专家与普通用户在利用 AI Agent 方面日益扩大的差距。 Cola 旨在通过可复用的技能,让 MCP、记忆、工具调用等 Agent 能力变得易于使用。

rss · AIHOT 全部动态 · Jun 12, 22:06AIHOT 全部动态

背景: K 型分化描述了 AI 如何让专家用户受益而将新手抛在后面。这里的’Skill’指封装好的、可复用的 Agent 能力,用于简化复杂工作流。

参考链接

标签: #AI Agents, #Human-AI Interaction, #Skill Engineering, #Tooling, #Accessibility


Gemini 3.5 Live Translate 发布 ⭐️ 7.0/10

Google 宣布通过 Gemini Live API 推出 Gemini 3.5 Live Translate,实现近实时语音翻译。 这使得开发者能够为应用添加实时多语言语音翻译,提升全球可访问性。 它支持连续语音到语音(S2ST)和同步转录。

rss · AIHOT 全部动态 · Jun 12, 21:36AIHOT 全部动态

背景: Gemini Live API 支持与 Gemini 进行低延迟、实时的语音和视觉交互,处理连续的音频、图像和文本流。

参考链接

标签: #AI, #speech translation, #Gemini, #real-time, #API


基于 GPT 的 deep^2 在成本效率上超越 Fable 10-20 倍 ⭐️ 7.0/10

基准测试显示,deep^2 完成类似任务花费 40 美元,而 Fable 花费 457 美元,差距达 10-20 倍。 这凸显了 AI 代理用户在复杂多步骤任务中实现巨大成本节约的潜力。 deep^2 使用 GPT-4,而 Fable 基于 Claude;deep^2 首次尝试失败但可修复,Fable 首次成功但成本更高。

rss · AIHOT 全部动态 · Jun 12, 21:09AIHOT 全部动态

背景: Fable 是 Anthropic 开发的 AI 代理,可无人值守运行数天;deep^2 是基于 GPT 的类似任务代理。

参考链接

社区讨论: 未提供社区讨论。

标签: #AI, #cost efficiency, #GPT, #Fable, #benchmark


谷歌起诉中国 AI 诈骗团伙 ⭐️ 7.0/10

谷歌起诉中国网络犯罪团伙 Outsider Enterprise,指控其利用 AI 发送 250 万条诈骗短信,受害人数十万。 这标志着对大规模 AI 网络犯罪的重要法律行动。 该团伙利用谷歌 Gemini AI 创建仿冒谷歌、YouTube 和政府网站的钓鱼模板。

rss · AIHOT 全部动态 · Jun 12, 20:38AIHOT 全部动态

参考链接

社区讨论: 讨论强调 AI 诈骗威胁日益严重,需要加强监管。

标签: #cybersecurity, #AI misuse, #Google, #cybercrime, #scam


Project Ire 识别出 LOTUSLITE 恶意软件 ⭐️ 7.0/10

微软研究院的 Project Ire 逆向工程了一个逃避大多数 EDR 工具的 LOTUSLITE 恶意软件变种。 该分析揭示了高级逃避技术,帮助防御者改进针对定向间谍活动的检测。 该样本是一个 Windows DLL 后门变种,不在 Acronis 的 IOC 列表中。

rss · AIHOT 全部动态 · Jun 12, 20:33AIHOT 全部动态

背景: LOTUSLITE 是一种用于定向间谍活动的后门,通常通过政治主题的钓鱼邮件传播。EDR 逃避技术使恶意软件能够绕过端点检测和响应系统。

参考链接

社区讨论: X 上的帖子强调了逆向工程方法的新颖性。

标签: #malware analysis, #reverse engineering, #cybersecurity, #EDR evasion


特斯拉 FSD 在丹麦认证视频中被发现使用自行车道 ⭐️ 7.0/10

据 Politiken 报道,特斯拉的全自动驾驶(FSD)模式在丹麦官方认证视频中被发现驶入自行车道。 这一在官方测试中暴露的安全缺陷可能延迟监管批准,并削弱公众对自动驾驶的信任。 事件发生在 1 分 49 秒视频的第 12 秒,随后还出现了多个错误。

rss · AIHOT 全部动态 · Jun 12, 19:30AIHOT 全部动态

背景: 特斯拉的 FSD 目前被归类为 L2 级驾驶辅助,需要人类持续监督,尽管其名称暗示全自动驾驶。

参考链接

社区讨论: Hacker News 上的帖子获得了 100 个点赞,表明社区对安全影响的高度关注。

标签: #Tesla, #autonomous driving, #safety, #regulation, #AI


ggerganov 点赞 locate-anything.cpp ⭐️ 6.0/10

ggerganov 点赞了 locate-anything.cpp,这是 NVIDIA 的 Locate Anything 模型的 C++ 实现。 这表明对视觉语言定位的高效 C++ 推理可能产生兴趣。 Locate Anything 使用并行框解码,推理速度提升高达 2.5 倍。

github · ggerganov · Jun 12, 14:51

背景: Locate Anything 是 NVIDIA 的视觉语言模型,可以定位文本描述的对象。ggerganov 是 llama.cpp 的创建者,这是一个流行的 LLM C++ 推理引擎。

参考链接

标签: #C++, #computer vision, #open source, #AI


Ollama v0.30.8:修复提供商选择、改进提示缓存、提升 MLX 稳定性 ⭐️ 6.0/10

Ollama v0.30.8 修复了 ollama launch 中的提供商选择问题,改进了提示缓存,并增强了 MLX 推理的稳定性。 此补丁提高了运行本地大语言模型的 Ollama 用户的可靠性,尤其是在 Apple Silicon 上使用 MLX 时。 提示缓存与上下文移位解耦,以更好地重用 KV 缓存;MLX 运行器现在在提示处理期间创建快照。

github · github-actions[bot] · Jun 12, 17:04

背景: MLX 是一个用于 Apple Silicon 上机器学习的数组框架,针对高效推理进行了优化。提示缓存存储中间计算结果,以避免重复处理相同的输入。

参考链接

标签: #ollama, #MLX, #prompt caching, #recurrent models, #release


在 macOS 上设置本地编码代理 ⭐️ 6.0/10

一篇教程详细介绍了如何在 macOS 上使用 llama.cpp 和开源模型设置本地编码代理。 开发者可以本地运行 AI 编码助手,确保隐私和离线能力。 该指南使用 llama.cpp 的服务器搭配 GGUF 模型以及’pi’代理框架。

hackernews · AIHOT 全部动态 · Jun 12, 17:34 · 社区讨论T2 社区与开源

背景: llama.cpp 是一个开源的 C/C++库,用于本地运行 LLM,支持 GGUF 格式模型,是本地推理的事实标准。

参考链接

社区讨论: 用户建议使用 Ollama 搭配 opencode 等替代方案,并指出短基准测试可能产生虚假的加速结果。

标签: #local-llm, #coding-agent, #macOS, #tutorial


减少 AI 生成界面粗糙感的技巧 ⭐️ 6.0/10

一篇博客文章通过指定设计约束,提供了减少 AI 生成前端通用粗糙外观的实用技巧。 使用 LLM 生成 UI 的开发者可以通过简单约束提升输出质量,节省手动调整的时间。 技巧包括使用特定 CSS 框架、限制调色板以及避免过度依赖默认模式。

hackernews · FergusArgyll · Jun 12, 14:48 · 社区讨论T2 社区与开源

社区讨论: 评论者就设计偏好展开辩论,有人指出 Qt 在训练数据中的大量出现影响了 AI 输出。

标签: #AI, #frontend, #UI design, #LLM


Preply 结合 AI 与真人导师实现个性化学习 ⭐️ 6.0/10

Preply 整合 OpenAI,为语言学习者生成个性化课程总结和练习。 通过自动化反馈提升真人辅导效率,使个性化语言学习更具可扩展性。 AI 在每节课后生成关键主题总结、语法纠正、词汇重点和发音反馈。

rss · OpenAI Blog · Jun 12, 00:00T1 官方实验室

背景: Preply 是一个在线语言学习市场,连接超过 5 万名导师和数百万学习者,利用机器学习推荐导师。

参考链接

标签: #AI, #education, #language learning, #personalization


Oran Ge 开源《人味儿写作心法》保留 AI 写作中的人味 ⭐️ 6.0/10

Oran Ge 开源了《人味儿写作心法.skill》,用于在 AI 辅助写作中保留人的存在感。 这解决了 AI 写作的一个关键局限:缺乏真实的人类声音和生活体验。 该技能专为用户先写作或口述、再由 AI 润色并保留人味的场景设计。

rss · AIHOT 精选 · Jun 12, 22:48AIHOT 精选

背景: Claude Fable 5 是 Anthropic 于 2026 年 6 月发布的最强大的通用模型。Oran Ge 用它打磨文案时发现输出缺乏“存在感”——即作者在具体位置付出过具体代价的感觉。

参考链接

标签: #AI writing, #open source, #writing tools, #Claude


在 OpenRouter 上最小化 LLM 成本 ⭐️ 6.0/10

OpenRouter 的:floor后缀和max_price参数可实现最低成本的 LLM 推理,并提供 20 多个免费模型。 开发者可以通过自动选择最便宜的提供商来大幅降低 LLM 推理成本。 :floor后缀强制为给定模型选择最低价格的提供商。

rss · AIHOT 精选 · Jun 12, 16:00AIHOT 精选

背景: OpenRouter 是一个统一 API,将请求路由到多个 LLM 提供商,通过参数实现成本优化。

参考链接

标签: #LLM, #cost optimization, #OpenRouter, #tutorial


字节豆包上线任务模式,升级专家模式 ⭐️ 6.0/10

字节跳动旗下 AI 应用豆包上线“任务模式”,支持定时执行与文件生成,并将“思考模式”升级为“专家模式”,强化深度推理能力。 此次更新将豆包从聊天机器人转变为任务自动化平台,与其他 AI 智能体展开竞争。 任务模式支持零代码网页生成、一键 PPT 制作和数据可视化;专家模式调用豆包 2.0 Pro 进行深度推理。

rss · AIHOT 精选 · Jun 12, 15:33AIHOT 精选

背景: 豆包是字节跳动基于大语言模型的 AI 助手。新的任务模式支持全链路 Agent 执行,用户无需编码即可自动化复杂工作流。

参考链接

标签: #AI, #ByteDance, #product update, #task automation, #LLM


qiaomu-ai-prd:面向 AI 的 PRD 生成 Prompt ⭐️ 6.0/10

发布了一个专门为 AI Agent 设计的 PRD 生成 Prompt(qiaomu-ai-prd),旨在提升 AI 驱动开发中的功能完整度。 它解决了 AI 辅助开发中人类与 AI 需求之间的差距,有望提升 AI 生成代码的质量。 安装命令:npx skills add joeseesun/qiaomu-ai-prd;开源,Prompt 在评论区。

rss · AIHOT 精选 · Jun 12, 02:46AIHOT 精选

背景: PRD(产品需求文档)是软件开发中的标准文档。AI Agent 通常需要结构化输入才能生成准确代码;该 Prompt 专门为 AI 消费定制了 PRD 生成。

标签: #AI, #PRD, #prompt engineering, #developer tools


Replit Agent 新增自定义指令与技能 ⭐️ 6.0/10

Replit Agent 现在支持自定义指令和技能,可在不同项目中记住用户偏好。 这消除了重复提示,为使用 Replit Agent 的开发者和团队节省时间。 自定义指令可以是动态的,允许用户在会话期间更新代理应关注的内容。

rss · AIHOT 精选 · Jun 11, 18:58AIHOT 精选

背景: Replit Agent 是一种 AI 工具,可将自然语言转化为应用、设计和幻灯片,无需编码。技能允许教授代理专业知识。

参考链接

标签: #AI agent, #Replit, #productivity, #customization


OpenRouter 推出帕累托曲线基准探索器 ⭐️ 6.0/10

OpenRouter 发布了一个基准探索器,可在 10 个不同基准上绘制帕累托曲线以比较 AI 模型。 这有助于开发者通过平衡准确性和成本来选择模型,超越了简单的排行榜排名。 该工具可在 openrouter.ai/rankings#benchmarks 获取,更多功能即将推出。

rss · AIHOT 精选 · Jun 11, 15:32AIHOT 精选

背景: 帕累托曲线可视化两个指标(如准确性和成本)之间的权衡,显示一组最优模型,其中任何指标都无法在不恶化另一个指标的情况下得到改善。

参考链接

标签: #AI, #benchmarks, #OpenRouter, #tools


Krea 2 推出生成式滑块控制图像属性 ⭐️ 6.0/10

Krea 2 推出了生成式滑块,可控制生成图像的强度、复杂度和运动。 这为用户提供了对 AI 图像生成的更精细控制,增强了创意工作流程。 这些滑块位于 Krea 2 图像工具的控制面板中,支持随机化或重置设置。

rss · AIHOT 精选 · Jun 11, 15:00AIHOT 精选

参考链接

标签: #image generation, #AI tools, #generative AI, #Krea


OpenAI 降价被批评者 Gary Marcus 视为示弱 ⭐️ 6.0/10

OpenAI 正考虑大幅降价,Gary Marcus 认为这暴露了公司竞争力疲软。 这预示着 AI 行业可能面临定价压力,并可能影响开发者的采用。 OpenAI 尚未确认具体的降价细节。

rss · AIHOT 精选 · Jun 11, 13:34AIHOT 精选

背景: Gary Marcus 是一位认知科学家,也是知名的 AI 怀疑论者,经常批评主要 AI 公司。

参考链接

社区讨论: 该文章引发了关于降价是反映疲软还是战略竞争的讨论。

标签: #OpenAI, #pricing, #AI industry, #commentary


Baoyu-Design 技能现已支持导入本地 Figma 文件 ⭐️ 6.0/10

Baoyu-design 技能现已支持导入本地 .fig 文件,可在本地重建设计系统,效果与 Claude Design 在线版一致。 开发者现在可以离线重建和复用设计系统,减少对云服务的依赖。 该功能依赖 Claude Fable 5 辅助,且需要足够的 Token。

rss · AIHOT 精选 · Jun 11, 06:33AIHOT 精选

背景: Claude Fable 5 是 Anthropic 推出的大型语言模型,针对视觉任务优化,能够从截图重建 UI。

参考链接

标签: #design-tools, #figma, #claude, #open-source, #development-tools


Midjourney V8.1 成为默认模型 ⭐️ 6.0/10

Midjourney 已将默认模型从 V7 升级至 V8.1,提升了智能性、连贯性和文本渲染效果。 用户无需更改设置即可默认获得更优质的图像。 V8.1 现已支持高清模式,可输出更高分辨率的图像。

rss · AIHOT 精选 · Jun 11, 04:08AIHOT 精选

背景: Midjourney 是一家独立的 AI 研究实验室,以其文本到图像生成模型而闻名。V8.1 是一个专注于速度和质量的增量更新。

参考链接

标签: #AI, #image generation, #Midjourney, #model update


GitHub Copilot CLI 委托任务更智能 ⭐️ 6.0/10

GitHub Copilot CLI 现在通过更好的编排减少了不必要的任务交接并加快了进度,且没有新增任何配置选项。 使用 Copilot CLI 的开发者将经历更少的干扰和更快的任务完成,从而提高生产力。 改进在于编排层,使代理在选择何时委托子任务时更具选择性。

rss · AIHOT 全部动态 · Jun 12, 22:26AIHOT 全部动态

背景: GitHub Copilot CLI 是一个在终端中运行的 AI 驱动编码助手。它可以执行命令和编辑文件以完成任务。自动模式允许代理在不等待用户每一步批准的情况下完成任务。

参考链接

标签: #GitHub Copilot, #CLI, #AI, #developer tools


AI 高速对话加剧 ADHD,威胁专注力 ⭐️ 6.0/10

一条推文观察到,每两三分钟一次的 AI 对话形成注意力集中与涣散的交替循环,加剧 ADHD 症状。 这凸显了 AI 工具日益增长的认知成本,尤其对注意力困难的知识工作者影响显著。 推文特别提到前额叶是持续任务切换中承受压力的脑区。

rss · AIHOT 全部动态 · Jun 12, 21:38AIHOT 全部动态

背景: 前额叶负责执行功能,如专注和冲动控制。网络来源澄清,所谓“前额叶受损”常是自嘲的比喻,并非临床诊断。

参考链接

标签: #ADHD, #AI, #attention, #productivity


Anthropic 将 Claude Convey Agent 作为 Labs 项目发布 ⭐️ 6.0/10

Anthropic 宣布推出 Claude Convey Agent,这是一个基于远程容器的代理,具有可自定义的 UI,作为 Labs 项目发布。 这扩展了 Anthropic 的代理生态系统,为开发者提供了一种在隔离环境中部署和自定义 AI 代理的新方式。 该代理在远程容器中运行,支持自定义 UI 标签和插件,类似于 Claude Design。

rss · AIHOT 全部动态 · Jun 12, 21:10AIHOT 全部动态

背景: Anthropic Labs 是负责实验新产品的部门;Claude Design 是之前的一个 Labs 项目,用于视觉协作。

参考链接

社区讨论: 该公告内容模糊,尚未提供技术细节或社区反应。

标签: #AI, #Anthropic, #Agent, #Labs


Replit 推出并行构建与多智能体支持 ⭐️ 6.0/10

Replit 现在支持并行构建多个项目并运行并发 AI 智能体。 开发者可通过同时运行最多 10 个智能体大幅加快开发速度。 用户可以向现有项目添加多个工件,并协调智能体处理不同任务。

rss · AIHOT 全部动态 · Jun 12, 19:00AIHOT 全部动态

参考链接

标签: #Replit, #parallel builds, #AI agents, #development tools


OpenAI 推出文档智能体 ⭐️ 6.0/10

OpenAI 在 developers.openai.com 上发布了文档智能体,帮助开发者查找答案并导航文档。 这通过使 OpenAI 产品文档更易于搜索和导航,改善了开发者体验。 该智能体直接链接到相关文档部分,减少搜索时间。

rss · AIHOT 全部动态 · Jun 12, 18:53AIHOT 全部动态

标签: #OpenAI, #developer tools, #documentation, #AI


受《席德·梅尔的海盗》启发的网页海战游戏 ⭐️ 5.0/10

一款受《席德·梅尔的海盗》启发的网页海战游戏已发布。 它为经典游戏的粉丝提供了怀旧体验。 该游戏是一个业余项目,机制和 AI 较为简单。

hackernews · iweczek · Jun 12, 17:07 · 社区讨论T2 社区与开源

社区讨论: 玩家建议增加风向动力学和更好的 AI 以增加挑战性。

标签: #game development, #web game, #retro gaming, #hobby project


OpenAI 推出三门学院课程 ⭐️ 5.0/10

OpenAI 发布了三门学院课程,涵盖实用 AI 技能、工作流和智能体。 帮助专业人士通过结构化学习将 AI 融入日常工作。 课程侧重于创建可重复的工作流和应用 AI 智能体。

rss · OpenAI Blog · Jun 12, 10:00T1 官方实验室

标签: #AI, #education, #OpenAI, #courses


iOS 27 健康 App 大改:卡片、营养识别、围绝经期追踪 ⭐️ 5.0/10

苹果重新设计了健康 App 的卡片布局,新增基于相机的营养识别、围绝经期追踪,并提升了数据同步速度。 这些功能使健康 App 更加主动和个性化,尤其对女性健康和营养追踪意义重大。 营养识别需要 iPhone 15 Pro 或更新机型;GymKit 现在可直接与 iPhone 配对,无需 Apple Watch。

rss · AIHOT 精选 · Jun 12, 02:06AIHOT 精选

背景: GymKit 是苹果用于在 iOS 设备和健身器材之间同步运动数据的协议。围绝经期是绝经前的过渡阶段,常伴有周期不规律。

参考链接

标签: #iOS, #Health, #Apple, #Nutrition, #Fitness


OpenAI Codex 推出速率重置攒存功能 ⭐️ 5.0/10

OpenAI 为 Codex 推出了速率限制重置攒存功能,首先面向 Go、Plus、Pro 和 Business 用户。 用户现在可以将速率限制重置保留到以后使用,从而更灵活地管理 Codex 使用量。 符合条件的用户最初可获得一次免费攒存重置。

rss · AIHOT 精选 · Jun 12, 00:11AIHOT 精选

背景: Codex 是 OpenAI 的 AI 编程助手。此前,速率限制重置会立即生效,无法存储。

参考链接

标签: #OpenAI, #Codex, #rate limit, #feature update


Replit 专家级提示词技巧 ⭐️ 5.0/10

Replit 在 Twitter 上发布了一条线程,分享如何为 AI Agent 编写更好的提示词以减少重写。 更好的提示词能帮助开发者一次获得正确代码,节省时间和精力。 该线程可能涵盖具体性、上下文和迭代优化技巧。

rss · AIHOT 精选 · Jun 11, 22:00AIHOT 精选

背景: Replit Agent 是一个 AI 编程助手,可将自然语言提示转换为应用。提示词工程是编写输入以有效引导 AI 输出的实践。

参考链接

标签: #Replit, #prompt engineering, #AI tools, #productivity


Replit 与 Databricks 集成升级,公开预览开放 ⭐️ 5.0/10

Replit 升级了与 Databricks 的集成,支持应用中按用户控制数据可见性,现已公开预览。 开发者可构建每个用户仅看到授权数据的应用,提升安全性和合规性。 该集成使用 Databricks 服务主体实现安全的行级数据访问控制。

rss · AIHOT 精选 · Jun 11, 21:49AIHOT 精选

参考链接

标签: #Replit, #Databricks, #data access control, #integration


乔木目标元技能:一句话转 Codex Goal ⭐️ 5.0/10

一个新 Skill 可将一句话需求转化为 Codex /goal 指令,通过 npx skills add joeseesun/qiaomu-goal-meta-skill 安装。 它减轻了阅读冗长文档以编写有效 Codex 目标的负担。 该 Skill 开源免费,旨在简化 4 万字文档的阅读负担。

rss · AIHOT 精选 · Jun 11, 15:15AIHOT 精选

背景: Codex /goal 是一个触发自主循环的功能,用于复杂任务,需要结构良好的目标指令。该 Skill 自动化了目标编写过程。

参考链接

标签: #Codex, #AI-assisted development, #tool, #open source


Hermes Agent Desktop 发布,支持硅基流动一键切换 ⭐️ 5.0/10

Nous Research 发布了 Hermes Agent Desktop,集成硅基流动,支持一键切换 DeepSeek-V4、GLM-5.1 等开源模型。 这简化了开发者的 AI 代理部署,无需手动配置即可灵活切换模型。 桌面应用支持 macOS、Windows 和 Linux,具备可视化技能商店和多代理协作功能。

rss · AIHOT 精选 · Jun 11, 10:17AIHOT 精选

背景: 硅基流动是一个 AI 基础设施平台,用于部署和运行大语言模型,由前微软研究员袁进辉博士创立。

参考链接

标签: #AI, #Open Source, #Model Deployment, #Agent


Codex 每 5 分钟并行维护仓库 ⭐️ 5.0/10

一个简单循环每 5 分钟唤醒 Codex,通过将工作分配到线程来自主维护仓库。 这展示了一种使用 AI 代理进行并行执行、自主维护仓库的实用模式。 该设置使用编排器技能,结合分类、自动审查和计算机使用技能,实现自主落地。

rss · AIHOT 精选 · Jun 11, 09:09AIHOT 精选

背景: OpenAI Codex 是 2025 年 5 月推出的自主编码代理,基于 o3/GPT-5 模型。编排器技能协调多个子技能以完成复杂任务。

参考链接

标签: #Codex, #autonomous agents, #parallel computing, #repo maintenance


WorkBuddy 教程:国内通用 AI Agent 产品 ⭐️ 5.0/10

一篇教程展示了 WorkBuddy(国内通用 AI Agent)的两个案例:微信公众号周报生成和功能网页开发。 WorkBuddy 为国内用户提供了一站式 AI Agent,集成了多个国产大模型和企业工具,降低了使用门槛。 WorkBuddy 支持 Windows 和 Mac,提供免费版和 58 元/月个人专业版,集成了腾讯混元、DeepSeek、GLM、Kimi 等模型。

rss · AIHOT 精选 · Jun 11, 01:58AIHOT 精选

背景: WorkBuddy 是腾讯云代码助手推出的 AI Agent,拥有 Skills 市场和 MCP 连接器生态,可打通 QQ 邮箱、腾讯会议、腾讯文档等服务。

参考链接

标签: #AI Agent, #Tutorial, #Chinese Tech, #WorkBuddy


橙线插画技能开源发布 ⭐️ 5.0/10

一个免费开源的“橙线插画”技能在 GitHub 上发布。 它提供了一个即用型 AI 代理技能,用于生成纽约客风格的极简插画。 该技能在白色背景上使用细黑墨线和唯一的暖橙点缀(#F97316)。

rss · AIHOT 精选 · Jun 11, 00:05AIHOT 精选

参考链接

标签: #open-source, #AI illustration, #tool, #GitHub


Palantir 对瑞士杂志诉讼败诉 ⭐️ 5.0/10

Palantir 在一起针对瑞士调查性杂志的诉讼中败诉,未能阻止其报道。 这一法律败诉可能影响 Palantir 控制对其业务关键报道的能力。 该案由《金融时报》报道,但未提供裁决的具体细节。

rss · AIHOT 全部动态 · Jun 12, 22:42AIHOT 全部动态

标签: #Palantir, #legal, #privacy, #surveillance


旧金山举办编码智能体基准测试活动 ⭐️ 5.0/10

Artificial Analysis 在旧金山举办了一场编码智能体基准测试活动,邀请了来自 Cognition、Cursor 和 NVIDIA 的演讲者。 该活动凸显了人们对 AI 编码智能体标准化基准测试日益增长的关注,这对于评估实际性能至关重要。 演讲者包括 Cognition 高级副总裁 Silas Alberti、Cursor 的 Nate Schmidt 和 NVIDIA 的 Venkat Srinivasan。

rss · AIHOT 全部动态 · Jun 12, 22:34AIHOT 全部动态

背景: 编码智能体是能够自主编写和调试代码的 AI 工具。基准测试衡量它们在软件工程等任务上的表现。Artificial Analysis 为此类基准测试提供了排行榜。

参考链接

标签: #AI, #coding agents, #benchmarking, #event


Claude Code v2.1.176:多语言标题与正则页脚链接 ⭐️ 5.0/10

Claude Code v2.1.176 新增多语言会话标题、正则页脚链接匹配及 Bedrock 凭证缓存优化。 这些改进提升了非英语用户的体验,并在终端输出中提供更灵活的链接处理。 新增的 footerLinksRegexes 设置允许用户使用正则表达式匹配页脚链接徽章。

rss · AIHOT 全部动态 · Jun 12, 21:53AIHOT 全部动态

背景: Claude Code 是 Anthropic 的终端代理编码工具。Bedrock 是 AWS 的基础模型托管服务。

参考链接

标签: #Claude Code, #release, #bug fix, #AI tools


Tailwind 与 Slop 应用引发 HN 热议 ⭐️ 5.0/10

一篇题为“Tailwind and slop apps”的 Hacker News 帖子获得 100 点热度,引发社区讨论。 该讨论反映了开发者对实用优先 CSS 框架和低质量 AI 生成应用的看法。 Tailwind CSS 是一个实用优先的框架,截至 2026 年 2 月在 GitHub 上拥有超过 93,700 颗星。

rss · AIHOT 全部动态 · Jun 12, 21:38AIHOT 全部动态

背景: Tailwind CSS 是一个开源实用优先的 CSS 框架,使用像’bg-yellow-300’这样的工具类而非预定义组件。’Slop apps’可能指低质量或 AI 生成的应用,该术语在开发者社区中逐渐流行。

参考链接

社区讨论: HN 讨论可能围绕 Tailwind 实用优先方法与传统 CSS 的优劣,以及“slop”应用的泛滥展开。

标签: #Tailwind CSS, #web development, #community discussion


Hyperframes 与 Gemini 视频分析智能体流程 ⭐️ 5.0/10

一个智能体流程将 Hyperframes 与 Gemini 视频分析结合,生成带注释的视频。 这展示了生成式视频帧与 AI 视频理解的新颖集成,用于自动注释。 Hyperframes 可能生成关键帧或摘要,然后由 Gemini 分析以产生注释。

rss · AIHOT 全部动态 · Jun 12, 20:07AIHOT 全部动态

参考链接

标签: #video analysis, #AI agents, #Gemini, #Hyperframes


Codex AI 代理玩 Rimworld ⭐️ 5.0/10

一条推文显示 OpenAI 的 Codex AI 代理正在运行游戏 Rimworld。 这展示了 Codex 与复杂游戏环境交互的能力。 Codex 是一个 AI 编码代理,可以在隔离环境中编写代码并执行任务。

rss · AIHOT 全部动态 · Jun 12, 19:40AIHOT 全部动态

背景: Codex 是 OpenAI 开发的 AI 编码代理,于 2025 年 4 月以 Codex CLI 形式发布。它帮助进行编码、调试和功能交付。

参考链接

社区讨论: 未提供讨论内容。

标签: #Codex, #AI, #gaming, #demonstration


Codex 将网站更新从一周缩短至三天 ⭐️ 5.0/10

OpenAI 的 Codex 代理能够并行更新网站的多个部分,将一周的工作量缩短为三天。 这展示了 Codex 在实际任务中大幅提升开发者生产力的潜力。 来自 @intelligenceco 的用户 @ndrewpignanelli 通过在多个部分并行运行 Codex 实现了这一效果。

rss · AIHOT 全部动态 · Jun 12, 19:30AIHOT 全部动态

背景: Codex 是 OpenAI 的 AI 编码代理,能够自主编写代码、修复错误,并在隔离环境中执行软件工程任务。

参考链接

标签: #Codex, #AI-assisted development, #productivity