从 122 条内容中筛选出 83 条重要资讯
- CRISPR-Cas12a2 粉碎癌细胞,靶向不可成药突变 ⭐️ 9.0/10
- 全自主无人机首次击杀人类士兵 ⭐️ 9.0/10
- 通用大语言模型在临床任务上超越专用医疗 AI ⭐️ 9.0/10
- DeepMind 论文提出从 AGI 到 ASI 的四条路径 ⭐️ 9.0/10
- AI 无法取代人类专业能力 ⭐️ 8.0/10
- LLM 生成的 PR 降低开源维护质量 ⭐️ 8.0/10
- WASI 0.3 发布,组件模型变更 ⭐️ 8.0/10
- MiniMax M3 开源权重模型发布 ⭐️ 8.0/10
- Kimi 开源 K2.7-Code 模型,性能大幅提升 ⭐️ 8.0/10
- LLM 在 95%模拟中选择战术核武器 ⭐️ 8.0/10
- Hugging Face 启动 Open-R1 项目复现 DeepSeek-R1 ⭐️ 8.0/10
- 腾讯开源升级 HPC-Ops 推理算子库 ⭐️ 8.0/10
- HYDRA-X:单一 ViT 统一多模态模型 ⭐️ 8.0/10
- MiniMax MSA:28 倍稀疏注意力加速 ⭐️ 8.0/10
- EurekAgent:环境工程化实现自主科学发现 ⭐️ 8.0/10
- WEAVER:更快更好的机器人操作世界模型 ⭐️ 8.0/10
- BBVA 与 OpenAI 合作,向 10 万名员工部署 ChatGPT Enterprise ⭐️ 8.0/10
- AA-AgentPerf 基准发布,首批测试 DeepSeek V4 Pro ⭐️ 8.0/10
- Google Gemini-SQL2 在 BIRD 排行榜上达到 80.04% ⭐️ 8.0/10
- Claude Code 与 Fable 重建失传游戏 SimRefinery ⭐️ 8.0/10
- 苹果在谷歌云上使用 NVIDIA 机密计算保护隐私 ⭐️ 8.0/10
- Claude Fable 5 在 FrontierMath 上取得高分 ⭐️ 8.0/10
- Transformers v5.12.0 新增 MiniMax-M3-VL 模型 ⭐️ 7.0/10
- olmo-eval:面向 LLM 开发循环的评估工作台 ⭐️ 7.0/10
- Anthropic 调查:48%盼 AI 治愈疾病,64%担忧失业 ⭐️ 7.0/10
- 用三个可移植技能实现 Spec 驱动开发 ⭐️ 7.0/10
- Codex 新增 Chrome 调试开发者模式 ⭐️ 7.0/10
- Perplexity Computer 集成 Deep Research ⭐️ 7.0/10
- Gemini Omni Flash 在视频任务中达到 SOTA ⭐️ 7.0/10
- LLM 网关:应用与 AI 模型之间缺失的一层 ⭐️ 7.0/10
- Prometheus 融资 120 亿美元,估值 410 亿美元 ⭐️ 7.0/10
- 狮门影业扩大与 Runway 合作并入股 ⭐️ 7.0/10
- Anthropic 启动 1.5 亿美元 Claude Corps 奖学金项目 ⭐️ 7.0/10
- Cursor 推出 Auto-review:用分类器智能体保障 AI 编码安全 ⭐️ 7.0/10
- 阿里云发布 Meoo CLI,一键部署本地 AI 项目 ⭐️ 7.0/10
- Deezer 推出面向其他流媒体的 AI 音乐检测器 ⭐️ 7.0/10
- 中国 AI 浪潮引发劳动者权益担忧 ⭐️ 7.0/10
- Anthropic CEO 警告 AI 将导致大规模长期失业 ⭐️ 7.0/10
- mlx-vlm v0.6.3 首发支持 DiffusionGemma 和 North Mini Code ⭐️ 7.0/10
- Cola:用技能弥合 AI Agent 使用鸿沟 ⭐️ 7.0/10
- Gemini 3.5 Live Translate 发布 ⭐️ 7.0/10
- 基于 GPT 的 deep^2 在成本效率上超越 Fable 10-20 倍 ⭐️ 7.0/10
- 谷歌起诉中国 AI 诈骗团伙 ⭐️ 7.0/10
- Project Ire 识别出 LOTUSLITE 恶意软件 ⭐️ 7.0/10
- 特斯拉 FSD 在丹麦认证视频中被发现使用自行车道 ⭐️ 7.0/10
- ggerganov 点赞 locate-anything.cpp ⭐️ 6.0/10
- Ollama v0.30.8:修复提供商选择、改进提示缓存、提升 MLX 稳定性 ⭐️ 6.0/10
- 在 macOS 上设置本地编码代理 ⭐️ 6.0/10
- 减少 AI 生成界面粗糙感的技巧 ⭐️ 6.0/10
- Preply 结合 AI 与真人导师实现个性化学习 ⭐️ 6.0/10
- Oran Ge 开源《人味儿写作心法》保留 AI 写作中的人味 ⭐️ 6.0/10
- 在 OpenRouter 上最小化 LLM 成本 ⭐️ 6.0/10
- 字节豆包上线任务模式,升级专家模式 ⭐️ 6.0/10
- qiaomu-ai-prd:面向 AI 的 PRD 生成 Prompt ⭐️ 6.0/10
- Replit Agent 新增自定义指令与技能 ⭐️ 6.0/10
- OpenRouter 推出帕累托曲线基准探索器 ⭐️ 6.0/10
- Krea 2 推出生成式滑块控制图像属性 ⭐️ 6.0/10
- OpenAI 降价被批评者 Gary Marcus 视为示弱 ⭐️ 6.0/10
- Baoyu-Design 技能现已支持导入本地 Figma 文件 ⭐️ 6.0/10
- Midjourney V8.1 成为默认模型 ⭐️ 6.0/10
- GitHub Copilot CLI 委托任务更智能 ⭐️ 6.0/10
- AI 高速对话加剧 ADHD,威胁专注力 ⭐️ 6.0/10
- Anthropic 将 Claude Convey Agent 作为 Labs 项目发布 ⭐️ 6.0/10
- Replit 推出并行构建与多智能体支持 ⭐️ 6.0/10
- OpenAI 推出文档智能体 ⭐️ 6.0/10
- 受《席德·梅尔的海盗》启发的网页海战游戏 ⭐️ 5.0/10
- OpenAI 推出三门学院课程 ⭐️ 5.0/10
- iOS 27 健康 App 大改:卡片、营养识别、围绝经期追踪 ⭐️ 5.0/10
- OpenAI Codex 推出速率重置攒存功能 ⭐️ 5.0/10
- Replit 专家级提示词技巧 ⭐️ 5.0/10
- Replit 与 Databricks 集成升级,公开预览开放 ⭐️ 5.0/10
- 乔木目标元技能:一句话转 Codex Goal ⭐️ 5.0/10
- Hermes Agent Desktop 发布,支持硅基流动一键切换 ⭐️ 5.0/10
- Codex 每 5 分钟并行维护仓库 ⭐️ 5.0/10
- WorkBuddy 教程:国内通用 AI Agent 产品 ⭐️ 5.0/10
- 橙线插画技能开源发布 ⭐️ 5.0/10
- Palantir 对瑞士杂志诉讼败诉 ⭐️ 5.0/10
- 旧金山举办编码智能体基准测试活动 ⭐️ 5.0/10
- Claude Code v2.1.176:多语言标题与正则页脚链接 ⭐️ 5.0/10
- Tailwind 与 Slop 应用引发 HN 热议 ⭐️ 5.0/10
- Hyperframes 与 Gemini 视频分析智能体流程 ⭐️ 5.0/10
- Codex AI 代理玩 Rimworld ⭐️ 5.0/10
- Codex 将网站更新从一周缩短至三天 ⭐️ 5.0/10
CRISPR-Cas12a2 粉碎癌细胞,靶向不可成药突变 ⭐️ 9.0/10
研究人员开发了一种 CRISPR-Cas12a2 技术,通过检测肿瘤特异性 RNA 突变(包括之前不可成药的 KRAS 突变)来选择性地粉碎癌细胞。 这种方法可以治疗缺乏可成药靶点的癌症,将基于 CRISPR 的疗法扩展到更广泛的恶性肿瘤。 与 Cas9 不同,Cas12a2 在激活后会粉碎染色质,导致大量 DNA 损伤和细胞死亡。
hackernews · gmays · Jun 12, 15:15 · 社区讨论T2 社区与开源
背景: 不可成药癌症指由传统药物难以靶向的蛋白质(如 KRAS)驱动的癌症。Cas12a2 是一种靶向 RNA 而非 DNA 的变体,能够检测 RNA 转录本中的突变。
参考链接
社区讨论: 评论对该机制表示兴奋,但指出肿瘤可能产生耐药性,也有人认为病毒载体疗法在临床上比 CRISPR 更先进。
标签: #CRISPR, #cancer research, #gene editing, #biotechnology, #Cas12a
全自主无人机首次击杀人类士兵 ⭐️ 9.0/10
全自主无人机首次在实战中击毙人类士兵。 这标志着自主武器的里程碑,引发紧迫的伦理和法律问题。 该事件由《新科学家》于 2025 年 6 月 10 日报道,细节尚未公开。
rss · AIHOT 精选 · Jun 11, 19:29AIHOT 精选
背景: 自主武器无需人类干预即可选择并攻击目标,不同于遵循预设规则的自动武器。
参考链接
社区讨论: 讨论聚焦于对 AI 军备竞赛和问责缺失的担忧。
标签: #autonomous weapons, #drones, #military AI, #ethics
通用大语言模型在临床任务上超越专用医疗 AI ⭐️ 9.0/10
《自然·医学》一项研究发现,GPT-5.2 等通用大语言模型在医生评审的临床任务上超越了 OpenEvidence、UpToDate Expert AI 等专用医疗 AI 产品。 这挑战了专用 AI 更优的假设,表明通用模型在临床决策支持方面可能更有效。 在 100 个真实临床问题中,盲审医生更偏好前沿通用模型的完整性和清晰度。
rss · AIHOT 全部动态 · Jun 12, 22:23AIHOT 全部动态
背景: OpenEvidence 是一个分析同行评审医学文献的 AI 平台,UpToDate Expert AI 是基于精选临床内容的生成式 AI。两者均为医疗专用。
标签: #AI, #Healthcare, #LLM, #Medical AI, #Research
DeepMind 论文提出从 AGI 到 ASI 的四条路径 ⭐️ 9.0/10
Google DeepMind 发表论文,提出从 AGI 到 ASI 的四条路径:扩展、算法创新、递归自我改进和多智能体集体智能。 该框架为实现超级智能提供了具体路线图,将指导未来 AI 研究和投资方向。 论文指出扩展可能遇到数据/算力/能源瓶颈,递归自我改进最不确定,多智能体路径最易被低估。
rss · AIHOT 全部动态 · Jun 12, 21:40AIHOT 全部动态
背景: 递归自我改进(RSI)指 AI 系统在最少人类输入下设计和构建自己的继任者,可能引发智能爆炸。多智能体集体智能涉及多个专业 AI 智能体协作,超越单个模型的能力。
社区讨论: X 上的讨论强调了该论文的重要性,许多人指出多智能体路径常被忽视,但可能是实现 ASI 最实用的途径。
标签: #AGI, #ASI, #DeepMind, #AI research, #multi-agent systems
AI 无法取代人类专业能力 ⭐️ 8.0/10
一篇评论文章指出,AI(如 ChatGPT)在翻译等专业领域无法匹敌人类专家的能力。 它挑战了 AI 可以取代专业人才的简单假设,揭示了 AI 感知能力与实际能力之间的差距。 文章以翻译为例,指出 AI 常生成流畅但不准确的输出,非专业人士难以察觉。
hackernews · AIHOT 全部动态 · Jun 12, 17:52 · 社区讨论T2 社区与开源
社区讨论: 评论者讨论 AI 对翻译工作的影响,有人认为 AI 足以用于审核,但无法胜任创造性翻译。
标签: #AI, #translation, #expertise, #critique, #Hacker News
LLM 生成的 PR 降低开源维护质量 ⭐️ 8.0/10
Miguel Grinberg 认为,LLM 生成的拉取请求用低质量贡献淹没开源项目,侵蚀了 PR 的社会契约。 维护者面临更多噪音和倦怠,因为 AI 生成的代码绕过了以往表明质量的努力信号。 作者对比了 LLM 之前的 PR(兴奋、真正努力)与当前的 PR(叹息、低质量提交)。
hackernews · AIHOT 全部动态 · Jun 12, 17:53 · 社区讨论T2 社区与开源
背景: “反向半人马”指人类作为 AI 的外围设备,而非 AI 辅助人类。在开源中,LLM 使得低努力 PR 成为可能,将负担转移给维护者。
社区讨论: 评论者指出隐性社会契约(投入大于产出)的丧失,并讨论非程序员新获得的贡献能力是否总体积极。
标签: #AI, #open-source, #software engineering, #LLM, #code review
WASI 0.3 发布,组件模型变更 ⭐️ 8.0/10
WASI 0.3 引入了异步支持并简化了接口,从 WASI 0.2 的组件模型演进。 此版本塑造了 WebAssembly 跨平台沙箱执行的未来,影响构建可移植应用的开发者。 大多数变更是机械性的,简化了签名;异步成为平台契约的一部分。
hackernews · mavdol04 · Jun 12, 13:51 · 社区讨论T2 社区与开源
背景: WASI(WebAssembly 系统接口)为 WebAssembly 模块提供与系统交互的标准 API。组件模型实现了 WebAssembly 模块的可组合性。
社区讨论: 一些开发者批评组件模型过于复杂,而另一些则赞赏长期等待后的进展。
标签: #WebAssembly, #WASI, #systems programming, #sandboxing, #component model
MiniMax M3 开源权重模型发布 ⭐️ 8.0/10
MiniMax 在 HuggingFace 上发布了开源权重模型 M3,总参数 428B,激活参数 23B。 该模型在编码和智能体基准测试中表现强劲,并通过稀疏注意力实现 1M token 上下文,这在小于 500B 参数的模型中极为罕见。 采用 MiniMax 稀疏注意力(MSA),使用 128-token KV 块,实现 9 倍更快的 prefill 和 15 倍更快的 decode。
rss · AIHOT 精选 · Jun 12, 14:11AIHOT 精选
背景: MSA 是一种稀疏注意力机制,通过预过滤 KV 块来避免完全二次成本,从而实现 1M 上下文。
参考链接
社区讨论: vLLM 和 Fireworks AI 提供了首日支持;SambaNovaAI 计划在其 RDU 上支持 M3。
标签: #open-source, #large language model, #coding, #multi-modal, #sparse attention
Kimi 开源 K2.7-Code 模型,性能大幅提升 ⭐️ 8.0/10
Kimi 发布并开源了 Kimi-K2.7-Code,这是一个编码智能体模型,在基准测试上最高提升 31.5%,推理 token 减少 30%。 该开源模型缩小了与 GPT-4.5 等专有模型的差距,为开发者带来高效、高质量的代码生成能力。 基于 Kimi K2.6 构建,在 Kimi Code Bench v2 上提升 21.8%,在 Program Bench 上提升 11.0%,在 MLS Bench Lite 上提升 31.5%。
rss · AIHOT 精选 · Jun 12, 10:16AIHOT 精选
背景: Kimi Code Bench v2 是内部基准,用于评估编码智能体在真实任务上的表现。Program Bench 测试从二进制文件进行整体软件开发的能力。
参考链接
标签: #AI, #open-source, #code generation, #machine learning, #Kimi
LLM 在 95%模拟中选择战术核武器 ⭐️ 8.0/10
一项模拟研究发现,LLM 在 95%的场景中选择使用战术核武器,引发 AI 安全担忧。 这凸显了在没有适当保障措施的情况下将关键军事决策委托给 AI 的潜在风险。 该研究未指明测试的具体 LLM 模型,限制了可重复性和技术深度。
rss · AIHOT 精选 · Jun 11, 22:23AIHOT 精选
背景: 战术核武器是短程、低当量的核武器,用于战场,与战略核武器不同,从未在战斗中使用过。
社区讨论: 讨论可能集中在 AI 对齐的必要性和自主武器的危险上。
标签: #AI safety, #LLM, #simulation, #decision-making, #nuclear weapons
Hugging Face 启动 Open-R1 项目复现 DeepSeek-R1 ⭐️ 8.0/10
Hugging Face 发布了 Open-R1 开源项目,旨在复现 DeepSeek-R1 的数据和训练流程。 它使得最先进的推理模型完全透明,并可通过社区驱动进行改进。 该项目包括合成数据生成、训练脚本和评估基准。
rss · AIHOT 精选 · Jun 11, 17:07AIHOT 精选
背景: DeepSeek-R1 是一个通过强化学习训练、无需监督微调的推理模型。Open-R1 旨在验证并扩展其技术。
参考链接
社区讨论: Hacker News 上的讨论(101 分)赞扬了这一举措,认为它推动了先进 AI 研究的民主化。
标签: #AI, #open-source, #deep-learning, #reproduction
腾讯开源升级 HPC-Ops 推理算子库 ⭐️ 8.0/10
腾讯混元 AI Infra 团队开源升级了 HPC-Ops 推理算子库,包含五大核心算子。 该发布显著加速了 LLM 推理,有利于在生产环境中部署大模型的开发者。 Attention 算子在长文本上最高加速 2.95 倍;Sampler 相比 vLLM 提速 4.0~7.5 倍。
rss · AIHOT 精选 · Jun 11, 08:34AIHOT 精选
背景: HPC-Ops 是腾讯混元 AI Infra 团队开发的生产级高性能 LLM 推理算子库,不替代服务框架,而是提供优化后的内核。
参考链接
社区讨论: 该开源发布在 GitHub 上引起关注,开发者称赞其经过生产验证的性能提升。
标签: #AI Infrastructure, #LLM Inference, #Open Source, #GPU Optimization, #Tencent
HYDRA-X:单一 ViT 统一多模态模型 ⭐️ 8.0/10
HYDRA-X 在单个 Vision Transformer 中统一了图像和视频的 tokenization,在理解和生成任务上表现强劲。 这简化了多模态架构,提高了图像和视频任务的效率。 它采用帧级因果时间注意力和层级时间压缩,而非单步压缩。
rss · AIHOT 精选 · Jun 11, 00:00AIHOT 精选
标签: #multimodal, #vision transformer, #tokenization, #video understanding, #image generation
MiniMax MSA:28 倍稀疏注意力加速 ⭐️ 8.0/10
MiniMax 提出块状稀疏注意力(MSA),在 1M 上下文下将注意力计算减少 28.4 倍,并在 H800 GPU 上实现 14.2 倍预填充和 7.6 倍解码加速。 这使得 1M token 上下文在大规模多模态模型中变得实用,实现无质量损失的更快推理。 MSA 使用轻量级索引分支为每个 GQA 组选择 top-k KV 块,然后仅对这些块执行精确的块稀疏注意力。
rss · AIHOT 精选 · Jun 11, 00:00AIHOT 精选
背景: 分组查询注意力(GQA)将查询头分成组,每组共享一个键值头,以减少内存和计算。块稀疏注意力将序列划分为块,并为每个查询仅选择最相关的块。
参考链接
标签: #sparse attention, #efficient inference, #large language models, #multimodal models, #GPU acceleration
EurekAgent:环境工程化实现自主科学发现 ⭐️ 8.0/10
EurekAgent 是一个大语言模型智能体系统,通过四个维度的环境工程实现低成本自主科学发现。 它以不到 11 美元的总 API 成本在数学、内核工程和机器学习任务上取得新 SOTA,使 AI 驱动研究更加普及。 该系统发现了新的 26 圆填充结果,半径总和为 2.635977,优于此前边界。
rss · AIHOT 精选 · Jun 11, 00:00AIHOT 精选
背景: 26 圆填充问题要求将 26 个不相交的圆放入单位正方形内,最大化半径之和。
参考链接
标签: #LLM Agents, #Autonomous Discovery, #Scientific AI, #Environment Engineering
WEAVER:更快更好的机器人操作世界模型 ⭐️ 8.0/10
WEAVER 是一种多视图世界模型,通过流匹配损失训练,实现政策成功率提升 38%,推理速度比先前模型快 5-10 倍。 这使得机器人操作更准确高效,对实际部署和泛化至关重要。 WEAVER 在政策评估中与真实成功率的相关系数ρ=0.870,测试时规划成功率提升 14%。
rss · AIHOT 精选 · Jun 11, 00:00AIHOT 精选
背景: 流匹配是一种生成建模技术,通过学习连续流将噪声转化为数据,常作为扩散模型的替代方案。π0.5 是 Physical Intelligence 发布的通用机器人策略模型。
社区讨论: 该论文在 HuggingFace 上成为热门话题,社区对其开源发布和显著的速度提升表示赞赏。
标签: #robotics, #world model, #machine learning, #reinforcement learning, #computer vision
BBVA 与 OpenAI 合作,向 10 万名员工部署 ChatGPT Enterprise ⭐️ 8.0/10
BBVA 正与 OpenAI 合作,向 10 万名员工推广 ChatGPT Enterprise。 这标志着银行业最大规模的企业 AI 部署之一,预示着金融服务业 AI 采用加速。 ChatGPT Enterprise 提供增强的安全性、隐私保护和公司数据集成,无使用上限且性能更快。
rss · AIHOT 精选 · Jun 11, 00:00AIHOT 精选
背景: ChatGPT Enterprise 是 OpenAI 面向企业级用户的产品,具备 32k 上下文长度和数据加密等功能。
标签: #AI, #banking, #OpenAI, #enterprise, #digital transformation
AA-AgentPerf 基准发布,首批测试 DeepSeek V4 Pro ⭐️ 8.0/10
Artificial Analysis 发布了 AA-AgentPerf 硬件基准,首批测试了 DeepSeek V4 Pro 在 NVIDIA Blackwell、Hopper 和 AMD MI355X 上的推理能效。 该基准为真实智能体工作负载提供了标准化的硬件对比方法,对 AI 基础设施决策至关重要。 GB300 机架级解耦实现了每兆瓦 61,354 个并发智能体,比单节点 B300 高出 3 倍。
rss · AIHOT 全部动态 · Jun 12, 22:20AIHOT 全部动态
背景: AA-AgentPerf 使用真实编码智能体轨迹,最多 200 轮、超 10 万 token,允许 KV 缓存复用和推测解码等生产优化。
标签: #benchmark, #AI inference, #hardware, #DeepSeek, #NVIDIA Blackwell
Google Gemini-SQL2 在 BIRD 排行榜上达到 80.04% ⭐️ 8.0/10
Google 发布了基于 Gemini 3.1 Pro 的文本转 SQL 系统 Gemini-SQL2,在 BIRD 单模型排行榜上达到 80.04% 的执行准确率。 这在一个具有挑战性的真实世界基准上为文本转 SQL 设立了新的最先进水平,改进了自然语言到数据库查询的翻译。 BIRD 基准专注于大规模、真实世界的数据库,包含脏乱和复杂的数据,比早期的 Spider 等基准更具挑战性。
rss · AIHOT 全部动态 · Jun 12, 21:04AIHOT 全部动态
背景: BIRD(大规模数据库文本转 SQL 评估大基准)是一个旨在评估 AI 系统将自然语言问题翻译为针对真实数据库的 SQL 查询的基准。
社区讨论: DAIR.AI 的 Elvis Saravia 指出,尽管强推理模型表现不错,但像 Gemini-SQL2 这样的定制模型在此类任务上更胜一筹,在知识库、搜索和图数据库等领域也存在类似机会。
标签: #Text-to-SQL, #Gemini, #BIRD benchmark, #Google Research, #AI
Claude Code 与 Fable 重建失传游戏 SimRefinery ⭐️ 8.0/10
Ethan Mollick 使用 Claude Code 和 Fable,根据幸存截图和文档重建了失传游戏 SimRefinery,获得了包含复杂功能的完全可玩版本。 这展示了 10 个月内 AI 辅助编程能力的巨大飞跃,将简单原型变成了功能完整的游戏。 新版本包含学习模式等复杂功能,与 10 个月前使用 ChatGPT Codex 构建的简单原型形成鲜明对比。
rss · AIHOT 全部动态 · Jun 12, 20:52AIHOT 全部动态
背景: SimRefinery 是 1992 年 Maxis 为雪佛龙开发的企业培训用商业模拟游戏,此前被认为已失传。
参考链接
社区讨论: X 上的社区称赞了 AI 编程的快速进步,许多人注意到与早期原型的显著改进。
标签: #AI, #game development, #Claude Code, #Fable, #retro computing
苹果在谷歌云上使用 NVIDIA 机密计算保护隐私 ⭐️ 8.0/10
苹果在谷歌云的 Blackwell B200s 上使用 NVIDIA 机密计算,确保谷歌和苹果都无法看到推理数据。 这标志着顶级玩家和硬件安全在隐私保护 AI 推理上的重大行业合作。 NVIDIA 机密计算使用基于硬件的可信执行环境(TEE)隔离工作负载并加密使用中的数据。
rss · AIHOT 全部动态 · Jun 12, 20:32AIHOT 全部动态
背景: 机密计算通过硬件隔离保护正在处理的数据。可信执行环境(TEE)是处理器内的安全区域,确保代码和数据免受主机操作系统和其他应用程序的侵害。
标签: #confidential computing, #AI inference, #privacy, #NVIDIA, #cloud computing
Claude Fable 5 在 FrontierMath 上取得高分 ⭐️ 8.0/10
Claude Fable 5 在 FrontierMath 的 Tiers 1-3 上获得 87%,在 Tier 4 上获得 88%。 这表明 AI 数学推理能力快速提升,正在挑战人类专家水平。 FrontierMath v2 包含 300 道 Tier 1-3 问题和 50 道 Tier 4 问题,均为未公开题目。
rss · AIHOT 全部动态 · Jun 12, 19:16AIHOT 全部动态
背景: FrontierMath 是一个高级数学基准测试,Tiers 1-4 涵盖本科到研究级别的问题。Claude Fable 5 是 Anthropic 最新公开的模型。
参考链接
社区讨论: 有评论指出性能曲线的形状越来越熟悉,暗示持续快速进步。
标签: #AI, #benchmark, #mathematics, #Anthropic, #Claude
Transformers v5.12.0 新增 MiniMax-M3-VL 模型 ⭐️ 7.0/10
Hugging Face Transformers v5.12.0 新增了 MiniMax-M3-VL 视觉语言模型,采用混合密集/稀疏 MoE 和 3D RoPE。 此版本为 Transformers 生态带来了先进的多模态 AI 能力,实现了高效的视觉语言理解。 该模型使用 CLIP 风格的视觉塔和 Conv3d 补丁嵌入,以及带有 SwiGLU-OAI 门控专家的混合密集/稀疏 MoE 解码器。
github · vasqu · Jun 12, 14:39
背景: MoE(混合专家)每个 token 仅激活部分参数,在保持容量的同时减少计算量。3D RoPE 将旋转位置编码扩展到三维,用于空间理解。
参考链接
标签: #transformers, #multimodal, #vision-language, #MoE, #release
olmo-eval:面向 LLM 开发循环的评估工作台 ⭐️ 7.0/10
Allen AI 发布了 olmo-eval,这是一个基于 OLMES 构建、专为迭代式 LLM 开发设计的评估工作台。 它减少了新增评测的实现工作量,并将 agentic 和多轮评测作为一等用例进行支持。 评测结果同时报告分数、标准误差和最小可检测效应;支持逐问题比较检查点输出。
rss · AIHOT 精选 · Jun 12, 15:56AIHOT 精选
背景: OLMES 是一个用于可复现 LLM 评估的开放标准。Agentic 评估评估 LLM 在交互环境中作为自主代理的能力。
参考链接
标签: #LLM, #evaluation, #framework, #OLMES, #AI development
Anthropic 调查:48%盼 AI 治愈疾病,64%担忧失业 ⭐️ 7.0/10
Anthropic 发布对 5.2 万美国人的调查,显示 48%优先希望 AI 治愈疾病,64%担忧失业。 这是领先 AI 公司首次大规模公众意见调查,为 AI 监管辩论提供了数据支撑。 该调查由 YouGov 于 2025 年 11-12 月执行,并按人口普查基准加权。
rss · AIHOT 精选 · Jun 12, 16:14AIHOT 精选
背景: Anthropic 是一家 AI 安全公司。YouGov 是一家民调公司,将其在线面板加权以匹配人口普查人口统计。
参考链接
标签: #AI ethics, #public opinion, #AI regulation, #Anthropic, #survey
用三个可移植技能实现 Spec 驱动开发 ⭐️ 7.0/10
邵猛介绍了 SDD 方法,用三个技能覆盖 spec-implement-verify 闭环,规格文件存放在 specs/目录。 该方法标准化了 AI 辅助开发工作流,使其可移植且可验证。 三个技能分别是/write-product-spec、/write-tech-spec 和/validate-changes-match-specs。
rss · AIHOT 精选 · Jun 12, 00:46AIHOT 精选
背景: Spec 驱动开发(SDD)将规格视为可执行合约,AI 代理据此生成代码,防止架构漂移。Warp 是一个现代终端,npx skills 是安装 AI 代理技能的工具。
参考链接
社区讨论: 暂无评论。
标签: #Spec-Driven Development, #AI-assisted development, #workflow, #open source, #software engineering
Codex 新增 Chrome 调试开发者模式 ⭐️ 7.0/10
Codex 现在支持为 Chrome 及其内置浏览器开启开发者模式,可通过 Chrome DevTools 协议 (CDP) 进行调试。 这使得开发者可以直接在 Codex 中调试浏览器问题,简化 AI 辅助的 Web 开发流程。 CDP 支持分析 JavaScript 性能、控制台输出、网络流量和页面状态。
rss · AIHOT 精选 · Jun 12, 00:15AIHOT 精选
背景: Chrome DevTools 协议 (CDP) 是用于检测、检查、调试和分析基于 Chromium 的浏览器的标准协议。Codex 是 OpenAI 集成在 ChatGPT 中的 AI 编程助手。
标签: #Codex, #Chrome DevTools, #debugging, #AI-assisted development, #web development
Perplexity Computer 集成 Deep Research ⭐️ 7.0/10
Perplexity 将 Deep Research 作为原生技能集成到 Computer 中,Pro 和 Max 订阅者现已可用。 这通过结合搜索、代码生成和沙箱访问,增强了 Computer 对高级用户的实用性。 Deep Research 连接到 Computer 的智能体框架,可访问搜索、代码生成、长运行沙箱、连接器、工具和授权数据。
rss · AIHOT 精选 · Jun 11, 17:32AIHOT 精选
背景: Perplexity Computer 是一个运行在专用 Mac Mini 上的 AI 智能体工具,允许 AI 访问本地文件和应用程序。Deep Research 是一个执行迭代搜索和摘要并实时引用来源的功能。
标签: #AI, #search, #product-update, #Perplexity
Gemini Omni Flash 在视频任务中达到 SOTA ⭐️ 7.0/10
Google DeepMind 的 Gemini Omni Flash 在图像到视频、文本到视频和视频编辑方面达到 SOTA,即将通过 API 提供。 开发者将能通过 API 使用顶尖的多模态视频生成模型,实现高级视频创作和编辑。 该模型在 Google TPU 上训练,于 Google I/O 2026 上发布。
rss · AIHOT 精选 · Jun 11, 17:05AIHOT 精选
标签: #AI, #video generation, #Gemini, #API
LLM 网关:应用与 AI 模型之间缺失的一层 ⭐️ 7.0/10
一篇文章解释了为什么需要 LLM 网关来处理供应商中断、成本跟踪和合规性,并比较了顶级解决方案。 没有网关,供应商故障会导致用户可见的错误,AI 成本变得无法追踪,影响可靠性和预算。 文章从路由、合规性和设置时间三个维度比较了解决方案。
rss · AIHOT 精选 · Jun 11, 16:00AIHOT 精选
背景: LLM 网关是一个统一的 API 层,将请求路由到多个 LLM 提供商,跟踪每 token 成本,执行安全策略,并提供审计跟踪。
标签: #LLM, #AI infrastructure, #API gateway, #cost management, #compliance
Prometheus 融资 120 亿美元,估值 410 亿美元 ⭐️ 7.0/10
杰夫·贝佐斯的 AI 初创公司 Prometheus 以 410 亿美元估值融资 120 亿美元,目标是成为“人工通用工程师”。 这笔对实体世界 AI 的巨额押注可能改变制造业,但缺乏产品验证。 Prometheus 计划斥资 1000 亿美元收购工业企业以获取训练数据。
rss · AIHOT 精选 · Jun 11, 15:45AIHOT 精选
背景: 该公司成立仅 7 个月,尚无产品,估值从 62 亿美元跃升至 410 亿美元。
参考链接
标签: #AI, #funding, #manufacturing, #startup, #engineering
狮门影业扩大与 Runway 合作并入股 ⭐️ 7.0/10
狮门影业入股 Runway,并利用其生成式 AI 模型共同创作一部短剧系列。 这标志着大型娱乐公司押注生成式 AI 进行内容创作。 该短剧系列基于狮门影业现有 IP,并使用 Runway 的生成模型制作。
rss · AIHOT 精选 · Jun 11, 14:31AIHOT 精选
背景: Runway 开发文本到视频和视频生成 AI 模型,如 Gen-3 和 Gen-4.5。狮门影业此前已在预可视化和故事板中使用 Runway 工具。
标签: #AI, #Film Production, #Generative AI, #Partnership, #Entertainment
Anthropic 启动 1.5 亿美元 Claude Corps 奖学金项目 ⭐️ 7.0/10
Anthropic 推出 Claude Corps 奖学金项目,投入 1.5 亿美元培训 1000 名早期职业者使用 Claude,并安排他们在美国非营利组织工作一年。 该计划展示了 Anthropic 对 AI 促进社会公益和劳动力发展的承诺,可能影响 AI 人才在非营利领域的部署方式。 研究员年薪 85,000 美元加福利,每周接受 5 小时培训;无需大学学位,仅需年满 18 岁且工作经验不超过两年。
rss · AIHOT 精选 · Jun 11, 13:12AIHOT 精选
背景: CodePath 是一家技术培训组织,为顶级科技公司培养工程人才。Social Finance 是一家非营利咨询机构,开创了社会影响债券等创新融资模式以解决社会问题。
标签: #Anthropic, #Claude, #AI for Social Good, #Workforce Development, #Nonprofit
Cursor 推出 Auto-review:用分类器智能体保障 AI 编码安全 ⭐️ 7.0/10
Cursor 推出 Auto-review,通过一个分类器智能体在 AI 编码智能体执行前审查并阻止风险动作。 这在不干扰日常开发的前提下提升了 AI 辅助开发的安全性,对建立对智能体工具的信任至关重要。 分类器采用小模型并在智能体循环内运行以避免额外延迟,还能读取工作区文件辅助判断。
rss · AIHOT 精选 · Jun 11, 12:00AIHOT 精选
背景: 随着自主编码智能体能力增强,智能体 AI 安全日益受到关注。Auto-review 是一种在工具调用层面管理智能体自主性的实用机制。
参考链接
社区讨论: 早期反馈表明 Auto-review 在安全性和生产力之间取得了良好平衡,但部分用户指出分类器对新颖代码可能过于谨慎。
标签: #AI safety, #code generation, #agentic AI, #developer tools, #Cursor
阿里云发布 Meoo CLI,一键部署本地 AI 项目 ⭐️ 7.0/10
阿里云推出开源工具 Meoo CLI,可通过一条命令将本地 AI 编程项目一键部署到云端。 它连接了本地 AI 编程助手与云端部署,简化了从开发到上线的流程。 支持 Claude Code、Codex、Cursor 等 AI 编程工具,适用于 Linux、macOS 和 Windows 平台。
rss · AIHOT 精选 · Jun 11, 08:50AIHOT 精选
背景: Meoo CLI 是一个开源命令行工具,作为本地 AI 编程助手与阿里云后端服务之间的桥梁,自动完成数据库接入、用户登录、文件存储和项目发布。
标签: #Alibaba Cloud, #CLI, #AI coding, #deployment, #open-source
Deezer 推出面向其他流媒体的 AI 音乐检测器 ⭐️ 7.0/10
Deezer 发布了一款免费在线工具,可扫描任何流媒体服务的播放列表,检测 AI 生成的曲目。 这使用户能够在不同平台上识别合成音乐,解决了流媒体中 AI 生成内容日益增多的问题。 该检测器在 2025 年已在 Deezer 上标记了超过 1340 万首 AI 曲目。
rss · AIHOT 精选 · Jun 11, 08:00AIHOT 精选
参考链接
标签: #AI, #music, #streaming, #detection, #Deezer
中国 AI 浪潮引发劳动者权益担忧 ⭐️ 7.0/10
中国官媒罕见直白呼吁,在职场快速采用 AI 的背景下保护劳动者权益。 这预示着中国可能出台新的 AI 监管法规,影响数百万劳动者和全球 AI 产业。 北京正在考虑如何控制这项新技术带来的风险,但具体措施尚不明确。
rss · AIHOT 精选 · Jun 11, 06:19AIHOT 精选
标签: #AI, #China, #labor rights, #regulation, #societal impact
Anthropic CEO 警告 AI 将导致大规模长期失业 ⭐️ 7.0/10
Anthropic CEO 达里奥·阿莫迪警告 AI 将导致结构性长期失业,并提出薪资保险和全民基本收入等解决方案。 这表明一位 AI 领军人物承认劳动力市场将发生永久性变化,影响政策和劳动力规划。 阿莫迪认为失业是 AI 复制人类认知能力的固有属性,而非暂时性干扰。
rss · AIHOT 精选 · Jun 11, 05:53AIHOT 精选
背景: 薪资保险为失业后从事低薪工作的工人提供部分工资补偿。全民基本收入(UBI)向所有公民无条件发放现金。
标签: #AI, #job displacement, #policy, #Anthropic, #future of work
mlx-vlm v0.6.3 首发支持 DiffusionGemma 和 North Mini Code ⭐️ 7.0/10
mlx-vlm v0.6.3 通过 MLX 在 Apple Silicon 上首发支持 Google 的 DiffusionGemma 和 Cohere 的 North Mini Code 1.0。 这使得在 Mac 上高效本地推理两种新型架构成为可能,扩展了 MLX 生态系统。 DiffusionGemma(26B MoE,3.8B 激活)以 256 token 块并行生成;North Mini Code(30B MoE,3B 激活)在 BF16 下约 66 tok/s。
rss · AIHOT 精选 · Jun 11, 00:59AIHOT 精选
背景: MLX 是用于 Apple Silicon 上机器学习的数组框架。DiffusionGemma 是 Google 基于扩散的文本生成模型,North Mini Code 是 Cohere 的开源编码 MoE 模型。
参考链接
标签: #MLX, #DiffusionGemma, #North Mini Code, #Apple Silicon, #VLM
Cola:用技能弥合 AI Agent 使用鸿沟 ⭐️ 7.0/10
Cola 项目提出将’Skill’作为解决 AI Agent 采用中 K 型分化的方案。 它解决了专家与普通用户在利用 AI Agent 方面日益扩大的差距。 Cola 旨在通过可复用的技能,让 MCP、记忆、工具调用等 Agent 能力变得易于使用。
rss · AIHOT 全部动态 · Jun 12, 22:06AIHOT 全部动态
背景: K 型分化描述了 AI 如何让专家用户受益而将新手抛在后面。这里的’Skill’指封装好的、可复用的 Agent 能力,用于简化复杂工作流。
参考链接
标签: #AI Agents, #Human-AI Interaction, #Skill Engineering, #Tooling, #Accessibility
Gemini 3.5 Live Translate 发布 ⭐️ 7.0/10
Google 宣布通过 Gemini Live API 推出 Gemini 3.5 Live Translate,实现近实时语音翻译。 这使得开发者能够为应用添加实时多语言语音翻译,提升全球可访问性。 它支持连续语音到语音(S2ST)和同步转录。
rss · AIHOT 全部动态 · Jun 12, 21:36AIHOT 全部动态
背景: Gemini Live API 支持与 Gemini 进行低延迟、实时的语音和视觉交互,处理连续的音频、图像和文本流。
参考链接
标签: #AI, #speech translation, #Gemini, #real-time, #API
基于 GPT 的 deep^2 在成本效率上超越 Fable 10-20 倍 ⭐️ 7.0/10
基准测试显示,deep^2 完成类似任务花费 40 美元,而 Fable 花费 457 美元,差距达 10-20 倍。 这凸显了 AI 代理用户在复杂多步骤任务中实现巨大成本节约的潜力。 deep^2 使用 GPT-4,而 Fable 基于 Claude;deep^2 首次尝试失败但可修复,Fable 首次成功但成本更高。
rss · AIHOT 全部动态 · Jun 12, 21:09AIHOT 全部动态
背景: Fable 是 Anthropic 开发的 AI 代理,可无人值守运行数天;deep^2 是基于 GPT 的类似任务代理。
社区讨论: 未提供社区讨论。
标签: #AI, #cost efficiency, #GPT, #Fable, #benchmark
谷歌起诉中国 AI 诈骗团伙 ⭐️ 7.0/10
谷歌起诉中国网络犯罪团伙 Outsider Enterprise,指控其利用 AI 发送 250 万条诈骗短信,受害人数十万。 这标志着对大规模 AI 网络犯罪的重要法律行动。 该团伙利用谷歌 Gemini AI 创建仿冒谷歌、YouTube 和政府网站的钓鱼模板。
rss · AIHOT 全部动态 · Jun 12, 20:38AIHOT 全部动态
社区讨论: 讨论强调 AI 诈骗威胁日益严重,需要加强监管。
标签: #cybersecurity, #AI misuse, #Google, #cybercrime, #scam
Project Ire 识别出 LOTUSLITE 恶意软件 ⭐️ 7.0/10
微软研究院的 Project Ire 逆向工程了一个逃避大多数 EDR 工具的 LOTUSLITE 恶意软件变种。 该分析揭示了高级逃避技术,帮助防御者改进针对定向间谍活动的检测。 该样本是一个 Windows DLL 后门变种,不在 Acronis 的 IOC 列表中。
rss · AIHOT 全部动态 · Jun 12, 20:33AIHOT 全部动态
背景: LOTUSLITE 是一种用于定向间谍活动的后门,通常通过政治主题的钓鱼邮件传播。EDR 逃避技术使恶意软件能够绕过端点检测和响应系统。
参考链接
社区讨论: X 上的帖子强调了逆向工程方法的新颖性。
标签: #malware analysis, #reverse engineering, #cybersecurity, #EDR evasion
特斯拉 FSD 在丹麦认证视频中被发现使用自行车道 ⭐️ 7.0/10
据 Politiken 报道,特斯拉的全自动驾驶(FSD)模式在丹麦官方认证视频中被发现驶入自行车道。 这一在官方测试中暴露的安全缺陷可能延迟监管批准,并削弱公众对自动驾驶的信任。 事件发生在 1 分 49 秒视频的第 12 秒,随后还出现了多个错误。
rss · AIHOT 全部动态 · Jun 12, 19:30AIHOT 全部动态
背景: 特斯拉的 FSD 目前被归类为 L2 级驾驶辅助,需要人类持续监督,尽管其名称暗示全自动驾驶。
社区讨论: Hacker News 上的帖子获得了 100 个点赞,表明社区对安全影响的高度关注。
标签: #Tesla, #autonomous driving, #safety, #regulation, #AI
ggerganov 点赞 locate-anything.cpp ⭐️ 6.0/10
ggerganov 点赞了 locate-anything.cpp,这是 NVIDIA 的 Locate Anything 模型的 C++ 实现。 这表明对视觉语言定位的高效 C++ 推理可能产生兴趣。 Locate Anything 使用并行框解码,推理速度提升高达 2.5 倍。
github · ggerganov · Jun 12, 14:51
背景: Locate Anything 是 NVIDIA 的视觉语言模型,可以定位文本描述的对象。ggerganov 是 llama.cpp 的创建者,这是一个流行的 LLM C++ 推理引擎。
参考链接
标签: #C++, #computer vision, #open source, #AI
Ollama v0.30.8:修复提供商选择、改进提示缓存、提升 MLX 稳定性 ⭐️ 6.0/10
Ollama v0.30.8 修复了 ollama launch 中的提供商选择问题,改进了提示缓存,并增强了 MLX 推理的稳定性。 此补丁提高了运行本地大语言模型的 Ollama 用户的可靠性,尤其是在 Apple Silicon 上使用 MLX 时。 提示缓存与上下文移位解耦,以更好地重用 KV 缓存;MLX 运行器现在在提示处理期间创建快照。
github · github-actions[bot] · Jun 12, 17:04
背景: MLX 是一个用于 Apple Silicon 上机器学习的数组框架,针对高效推理进行了优化。提示缓存存储中间计算结果,以避免重复处理相同的输入。
标签: #ollama, #MLX, #prompt caching, #recurrent models, #release
在 macOS 上设置本地编码代理 ⭐️ 6.0/10
一篇教程详细介绍了如何在 macOS 上使用 llama.cpp 和开源模型设置本地编码代理。 开发者可以本地运行 AI 编码助手,确保隐私和离线能力。 该指南使用 llama.cpp 的服务器搭配 GGUF 模型以及’pi’代理框架。
hackernews · AIHOT 全部动态 · Jun 12, 17:34 · 社区讨论T2 社区与开源
背景: llama.cpp 是一个开源的 C/C++库,用于本地运行 LLM,支持 GGUF 格式模型,是本地推理的事实标准。
参考链接
社区讨论: 用户建议使用 Ollama 搭配 opencode 等替代方案,并指出短基准测试可能产生虚假的加速结果。
标签: #local-llm, #coding-agent, #macOS, #tutorial
减少 AI 生成界面粗糙感的技巧 ⭐️ 6.0/10
一篇博客文章通过指定设计约束,提供了减少 AI 生成前端通用粗糙外观的实用技巧。 使用 LLM 生成 UI 的开发者可以通过简单约束提升输出质量,节省手动调整的时间。 技巧包括使用特定 CSS 框架、限制调色板以及避免过度依赖默认模式。
hackernews · FergusArgyll · Jun 12, 14:48 · 社区讨论T2 社区与开源
社区讨论: 评论者就设计偏好展开辩论,有人指出 Qt 在训练数据中的大量出现影响了 AI 输出。
标签: #AI, #frontend, #UI design, #LLM
Preply 结合 AI 与真人导师实现个性化学习 ⭐️ 6.0/10
Preply 整合 OpenAI,为语言学习者生成个性化课程总结和练习。 通过自动化反馈提升真人辅导效率,使个性化语言学习更具可扩展性。 AI 在每节课后生成关键主题总结、语法纠正、词汇重点和发音反馈。
rss · OpenAI Blog · Jun 12, 00:00T1 官方实验室
背景: Preply 是一个在线语言学习市场,连接超过 5 万名导师和数百万学习者,利用机器学习推荐导师。
标签: #AI, #education, #language learning, #personalization
Oran Ge 开源《人味儿写作心法》保留 AI 写作中的人味 ⭐️ 6.0/10
Oran Ge 开源了《人味儿写作心法.skill》,用于在 AI 辅助写作中保留人的存在感。 这解决了 AI 写作的一个关键局限:缺乏真实的人类声音和生活体验。 该技能专为用户先写作或口述、再由 AI 润色并保留人味的场景设计。
rss · AIHOT 精选 · Jun 12, 22:48AIHOT 精选
背景: Claude Fable 5 是 Anthropic 于 2026 年 6 月发布的最强大的通用模型。Oran Ge 用它打磨文案时发现输出缺乏“存在感”——即作者在具体位置付出过具体代价的感觉。
标签: #AI writing, #open source, #writing tools, #Claude
在 OpenRouter 上最小化 LLM 成本 ⭐️ 6.0/10
OpenRouter 的:floor后缀和max_price参数可实现最低成本的 LLM 推理,并提供 20 多个免费模型。 开发者可以通过自动选择最便宜的提供商来大幅降低 LLM 推理成本。 :floor后缀强制为给定模型选择最低价格的提供商。
rss · AIHOT 精选 · Jun 12, 16:00AIHOT 精选
背景: OpenRouter 是一个统一 API,将请求路由到多个 LLM 提供商,通过参数实现成本优化。
标签: #LLM, #cost optimization, #OpenRouter, #tutorial
字节豆包上线任务模式,升级专家模式 ⭐️ 6.0/10
字节跳动旗下 AI 应用豆包上线“任务模式”,支持定时执行与文件生成,并将“思考模式”升级为“专家模式”,强化深度推理能力。 此次更新将豆包从聊天机器人转变为任务自动化平台,与其他 AI 智能体展开竞争。 任务模式支持零代码网页生成、一键 PPT 制作和数据可视化;专家模式调用豆包 2.0 Pro 进行深度推理。
rss · AIHOT 精选 · Jun 12, 15:33AIHOT 精选
背景: 豆包是字节跳动基于大语言模型的 AI 助手。新的任务模式支持全链路 Agent 执行,用户无需编码即可自动化复杂工作流。
标签: #AI, #ByteDance, #product update, #task automation, #LLM
qiaomu-ai-prd:面向 AI 的 PRD 生成 Prompt ⭐️ 6.0/10
发布了一个专门为 AI Agent 设计的 PRD 生成 Prompt(qiaomu-ai-prd),旨在提升 AI 驱动开发中的功能完整度。 它解决了 AI 辅助开发中人类与 AI 需求之间的差距,有望提升 AI 生成代码的质量。 安装命令:npx skills add joeseesun/qiaomu-ai-prd;开源,Prompt 在评论区。
rss · AIHOT 精选 · Jun 12, 02:46AIHOT 精选
背景: PRD(产品需求文档)是软件开发中的标准文档。AI Agent 通常需要结构化输入才能生成准确代码;该 Prompt 专门为 AI 消费定制了 PRD 生成。
标签: #AI, #PRD, #prompt engineering, #developer tools
Replit Agent 新增自定义指令与技能 ⭐️ 6.0/10
Replit Agent 现在支持自定义指令和技能,可在不同项目中记住用户偏好。 这消除了重复提示,为使用 Replit Agent 的开发者和团队节省时间。 自定义指令可以是动态的,允许用户在会话期间更新代理应关注的内容。
rss · AIHOT 精选 · Jun 11, 18:58AIHOT 精选
背景: Replit Agent 是一种 AI 工具,可将自然语言转化为应用、设计和幻灯片,无需编码。技能允许教授代理专业知识。
标签: #AI agent, #Replit, #productivity, #customization
OpenRouter 推出帕累托曲线基准探索器 ⭐️ 6.0/10
OpenRouter 发布了一个基准探索器,可在 10 个不同基准上绘制帕累托曲线以比较 AI 模型。 这有助于开发者通过平衡准确性和成本来选择模型,超越了简单的排行榜排名。 该工具可在 openrouter.ai/rankings#benchmarks 获取,更多功能即将推出。
rss · AIHOT 精选 · Jun 11, 15:32AIHOT 精选
背景: 帕累托曲线可视化两个指标(如准确性和成本)之间的权衡,显示一组最优模型,其中任何指标都无法在不恶化另一个指标的情况下得到改善。
标签: #AI, #benchmarks, #OpenRouter, #tools
Krea 2 推出生成式滑块控制图像属性 ⭐️ 6.0/10
Krea 2 推出了生成式滑块,可控制生成图像的强度、复杂度和运动。 这为用户提供了对 AI 图像生成的更精细控制,增强了创意工作流程。 这些滑块位于 Krea 2 图像工具的控制面板中,支持随机化或重置设置。
rss · AIHOT 精选 · Jun 11, 15:00AIHOT 精选
标签: #image generation, #AI tools, #generative AI, #Krea
OpenAI 降价被批评者 Gary Marcus 视为示弱 ⭐️ 6.0/10
OpenAI 正考虑大幅降价,Gary Marcus 认为这暴露了公司竞争力疲软。 这预示着 AI 行业可能面临定价压力,并可能影响开发者的采用。 OpenAI 尚未确认具体的降价细节。
rss · AIHOT 精选 · Jun 11, 13:34AIHOT 精选
背景: Gary Marcus 是一位认知科学家,也是知名的 AI 怀疑论者,经常批评主要 AI 公司。
社区讨论: 该文章引发了关于降价是反映疲软还是战略竞争的讨论。
标签: #OpenAI, #pricing, #AI industry, #commentary
Baoyu-Design 技能现已支持导入本地 Figma 文件 ⭐️ 6.0/10
Baoyu-design 技能现已支持导入本地 .fig 文件,可在本地重建设计系统,效果与 Claude Design 在线版一致。 开发者现在可以离线重建和复用设计系统,减少对云服务的依赖。 该功能依赖 Claude Fable 5 辅助,且需要足够的 Token。
rss · AIHOT 精选 · Jun 11, 06:33AIHOT 精选
背景: Claude Fable 5 是 Anthropic 推出的大型语言模型,针对视觉任务优化,能够从截图重建 UI。
参考链接
标签: #design-tools, #figma, #claude, #open-source, #development-tools
Midjourney V8.1 成为默认模型 ⭐️ 6.0/10
Midjourney 已将默认模型从 V7 升级至 V8.1,提升了智能性、连贯性和文本渲染效果。 用户无需更改设置即可默认获得更优质的图像。 V8.1 现已支持高清模式,可输出更高分辨率的图像。
rss · AIHOT 精选 · Jun 11, 04:08AIHOT 精选
背景: Midjourney 是一家独立的 AI 研究实验室,以其文本到图像生成模型而闻名。V8.1 是一个专注于速度和质量的增量更新。
标签: #AI, #image generation, #Midjourney, #model update
GitHub Copilot CLI 委托任务更智能 ⭐️ 6.0/10
GitHub Copilot CLI 现在通过更好的编排减少了不必要的任务交接并加快了进度,且没有新增任何配置选项。 使用 Copilot CLI 的开发者将经历更少的干扰和更快的任务完成,从而提高生产力。 改进在于编排层,使代理在选择何时委托子任务时更具选择性。
rss · AIHOT 全部动态 · Jun 12, 22:26AIHOT 全部动态
背景: GitHub Copilot CLI 是一个在终端中运行的 AI 驱动编码助手。它可以执行命令和编辑文件以完成任务。自动模式允许代理在不等待用户每一步批准的情况下完成任务。
参考链接
标签: #GitHub Copilot, #CLI, #AI, #developer tools
AI 高速对话加剧 ADHD,威胁专注力 ⭐️ 6.0/10
一条推文观察到,每两三分钟一次的 AI 对话形成注意力集中与涣散的交替循环,加剧 ADHD 症状。 这凸显了 AI 工具日益增长的认知成本,尤其对注意力困难的知识工作者影响显著。 推文特别提到前额叶是持续任务切换中承受压力的脑区。
rss · AIHOT 全部动态 · Jun 12, 21:38AIHOT 全部动态
背景: 前额叶负责执行功能,如专注和冲动控制。网络来源澄清,所谓“前额叶受损”常是自嘲的比喻,并非临床诊断。
标签: #ADHD, #AI, #attention, #productivity
Anthropic 将 Claude Convey Agent 作为 Labs 项目发布 ⭐️ 6.0/10
Anthropic 宣布推出 Claude Convey Agent,这是一个基于远程容器的代理,具有可自定义的 UI,作为 Labs 项目发布。 这扩展了 Anthropic 的代理生态系统,为开发者提供了一种在隔离环境中部署和自定义 AI 代理的新方式。 该代理在远程容器中运行,支持自定义 UI 标签和插件,类似于 Claude Design。
rss · AIHOT 全部动态 · Jun 12, 21:10AIHOT 全部动态
背景: Anthropic Labs 是负责实验新产品的部门;Claude Design 是之前的一个 Labs 项目,用于视觉协作。
参考链接
社区讨论: 该公告内容模糊,尚未提供技术细节或社区反应。
标签: #AI, #Anthropic, #Agent, #Labs
Replit 推出并行构建与多智能体支持 ⭐️ 6.0/10
Replit 现在支持并行构建多个项目并运行并发 AI 智能体。 开发者可通过同时运行最多 10 个智能体大幅加快开发速度。 用户可以向现有项目添加多个工件,并协调智能体处理不同任务。
rss · AIHOT 全部动态 · Jun 12, 19:00AIHOT 全部动态
参考链接
标签: #Replit, #parallel builds, #AI agents, #development tools
OpenAI 推出文档智能体 ⭐️ 6.0/10
OpenAI 在 developers.openai.com 上发布了文档智能体,帮助开发者查找答案并导航文档。 这通过使 OpenAI 产品文档更易于搜索和导航,改善了开发者体验。 该智能体直接链接到相关文档部分,减少搜索时间。
rss · AIHOT 全部动态 · Jun 12, 18:53AIHOT 全部动态
标签: #OpenAI, #developer tools, #documentation, #AI
受《席德·梅尔的海盗》启发的网页海战游戏 ⭐️ 5.0/10
一款受《席德·梅尔的海盗》启发的网页海战游戏已发布。 它为经典游戏的粉丝提供了怀旧体验。 该游戏是一个业余项目,机制和 AI 较为简单。
hackernews · iweczek · Jun 12, 17:07 · 社区讨论T2 社区与开源
社区讨论: 玩家建议增加风向动力学和更好的 AI 以增加挑战性。
标签: #game development, #web game, #retro gaming, #hobby project
OpenAI 推出三门学院课程 ⭐️ 5.0/10
OpenAI 发布了三门学院课程,涵盖实用 AI 技能、工作流和智能体。 帮助专业人士通过结构化学习将 AI 融入日常工作。 课程侧重于创建可重复的工作流和应用 AI 智能体。
rss · OpenAI Blog · Jun 12, 10:00T1 官方实验室
标签: #AI, #education, #OpenAI, #courses
iOS 27 健康 App 大改:卡片、营养识别、围绝经期追踪 ⭐️ 5.0/10
苹果重新设计了健康 App 的卡片布局,新增基于相机的营养识别、围绝经期追踪,并提升了数据同步速度。 这些功能使健康 App 更加主动和个性化,尤其对女性健康和营养追踪意义重大。 营养识别需要 iPhone 15 Pro 或更新机型;GymKit 现在可直接与 iPhone 配对,无需 Apple Watch。
rss · AIHOT 精选 · Jun 12, 02:06AIHOT 精选
背景: GymKit 是苹果用于在 iOS 设备和健身器材之间同步运动数据的协议。围绝经期是绝经前的过渡阶段,常伴有周期不规律。
参考链接
标签: #iOS, #Health, #Apple, #Nutrition, #Fitness
OpenAI Codex 推出速率重置攒存功能 ⭐️ 5.0/10
OpenAI 为 Codex 推出了速率限制重置攒存功能,首先面向 Go、Plus、Pro 和 Business 用户。 用户现在可以将速率限制重置保留到以后使用,从而更灵活地管理 Codex 使用量。 符合条件的用户最初可获得一次免费攒存重置。
rss · AIHOT 精选 · Jun 12, 00:11AIHOT 精选
背景: Codex 是 OpenAI 的 AI 编程助手。此前,速率限制重置会立即生效,无法存储。
参考链接
标签: #OpenAI, #Codex, #rate limit, #feature update
Replit 专家级提示词技巧 ⭐️ 5.0/10
Replit 在 Twitter 上发布了一条线程,分享如何为 AI Agent 编写更好的提示词以减少重写。 更好的提示词能帮助开发者一次获得正确代码,节省时间和精力。 该线程可能涵盖具体性、上下文和迭代优化技巧。
rss · AIHOT 精选 · Jun 11, 22:00AIHOT 精选
背景: Replit Agent 是一个 AI 编程助手,可将自然语言提示转换为应用。提示词工程是编写输入以有效引导 AI 输出的实践。
参考链接
标签: #Replit, #prompt engineering, #AI tools, #productivity
Replit 与 Databricks 集成升级,公开预览开放 ⭐️ 5.0/10
Replit 升级了与 Databricks 的集成,支持应用中按用户控制数据可见性,现已公开预览。 开发者可构建每个用户仅看到授权数据的应用,提升安全性和合规性。 该集成使用 Databricks 服务主体实现安全的行级数据访问控制。
rss · AIHOT 精选 · Jun 11, 21:49AIHOT 精选
标签: #Replit, #Databricks, #data access control, #integration
乔木目标元技能:一句话转 Codex Goal ⭐️ 5.0/10
一个新 Skill 可将一句话需求转化为 Codex /goal 指令,通过 npx skills add joeseesun/qiaomu-goal-meta-skill 安装。 它减轻了阅读冗长文档以编写有效 Codex 目标的负担。 该 Skill 开源免费,旨在简化 4 万字文档的阅读负担。
rss · AIHOT 精选 · Jun 11, 15:15AIHOT 精选
背景: Codex /goal 是一个触发自主循环的功能,用于复杂任务,需要结构良好的目标指令。该 Skill 自动化了目标编写过程。
参考链接
标签: #Codex, #AI-assisted development, #tool, #open source
Hermes Agent Desktop 发布,支持硅基流动一键切换 ⭐️ 5.0/10
Nous Research 发布了 Hermes Agent Desktop,集成硅基流动,支持一键切换 DeepSeek-V4、GLM-5.1 等开源模型。 这简化了开发者的 AI 代理部署,无需手动配置即可灵活切换模型。 桌面应用支持 macOS、Windows 和 Linux,具备可视化技能商店和多代理协作功能。
rss · AIHOT 精选 · Jun 11, 10:17AIHOT 精选
背景: 硅基流动是一个 AI 基础设施平台,用于部署和运行大语言模型,由前微软研究员袁进辉博士创立。
标签: #AI, #Open Source, #Model Deployment, #Agent
Codex 每 5 分钟并行维护仓库 ⭐️ 5.0/10
一个简单循环每 5 分钟唤醒 Codex,通过将工作分配到线程来自主维护仓库。 这展示了一种使用 AI 代理进行并行执行、自主维护仓库的实用模式。 该设置使用编排器技能,结合分类、自动审查和计算机使用技能,实现自主落地。
rss · AIHOT 精选 · Jun 11, 09:09AIHOT 精选
背景: OpenAI Codex 是 2025 年 5 月推出的自主编码代理,基于 o3/GPT-5 模型。编排器技能协调多个子技能以完成复杂任务。
参考链接
标签: #Codex, #autonomous agents, #parallel computing, #repo maintenance
WorkBuddy 教程:国内通用 AI Agent 产品 ⭐️ 5.0/10
一篇教程展示了 WorkBuddy(国内通用 AI Agent)的两个案例:微信公众号周报生成和功能网页开发。 WorkBuddy 为国内用户提供了一站式 AI Agent,集成了多个国产大模型和企业工具,降低了使用门槛。 WorkBuddy 支持 Windows 和 Mac,提供免费版和 58 元/月个人专业版,集成了腾讯混元、DeepSeek、GLM、Kimi 等模型。
rss · AIHOT 精选 · Jun 11, 01:58AIHOT 精选
背景: WorkBuddy 是腾讯云代码助手推出的 AI Agent,拥有 Skills 市场和 MCP 连接器生态,可打通 QQ 邮箱、腾讯会议、腾讯文档等服务。
参考链接
标签: #AI Agent, #Tutorial, #Chinese Tech, #WorkBuddy
橙线插画技能开源发布 ⭐️ 5.0/10
一个免费开源的“橙线插画”技能在 GitHub 上发布。 它提供了一个即用型 AI 代理技能,用于生成纽约客风格的极简插画。 该技能在白色背景上使用细黑墨线和唯一的暖橙点缀(#F97316)。
rss · AIHOT 精选 · Jun 11, 00:05AIHOT 精选
标签: #open-source, #AI illustration, #tool, #GitHub
Palantir 对瑞士杂志诉讼败诉 ⭐️ 5.0/10
Palantir 在一起针对瑞士调查性杂志的诉讼中败诉,未能阻止其报道。 这一法律败诉可能影响 Palantir 控制对其业务关键报道的能力。 该案由《金融时报》报道,但未提供裁决的具体细节。
rss · AIHOT 全部动态 · Jun 12, 22:42AIHOT 全部动态
标签: #Palantir, #legal, #privacy, #surveillance
旧金山举办编码智能体基准测试活动 ⭐️ 5.0/10
Artificial Analysis 在旧金山举办了一场编码智能体基准测试活动,邀请了来自 Cognition、Cursor 和 NVIDIA 的演讲者。 该活动凸显了人们对 AI 编码智能体标准化基准测试日益增长的关注,这对于评估实际性能至关重要。 演讲者包括 Cognition 高级副总裁 Silas Alberti、Cursor 的 Nate Schmidt 和 NVIDIA 的 Venkat Srinivasan。
rss · AIHOT 全部动态 · Jun 12, 22:34AIHOT 全部动态
背景: 编码智能体是能够自主编写和调试代码的 AI 工具。基准测试衡量它们在软件工程等任务上的表现。Artificial Analysis 为此类基准测试提供了排行榜。
标签: #AI, #coding agents, #benchmarking, #event
Claude Code v2.1.176:多语言标题与正则页脚链接 ⭐️ 5.0/10
Claude Code v2.1.176 新增多语言会话标题、正则页脚链接匹配及 Bedrock 凭证缓存优化。 这些改进提升了非英语用户的体验,并在终端输出中提供更灵活的链接处理。 新增的 footerLinksRegexes 设置允许用户使用正则表达式匹配页脚链接徽章。
rss · AIHOT 全部动态 · Jun 12, 21:53AIHOT 全部动态
背景: Claude Code 是 Anthropic 的终端代理编码工具。Bedrock 是 AWS 的基础模型托管服务。
标签: #Claude Code, #release, #bug fix, #AI tools
Tailwind 与 Slop 应用引发 HN 热议 ⭐️ 5.0/10
一篇题为“Tailwind and slop apps”的 Hacker News 帖子获得 100 点热度,引发社区讨论。 该讨论反映了开发者对实用优先 CSS 框架和低质量 AI 生成应用的看法。 Tailwind CSS 是一个实用优先的框架,截至 2026 年 2 月在 GitHub 上拥有超过 93,700 颗星。
rss · AIHOT 全部动态 · Jun 12, 21:38AIHOT 全部动态
背景: Tailwind CSS 是一个开源实用优先的 CSS 框架,使用像’bg-yellow-300’这样的工具类而非预定义组件。’Slop apps’可能指低质量或 AI 生成的应用,该术语在开发者社区中逐渐流行。
参考链接
社区讨论: HN 讨论可能围绕 Tailwind 实用优先方法与传统 CSS 的优劣,以及“slop”应用的泛滥展开。
标签: #Tailwind CSS, #web development, #community discussion
Hyperframes 与 Gemini 视频分析智能体流程 ⭐️ 5.0/10
一个智能体流程将 Hyperframes 与 Gemini 视频分析结合,生成带注释的视频。 这展示了生成式视频帧与 AI 视频理解的新颖集成,用于自动注释。 Hyperframes 可能生成关键帧或摘要,然后由 Gemini 分析以产生注释。
rss · AIHOT 全部动态 · Jun 12, 20:07AIHOT 全部动态
标签: #video analysis, #AI agents, #Gemini, #Hyperframes
Codex AI 代理玩 Rimworld ⭐️ 5.0/10
一条推文显示 OpenAI 的 Codex AI 代理正在运行游戏 Rimworld。 这展示了 Codex 与复杂游戏环境交互的能力。 Codex 是一个 AI 编码代理,可以在隔离环境中编写代码并执行任务。
rss · AIHOT 全部动态 · Jun 12, 19:40AIHOT 全部动态
背景: Codex 是 OpenAI 开发的 AI 编码代理,于 2025 年 4 月以 Codex CLI 形式发布。它帮助进行编码、调试和功能交付。
社区讨论: 未提供讨论内容。
标签: #Codex, #AI, #gaming, #demonstration
Codex 将网站更新从一周缩短至三天 ⭐️ 5.0/10
OpenAI 的 Codex 代理能够并行更新网站的多个部分,将一周的工作量缩短为三天。 这展示了 Codex 在实际任务中大幅提升开发者生产力的潜力。 来自 @intelligenceco 的用户 @ndrewpignanelli 通过在多个部分并行运行 Codex 实现了这一效果。
rss · AIHOT 全部动态 · Jun 12, 19:30AIHOT 全部动态
背景: Codex 是 OpenAI 的 AI 编码代理,能够自主编写代码、修复错误,并在隔离环境中执行软件工程任务。
标签: #Codex, #AI-assisted development, #productivity