YLF News Daily: 2026-06-18 (ZH)

从 149 条内容中筛选出 69 条重要资讯

发现一万个 GitHub 仓库分发木马恶意软件 ⭐️ 9.0/10
Transformer 共同作者 Shazeer 加盟 OpenAI ⭐️ 9.0/10
OpenAI 用强化学习训练诚实与可纠正性，对齐泛化 ⭐️ 9.0/10
Claude Opus 4.7 自主完成任务，速度比人类快 20 倍 ⭐️ 9.0/10
中国发布首部 L3/L4 自动驾驶强制性国标 ⭐️ 9.0/10
苹果 Xcode 27 核心首次深度集成 AI 智能体：支持自然语言修 Bug、构建 App ⭐️ 9.0/10
OpenAI 2025 年营收 130 亿美元，亏损 390 亿美元 ⭐️ 9.0/10
NVIDIA GEAR 实验室 ENPIRE：8 个 Codex 智能体自主控制机器人 ⭐️ 9.0/10
谷歌 AMIE AI 迈向长期疾病管理 ⭐️ 9.0/10
Elkjop 因强制同意被罚 180 万欧元 ⭐️ 8.0/10
医院和大学药物再利用使成本降低 90% ⭐️ 8.0/10
Microsoft new Outlook takes 10 seconds to do what Outlook Classic does instantly ⭐️ 8.0/10
GPT-5.5 Instant 提升 ChatGPT 健康智能 ⭐️ 8.0/10
AI 模型辅助诊断儿童罕见病：诊断率提升 4.8% ⭐️ 8.0/10
MosaicLeaks 揭示 AI 研究智能体的隐私风险 ⭐️ 8.0/10
超越 LoRA：如何选择最佳 PEFT 技术 ⭐️ 8.0/10
Cloudflare 的漏洞检测框架架构 ⭐️ 8.0/10
亚马逊将向数据中心销售 AI 芯片，挑战英伟达 ⭐️ 8.0/10
FERC 强制为 AI 数据中心提供快速并网通道 ⭐️ 8.0/10
Claude Enterprise 推出 MCP 连接器托管授权管理 ⭐️ 8.0/10
Claude Code 自定义：七种方法详解 ⭐️ 8.0/10
Grok TTS 在盲测人类相似度中获 96 分登顶 ⭐️ 8.0/10
Adobe 为 Photoshop、Premiere 等 Creative Cloud 应用加入 AI 智能体 ⭐️ 8.0/10
ChatGPT 图像生成器可绕过滤镜生成违规内容 ⭐️ 8.0/10
cuTile Rust：安全无数据竞争的 GPU 内核系统 ⭐️ 8.0/10
LOGOS：首个开源统一科学基础模型 ⭐️ 8.0/10
上交所放宽 AI 大模型企业上市条件 ⭐️ 8.0/10
库克称 AI 存储芯片短缺致苹果产品涨价不可避免 ⭐️ 8.0/10
GitHub 发布 CC0-1.0 多语言仓库数据集 ⭐️ 8.0/10
AI 首席执行官提议美国主导联盟排除中国 ⭐️ 8.0/10
Vercel 开源 Eve：文件系统优先的 AI 智能体框架 ⭐️ 8.0/10
Omnigent 开源：AI 智能体团队元框架 ⭐️ 8.0/10
MolmoMotion：语言引导的 3D 运动预测模型 ⭐️ 8.0/10
AWS 开源 Strands Robots SDK，实现统一机器人控制 ⭐️ 8.0/10
OpenAI 利用 RL 训练提升跨领域诚实性 ⭐️ 8.0/10
OpenAI Codex 新增 Record & Replay 插件 ⭐️ 8.0/10
Perplexity 推出 Brain：智能体自改进记忆系统 ⭐️ 8.0/10
Yann LeCun：LLM 现实智能受限，因语言只是世界的简化描述 ⭐️ 8.0/10
李飞飞：空间智能通过 Marble 赋能人类创造力 ⭐️ 8.0/10
SK Telecom 涉华关联引发 Anthropic 危机，Claude Mythos 和 Fable 5 被下线 ⭐️ 8.0/10
康奈尔 CS 6120 高级编译器课程现以自导形式开放 ⭐️ 7.0/10
W Social：欧洲数字主权还是作秀？ ⭐️ 7.0/10
除了 .gitignore：其他 Git 忽略机制 ⭐️ 7.0/10
两人初创公司打造 60Hz 彩色电子纸显示器 ⭐️ 7.0/10
Emacs 31 预览：关键变化与社区热议 ⭐️ 7.0/10
Hugging Face 发布 AI 智能体友好度基准测试 ⭐️ 7.0/10
AI 推理公司 Baseten 据报以 130 亿美元估值融资 15 亿美元 ⭐️ 7.0/10
Snap 剥离 AI 视频团队成立新公司 Dotmo ⭐️ 7.0/10
德州数据泄露：300 万驾照被盗 ⭐️ 7.0/10
苹果在巴西开放 App Store 竞争 ⭐️ 7.0/10
General Intuition 以 20 亿美元估值融资 3 亿美元，用于具身 AI ⭐️ 7.0/10
Waymo 召回近 4000 辆无人驾驶出租车，因进入施工区 ⭐️ 7.0/10
Claude Code 推出 Artifacts 功能 ⭐️ 7.0/10
桑德斯 7 万亿美元 AI 计划：对大型 AI 公司征收 50%股票税 ⭐️ 7.0/10
皮尤民调：63%美国人认为 AI 发展过快 ⭐️ 7.0/10
火山引擎发布豆包实时语音模型 3.0 API ⭐️ 7.0/10
DeepSeek 识图模式正式上线 ⭐️ 7.0/10
Matt Pocock 开源 skills v1，降低 Token 成本 63% ⭐️ 7.0/10
谷歌发布 99 美元 Gemini 智能音箱 ⭐️ 7.0/10
Cloudflare One Stack：AI 智能体驱动的零信任部署工具 ⭐️ 7.0/10
阿里云发布 HappyOyster 1.0，实时交互数字世界 ⭐️ 7.0/10
OpenAI 第一季度现金消耗达 37 亿美元，超收入一半 ⭐️ 7.0/10
AA-Briefcase 基准评估 AI 智能体的长期知识工作能力 ⭐️ 7.0/10
开源 LLM 收入或超 Anthropic，Cursor 先例 ⭐️ 7.0/10
OpenAI 从 Meta 挖来高管与政策顾问，加强硬件与政府关系 ⭐️ 7.0/10
英特尔任命李锡熙为代工执行副总裁聚焦 AI 芯片封装 ⭐️ 7.0/10
Atomic Mail 推出 AI 智能体专用 API 优先邮箱 ⭐️ 7.0/10
Google 庆祝 A2A 协议发布一周年：协作智能体生态 ⭐️ 7.0/10
Wisedocs 推出医学长上下文推理基准 MLCR ⭐️ 7.0/10

发现一万个 GitHub 仓库分发木马恶意软件 ⭐️ 9.0/10

一名安全研究员发现一万个 GitHub 仓库在分发木马恶意软件。这种广泛的供应链攻击威胁每一个信任开源依赖的开发者。恶意仓库使用频繁删除并推送提交等技术以保持可见性。

hackernews · theorchid · Jun 18, 11:45 · 社区讨论T2 社区与开源

社区讨论: 开发者报告类似经历，并讨论这些仓库如何针对自动化代理而非人类。

标签: #security, #malware, #GitHub, #supply chain, #trojan

Transformer 共同作者 Shazeer 加盟 OpenAI ⭐️ 9.0/10

Noam Shazeer， seminal 论文《Attention Is All You Need》的共同作者，在 X 上宣布他将离开 Google 加入 OpenAI。 Shazeer 是驱动现代 AI 的 transformer 架构的关键人物，他的跳槽标志着重大人才变动。 Shazeer 此前共同创立了 Character.AI，并于 2024 年通过价值约 27 亿美元的授权协议回归 Google，担任 Gemini 联合负责人。

hackernews · AIHOT 全部动态 · Jun 18, 00:26 · 社区讨论T2 社区与开源

背景: Transformer 架构在 2017 年的论文《Attention Is All You Need》中提出，它取代了循环神经网络用于序列任务，并成为 GPT 和 Gemini 等模型的基础。Shazeer 是八位共同作者之一。

参考链接

社区讨论: 用户注意到 Shazeer 短暂回归 Google 的情况，并猜测其离职可能涉及政治或薪酬原因。

标签: #AI, #transformers, #OpenAI, #talent, #research

OpenAI 用强化学习训练诚实与可纠正性，对齐泛化 ⭐️ 9.0/10

OpenAI 用强化学习训练诚实与可纠正性，对齐泛化。有益行为在对抗性压力下保持，提升 AI 安全性。训练数据覆盖多个领域；评测包括奖励黑客和欺骗。

rss · AIHOT 精选 · Jun 18, 18:00AIHOT 精选

背景: 奖励黑客指 AI 利用奖励信号而未达成预期目标，类似作弊。本研究训练出的特质能抵御此类问题。

参考链接

标签: #AI alignment, #reinforcement learning, #generalization, #trustworthy AI

Claude Opus 4.7 自主完成任务，速度比人类快 20 倍 ⭐️ 9.0/10

Claude Opus 4.7 在 Project Fetch 第二阶段自主完成任务，速度比人类团队快 20 倍。通用模型规模化即可实现显著的自主智能体速度提升。编码量减少近 10 倍，但精确闭环控制仍有困难。

rss · AIHOT 精选 · Jun 18, 16:22AIHOT 精选

背景: 闭环控制利用反馈来调整动作；缩放定律显示模型性能随规模提升。

参考链接

标签: #AI, #robotics, #autonomous agents, #Claude, #Anthropic

中国发布首部 L3/L4 自动驾驶强制性国标 ⭐️ 9.0/10

工信部公示首部 L3/L4 自动驾驶强制性国标，2027 年 7 月实施。该标准对 L3/L4 车辆设定强制安全要求，影响在华所有车企。引入 Safety Case 机制，L3 重点规范人机交接，L4 需独立处置风险，不得依赖远程协助。

rss · AIHOT 精选 · Jun 18, 14:57AIHOT 精选

背景: Safety Case 是一种结构化论证和证据，证明自动驾驶系统安全可部署。该机制在安全关键行业广泛使用，现被中国 L3/L4 法规强制要求。

参考链接

Aurora’s Safety Case Framework

标签: #autonomous driving, #regulation, #L3/L4, #China, #safety standards

苹果 Xcode 27 核心首次深度集成 AI 智能体：支持自然语言修 Bug、构建 App ⭐️ 9.0/10

Apple announces Xcode 27 with deep AI integration, allowing natural language bug fixing and app building.

rss · AIHOT 精选 · Jun 18, 00:43AIHOT 精选

标签: #Xcode, #AI Agent, #Apple, #Swift, #iOS Development

OpenAI 2025 年营收 130 亿美元，亏损 390 亿美元 ⭐️ 9.0/10

泄露文件显示，OpenAI 2025 年营收 130.7 亿美元，净亏损约 390 亿美元。这揭示了领先 AI 开发的惊人成本，挑战了前沿 AI 公司的经济可行性。研发成本高达 191.8 亿美元，其中向微软支付 105.9 亿美元，推理计算成本 75 亿美元。

rss · AIHOT 精选 · Jun 17, 23:09AIHOT 精选

背景: 推理计算是指运行 AI 模型生成回应的成本，目前占大型 AI 提供商（如 OpenAI）运营成本的大部分。

参考链接

标签: #OpenAI, #AI economics, #financial analysis, #ChatGPT, #AI industry

NVIDIA GEAR 实验室 ENPIRE：8 个 Codex 智能体自主控制机器人 ⭐️ 9.0/10

ENPIRE 系统使用 8 个 Codex 智能体自主控制机器人进行物理实验。这是首个使用多智能体机器人实现物理世界自主研究的系统。安全措施包括硬运动极限切断和扭矩受限夹爪，奖励函数离线冻结防止作弊。

rss · AIHOT 精选 · Jun 17, 16:31AIHOT 精选

背景: Codex 是 OpenAI 开发的 AI 智能体，能自主执行编程任务。ENPIRE 将其适配到机器人控制。

参考链接

标签: #NVIDIA, #robotics, #AI agents, #embodied AI, #autonomous research

谷歌 AMIE AI 迈向长期疾病管理 ⭐️ 9.0/10

谷歌的 AMIE AI 系统发表在《自然》杂志上，现已能处理长期疾病管理，在临床推理中与医生相当或更优。这标志着迈向 AI 辅助慢性病护理的重要一步，可能减轻临床医生的工作负担。 AMIE 利用 Gemini 的长上下文窗口交叉引用数百份临床指南，并整合共情对话和深度思考智能体。

rss · AIHOT 精选 · Jun 17, 15:00AIHOT 精选

背景: AMIE（Articulate Medical Intelligence Explorer）是谷歌的研究 AI 系统，针对诊断推理和对话进行了优化。新系统从一次性诊断扩展到持续疾病管理。

参考链接

标签: #AI, #healthcare, #medical AI, #disease management, #Gemini

Elkjop 因强制同意被罚 180 万欧元 ⭐️ 8.0/10

挪威数据保护机构对电子零售商 Elkjop 处以 180 万欧元罚款，因其要求顾客同意营销才能加入会员俱乐部。这一执法案例树立了先例，表明将营销同意与会员资格捆绑违反 GDPR 自由同意的原则。罚款是在 2018 年一位顾客投诉后作出的，DPA 确认这种做法违法。

hackernews · speckx · Jun 18, 18:31 · 社区讨论T2 社区与开源

背景: GDPR 要求同意是自由给出的、具体的、知情的且明确的。强制同意，即服务以同意为条件，通常无效。

社区讨论: 评论者分享了官方决定链接，并赞扬挪威数据保护机构以用户为中心的执法，同时指出过程缓慢。

标签: #GDPR, #privacy, #consent, #data protection, #enforcement

医院和大学药物再利用使成本降低 90% ⭐️ 8.0/10

医院和大学正在以比开发新药低 90%的成本，将现有药物用于新的适应症。这种方法可以大幅降低医疗费用，提高常见病和罕见病治疗的可及性。例如，抗癌药物 Avastin（每剂 50 美元）可用于治疗黄斑变性，替代疗效相同但价格高达每剂 1500 美元的 Lucentis。

hackernews · giuliomagnifico · Jun 18, 10:33 · 社区讨论T2 社区与开源

背景: 药物再利用（或重定位）是研究已获批药物用于新的治疗目的。由于已有安全性数据，它可以绕过许多早期试验，大幅降低开发成本。

参考链接

社区讨论: 评论者指出 Avastin 和 Lucentis 之间惊人的成本差异，并强调缺乏无需制造商许可即可实现药物再利用的监管途径。

标签: #drug repurposing, #healthcare, #cost reduction, #pharmaceuticals, #public health

Microsoft new Outlook takes 10 seconds to do what Outlook Classic does instantly ⭐️ 8.0/10

The new Microsoft Outlook, built on WebView2, takes 10 seconds to perform tasks that the classic version does instantly, frustrating users and sparking debate about modern web-based desktop apps.

hackernews · Adam-Hincu · Jun 18, 12:19 · 社区讨论T2 社区与开源

标签: #performance, #Outlook, #WebView2, #desktop apps, #user experience

GPT-5.5 Instant 提升 ChatGPT 健康智能 ⭐️ 8.0/10

OpenAI 发布了 GPT-5.5 Instant，增强了 ChatGPT 在健康领域的响应能力，推理更强且事实错误减少 71%，现已面向所有免费用户开放。此次升级为免费用户提供了更高质量的健康信息，减少了错误，提高了医疗查询的安全性。 GPT-5.5 Instant 在 HealthBench 基准测试上达到了 OpenAI 顶级 Thinking 模型的性能，且成本更低。

rss · AIHOT 精选 · Jun 18, 11:00AIHOT 精选

背景: HealthBench 是一个由 262 位医生参与构建的新基准，用于评估 LLM 在临床场景中的表现。Thinking 模型指的是 OpenAI 的推理模型（如 o3 和 o4-mini），它们在响应前会进行“思考”。

参考链接

标签: #GPT-5.5, #AI healthcare, #ChatGPT, #OpenAI, #health intelligence

AI 模型辅助诊断儿童罕见病：诊断率提升 4.8% ⭐️ 8.0/10

OpenAI 的 o3 Deep Research 模型与波士顿儿童医院和哈佛大学合作，在 376 例未确诊罕见病中额外诊断了 18 例（额外诊断率 4.8%）。这表明推理 AI 在协助专家解决疑难诊断病例方面具有临床意义，使定期再分析更具可扩展性。该模型生成基于证据的候选解释供专家审查，但不直接诊断或做临床决策。

rss · AIHOT 精选 · Jun 18, 08:00AIHOT 精选

背景: OpenAI o3 是一个推理模型；其 Deep Research 版本针对复杂的多步网络研究任务进行了优化。罕见病常多年未确诊，AI 能从现有数据生成可检验的假设。

参考链接

标签: #AI in healthcare, #rare disease diagnosis, #OpenAI, #clinical AI, #reasoning model

MosaicLeaks 揭示 AI 研究智能体的隐私风险 ⭐️ 8.0/10

MosaicLeaks 提出了包含 1,001 条多跳研究链的基准测试，以及 PA-DR 训练方法，将隐私泄露降低 24.1% 同时提升任务成功率。这暴露了结合私有与公共数据的 AI 智能体中的关键漏洞，影响构建隐私敏感研究智能体的开发者。 PA-DR 将严格链成功率从 48.7% 提升至 58.7%，并将答案/全面信息泄露率从 34.0% 降至 9.9%。

rss · AIHOT 精选 · Jun 18, 18:13AIHOT 精选

背景: 深度研究智能体在私有文档和公共网页结果上进行多步推理。多跳研究链由交错排列的子问题组成，需要跨来源整合信息。

参考链接

标签: #AI privacy, #multi-hop reasoning, #LLM agents, #privacy leakage

超越 LoRA：如何选择最佳 PEFT 技术 ⭐️ 8.0/10

Hugging Face 揭示 LoRA 占据 98.4%的 PEFT 模型卡和 95%的外部检查点，随后引入基于思维链推理的基准测试来对比 40 多种 PEFT 方法。这挑战了声称其他方法优于 LoRA 的研究偏见，并为从业者提供了选择最佳 PEFT 技术的客观工具。该基准测试在数学数据集上使用思维链推理微调 LLM；仅调整学习率就能让 LoRA 匹配声称更优的方法。

rss · AIHOT 精选 · Jun 18, 00:00AIHOT 精选

背景: 参数高效微调（PEFT）通过仅更新少量参数来适配大型模型，降低成本。低秩自适应（LoRA）是最流行的 PEFT 方法，注入可训练的低秩矩阵。思维链（CoT）推理引导 LLM 生成中间步骤，提高复杂任务的准确性。

参考链接

标签: #PEFT, #LoRA, #fine-tuning, #LLM, #benchmarking

Cloudflare 的漏洞检测框架架构 ⭐️ 8.0/10

Cloudflare 发布了关于其多阶段漏洞检测框架和自动分类系统的技术深度解析，包括状态管理和误报减少。这展示了一种可扩展的自动化漏洞挖掘方法，结合了 LLM 和对抗性审查来分类真实漏洞。该系统采用两阶段框架：漏洞发现框架（VDH）用于扫描，漏洞验证系统（VVS）用于去重、判断和修复。

rss · Cloudflare Blog · Jun 18, 17:59T1 官方实验室

背景: 漏洞检测框架是一种自动扫描代码库以发现潜在安全问题的工具。Cloudflare 的方法使用了多个阶段和对抗性审查来减少误报，并通过绕行策略处理 LLM 上下文限制。

参考链接

Build your own vulnerability harness

标签: #security, #vulnerability management, #automation, #LLM, #Cloudflare

亚马逊将向数据中心销售 AI 芯片，挑战英伟达 ⭐️ 8.0/10

亚马逊云服务将向其他数据中心出售 AI 芯片，挑战英伟达。此举挑战英伟达的 AI 芯片主导地位，为亚马逊创造 500 亿美元机会。 AWS Trainium 和 Inferentia 芯片专为 AI 训练和推理定制设计。

rss · TechCrunch · Jun 18, 18:22T1 官方实验室

背景: AWS 自 2018 年起研发自定义 AI 芯片 Trainium 和 Inferentia，用于 AI 工作负载。

参考链接

社区讨论: 初创公司称亚马逊芯片性能落后英伟达，但 OpenAI 仍在使用。

标签: #AI chips, #AWS, #Nvidia, #cloud computing, #semiconductors

FERC 强制为 AI 数据中心提供快速并网通道 ⭐️ 8.0/10

FERC 命令六大电网运营商为数据中心等大型用户提供快速并网通道。缓解了并网瓶颈，但未解决电力供应短缺问题。数据中心需承担并网费用；FERC 要求在 60 天内审查发电容量和电价。

rss · AIHOT 精选 · Jun 18, 17:49AIHOT 精选

背景: FERC 是美国联邦能源监管委员会，负责监管跨州电力传输，但不控制发电。数据中心电力需求预计到 2035 年增长近三倍。

参考链接

社区讨论: 观察人士指出，新输电线路建设仍是关键瓶颈。

标签: #AI, #data centers, #energy policy, #FERC, #grid

Claude Enterprise 推出 MCP 连接器托管授权管理 ⭐️ 8.0/10

Claude Enterprise 现已支持管理员通过 Okta 等身份提供商集中管理 MCP 连接器授权，用户可自动获得权限。通过将授权集成到现有身份提供商工作流中，简化了企业 AI 工具的部署，提升安全性并减少人工操作。基于 MCP 的企业托管授权扩展，支持 Asana、Atlassian、Canva、Figma 等提供商，Slack 即将加入。

rss · AIHOT 精选 · Jun 18, 17:51AIHOT 精选

背景: 模型上下文协议（MCP）是连接 AI 系统与外部工具和数据的开放标准。企业托管授权扩展允许组织的身份提供商授权 MCP 连接，支持基于组的访问和快速撤销。

参考链接

标签: #enterprise, #MCP, #identity-provider, #authorization, #Claude

Claude Code 自定义：七种方法详解 ⭐️ 8.0/10

Anthropic 发布指南，详解七种自定义 Claude Code 行为的方法。这帮助开发者在 AI 辅助编程中优化上下文使用和自动化。方法在加载时机、压缩行为和上下文成本上各有不同，从始终加载的 CLAUDE.md 到永不压缩的钩子。

rss · AIHOT 精选 · Jun 18, 17:51AIHOT 精选

背景: CLAUDE.md 是一个文件，每次 Claude Code 会话都会加载其中的指令，充当持久的系统提示。子智能体在隔离的上下文中运行，具有独立的 token 预算。钩子是在生命周期事件上触发的 shell 命令。

参考链接

标签: #Claude Code, #AI customization, #prompt engineering, #developer tools, #Anthropic

Grok TTS 在盲测人类相似度中获 96 分登顶 ⭐️ 8.0/10

xAI 的 Grok TTS 模型在 Vapi AI 的 Humanness Index 盲测中获得 96 分（满分 100），仅比真人声音低 4 分。这种接近人类的表现标志着 AI 语音合成的一个里程碑，表明合成声音几乎可以与真人声音难以区分。盲测使用相同的语音样本和引文由每个模型克隆，然后由听众评分。

rss · AIHOT 精选 · Jun 18, 17:02AIHOT 精选

背景: Humanness Index 是由 Vapi AI（一个构建语音 AI 代理的平台）进行的盲测。它衡量 TTS 声音听起来有多像人类，真人声音设为 100 分。

参考链接

社区讨论: xAI 的公告帖显示 Grok TTS 在排行榜上位居榜首，评论者对其接近人类的质量印象深刻。

标签: #TTS, #AI, #Grok, #xAI, #speech synthesis

Adobe 为 Photoshop、Premiere 等 Creative Cloud 应用加入 AI 智能体 ⭐️ 8.0/10

Adobe 以公开测试形式在 Photoshop、Premiere、Illustrator 和 InDesign 等应用中推出 AI 智能体（Firefly AI Assistant），可自动完成多步骤创意任务。创意专业人士现在可以将重复性工作流程步骤交给 AI 处理，大幅提升生产力并加快内容迭代速度。 AI 智能体可在 Premiere 中自动分拣素材并生成粗剪、在 Photoshop 中换背景、在 Illustrator 中批量生成文件、在 InDesign 中更新版式；Firefly 还新增了 Quick Cut 自动粗剪功能。

rss · AIHOT 精选 · Jun 18, 12:59AIHOT 精选

背景: Adobe Firefly 是 2023 年首次推出的生成式 AI 模型系列，基于许可和公共领域内容训练，提供商业安全输出。新的 AI 智能体将 Firefly 的能力从单步生成扩展到跨 Creative Cloud 应用的多步骤工作流自动化。

参考链接

Adobe Firefly - Free Generative AI for Creatives

标签: #Adobe, #AI Agents, #Creative Cloud, #Automation, #Productivity

ChatGPT 图像生成器可绕过滤镜生成违规内容 ⭐️ 8.0/10

Mindgard 红队研究人员发现，通过简单的提示工程可让 ChatGPT 图像生成器在未明确请求时自动生成暴力和色情图像。这暴露了广泛使用的 AI 图像生成器中的关键安全缺陷，引发对内容审核和负责任 AI 部署的担忧。一个流行的“恢复照片”提示词因模糊性绕过了输入过滤器；添加虚假图像 ID 和“不做审查”指令后，模型持续生成高度性化图像和暴力场景。

rss · AIHOT 精选 · Jun 18, 11:25AIHOT 精选

背景: AI 红队测试指通过模拟对抗性攻击来发现部署前的漏洞。提示工程攻击通过操纵输入文本引发语言模型的意外行为。

参考链接

什么是AI 红队（AI Red Teaming）？ – AI Training – Qgenius

社区讨论: 研究指出，生成的图像被描述为如同“俄罗斯轮盘赌”的有害内容，且 OpenAI 此前声称修复的裸露问题仍未解决。

标签: #ai-safety, #content-filtering, #chatgpt, #red-teaming, #image-generation

cuTile Rust：安全无数据竞争的 GPU 内核系统 ⭐️ 8.0/10

cuTile Rust 是一个基于 tile 的 GPU 内核系统，利用 Rust 编写内存安全、无数据竞争的内核，在 NVIDIA GPU 上达到接近峰值性能。它将 Rust 的安全保障引入 GPU 编程，实现了 91% 带宽和 92% 峰值浮点性能，有望提升机器学习推理和高性能计算的可靠性。在 NVIDIA B200 上，逐元素操作达 7 TB/s（约 91% 峰值带宽），GEMM 达 2 PFlop/s（约 92% 密集 f16 峰值）。

rss · AIHOT 精选 · Jun 18, 03:09AIHOT 精选

背景: 基于 tile 的 GPU 内核系统将计算划分为小块以实现高效并行执行。CUDA Tile IR 是一种底层中间表示，将 GPU 建模为基于 tile 的处理器，在此用于 JIT 编译为 GPU cubin（CUDA 二进制格式）。

参考链接

标签: #GPU programming, #Rust, #Machine learning inference, #Memory safety, #JIT compilation

LOGOS：首个开源统一科学基础模型 ⭐️ 8.0/10

首个开源统一科学基础模型 LOGOS-1B 正式发布，在六大分子任务上取得最先进性能，采用基于序列的方法且无需 3D 坐标。它表明单一模型可在分子生成、逆合成和 MOF 设计等领域超越专业模型，降低了 AI 在科学领域的应用门槛。 LOGOS-1B 使用统一词汇表将蛋白质和小分子编码为离散令牌，通过空间交互离散化实现无需 3D 坐标的序列预测。

rss · AIHOT 精选 · Jun 18, 02:31AIHOT 精选

背景: 该模型采用“统一科学语法”和空间交互离散化技术，将分子相互作用编码为离散序列令牌，从而省去昂贵的 3D 结构计算。

标签: #AI for Science, #Foundation Model, #Molecular Generation, #Open Source, #Protein Design

上交所放宽 AI 大模型企业上市条件 ⭐️ 8.0/10

上交所发布指引，允许尚未形成稳定收入的 AI 大模型企业适用科创板第五套上市标准。该政策为国内 AI 大模型初创企业打开了 IPO 通道，加速行业商业化和投资。申报企业需至少有一个大模型产品完成上线发布并实现规模化应用。

rss · AIHOT 精选 · Jun 18, 00:49AIHOT 精选

背景: 科创板第五套上市标准原为生物医药、集成电路等研发密集但收入不稳定的企业设计。此次扩展至 AI 大模型公司是重大政策转向。

参考链接

科创板第五套标准扩围至大模型企业，智谱、MiniMax“回A”有望提速

社区讨论: 业内观察人士预计智谱、MiniMax 等公司将加速 A 股上市计划。

标签: #AI, #regulation, #IPO, #China, #stock exchange

库克称 AI 存储芯片短缺致苹果产品涨价不可避免 ⭐️ 8.0/10

库克确认，AI 热潮导致存储芯片短缺和价格暴涨，苹果产品涨价已不可避免。这意味着 iPhone、Mac 等苹果设备将涨价，影响数百万消费者。自 2024 年以来存储芯片价格已翻四倍，下一代 iPhone 18 Pro 售价或需增加约 270 美元。

rss · AIHOT 精选 · Jun 17, 22:41AIHOT 精选

背景: 高带宽内存（HBM）是一种 3D 堆叠 DRAM 架构，用于 AI 加速器以提供海量数据吞吐。AI 公司对 HBM 的需求激增，挤占了消费电子芯片的供应，导致价格上涨。

参考链接

High Bandwidth Memory - Wikipedia

标签: #AI, #memory chips, #Apple, #pricing, #supply chain

GitHub 发布 CC0-1.0 多语言仓库数据集 ⭐️ 8.0/10

GitHub 发布了采用 CC0-1.0 许可证的新数据集，包含多语言仓库的 README、Issue 和 Pull Request 数据。该数据集使研究人员和开发者能够构建和改进多语言 AI 模型，用于代码理解和开发者工具。该数据集是仓库级别的，保留了整个仓库的结构，并涵盖了 README、Issue 和 PR 内容。

rss · AIHOT 精选 · Jun 17, 19:41AIHOT 精选

背景: CC0-1.0 是 Creative Commons 许可证，允许放弃所有版权，将作品置于公共领域。仓库级数据集包含代码仓库的完整结构，而不仅仅是孤立文件。

参考链接

Лицензии и инструменты Creative Commons — Википедия

标签: #dataset, #open source, #GitHub, #multi-language, #AI

AI 首席执行官提议美国主导联盟排除中国 ⭐️ 8.0/10

Anthropic 和 DeepMind CEO 呼吁美国主导的 AI 联盟排除中国。这可能重塑全球 AI 治理，加剧地缘政治竞争。该提案以前沿模型和硬件的访问权限为手段排除中国。

rss · AIHOT 精选 · Jun 17, 18:16AIHOT 精选

背景: 前沿模型是最先进的 AI 模型，通常需要大量资源并带来独特风险。

参考链接

Frontier Models Explained: What Defines the Cutting Edge of AI

社区讨论: 批评者称这是高技术新冷战的开端。

标签: #AI governance, #geopolitics, #regulation, #Anthropic, #DeepMind

Vercel 开源 Eve：文件系统优先的 AI 智能体框架 ⭐️ 8.0/10

Vercel 开源了文件系统优先的 AI 智能体框架 Eve。 Eve 的设计使 AI 智能体更简单且可投产。 Eve 具备检查点、沙箱、MCP/OpenAPI、多通道和追踪能力。

rss · AIHOT 精选 · Jun 17, 17:22AIHOT 精选

背景: MCP 是 Anthropic 提出的 AI 与外部工具连接的标准。Eve 支持 MCP。

参考链接

Model Context Protocol - Wikipedia

标签: #AI, #open-source, #framework, #Vercel, #agents

Omnigent 开源：AI 智能体团队元框架 ⭐️ 8.0/10

Omnigent is an open-source meta-framework for running a team of AI agents (Claude Code, Codex, Cursor, Pi) in a single real-time session.

rss · AIHOT 精选 · Jun 17, 15:47AIHOT 精选

标签: #AI agents, #open source, #framework, #Databricks, #multi-agent

MolmoMotion：语言引导的 3D 运动预测模型 ⭐️ 8.0/10

MolmoMotion 基于 Molmo 2，从视频、3D 点和文本指令预测 3D 轨迹。该开源模型推进了语言引导的 3D 运动预测，对机器人和 AI 领域有意义。两种变体：自回归(MolmoMotion-AR)和流匹配(MolmoMotion-FM)。

rss · AIHOT 精选 · Jun 17, 15:26AIHOT 精选

背景: Molmo 2 是 AI2 开放视觉语言模型。流匹配高效生成多条合理轨迹。

参考链接

社区讨论: 开源发布模型、数据集和基准广受好评。

标签: #3D motion prediction, #language-guided, #Molmo, #open-source, #dataset

AWS 开源 Strands Robots SDK，实现统一机器人控制 ⭐️ 8.0/10

AWS 以 Apache 2.0 许可证开源了 Strands Robots SDK，允许使用相同代码控制模拟和真实机器人，集成了 LeRobot 和 Hugging Face Hub。该开源 SDK 统一了模拟与硬件控制，降低了机器人研究与开发的门槛。在模拟（MuJoCo）与真实机器人之间切换仅需更改一个关键字参数，从 ‘mode=”sim”’ 改为 ‘mode=”real”‘。

rss · AIHOT 精选 · Jun 17, 10:18AIHOT 精选

背景: LeRobot 是 Hugging Face 的开源库，用于机器人深度学习。Zenoh 是一种高效通信中间件，用于向多台机器人广播命令。

参考链接

社区讨论: 该公告在机器人社区反响良好，因其缩小了模拟与真实部署之间的差距而受到称赞。

标签: #robotics, #open-source, #SDK, #simulation, #Hugging Face

OpenAI 利用 RL 训练提升跨领域诚实性 ⭐️ 8.0/10

OpenAI 使用强化学习，在涉及诚实、认知谦逊和可纠正性的对话数据上训练模型，发现诚实性泛化到 44 个未见测试领域，增强了对抗对抗提示和恶意微调的鲁棒性，且不损失正常指令能力。这表明强化学习可以给 AI 注入泛化的道德行为，是朝着对齐和安全迈出的关键一步，因为它提高了对攻击和恶意重新训练的鲁棒性。训练覆盖了诚实、认知谦逊和可纠正性等特质，涉及健康、教育等领域。

rss · AIHOT 全部动态 · Jun 18, 22:40AIHOT 全部动态

背景: 这些概念是 AI 对齐研究的一部分：认知谦逊指模型会说’我不知道’而不是胡编；可纠正性指 AI 不抗拒目标改变或关机。逆向对齐是训练好行为像坏行为一样泛化的思路。

参考链接

社区讨论: LessWrong 讨论将逆向意图对齐作为创造更安全的神谕的方法，表明这种方法可能对 AI 安全有前景。

标签: #AI alignment, #reinforcement learning, #honesty, #generalization, #OpenAI

OpenAI Codex 新增 Record & Replay 插件 ⭐️ 8.0/10

OpenAI Codex 推出 Record & Replay 插件，可捕获用户操作并将工作流转换为可复用的技能。用户现在可以通过演示来教会 Codex 复杂任务，减少手动指令的需求，实现工作流复用。该功能目前仅支持 macOS，且在欧盟、英国和瑞士不可用；使用前需开启 Computer Use。

rss · AIHOT 全部动态 · Jun 18, 22:25AIHOT 全部动态

背景: Codex Skills 是可重用的工作流文件，包含触发条件、输入参数、执行步骤和验证方式。Record & Replay 可通过屏幕录制自动创建这些技能，无需手动编写指令。

参考链接

标签: #OpenAI, #Codex, #AI coding assistant, #plugin

Perplexity 推出 Brain：智能体自改进记忆系统 ⭐️ 8.0/10

Perplexity 发布了 Brain，一个为其 Computer 智能体构建上下文图的自改进记忆系统。 Brain 将智能体正确性提升 25%，召回提升 16%，成本降低 13%，使 AI 智能体更可靠高效。 Brain 以 Research Preview 形式面向使用 Computer 的 Perplexity Max 和 Enterprise Max 订阅用户开放。

rss · AIHOT 全部动态 · Jun 18, 20:26AIHOT 全部动态

背景: 上下文图将任务、文档和用户修正等工件连接起来，使智能体能够理解关系并从以往工作中学习。递归自改进意味着系统会自主地随时间完善自身的知识。

参考链接

标签: #AI代理, #记忆系统, #上下文图, #Perplexity, #自改进

Yann LeCun：LLM 现实智能受限，因语言只是世界的简化描述 ⭐️ 8.0/10

Yann LeCun argues that LLMs are limited because language is a simplified abstraction of reality, lacking the rich sensory feedback humans get from visual and physical experience.

rss · AIHOT 全部动态 · Jun 18, 20:19AIHOT 全部动态

标签: #LLMs, #Yann LeCun, #artificial intelligence, #limitations, #Moravec paradox

李飞飞：空间智能通过 Marble 赋能人类创造力 ⭐️ 8.0/10

李飞飞强调 Marble 能从体积捕获生成持久且空间一致的 3D 世界。这标志着空间 AI 的重要进展，使创作者能够融合真实与合成的 3D 环境。 Marble 使用 NeRF 和 3D Gaussian Splatting 作为输入，并通过 Spark 渲染器实时输出世界。

rss · AIHOT 全部动态 · Jun 18, 20:11AIHOT 全部动态

背景: NeRF（神经辐射场）是一种用于 3D 场景的神经渲染技术。3D Gaussian Splatting 直接优化 3D 椭球体，无需神经网络。

参考链接

3 D Gaussian Splatting vs. NeRF : What is the difference? | LinkedIn

标签: #spatial intelligence, #3D generation, #world models, #NeRF, #AI creativity

SK Telecom 涉华关联引发 Anthropic 危机，Claude Mythos 和 Fable 5 被下线 ⭐️ 8.0/10

美国官员担忧 SK Telecom 涉华关联及 Fable 5 存在安全漏洞后，Anthropic 关闭了 Claude Mythos 和 Fable 5。这表明地缘政治和安全担忧对先进 AI 部署产生了实质影响。 Project Glasswing 让 SK Telecom 获得了 Mythos 的访问权限；Fable 5 存在可绕过安全限制的漏洞。

rss · AIHOT 全部动态 · Jun 18, 18:54AIHOT 全部动态

背景: Claude Mythos 是 Anthropic 强大但未公开发布的模型。Project Glasswing 是 Anthropic 针对关键软件的网络安全计划。

参考链接

标签: #AI Safety, #Anthropic, #Geopolitics, #Claude, #SK Telecom

康奈尔 CS 6120 高级编译器课程现以自导形式开放 ⭐️ 7.0/10

CS 6120 高级编译器课程现已作为自导在线资源开放。这使得高质量的高级编译器教育对所有人开放。课程包含跟踪编译，一些专家认为该方法已过时。

hackernews · ibobev · Jun 18, 11:04 · 社区讨论T2 社区与开源

背景: CS 6120 是康奈尔大学的研究生级编译器课程，涵盖中间表示、优化和运行时系统。

社区讨论: 评论者讨论跟踪编译的相关性以及课程是否真正高级。

标签: #compilers, #education, #online-course, #computer-science

W Social：欧洲数字主权还是作秀？ ⭐️ 7.0/10

W Social 作为欧洲版的 X 推出，但批评者质疑其透明度和开源承诺。该平台的可信度影响对欧洲数字主权努力的信任。基于 AT 协议（与 Bluesky 相同），但以 LLC 形式运营，且有金融背景。

hackernews · nemoniac · Jun 18, 12:46 · 社区讨论T2 社区与开源

背景: AT 协议是一种用于互操作网络的去中心化社交协议。W Social 声称使用它实现数据可移植性。

参考链接

社区讨论: 评论指出其可疑之处，将其与 TruthSocial 比较，并怀疑与 WEF 的关系。

标签: #European digital sovereignty, #social media, #open source, #criticism, #AT Protocol

除了 .gitignore：其他 Git 忽略机制 ⭐️ 7.0/10

一篇文章探讨了 Git 忽略的替代方法，如全局排除文件和用于忽略 diff 的 .gitattributes。开发者可以更高效地按用户或按文件管理忽略规则，减少 .gitignore 中的杂乱。全局忽略通过 core.excludesFile 或 XDG 配置设置；.gitattributes 可以跳过特定文件的 diff 生成。

hackernews · FergusArgyll · Jun 18, 10:29 · 社区讨论T2 社区与开源

背景: Git 的全局忽略和 info/exclude 文件让用户无需修改仓库即可跳过个人文件。.gitattributes 可以禁用指定文件的 diff。

参考链接

社区讨论: 评论者强调使用 ~/.config/git/ignore 进行全局排除，以及使用 ‘attic’ 目录技巧处理临时文件。

标签: #git, #version-control, #.gitignore, #dev-tools, #gitignore-alternatives

两人初创公司打造 60Hz 彩色电子纸显示器 ⭐️ 7.0/10

Modos 开发了一款 13.3 英寸 60Hz 彩色电子纸显示器，分辨率为 3200x2400。使彩色电子纸更接近取代日常使用的 LCD。原生分辨率 3200x2400，支持触控输入，采用 Carta 面板。

hackernews · Vinnl · Jun 18, 11:41 · 社区讨论T2 社区与开源

背景: 电子纸反射环境光，功耗低，但传统上刷新慢、色彩有限。采用 Carta 面板实现 60Hz 和彩色。

参考链接

社区讨论: 对规格感到兴奋，但担心 60Hz 下面板的寿命。

标签: #e-paper, #display technology, #color e-ink, #startup, #hardware

Emacs 31 预览：关键变化与社区热议 ⭐️ 7.0/10

一篇博客文章详细介绍了 Emacs 31 的新功能，作者已日常使用。 Emacs 31 的更新对庞大的 Emacs 社区很重要，带来了更好的可配置性和 AI 集成。文章重点介绍了用户可见的变化，但未给出官方发布日期。

hackernews · frou_dh · Jun 18, 12:10 · 社区讨论T2 社区与开源

社区讨论: 评论从幽默地忽略变化，到赞扬配置中的 AI 代理，以及坚定捍卫 Emacs 的长久性。

标签: #Emacs, #text editor, #open source, #development tools, #update

Hugging Face 发布 AI 智能体友好度基准测试 ⭐️ 7.0/10

Hugging Face 发布了一个评估库对 AI 智能体友好度的基准测试框架，使用 pi coding agent 和开源模型驱动。这有助于开发者针对 AI 智能体优化库，降低成本和 token 用量，对大规模智能体部署至关重要。该框架衡量成本、延迟、token 使用量和失败率，而非仅最终结果，并使用 Hugging Face Jobs 确保硬件一致性。

rss · AIHOT 精选 · Jun 18, 00:00AIHOT 精选

背景: Pi Coding Agent 是一个开源 AI 编码智能体，因其极简系统提示而 token 效率高。Hugging Face Jobs 为 AI 工作流提供计算资源。

参考链接

标签: #AI agents, #benchmarking, #Hugging Face, #transformers, #open-source

AI 推理公司 Baseten 据报以 130 亿美元估值融资 15 亿美元 ⭐️ 7.0/10

AI 推理初创公司 Baseten 据报道正在以 130 亿美元估值融资 15 亿美元，距离上一轮大型融资仅几个月。这凸显了 AI 推理服务的旺盛需求以及低成本模型部署的‘淘金热’。本轮融资为分价轮，部分投资者以 130 亿美元入场，部分以 110 亿美元。该公司成立于 2019 年。

rss · AIHOT 全部动态 · Jun 18, 21:20AIHOT 全部动态

背景: Baseten 使用模型路由技术，通过将请求导向最优开源模型来优化成本和性能。这是‘推理淘金热’的一部分，公司们竞相提供高效运行 AI 模型的基础设施。

社区讨论: 来源未提供社区讨论。

标签: #AI, #inference, #startup funding, #Baseten, #AI infrastructure

Snap 剥离 AI 视频团队成立新公司 Dotmo ⭐️ 7.0/10

Snap 将其内部生成式 AI 视频团队剥离为独立公司 Dotmo，专注于开发用于互动游戏体验的 AI 模型。此次剥离让 Snap 降低内部成本同时保留股权，并表明 AI 在游戏领域的战略重要性日益增加。 Dotmo 将从 Snap 获得技术许可用于其游戏平台，Snap 首席技术官 Bobby Murphy 以个人身份成为主要投资者。

rss · AIHOT 全部动态 · Jun 18, 20:30AIHOT 全部动态

背景: 这是 Snap 在 2026 年的第二次重大剥离，此前已将其 AR 眼镜业务 Specs 剥离为独立公司。

参考链接

Snap spins off AI video team into new company, Dotmo ... | TechCrunch

标签: #Snap, #AI video generation, #gaming, #corporate spin-off, #generative AI

德州数据泄露：300 万驾照被盗 ⭐️ 7.0/10

黑客从德州政府系统窃取了超过 300 万份驾照和护照。数百万受害者面临政府身份证件被盗用导致身份盗窃的风险。泄露目标为德州公共安全部，涉及驾照和护照。

rss · TechCrunch · Jun 18, 17:12T1 官方实验室

标签: #data breach, #security, #privacy, #government, #identity theft

苹果在巴西开放 App Store 竞争 ⭐️ 7.0/10

苹果将允许在巴西的 iPhone 上使用第三方应用商店。这打破了苹果在巴西应用分发上的垄断。这一变化是为了回应巴西监管机构的反垄断压力。

rss · TechCrunch · Jun 18, 15:48T1 官方实验室

背景: 苹果历来限制 iOS 应用只能通过其官方 App Store 安装。全球反垄断机构正在挑战这一政策。

标签: #Apple, #App Store, #Brazil, #Antitrust, #Competition

General Intuition 以 20 亿美元估值融资 3 亿美元，用于具身 AI ⭐️ 7.0/10

General Intuition 正洽谈以 20 亿美元估值融资 3 亿美元，利用 Medal 的视频数据集训练具身 AI 模型。这笔巨额融资表明市场对具身 AI 的浓厚兴趣，可能推动自主系统和机器人技术的进步。 Medal 每年提供 20 亿个视频，来自 1000 万月活跃用户，为训练提供了海量真实世界数据集。

rss · TechCrunch · Jun 18, 15:20T1 官方实验室

背景: 具身 AI 指嵌入物理实体、通过传感器和执行器与环境交互的 AI 系统。世界模型是内部预测模型，使智能体能够模拟未来状态以进行规划和决策。

参考链接

标签: #AI, #funding, #embodied AI, #datasets, #startups

Waymo 召回近 4000 辆无人驾驶出租车，因进入施工区 ⭐️ 7.0/10

Waymo 召回近 4000 辆无人驾驶出租车，因为至少发生了 13 起驶入高速公路施工区的事件。此次召回凸显了自动驾驶汽车在动态道路环境中导航的关键安全缺陷。召回覆盖可能无法检测或正确处理施工区封闭的车队车辆。

rss · TechCrunch · Jun 18, 11:59T1 官方实验室

背景: 自动驾驶汽车依靠传感器融合和深度学习来理解道路场景，但由于施工区的动态和异质性，它们构成了独特的挑战。

参考链接

社区讨论: 无评论。

标签: #autonomous vehicles, #Waymo, #recall, #safety, #AI

Claude Code 推出 Artifacts 功能 ⭐️ 7.0/10

Claude Code 现已支持 Artifacts，可将编程会话转换为实时、可分享的交互式网页，用于 PR 走查、仪表盘和调试时间线。此功能使工作进度可视化分享，无需重复汇报，从而增强团队协作和调试效率。 Artifacts 基于完整会话上下文（代码库、工具、聊天记录）自动构建并原地刷新；默认私有，仅组织内成员可见。

rss · AIHOT 精选 · Jun 18, 18:54AIHOT 精选

参考链接

社区讨论: 用户 Boris Cherny 表示 Artifacts 改变了他与 Claude 的工作方式，可用于可视化代码解释、系统图和团队仪表盘。

标签: #Claude Code, #artifacts, #collaboration, #real-time, #debugging

桑德斯 7 万亿美元 AI 计划：对大型 AI 公司征收 50%股票税 ⭐️ 7.0/10

伯尼·桑德斯提出立法，对大型 AI 公司征收 50%股票税，建立价值约 7 万亿美元的主权财富基金。若通过，将向每位美国公民发放年度股息并资助公共事业，重新分配 AI 产业财富。基金每年向每位公民发放超 1000 美元（5%年股息），并要求 AI 公司剥离非 AI 业务。

rss · AIHOT 精选 · Jun 18, 17:02AIHOT 精选

背景: 主权财富基金是一种国家所有的投资基金。该计划还成立一个两党委员会，通过投票权阻止公司损害公共利益。

标签: #AI policy, #regulation, #tech industry, #sovereign wealth fund, #Bernie Sanders

皮尤民调：63%美国人认为 AI 发展过快 ⭐️ 7.0/10

63%美国人认为 AI 发展过快，ChatGPT 使用率翻倍至 44%。公众怀疑可能减缓 AI 采用并影响监管。仅 16%期待正面影响，66%担忧 AI 传播错误信息。

rss · AIHOT 精选 · Jun 18, 12:11AIHOT 精选

背景: 皮尤研究中心是一个无党派美国智库，以民意调查闻名。

标签: #AI, #public opinion, #ChatGPT, #Pew Research, #societal impact

火山引擎发布豆包实时语音模型 3.0 API ⭐️ 7.0/10

火山引擎上线豆包实时语音模型 3.0（Seeduplex）API 服务并开启邀测，具备全双工、抗干扰和动态判停功能。该 API 可降低延迟、减少误打断，适用于汽车座舱、智能硬件和客服等场景，提升语音交互自然度。判停延迟缩短约 250ms，用户主动打断延迟缩短约 300ms。

rss · AIHOT 精选 · Jun 18, 10:36AIHOT 精选

背景: 全双工端到端语音模型可同时听和说，不同于传统半双工助手轮流发言。Seeduplex 是字节跳动研发的生产级全双工语音 AI。

参考链接

标签: #AI, #voice model, #real-time, #Volcengine, #API

DeepSeek 识图模式正式上线 ⭐️ 7.0/10

6 月 18 日，DeepSeek 在网页和 App 端正式上线识图模式，用户可直接上传图片进行识别。这为 DeepSeek 增加了多模态能力，使其在视觉理解方面与其他 AI 助手竞争。该模式使用今年 4 月公开的“以视觉原语思考”框架。

rss · AIHOT 精选 · Jun 18, 07:48AIHOT 精选

背景: DeepSeek 是由深度求索公司开发的 AI 模型，以高效训练著称。视觉模式超越 OCR，理解图像内容。

参考链接

标签: #AI, #multimodal, #DeepSeek, #image recognition

Matt Pocock 开源 skills v1，降低 Token 成本 63% ⭐️ 7.0/10

Matt Pocock 发布了 skills v1，一个开源工具包，将技能描述的 Token 成本降低 63%。 LLM 开发者现在可以构建更高效、结构化的提示，节省大量成本和复杂性。技能分为模型可调用和用户可调用，新增了 /codebase-design、/domain-modeling 等技能。

rss · AIHOT 精选 · Jun 17, 19:22AIHOT 精选

背景: 传统提示工程将提示视为临时咒语；skills v1 将其重构为结构化、可复用且模型可调用的流程。

参考链接

Releases · lmintlcx/pvztoolkit · GitHub

标签: #prompt engineering, #LLM, #open source, #token optimization, #skills toolkit

谷歌发布 99 美元 Gemini 智能音箱 ⭐️ 7.0/10

谷歌发布 99 美元 Gemini 智能音箱，具备高级 AI 功能。平价 Gemini AI 音箱让高级功能触手可及。高级订阅需付费 10 美元/月以启用 Gemini Live 和摄像头摘要；基础 AI 免费。

rss · AIHOT 精选 · Jun 17, 16:30AIHOT 精选

背景: Gemini 是谷歌的多模态大语言模型系列，是 LaMDA 和 PaLM 2 的继任者。

参考链接

标签: #Google, #Gemini, #Smart Speaker, #AI, #Consumer Tech

Cloudflare One Stack：AI 智能体驱动的零信任部署工具 ⭐️ 7.0/10

Cloudflare 推出了 Cloudflare One Stack，一组用于自动部署和迁移零信任环境的 AI 智能体技能。通过自动配置和从传统厂商迁移，大幅降低了零信任采用的门槛。该工具集包含两个技能：cloudflare-one 用于通用零信任指导，cloudflare-one-migration 用于从 Zscaler 或 Palo Alto Networks 迁移。

rss · AIHOT 精选 · Jun 17, 13:00AIHOT 精选

参考链接

Introducing the Cloudflare One stack : agent -powered deployment

标签: #Cloudflare, #Zero Trust, #AI agents, #network security, #automation

阿里云发布 HappyOyster 1.0，实时交互数字世界 ⭐️ 7.0/10

阿里云发布 HappyOyster 1.0，一个支持实时交互的开放式多模态世界模型。它让创作者能实时生成并交互一致的数字环境，推动 AI 内容生成新范式。该模型保持长程一致性，并可在生成过程中接收用户指令。

rss · AIHOT 精选 · Jun 17, 12:46AIHOT 精选

背景: 开放式世界模型能实时生成动态场景，用户可探索和修改。与视频生成不同，它支持持续交互。

参考链接

标签: #AI, #multimodal, #Alibaba Cloud, #digital world, #real-time interaction

OpenAI 第一季度现金消耗达 37 亿美元，超收入一半 ⭐️ 7.0/10

OpenAI 第一季度现金消耗 37 亿美元，超过收入一半。突显 AI 成本压力，IPO 在即。已保密递交 IPO，可能 9 月完成，估值 1 万亿美元。

rss · AIHOT 精选 · Jun 17, 04:55AIHOT 精选

标签: #OpenAI, #AI industry, #cash burn, #IPO, #business news

AA-Briefcase 基准评估 AI 智能体的长期知识工作能力 ⭐️ 7.0/10

Artificial Analysis 发布了 AA-Briefcase 基准，用于评估 AI 智能体在长期知识工作项目中的表现，每个任务涉及超过 25,000 条 Slack 消息和 3,500 封邮件。该基准显示，虽然 Claude Fable 5 等专有模型在性能上领先，但 GLM-5.2 等开源模型在成本效率上显著更优。所有模型中仅 3%的任务满足全部标准；Claude Fable 5 的 Elo 得分为 1587，但每任务成本 31 美元，而 DeepSeek V4 Flash 每任务仅约 0.04 美元。

rss · AIHOT 全部动态 · Jun 18, 23:01AIHOT 全部动态

背景: AA-Briefcase 基准采用 Elo 评分系统（一种常见于游戏的成对比较排名方法）来评估 AI 智能体在复杂长期任务上的表现。智能体能力指 AI 在长时间工作流中自主规划、执行和适应的能力。

参考链接

社区讨论: 原始推文及后续讨论突出显示了开源模型的惊人成本效率，一些评论者指出低价模型现已接近顶级性能。

标签: #Benchmark, #AI Agents, #Knowledge Work, #Cost Efficiency, #Model Evaluation

开源 LLM 收入或超 Anthropic，Cursor 先例 ⭐️ 7.0/10

预测开源 LLM 收入可能超过 Anthropic，以 Cursor 为例说明企业如何拥有模型权重。从租用转向拥有开源权重，重塑 AI 经济格局。 Cursor 在 2026 年初 ARR 达 30 亿美元，验证开源 LLM 商业化。

rss · AIHOT 全部动态 · Jun 18, 21:20AIHOT 全部动态

背景: 拥有模型权重指企业获取并定制开源 LLM，后训练则针对特定任务优化模型。

参考链接

标签: #open source, #LLM, #Anthropic, #Cursor, #AI economics

OpenAI 从 Meta 挖来高管与政策顾问，加强硬件与政府关系 ⭐️ 7.0/10

OpenAI 从 Meta 挖来 Ha Thai 负责设备通讯，并聘请政策顾问 Dean Ball，此举表明其正在加强硬件和政府领域布局。此举有助于 OpenAI 推出首款设备并应对监管挑战，同时在竞争对手 Anthropic 与政府关系紧张之际，OpenAI 借机强化自身优势。 Ha Thai 将负责 OpenAI 即将推出的首款设备的通讯工作；Dean Ball 曾参与塑造特朗普时期的政策。

rss · AIHOT 全部动态 · Jun 18, 20:43AIHOT 全部动态

背景: Anthropic 是一家领先的人工智能公司，近期与美国政府在安全监管问题上关系紧张。OpenAI 希望借此机会加强自身政府关系，并推出硬件设备。

标签: #OpenAI, #AI industry, #hardware, #government relations, #Anthropic

英特尔任命李锡熙为代工执行副总裁聚焦 AI 芯片封装 ⭐️ 7.0/10

英特尔任命李锡熙为代工执行副总裁，负责先进封装与系统集成以强化 AI 计算能力。该任命显示英特尔加强先进封装以在 AI 芯片市场与台积电竞争。李锡熙曾担任 SK 海力士 CEO，主导收购英特尔 NAND 业务并推进 HBM 技术。

rss · AIHOT 全部动态 · Jun 18, 20:35AIHOT 全部动态

背景: 先进封装将多个芯片集成在一个封装中，提升性能并缩短信号路径，对于需要高内存带宽的 AI 芯片至关重要。英特尔的 EMIB 和台积电的 CoWoS 是该领域的关键技术。

参考链接

Advanced packaging (semiconductors)

标签: #Intel, #semiconductor, #advanced packaging, #AI hardware, #executive appointment

Atomic Mail 推出 AI 智能体专用 API 优先邮箱 ⭐️ 7.0/10

Atomic Mail 推出专供 AI 智能体的 API 优先邮箱。实现无需人工干预的邮件工作流全自动化。免费 alpha 阶段，采用工作量证明和声誉系统防滥用。

rss · AIHOT 全部动态 · Jun 18, 19:33AIHOT 全部动态

背景: MCP 是连接 AI 助手与外部系统的开放标准。Agent Skill 是 AI 编码助手的可复用能力。

参考链接

标签: #AI agents, #email service, #API, #automation

Google 庆祝 A2A 协议发布一周年：协作智能体生态 ⭐️ 7.0/10

Google marks the first anniversary of the A2A protocol for collaborative AI agents, highlighting its architectural advantages and a practical application in protein structure prediction.

rss · AIHOT 全部动态 · Jun 18, 19:16AIHOT 全部动态

标签: #A2A, #AI agents, #protocol, #interoperability, #generative AI

Wisedocs 推出医学长上下文推理基准 MLCR ⭐️ 7.0/10

Wisedocs releases MLCR benchmark for testing LLM long-document reasoning on medical records, including 250 questions across 6 difficulty levels and open-source materials.

rss · AIHOT 全部动态 · Jun 18, 18:56AIHOT 全部动态

标签: #LLM, #benchmark, #medical, #reasoning, #long-context