小互 AI 日报 — 2026-06-08

2026-06-08 · 周一生成 10:17:59

覆盖源

174

条目数

35

高分 8+

4

主题簇

4

🌟 今日头条

ChatGPT 内存准确率翻倍升至 83%，新系统自动学习对话历史

OpenAI 本周首次公开了 ChatGPT 内存功能的实际效能数据，揭露了一个持续两年的严重缺陷。该功能在 2024 年 2 月推出时是一个手动记录工具，但事实回忆准确率仅为 41.5%，这意味着在超过一半的依赖内存的对话中，ChatGPT 毫无察觉地给出错误答案。OpenAI 现已推出新版本「Dreaming V3」，这是一个后台自动进程，无需手动输入命令即可综合对话历史。内部测试显示，新系统的事实回忆准确率达到 82.8%（翻倍提升），用户偏好遵守度从 55.3% 升至 71.3%。系统具有自我纠正能力——比如新加坡旅行结束后，ChatGPT 会停止推荐当地餐厅。这次升级对日常 ChatGPT 用户具有实际价值，特别是那些依赖内存功能维持跨对话连贯性和个性化体验的用户。自媒体创业者可以围绕「AI 工具更新如何改善工作流」这个角度写文章。

💬 编辑点评

OpenAI 坦诚两年缺陷，83% 准确率是进步但非救赎——金融医疗等高风险场景仍无法信任，自动学习的隐私边界也需审视。

阅读原文 → 产品动态

🔥今日要点

01

OpenAI 宣布「聊天已死」，启动 ChatGPT 有史以来最大改造为超级应用

9/10 新产品

OpenAI 对 ChatGPT 进行自发布以来规模最大的战略调整。产品将从聊天界面升级为「超级应用」，内置代理、编码工具，并接入 Canva、Booking 等合作方应用。这标志着 OpenAI 从「聊天助手」向「任务代理」的范式转变，反映出 AI 交互方式的深层演进。

阅读原文 →

02

Vim 编辑器的多重面孔：超越版本号的使用方式差异

9/10 教程

讨论 Vim 编辑器的多种使用形态。虽然版本众多，但更深层差异在于使用方式——不同开发者通过插件、配置、工作流的个性化组合，体验到的是完全不同的 Vim。这是程序员工具分析，与 AI 领域关系不大。

阅读原文 →

03

AT&T用AI驱动的数据优势创造40%效率提升

8/10 行业分析

AT&T是一家拥有13.5万员工、5万辆车队、1.2亿无线用户的电信巨头，近期宣布通过AI和数据优势实现了运营的大幅提升。公司CEO约翰·斯坦基在2026年3月表示，AT&T在呼叫中心效率、客户响应和代码编写等方面均取得了接近40%的效率提升。

阅读原文 →

04

Datasette Agent Edit 0.1a0 发布：支持 AI 代理编辑文本内容

7/10 教程

Datasette 插件开发者 Simon Willison 发布了 datasette-agent-edit 的早期版本。该插件让 AI 代理能够编辑协作文档、更新 SQL 查询、处理 SVG 文件等文本内容。解决了代理式编辑的设计难题，适合需要自动化内容更新和多人协作的开发者。

阅读原文 →

05

Deepseek 跃升美国企业采购排行榜首，成本优势背后隐含数据安全风险

7/10 资讯

中国 AI 模型 Deepseek 在美国企业采购平台 Ramp 的 6 月排行中冲到第一。采购经理看中的是成本优势——相比 OpenAI 和 Google 的高价 API，Deepseek 能显著降低成本。

阅读原文 →

06

ChatGPT 推出 Lockdown Mode 防护：禁用网络和代理阻止提示注入数据窃取

7/10 新产品

OpenAI 推出 ChatGPT 锁定模式，禁用网络访问、深度研究、代理模式，降低提示注入攻击风险。虽然无法彻底杜绝注入攻击，但能阻断数据窃取的最后一环。这为处理机密信息的企业用户提供多层防护，体现 OpenAI 对数据安全的重视。

阅读原文 →

📊今日主题热点

📌 ChatGPT超级应用升级

OpenAI持续推进ChatGPT向超级应用方向升级，新增内存、安全、代理功能。

ChatGPT 内存准确率翻倍升至 83%，新系统自动学习对话历史 10

OpenAI 宣布「聊天已死」，启动 ChatGPT 有史以来最大改造为超级应用 9

ChatGPT 推出 Lockdown Mode 防护：禁用网络和代理阻止提示注入数据窃取 7

OpenAI 仍推进超级应用计划 7

ChatGPT 要变 AgentGPT 了 7

📌 AI芯片基础设施竞赛

Nvidia等大厂在AI存储芯片与工厂基础设施上加速投资，支撑大模型训练。

英伟达与斗山集团合作推进物理AI及AI工厂基础设施 7

Nvidia 与 SK Hynix 签署多年协议，共同开发下一代 AI 存储芯片 7

NVIDIA RTX Spark 芯片在韩国首发，游戏与 AI 融合的新时代 5

📌 AI行业质量与风险评估

业界观察AI垃圾内容、代码质量下滑、成本危机等行业问题，同时关注竞争态势。

Deepseek 跃升美国企业采购排行榜首，成本优势背后隐含数据安全风险 7

Gary Marcus 警告：AI 垃圾内容泛滥，数字世界生产力停滞不前 6

Token 成本危机来临：AI 大厂上市融资或触发定价雪崩 6

AI 虚拟创作者变得越来越难识别 6

geohot 评论：大模型代码质量隐性下滑，陷入「永恒的九月」困境 5

📌 开源工具与技术创新

Perplexity、AWS、Datasette等推出代码搜索、数据库适配、模型编辑等新工具。

Datasette Agent Edit 0.1a0 发布：支持 AI 代理编辑文本内容 7

Perplexity 推出「代码搜索」新架构：让 AI 用 Python 自写搜索流程 7

研究发现：小模型学不会稀有任务的根本原因是频繁任务的覆盖 6

Ollama 0.30.7 版本更新：文档优化和 Windows 配置路径改进 5

AWS ExtendDB 开源：DynamoDB 兼容适配器支持 PostgreSQL 多后端 3

📖值得深入

🕐 约 3 分钟 · 行业分析 7/10

英伟达与斗山集团合作推进物理AI及AI工厂基础设施

💡 行业趋势与动态分析

英伟达与斗山集团扩大合作，覆盖斗山机器人、斗山山猫、斗山能源及斗山电子材料四大板块。斗山机器人将集成英伟达Isaac Sim、Isaac Lab、Cosmos世界基础模型、Newton物理引擎及Jetson Thor，推进Agentic Robot OS，探索卸垛、打磨等参考用例及双臂/人形机器人。斗山山猫计划将物理AI技术用于建筑、园林、农业设备，加速开发专用世界模型。斗山能源评估通过燃气轮机、汽轮机、小型模块化反应堆及氢燃料电池为AI工厂供电。斗山电子材料为英伟达MGX生态系统供应高性能铜箔基板（CCL），用于AI服务器PCB。

阅读原文 →

🕐 约 3 分钟 · 行业分析 7/10

OpenAI 仍推进超级应用计划

💡 行业趋势与动态分析

OpenAI 一位高级员工表示"聊天已死"，同时公司仍在继续推进超级应用计划。

阅读原文 →

🕐 约 3 分钟 · 行业分析 7/10

Nvidia 与 SK Hynix 签署多年协议，共同开发下一代 AI 存储芯片

💡 行业趋势与动态分析

Nvidia 与 SK Hynix 达成合作，将共同设计面向 AI 应用的未来几代存储芯片。此举巩固了 SK Hynix 在高端半导体领域的领先地位。

阅读原文 →

🕐 约 3 分钟 · 行业分析 7/10

ChatGPT 要变 AgentGPT 了

💡 行业趋势与动态分析

OpenAI 正筹备 ChatGPT 自 2022 年上线以来最大规模改版，从聊天机器人转向超级应用/Agent 平台，整合编程工具 Codex、图像生成及第三方应用（Canva、Booking）。高管称"聊天已死"，目标成为跨平台个人 AI 助手，未来甚至省去用户输入提示词。改版预计未来几周在网页和手机端上线。商业压力：ChatGPT 有 9 亿周活用户、5000 万付费用户、月收入 20 亿美元但未盈利；企业客户贡献约 40% 收入，目标年底达 50%；Codex 桌面版周活超 500 万。竞争对手 Anthropic 估值已达 9650 亿美元。OpenAI 刚完成 1220 亿美元融资，估值 8520 亿美元，IPO 目标估值可能超 1 万亿美元。

阅读原文 →

🕐 约 3 分钟 · 观点/深度 6/10

Gary Marcus 警告：AI 垃圾内容泛滥，数字世界生产力停滞不前

💡 观点与论证值得借鉴

知名 AI 评论家 Gary Marcus 指出一个悖论：AI 输出暴增，但生产力反而原地踏步。他引用英国《金融时报》的数据分析，展示 AI 生成的低质内容（"slop"）泛滥如何抵消了技术进步。这对当前 AI 发展方向提出深刻质疑。

阅读原文 →

📂按类别浏览

新产品

Perplexity 推出「代码搜索」新架构：让 AI 用 Python 自写搜索流程

7

搜索 AI 公司 Perplexity 推出「代码搜索」新架构。AI 不再依赖固定 API，而是用 Python 自己编写搜索流程，动态处理过滤、定制、查询优化等任务。这种方式让搜索代理更加灵活自适应，能应对复杂多变的用户查询。

阅读原文 →

NVIDIA RTX Spark 芯片在韩国首发，游戏与 AI 融合的新时代

5

NVIDIA CEO 黄仁勋亲赴韩国推介 RTX Spark 芯片，这款面向个人 AI 智能体的新品在游戏社区引发热烈反响。与游戏开发商和英雄联盟世界冠军 T1 合作，标志 NVIDIA 正将 AI 能力嵌入消费级游戏硬件，推动游戏与 AI 深度融合。

阅读原文 →

观点/深度

geohot 评论：大模型代码质量隐性下滑，陷入「永恒的九月」困境

5

开发者 geohot 指出大模型生成代码的质量问题。虽然模型变得越来越复杂，能更好地模仿代码分布，但输出的错误反而更难察觉。本质上这是统计模型固有的天花板——再复杂的统计学也无法保证代码正确性。

阅读原文 →

Hugging Face 项目复盘：从失败中汲取经验教训

5

Hugging Face 分享一个失败项目的经验复盘。虽然这个关于数字牙套的项目最终未成功，但通过深入梳理失败原因，团队积累了宝贵经验。这类失败案例分析对开发者理解技术边界、避免类似陷阱有重要参考价值。

阅读原文 →

自动编程时代的软件测试新局面

5

自动编程（AI 代码生成）能加快开发速度，但生成代码的结构质量往往不如手写代码。不过在实际应用中，精心管理的 AI 生成代码通常优于传统编写的代码。这标志着软件测试和质量保证方式的深层变革。

阅读原文 →

行业分析

特朗普政府与OpenAI讨论通过公共财富基金入股AI初创公司

7

据FT报道，特朗普政府正与OpenAI探讨通过公共财富基金机制让政府入股AI初创公司。方案是AI企业捐赠小部分股权至该基金，基金通过账户或分红将收益返还美国公民，而非政府直接运营公司。这不同于特朗普去年对Intel的90亿美元直接持股。

阅读原文 →

Adobe 力推艺术风格法律保护法案，AI 创意生成的法律之争

6

Adobe 支持的新法案试图为艺术风格提供法律保护，矛头指向 AI 艺术生成。但作者质疑艺术风格能否被法律界定和保护。涉及创意所有权、模仿与创新、版权与风格的复杂权衡，将对 AI 创意工具和人类艺术家都产生深远影响。

阅读原文 →

Token 成本危机来临：AI 大厂上市融资或触发定价雪崩

6

大 AI 公司即将上市融资，Token 成本上涨已成定局。投资者利润压力下，公司必须提高 API 定价以改善利润率。这将冲击所有依赖 AI API 的开发者和企业，可能引发行业成本结构重组和使用习惯改变。

阅读原文 →

教程

研究发现：小模型学不会稀有任务的根本原因是频繁任务的覆盖

6

研究人员揭示小模型学不会稀有任务的根本原因：频繁任务不断覆盖先前学到的技能，导致稀有技能无法被保留和掌握。论文通过不同规模模型对比实验验证了这一「技能覆盖」现象，为理解模型能力差异提供新的理论视角。

阅读原文 →

Ollama 0.30.7 版本更新：文档优化和 Windows 配置路径改进

5

开源 LLM 框架 Ollama 发布 0.30.7 版本。本次更新包括文档示例改进和 Windows 配置路径优化，属于常规维护版本，对框架的核心功能无实质影响，主要提升开发者体验。

阅读原文 →

AWS ExtendDB 开源：DynamoDB 兼容适配器支持 PostgreSQL 多后端

3

AWS 开源了 ExtendDB，一个 DynamoDB 兼容适配器，让开发者能用 DynamoDB API 对接 PostgreSQL 等多种存储后端。保持完整 SDK 兼容性的同时获得部署灵活性。这是基础设施工具创新，与 AI 业务方向关系不大。

阅读原文 →

📭今天可以忽略

这些被自动过滤了。给你看看原因，免得你担心错过：

OpenAI 自研芯片核心工程师跳槽 Anthropic，加剧 IPO 前的人才争夺
→ 已写过且无新增事实
工程师应该工作得更少：保持 80% 强度反而能产生更高价值
→ 评分过低（≤4），无可读性
Notion 与 Anthropic 集成恢复，服务中断期间引发广泛关注
→ 已写过且无新增事实
AWS ExtendDB 开源：DynamoDB 兼容适配器支持 PostgreSQL 多后端
→ 已写过且无新增事实
IBM 604 电子计算器的硬件探秘（1948）
→ 评分过低（≤4），无可读性
不使用 Experia Box 的 KPN 交互电视配置指南
→ 评分过低（≤4），无可读性
SwiftUI 的困局：简化开发却难保应用质量
→ 评分过低（≤4），无可读性
Aitken 加速法前史：Kepler 的迭代求解方法
→ 评分过低（≤4），无可读性

📎 长尾信息 (16) · 点击展开

Ollama 0.30.7 版本更新：文档优化和 Windows 配置路径改进 5

geohot 评论：大模型代码质量隐性下滑，陷入「永恒的九月」困境 5

Hugging Face 项目复盘：从失败中汲取经验教训 5

Notion 与 Anthropic 集成恢复，服务中断期间引发广泛关注 5

NVIDIA RTX Spark 芯片在韩国首发，游戏与 AI 融合的新时代 5

自动编程时代的软件测试新局面 5

AI 信仰的二元困境：苹果 AI 投资的本质反思 5

工程师应该工作得更少：保持 80% 强度反而能产生更高价值 4

AWS ExtendDB 开源：DynamoDB 兼容适配器支持 PostgreSQL 多后端 3

IBM 604 电子计算器的硬件探秘（1948） 3

不使用 Experia Box 的 KPN 交互电视配置指南 3

SwiftUI 的困局：简化开发却难保应用质量 2

Aitken 加速法前史：Kepler 的迭代求解方法 2

Laplace 极限：Kepler 方程的级数求解对比 2

用物理常数推导 π 的非常规公式 2

赞助：Mux——开发者视频服务平台 1