🌟 今日头条
英伟达开源550B大模型:Nemotron 3 Ultra为智能体优化
英伟达发布了Nemotron 3 Ultra,一个完全开源的550B参数专家混合(MoE)模型,活跃参数为55B,支持100万tokens上下文长度。该模型专门为AI智能体工作负载优化,声称相比其他方案快5倍、成本低30%。英伟达开放了模型权重、合成训练数据、奖励模型检查点、量化版本和完整训练recipes,采用OpenMDW 1.1开源许可证。这个完全开源方案让企业可在自有基础设施上运行长上下文AI智能体,同时大幅节省成本并增强隐私保护。相比专有API服务,这给了开发者和企业完全的控制权和灵活性。发布包含完整文档和集成支持,降低了开发者的使用门槛。对于想要部署生产级智能体的企业,这是一个高性能、高成本效益的替代方案,标志着开源AI模型库日益完善。
💬 编辑点评
英伟达开源 550B 参数模型,实质是向闭源 API 服务宣战。成本低 30%、隐私完全可控,这是打破大模型垄断的关键一步——开发者终于可以用不起 API 的价钱自建长上下文 AI 智能体。
10/10
新产品
OpenAI推出ChatGPT内存系统的重大升级,用户现在拥有一个专属页面,可以查看、编辑和删除ChatGPT记住的关于自己的信息。与存储孤立事实不同,ChatGPT现在从过去对话中构建运行档案,包含用户的偏好、兴趣和重复话题。用户可以主动告诉ChatGPT什么需要记住,什么需要遗忘。
10/10
新产品
Google发布了Gemini 2.0 Flash,一个经过优化的轻量版本,强调速度和成本效益。Flash保留了Gemini 2.0的核心推理能力,但通过减小模型规模来实现更快推理和更低成本,适合对延迟敏感或有预算限制的应用。使用场景包括客户服务聊天机器人、内容摘要、文本分类和实时分析。
10/10
新产品
微软推出 Scout,一款专为企业部署设计的自主 AI 助手。传统的自主代理常因不可预测性被企业拒之门外,Scout 从根本上解决了这个问题——它在架构层面内置了治理机制:持续的策略检查、完整的审计日志、内置的合规控制,确保 AI 行为完全可被监督和约束。
10/10
新产品
Meta在WhatsApp、Instagram和Messenger三大平台推出新AI智能体,已支持客户服务、预约、销售协助等功能。根据Meta的规划,未来版本将能进行市场研究、竞争对手分析,并集成日历、日程等企业工具。目前已有100多万家企业使用该智能体,现阶段免费提供,未来将转向付费模式。
10/10
新产品
Google Labs推出Dreambeans应用,一款iOS和Android AI应用,可将用户的Google数据转化为个性化的每日创意。该应用连接Gmail、Calendar、Photos、YouTube和Search History(获得用户许可),每天生成少量AI插图的故事,内容包括推荐地点…
9/10
观点/深度
Ladybird 浏览器项目宣布停止接受公开 PR 贡献,拒绝 AI 生成的代码。该项目认为,在浏览器开发中,谁对代码负责比代码出处更重要。这反映了开源社区对 AI 生成代码质量和责任归属的深度思考。