上下文 - WWW.YANGY11.CN

科大讯飞星火 X2-Flash 模型发布：基于华为昇腾 910B 集群训练，最大 256K 上下文

www.ithome.com · 2026-04-29 15:09:05+08:00 · tech

IT之家 4 月 29 日消息，科大讯飞星火 X2-Flash 模型今日正式发布，同步开放 API。星火 X2-Flash 采用 MoE 架构，总参数 30B，最大支持 256K 上下文，宣称在智能体、代码等能力上实现了大幅提升，基于华为昇腾 910B 集群训练完成。目前，AstronClaw、Loomy 已率先接入星火 X2-Flash。科大讯飞表示，经 AstronClaw 实测，星火 X2-Flash 在深度研究报告、Skill 管理与调用、系统控制与执行等多类“养龙虾”最常用的任务上效果接近业界万亿级参数模型效果；在相同工作流下，整体 token 消耗不到当前主流大尺寸模型的三分之一，降低了开发者构建复杂 Agent 应用的使用成本。以创建一个复杂的视频生成 Skill 为例，星火 X2-Flash 在了解详细需求后快速生成，并给出技能结构、核心功能和使用案例等关于 Skill 的详细说明。科大讯飞介绍称，星火 X2-Flash 率先在国产算力上实现了 DSA（稀疏注意力）与 MTP（多 token 预测）结合的长文本高效训练，上下文拓展至 256K，通过亲和国产芯片的算子和分布式训练策略深度优化实现训练效率相比同规模 A800 集群从 20% 提升到 90%，解决了智能体长上下文在国产芯片训练慢的难题。在智能体强化学习训练场景，星火 X2-Flash 通过上述的算法创新 + 工程创新，大幅提升了采样推理效率，相对于非 DSA 结构的采样解码效率最高可以提升 2 倍以上。该突破，一定程度缓解了 910B 上智能体长交互场景下采样效率过低影响 RL 训练问题，为后续的大规模强化学习对齐训练扫清了算力障碍。星火 X2-flash 已实现了 OpenClaw、Claude Code 等主流 Agent 框架的深度兼容。 IT之家附 API 地址如下： https://xinghuo.xfyun.cn/sparkapi

迈入百万上下文普惠时代：DeepSeek-V4 模型预览版正式上线并同步开源

www.ithome.com · 2026-04-24 10:59:09+08:00 · tech

IT之家 4 月 24 日消息，今天上午，DeepSeek-V4 模型预览版正式上线并同步开源。 DeepSeek-V4 拥有百万字超长上下文，在 Agent 能力、世界知识和推理性能上均实现国内与开源领域的领先。模型按大小分为两个版本：即日起登录官网 chat.deepseek.com 或官方 App ，即可与最新的 DeepSeek-V4 对话，探索 1M 超长上下文记忆的全新体验。API 服务已同步更新，通过修改 model_name 为 deepseek-v4-pro 或 deepseek-v4-flash 即可调用。 DeepSeek-V4 模型开源链接： https://huggingface.co/collections/deepseek-ai/deepseek-v4 https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4 DeepSeek-V4 技术报告： https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf IT之家附两款模型的官方介绍如下： DeepSeek-V4-Pro Agent 能力大幅提高：相比前代模型，DeepSeek-V4-Pro 的 Agent 能力显著增强。在 Agentic Coding 评测中，V4-Pro 已达到当前开源模型最佳水平，并在其他 Agent 相关评测中同样表现优异。目前 DeepSeek-V4 已成为公司内部员工使用的 Agentic Coding 模型，据评测反馈使用体验优于 Sonnet 4.5，交付质量接近 Opus 4.6 非思考模式，但仍与 Opus 4.6 思考模式存在一定差距。丰富的世界知识： DeepSeek-V4-Pro 在世界知识测评中，大幅领先其他开源模型，仅稍逊于顶尖闭源模型 Gemini-Pro-3.1。世界顶级推理性能：在数学、STEM、竞赛型代码的测评中，DeepSeek-V4-Pro 超越当前所有已公开评测的开源模型，取得了比肩世界顶级闭源模型的优异成绩。 DeepSeek-V4-Flash 相比 DeepSeek-V4-Pro，DeepSeek-V4-Flash 在世界知识储备方面稍逊一筹，但展现出了接近的推理能力。而由于模型参数和激活更小，相较之下 V4-Flash 能够提供更加快捷、经济的 API 服务。在 Agent 测评中，DeepSeek-V4-Flash 在简单任务上与 DeepSeek-V4-Pro 旗鼓相当，但在高难度任务上仍有差距。 DeepSeek-V4 开创了一种全新的注意力机制，在 token 维度进行压缩，结合 DSA 稀疏注意力（DeepSeek Sparse Attention），实现了全球领先的长上下文能力，并且相比于传统方法大幅降低了对计算和显存的需求。从现在开始，1M（一百万）上下文将是 DeepSeek 所有官方服务的标配。 DeepSeek-V4 针对 Claude Code 、OpenClaw、OpenCode、CodeBuddy 等主流的 Agent 产品进行了适配和优化，在代码任务、文档生成任务等方面表现均有提升。下图为 V4-Pro 在某 Agent 框架下生成的 PPT 内页示例： V4-Pro 与 V4-Flash 最大上下文长度为 1M ，均同时支持非思考模式与思考模式，其中思考模式支持 reasoning_effort 参数设置思考强度（high / max）。对于复杂的 Agent 场景建议使用思考模式，并设置强度为 max。旧有的 API 接口的两个模型名 deepseek-chat 与 deepseek-reasoner 将于三个月后（2026-07-24）停止使用。当前阶段内，这两个模型名分别指向 deepseek-v4-flash 的非思考模式与思考模式。

DeepSeek API 更新百万 Token 上下文，看齐 App 及网页版

www.ithome.com · 2026-04-22 16:48:24+08:00 · tech

IT之家 4 月 22 日消息，今日有大量用户反馈称，DeepSeek 官方 API 已经更新到了与客户端及网页版相同的 1M tokens 上下文版本（似乎是此前曝光的 DeepSeek V4 Lite），比之前的 128k 上下文更长。与此同时，最新 DeepSeek 的知识库已经更新到 2025 年 5 月，非联网状态下可准确输出 2025 年 4 月的新闻。另外，该模型仍不支持视觉输入，仅支持文本和处理语音，依然为非多模态模型。 DeepSeek 创始人梁文锋此前透露，DeepSeek 新一代旗舰大模型 DeepSeek V4 将于 4 月下旬正式发布。综合IT之家此前报道，DeepSeek 近期被网友发现出现多项能力提升，还于 4 月 8 日上线了一个专家模式，擅长复杂问题。相关阅读：《梁文锋：DeepSeek V4 将于 4 月下旬正式发布》《 DeepSeek 上线专家模式》《 DeepSeek 专家模式已支持上传文件》《 DeepSeek 连续三天出现服务异常，网页 / API 现已恢复》《 DeepSeek V4 Lite 原生多模态 AI 曝光：百万 tokens 上下文，非思考生图秒杀前代》《 DeepSeek 灰度测试百万 Token 上下文，知识库更新至 2025 年 5 月》

OpenAI Codex 推出 Chronicle 功能：通过录制屏幕构建上下文记忆库

www.ithome.com · 2026-04-21 07:09:49+08:00 · tech

IT之家 4 月 21 日消息，OpenAI 为其 Codex 应用推出了 Chronicle 功能，该功能通过屏幕录制构建记忆库，Codex 可将这些记忆作为后续任务的上下文参考，从而无需用户每次重新说明，就能知晓其所指内容、使用的工具以及正在进行的项目。据IT之家了解，Chronicle 会在后台运行，由智能体将录制内容整理为摘要，并以 Markdown 文件格式保存在本地设备中。录制文件仅临时存储，据 OpenAI 说明，会在六小时后自动删除。该功能目前以可选预览版形式，面向 macOS 系统的 ChatGPT Pro 订阅用户推出，但暂不面向欧盟、英国及瑞士地区开放。用户可在 Codex 设置的“个性化”选项中，依次开启“记忆”与“Chronicle”功能，并授予 macOS 屏幕录制与辅助功能权限即可启用。 OpenAI 同时提醒：Chronicle 会快速消耗调用额度，还会增加提示词注入攻击风险（恶意指令可能通过显示的网页植入），且记忆内容在设备上以未加密形式存储。

/tag/上下文