Thanks to visit codestin.com
Credit goes to developer.aliyun.com

阿里云 AI 网关支持 DeepSeek V4

简介: 阿里云 AI 网关,提供 Model API、Agent API、MCP Server 的管理能力,现已率先支持 DeepSeek-V4 API 的管理。

作者:望宸、梧同


今天,DeepSeek 发布两个模型,V4-Pro 和 V4-Flash。其架构和技术优势可以总结为:

  • 架构升级:流形约束残差连接 mHC、Muon 优化器,提升训练质量。
  • 后训练范式升级:引入领域专家培育和 on-policy distillation(把所有专家熔融合到一个学生模型里),提升后训练效率和效果。
  • 全新的注意力机制:在 DSA 的基础上引入 CSA 和 HCA,提升 1M 上下文情况下的对话效果。


从而带来了模型效果和性价比方面的提升,包括 [1]:

  • Agent 能力大幅提高:在 Agentic Coding 评测中,V4-Pro 已达到当前开源模型最佳水平,据评测反馈使用体验优于 Sonnet 4.5,交付质量接近 Opus 4.6 非思考模式,但仍与 Opus 4.6 思考模式存在一定差距。
  • 丰富的世界知识:DeepSeek-V4-Pro 在世界知识测评中,大幅领先其他开源模型,仅稍逊于顶尖闭源模型 Gemini-Pro-3.1。
  • 世界顶级推理性能:在数学、STEM、竞赛型代码的测评中,DeepSeek-V4-Pro 超越当前所有已公开评测的开源模型,取得了比肩世界顶级闭源模型的优异成绩。
  • 1M token 上下文,推理 FLOPs 只有上一代 V3.2 的 27%,KV cache 只要 10%。


DeepSeek-V4 支持 OpenAI ChatCompletions 接口与 Anthropic 接口。调用新模型 API 时,Model 参数需要改为 deepseek-v4-pro 或 deepseek-v4-flash。


阿里云 AI 网关,提供 Model API、Agent API、MCP Server 的管理能力,现已率先支持 DeepSeek-V4 API 的管理。 您可以通过阿里云 AI 网关,调用 DeepSeek-V4 API 服务,包括思考、多轮对话、Tool Call、Anthropic /v1/messages 兼容调用等功能,并支持在 Claude Code 上接入 DeepSeek-V4,此外,还实现了 DeepSeek-V4 和 Qwen 等其他模型之间的 Fallback 能力。


配置方式:

打开 AI 网关控制台 [ 2] 实例页面,在顶部菜单栏选择目标实例所在地域,并单击目标实例 ID。在左侧导航栏,单击 Model API,然后单击创建 Model API。

进入创建 Model API 表单后,您可按以下说明进行配置:

  • 协议:不同协议对应该场景下的一组内置默认路由,用于快速生成常用的 OpenAI/DashScope/vLLM 等兼容接口。
  • API 名称:您可自定义 API 名称,需注意名称必须全局唯一(同一账号下不可重复),支持英文、数字、下划线“_”、“-”,且不超过 64 个字符。
  • 域名:访问该 API 的域名,支持选择多个。域名与基本路径 BasePath 的组合必须唯一。
  • Base Path:配置 API 的基本请求路径,默认为 /。可选择是否启用转发至后端服务时移除**。


配置完后,进行用例测试:

相关链接:

[1]《DeepSeek-V4 预览版:迈入百万上下文普惠时代

[2] AI 网关控制台

https://www.aliyun.com/product/api-gateway/ai-gateway

相关文章
|
11天前
|
存储 人工智能 监控
Nacos Skill Registry:面向个人场景的 Skill 中心实践
构建个人 Skill 技能中心,实现多 Agent 复用与协作。
|
14天前
|
人工智能 数据库 开发工具
从可观测到可理解:用 UModel 构建 Agent 原生的代码知识图谱
本文对比 Claude Code、Cursor 等主流方案,提出基于 UModel 的代码知识图谱如何让 Agent 从"找代码"到"懂结构"。
240 11
|
10天前
|
数据采集 人工智能 安全
阿里巴巴 & 蚂蚁共建 LoongSuite GenAI 可观测语义规范:从统一数据语言到规模化落地
阿里巴巴与蚂蚁集团联合推出 LoongSuite GenAI 可观测语义规范,在 OpenTelemetry 标准之上,为 AI Agent、Skill、Token 级推理等场景建立统一数据语言。从链路追踪到引擎“显微镜”,本文揭秘如何让 GenAI 应用真正可看见、可分析、可治理。
152 12
|
14天前
|
自然语言处理 搜索推荐 数据挖掘
2026年电商行业有哪些agent应用?从客服、营销到数据决策的实战指南
本文详解电商智能体(Agent)实战应用:瓴羊Quick Service实现客服从应答到经营跃迁;Quick Audience推动营销从圈人到共情进化;Quick BI“智能小Q”助力数据决策从看报表到问答案革命。三者协同构建闭环智能体系,为电商企业提供可复用的分阶段落地指南。(239字)
|
17天前
|
缓存 人工智能 安全
你不知道的 Agent:原理、架构与工程实践
文章内容基于作者个人技术实践与独立思考,旨在分享经验,仅代表个人观点。
|
14天前
|
数据采集 自然语言处理 监控
2026年企业有哪些agent应用场景?Agent在客服与营销中的落地场景应用
2026年,企业Agent深度落地客服与营销场景:Quick Audience实现全域用户识别与智能旅程编排;Quick Service支持多层级意图理解与情感化服务;Quick BI提供自然语言分析与实时决策辅助;Dataphin夯实数据治理底座。五大能力闭环协同,驱动人机共智升级。(239字)
|
1月前
|
存储 Linux Docker
告别繁琐安装!Obsidian 容器化部署,跨设备访问笔记自由
Obsidian 作为一款备受欢迎的本地知识管理工具,凭借其灵活的笔记链接、本地存储优势,成为很多开发者、知识管理者的首选。而通过 Docker 部署 Obsidian,不仅能实现跨环境快速部署,还能轻松实现数据持久化,适配 NAS、服务器、个人电脑等多种场景。本文将详细介绍 Windows 和 Linux 两大系统下,通过 Docker 部署 Obsidian 的完整流程,同时提供 Docker 一键安装命令,降低部署门槛。
464 2
|
1月前
|
存储 自然语言处理 机器人
OpenClaw 搭团队太折腾?这个 Skill 一键搞定多智能体协作
OpenClaw是专为多智能体协作设计的基座,采用Actor架构,各Agent独立运行、消息驱动。针对协作失序、配置复杂等痛点,agentrun-team Skill提供一键组队能力:自动完成身份配置、构建团队意识与闭环流程,10分钟即可交付可协同、可审计、高透明的智能体团队。
|
10天前
|
人工智能 自然语言处理 小程序
零基础入门:阿里云 OpenClaw 一键部署全流程详解(图文版)
OpenClaw(龙虾AI)是阿里云推出的开源、本地优先AI代理引擎,可理解自然语言并自动执行文件操作、脚本运行、浏览器控制、邮件管理等任务。支持轻量服务器、计算巢、无影云电脑三种一键部署方案,最快两步即可启用,真正实现“指令即执行”。
217 1
|
2天前
|
存储 安全 Java
首个 Java Harness Framework 来了丨AgentScope 把 OpenClaw 带到企业分布式场景
本文旨在正式宣告 AgentScope Java 1.1.0 里程碑版本的发布,重点阐述该版本如何从工程实践层面完整落地“Harness Framework”理念。

热门文章

最新文章