一元网络论坛

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 198|回复: 0

DeepSeek API 推出 prompt kv 缓存命中优惠,价格低至一折。

[复制链接]

3万

主题

3万

帖子

9万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
96158
发表于 2024-8-19 18:40:43 | 显示全部楼层 |阅读模式
功能已上线,快来试试省钱!无缝接入,无需修改,即可使用。
适用于多个请求上下文相似的场景,例如:
- 代码补全
- 多轮对话
- 论文阅读 + 多角度提问
只要你的 prompt 与历史 prompt 前缀相似,就能匹配 kv cache,获得以下优势:
- 加速处理
- 每百万 token 仅需 0.1 元
注意:短 prompt 可能会无法触发缓存,建议使用 2K 以上的中长 prompt。目前 DeepSeek V2 Chat 约一半 prompt 命中,DeepSeek Coder V2 甚至超过一半。
功能仍在测试中,可能存在少量不稳定情况。
实现原理:利用 3FS 分布式存储系统作为 kv cache 的二级缓存,将热点 prompt token 对应缓存落盘,实现快速访问。缓存是分用户的,避免冲突。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|一元网络论坛

GMT+8, 2024-11-28 16:33 , Processed in 0.098661 second(s), 19 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表