一元网络论坛

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 122|回复: 0

搭载全球最大芯片的推理系统,性能飙升20倍,英伟达H100也被超越,GPU推理时代是否将迎来终结?

[复制链接]

3万

主题

3万

帖子

9万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
96158
发表于 2024-8-29 13:37:25 | 显示全部楼层 |阅读模式
Cerebras,曾打造全球最大芯片公司,现推出全球最快AI推理架构——Cerebras Inference。该架构以每秒1800个token的速度处理Llama 3.1 8B,70B参数的Llama 3.1也能达到每秒450个token的响应速度。Cerebras Inference不仅性能强大,价格也十分亲民。官方API定价显示,Llama 3.1 8B每百万token仅需10美分,Llama 3 70B每百万token仅需60美分。Cerebras 推理 API 同时保证了性能、速度、准确性和成本的最佳平衡,每天提供100万个免费令牌供开发者使用。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|一元网络论坛

GMT+8, 2024-11-28 02:30 , Processed in 0.072757 second(s), 19 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表