一元网络论坛

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 91|回复: 0

Nvidia Nemotron 70B 刚刚发布,在性能上超越了 Llama 3.1 405B、GPT4o 和 Claude 3.5 Sonnet。

[复制链接]

3万

主题

3万

帖子

9万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
95505
发表于 2024-10-18 06:27:03 | 显示全部楼层 |阅读模式
Nvidia Nemotron 70B 在多个基准测试中超越了 Llama 3.1 405B、GPT4o 和 Claude 3.5 Sonnet,包括竞技场、AlpacaEval 2 LC 和 MT Bench。该模型使用带有 Llama-3.1-Nemotron-70B-Reward 和 HelpSteer2-Preference 提示的 RLHF(REINFORCE)训练。Nemotron 70B 的 Instruct 模型、奖励模型和数据集已在 Hugging Face 上发布。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|一元网络论坛

GMT+8, 2024-11-25 07:53 , Processed in 0.058501 second(s), 20 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表