一元网络论坛

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 132|回复: 0

大型语言模型学术资源

[复制链接]

3万

主题

3万

帖子

9万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
96158
发表于 2024-9-10 03:27:35 | 显示全部楼层 |阅读模式
L站 c上最出名的莫过于各种品牌的LLM,而它们现在也十分火热。本文将提供一些难度较高的LLM资源,帮助想学LLM的站友深入了解最先进的技术。资源内容偏学术性,需要一定的深度学习基础,例如旷视北大或ucbCS182课程。
## LLM 0.5 基础入门 (主题入门)
以下三个资源概括了LLM的基本主题和解决方案。建议先补充背景知识,这些内容应该是高年级本科生能理解的。你可以参考伯克利的cs map定位并补足不熟悉的主题。
LLM 的研究大体可以分为以下几个部分:
* 模型 (Modeling)
* 训练 (Training)
    * 预训练 (Pre-Training)
    * 后训练 (Post-Training)
* 推理 (Inference)
* 评估 (Evaluation)
* 部署 (Deployment)
* 能力 (Abilities)
* 应用 (Applications)
* [COS 597G: Understanding Large Language Models](https://www.cs.princeton.edu/courses/archive/fall22/cos597G/)
* [CS 886: Recent Advances on Foundation Models](https://cs.uwaterloo.ca/~wenhuche/teaching/cs886/)
* [MIT 6.5940 Fall 2024 TinyML and Efficient Deep Learning Computing](https://hanlab.mit.edu/courses/2024-fall-65940)
伯克利的csmap: [https://linux.do/uploads/default/original/3X/9/d/9d9837cd5498b7f8366e38ab5edf2efc5a00969e.jpeg](https://linux.do/uploads/default/original/3X/9/d/9d9837cd5498b7f8366e38ab5edf2efc5a00969e.jpeg)
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|一元网络论坛

GMT+8, 2024-11-27 12:59 , Processed in 0.157603 second(s), 20 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表