拿到开源大模型以后还需要去训练吗-慕课网

1回答

tomiezhang 2024-04-18 03:43:15

开源大模型的意思就是只有一堆代码，怎么直接用。。。你至少得找个服务器把代码架起来跑呀，一般的服务器跑不动，只有GPU服务器才可以（为什么英伟达那么牛逼的原因）
闭源大模型是有人把这一堆代码和GPU服务器都解决了，用户直接用API方式就可以使用了。
这两者的区别在于，开源大模型相当于底层代码都在自己手里，你后期微调也好，API调用也好，所有投喂给LLM的数据都在自己手里，从商业角度来看比较安全。闭源大模型你只有使用权，而且你所有的交互数据相当于都传递给了这个闭源大模型（一般是一家商业公司如openai），数据安全不是很好（这也是为什么很多国家反对openai的原因之一）

0 回复有任何疑惑可以回复我~

提问者慕娘6279593 #1

你好，开源大模型与我理解的不太一样，我以前学过一些CNN等这些简单一些的模型，这些模型经过训练过以后可以导出成一个模型对象，然后通过load的方式去直接使用，用行业话来讲就是迁移学习的一种，这种情况下导出的模型其实是有数据的，行业话来讲就是导出的模型是学习了Future的，所以可以直接load然后使用，你说的需要服务器去跑这个我理解，但是我的理解是开源大模型肯定是已经带了学习的Future的所以如果服务器解决的话就可以直接使用不要投喂数据从头训练了，不知道我的理解是否正确？···

回复有任何疑惑可以回复我~ 2024-04-18 09:41:25

tomiezhang 回复提问者慕娘6279593 #2

了解，你知道CNN就简单多了，LLM开源模型底模肯定是带数据的，要不像openai的模型名称就不会带着时间了，但是这些训练数据有两个问题，一个是规模问题，比如7B的开源模型，只有70亿训练参数，那么它自带的数据肯定不会覆盖所有知识，就会造成它回答问题幻觉严重，另外一个是数据的时效性，类似openai发的模型很多时候名字都带个月份，表示该模型的知识最后更新时间，你如果问它当前发生的事情，因为没有训练，它是不知道的，也会导致模型幻觉。所以开源模型，节约的是底模全参训练的时间和金钱，但是对于训练集之外和最新的数据，一样是要通过RAG或者微调方式来处理的。

回复有任何疑惑可以回复我~ 2024-04-18 10:17:10

拿到开源大模型以后还需要去训练吗

正在回答回答被采纳积分+3

1回答

相似问题

请选择置顶位置

本课精华内容

shuziren Dockerfile 少加了一个斜杠/无法build

我用阿里千问的api，调用时跟你给的代码不一致

程序好像运行不了了

openai 调用无效令牌

macos m1 环境安装 pyenv 报错

热搜

最近搜索清空

拿到开源大模型以后还需要去训练吗

正在回答 回答被采纳积分+3

1回答

相似问题

请选择置顶位置

本课精华内容

shuziren Dockerfile 少加了一个斜杠/无法build

我用阿里千问的api，调用时跟你给的代码不一致

程序好像运行不了了

openai 调用 无效令牌

macos m1 环境安装 pyenv 报错

正在回答回答被采纳积分+3

openai 调用无效令牌