我认为大模型就是由无数训练好的小模型组成,训练这些模型其实是数据公司,他们有大量的人手训练,然后把训练好的模型卖给ai公司,就是一个组装的过程,我学着训练了一个狗尾花的识别模型,用了7万张图,当然是书里给的例子,用了几分钟,然后生成了一个模型,然后用程序读取模型,代入一个花的图片,他就可以识别是不是,速度飞快,估计几个纳秒。所以大模型之所以要等待一下,主要是识别你问什么,然后去找模型,其实识别很快,这也就是gpt发布路由器的厉害之处,缩短了寻找模型的时间,哈哈

你的理解其实抓住了一个非常关键的直觉

大模型看似庞大无比,但确实可以类比为由“许多小模型/能力块”拼接起来的系统,只不过这些小模型并不是单独训练、再像乐高一样硬拼在一起,而是通过一种“参数共享+任务泛化”的方式被统一在一个超大网络里。我们可以从几个角度来分析你的观点:

?

1.

小模型与大模型的关系

?t你训练的狗尾花识别模型

?t本质上是一个二分类器:输入图片

输出“是/不是”。

?t它的训练目标非常单一,7万张图足够把特定任务学好。

?t大模型(例如

gpt

或多模态模型)

?t它不是单一的分类器,而是类似超级“万能函数”。

?t内部确实会形成类似“子能力”的模块(比如语言理解、知识召回、逻辑推理、风格模仿等),就像你说的一个个“小模型”。

?t不过这些“子模型”并不是人为切分的,而是网络在海量训练中自动分化出来的功能区。

更多内容加载中...请稍候...

本站只支持手机浏览器访问,若您看到此段落,代表章节内容加载失败,请关闭浏览器的阅读模式、畅读模式、小说模式,以及关闭广告屏蔽功能,或复制网址到其他浏览器阅读!

本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!

都市小说推荐阅读 More+
衡门之下

衡门之下

天如玉
宗室女栖迟被退婚后,嫁给了出身寒微却手握重兵的伏廷。两人一南一北,相安无事地做了许久的挂名夫妻,直到某日,栖迟千里追夫而去,开始在这位夫君身上狂下血本……
都市 连载 69万字
憨婿

憨婿

瞎说D
硬核修真大佬,重生上门憨婿,上演憨憨当家,一切以老婆指令为方针,着重落实老婆掌握大权,做一名负责任的上门女婿!(硬核大佬,华丽变身极品憨憨。)
都市 连载 7万字
苟苟

苟苟

夏小正
苟苟作者:夏小正文案:宠溺变态攻&美貌双性弱受第1章太阳很大,站在门口准备敲门的宋萧回过头生气地叫他,“宋苟苟,你来不来?”宋荀站在太阳底下,支支吾吾地不想去,还没开口,就看见门开了,李时杼看着他俩笑,“诶,萧萧,苟苟,进来。”宋荀生来带着灾,想取个贱名好养活,家里都是文化人,又实在下不去口,只好大名叫宋荀
都市 全本 28万字
失焦

失焦

岁枝
许星喜欢了颜词三年。每喜欢颜词一天,她就会折一个星星,在里面写上祝颜词平平安安。那天雨夜她躺在颜词怀里折星星,颜词说:“星星,将这玻璃瓶装满,我们就结婚。”“好。”许星答。婚后某天。
都市 全本 26万字
满城衣冠

满城衣冠

金十四钗
衣冠这两个字很有意思,既指缙绅世族,也是斯文败类。许苏对傅云宪的记忆得追溯到十来年前。或许是时间久远,记忆发生了偏差,当时的傅云宪与这两个字全无干系,既不搭着前一层,也不挨着后一层。
都市 连载 52万字
好吃,不过饺子

好吃,不过饺子

笑谈饮血
我从小与哥哥长大,可有一天我那美丽动人的嫂子嫁过来后,我便过上了猪狗一般的生活,哥哥死后,嫂子更是把我当成奴隶使唤,对我百般虐待,可当有一天晚上,我发现了小姨的秘密……从此,美女...…
都市 连载 243万字