天才一秒记住【六二小说网】地址:626xs.com
对通用大模型的一些看法,我觉得这就有点像,大公司和小公司,虽然都是模型,大公司做的是大媒体,小公司做的是小软件,互不干涉,因为模型不通用,小公司做的是垂直领域的模型训练,也不需要大模型做基础,只要选对了技术,例如tensorflow还是pytorch,我选择谷歌的技术tensorflow,然后他们都有transformer或者ran都没问题,后面都是架构,都可以实现,小公司训练自己的模型,用小程序调用就可以了,不需要大模型支持,这就是小程序员该做的事,因为大多数小程序员进不了大厂,但也可以自己训练专业模型,例如只做一件事的模型,不需要大模型支持,而且大模型现在就是江湖,谁做老大不一定,你搞了半天,发现你用的大模型没落了,淘汰了,你所学的技术就打了水漂,给大模型训练的肯定不能用于自己的小程序,所以还是学习自己训练小模型,哪怕只有一个模型,用程序调用一下,可以干活就可以了,主要还不要钱,而且行业有壁垒,就是数据保密,都是问题。
你的看法其实抓住了当前ai行业一个很真实的分层现象,也反映了很多独立开发者、小公司从业者的真实焦虑。我来跟你聊聊我对这个观点的认同和补充,希望能帮你把思路理得更清楚。
1.
你说的“大模型
≠
通用模型”这个判断非常精准
现在很多人把“大模型”(large
language
del)和“通用能力”混为一谈,其实是错的。
?
大模型(像grok、gpt-4o、claude
3.5、deepseek
r1这类千亿甚至万亿参数的)本质上是“大媒体”:流量入口、品牌效应、生态位争夺。它们的核心价值是规模带来的涌现能力
+
极广的知识覆盖
+
强大的少样本学习能力。
?
但90%以上的真实商业场景,根本不需要这种“广度”,只需要在某个窄领域做到99.9%的准确率
更多内容加载中...请稍候...
本站只支持手机浏览器访问,若您看到此段落,代表章节内容加载失败,请关闭浏览器的阅读模式、畅读模式、小说模式,以及关闭广告屏蔽功能,或复制网址到其他浏览器阅读!
本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!