Llama2大模型开源,中国大模型数量会再增100倍？

作者： CashCat
2023年07月20日
人工智能

微软和Meta宣布Llama2大模型开源且可以商用，一下朋友圈刷屏。要知道，开源界最强大的模型就是过去Meta开源的Llama，而现在Llama2更强大，又开放商用，更有微软大模型霸主企业撑腰（微软既投资大模型界的IOS——ChatGPT，又联合发布大模型的Android——Llama2），开源大模型的确如当年的Android一样要流行起来了。

国产大模型“百花齐放”

反观国内，大模型也是最热的话题，前几天有人整理了一份现在国内发布大模型的企业和名称，笑称“中国古代的名词快不够用了”，我大概数了数大概114个大模型，但是其实这些只能叫做拥有自己业务适配的大模型企业，而不是真的中国有114个原创大模型。

取名类型	公司名	大模型名字	序号
旧词新组	百度	文心一言	1
	阿里	通义千问	2
	知乎	知海图	3
	云知声	山海	4
	中国科学院计算技术研究所	百聆	5
	中工互联	智工	6
	清博智能	先问	7
	第四范式	式说	8
	中国联通	鸿湖	9
	美亚柏科	天擎	10
	拓尔思	拓天	11
	拓世科技	拓世	12
	智臻智能	华藏	13
	京东	言犀	14
	新华三H3C	百业灵犀	15
	鹏城实验室	鹏城脑海	16
历史人物	华为	盘古	17
	硅基智能	炎帝	18
	度小满	轩辕	19
	澜舟科技	孟子	20
	达观	曹植	21
	IDEA研究院	封神榜	22
	IDEA研究院	二郎神	23
古词新用	腾讯	混元	24
	网易伏羲	玉言	25
	网易伏羲	丹青	26
	网易有道	子曰	27
	商汤	书生	28
		日日新	29
	北京语言大学	桃李	30
	星环科技	无涯	31
	星环科技	求索	32
	蚂蚁集团	贞仪	33
	国家超级计算天津中心	天河天元	34
	科大讯飞	星火	35
	上海人工智能实验室	书生·浦语	36
	电信智科	星河	37
	数慧时空	长城	38
	昆仑万维	天工	39
	云从科技	从容	40
	中科闻歌	雅意	41
	宇视科技	梧桐	42
	中国移动	九天	43
	创业黑马	天启	44
GPT+垂类专属名称	京东	ChatJD"	45
	360	SEEChat	46
	理想汽车	MindGPT	47
	中国电信	TeleChat	48
	农业银行	ChatABC	49
	好未来	MathGPT	50
	左手医生	左医GPT	51
	印象笔记	大象GPT	52
	数说故事	SocialGPT	53
	东北大学	TechGPT	54
	华东师范大学	EmoGPT EduChat	55
	北京信息工程大学	ChatLaw	56
	华南理工大学	SoulChat	57
	清华大学	ChatGLM	58
	恒生电子	LightGPT	59
	医联科技	medGPT	60
	孩子王	KidsGPT	61
	清睿智能	ArynGPT	62
	维智科技	CityGPT	63
中医大模型命名特点	哈尔滨工业大学	本草	64
	华南理工大学	扁鹊	65
	香港中文大学(深圳)	华佗GPT	66
	智慧眼	砭石	67
地名大模型	慧言科技+天津大学	海河·谛听	68
	西北工业大学与华为	秦岭·翱翔	69
	西湖心辰	西湖	70
首家学派大爆发”	中科院	紫东太初	71
	智源人工智能研究院	悟道天鹰	72
	智子引擎	元乘象	73
	阿里达摩院	八卦炉	74
	超对称技术公司	乾元	75
	理想科技	大道Dao	76
	云天励飞	天书	77
外国人物	台智云	福尔摩斯FFM	78
	赛灵力科技	达尔文	79
	联汇科技	欧姆	80
沾边动植物	上海交通大学	白玉兰	81
	出门问问	序列猴子	82
	麒麟合盛	天燕AiLMe	83
	容联云	赤兔	84
	云从科技	行业精灵	85
英文名	字节跳动	Grace	86
	贝壳	BELLE	87
	百川智能	baichuan	88
	OpenBMB	CPM	89
	虎博科技	TigerBot	90
	艾写科技	Anima	91
	稀宇科技	MiniMax	92
	医疗算网	Uni-talk	93
	奇点智源	Singularity OpenAPI	94
	深思考人工智能	Dongni	95
	微盟	WAI	96
	上海科技大学	DoctorGLM	97
电影角色名	实在智能	塔斯	98
电影角色名	复旦大学	MOSS	99
与公司名一脉相承	智媒开源研究院	智媒	100
	佳都科技	佳都知行	101
	长虹	长虹超脑	102
	乐言科技	乐言	103
	晓多科技+国家超算成都中心	晓模型XPT	104
其它	企查查	知彼阿尔法	105
	香港科技大学	罗宾Robin	106
	浪潮信息	源	107
	电科太极	小可	108
	中科创达	魔方Rubik	109
	追一科技	博文Bowen	110
	竹间智能	魔力写作	111
	浙江大学杭州国际科创中心	蛋白质	112
	聆心智能	超拟人大模型	113
	莫塔社区	元语人模说开源	114

大模型“百花齐放”的奥妙

中国有这么多的大模型的奥妙隐藏下面的这张图里：

在这个图里你会发现，企业使用大模型其实有几种方法，常见的就是个人和小企业，直接使用线上ChatGPT、Claude、Bard或者类似的服务，至多可以用Prompt或者Langchain来Embedding一些预置场景和信息给线上大模型服务。但此时，你所有的数据都在公网上的，而且你也不是真正的让这个大模型适配你的业务知识库和业务逻辑，所以遇到复杂的处理场景或者使用企业内部数据的时候线上大模型服务就无法满足要求。

此时，基于开源大模型的FineTune（优化）出现了，也就是过去有不少企业在网上开放了自己训练的大模型（例如Llama），让大家基于这个模型可以再次优化训练自己的业务模型。这样训练的模型可以解决公网大模型的数据私密问题和深度理解自己业务场景的问题，一下子解决很多问题。不过受限于还有一定的技术门槛，所以，能使用和优化开源大模型的企业还不多。不过也有不少大型企业和实体做了开源大模型优化，并把这个模型再次开发出来，这就成为了国产大模型“百花齐放”的景象。

但是，其实真的从0开始构建大模型，难度是非常非常非常大的，看ChatGPT烧掉那么多钱让GPU训练，Llama2都需要微软这样的大佬背后支撑就知道，真的能做出来中国自主大模型的企业凤毛麟角。

开源大模型生态降低使用门槛，让大模型用户x100倍

但，这并不会影响大模型在中国的普及，为什么我说中国大模型数量会再增100倍呢？这是因为我看到越来越多的开源大模型的生态项目，开始降低企业使用开源大模型的门槛，这就像当年Android的流行一样，开始只有一些大玩家在玩，然后Android开源生态起来之后，所有的企业都会开发Android APP了。

目前看到100多个拥有大模型的企业还都是比较大的实体，很少有中小企业有自己的大模型的。这是因为优化训练大模型，现在还存在着不少门槛：

专业人才：需要大模型算法专家进行调优，不是每个企业都有这样的专家
数据供给：需要给大模型优化准备数据，而且在适当的时候“喂”给大模型
调优效率：调优本身是一个反复的调整测试的工作，没有合适的工具来做
而现在各种开源社区都在进一步降低这个门槛，将大模型变得“人人可用”，例如Apache DolphinScheduler社区发布的文章《用一杯星巴克的钱，训练自己私有化的ChatGPT》，就给出了让普通程序员甚至数据分析师快速用自己的数据优化大模型的方案。而Apache SeaTunnel也在准备做企业内部数据和大模型的打通之间的Langchain《图书搜索领域重大突破！用 Apache SeaTunnel、Milvus 和 OpenAI 提高书名相似度搜索精准度和效率》。这些都会让没有相关人员、处理复杂数据、不知道怎么调优的企业进一步拥有自己的大模型。我相信，未来大模型的门槛曲线是下图虚线这样的，未来每个会使用ChatGPT的企业和个人，都可以拥有自己私有化的大模型：

随着Llama2的发布和商用化的解禁，我相信中国的开源大模型会进一步丰富起来，而中国开源大模型生态也会和中国开源Android生态系统一样，有自己一套开源支撑的生态体系，在拥有这么多数据和人口的国家蓬勃发展起来。

来源：郭大侠说开源


第一时间获取面向IT决策者的独家深度资讯，敬请关注IT经理网微信号：ctociocom


   除非注明，本站文章均为原创或编译，未经许可严禁转载。


相关文章：


                    谷歌将继续开源Android
                                      Gartner发布《2022中国网络安全技术成熟度曲线》DSP、ASM、SCA等技术正逢其时
                                      2020年数据科学的顶级编程语言TOP10
                                      开源的中国叙事
                                      二十年恩仇一笑泯，微软加入Linux基金会
                                      托瓦兹抨击GitHub：某些功能很垃圾
                                      微软成立技术子公司拥抱开源和开放标准
                                      Twitter开源其MySQL核心代码
                  



标签： Llama, Llama2, 开源