Llama2大模型开源,中国大模型数量会再增100倍?
微软和Meta宣布Llama2大模型开源且可以商用,一下朋友圈刷屏。要知道,开源界最强大的模型就是过去Meta开源的Llama,而现在Llama2更强大,又开放商用,更有微软大模型霸主企业撑腰(微软既投资大模型界的IOS——ChatGPT,又联合发布大模型的Android——Llama2),开源大模型的确如当年的Android一样要流行起来了。
国产大模型“百花齐放”
反观国内,大模型也是最热的话题,前几天有人整理了一份现在国内发布大模型的企业和名称,笑称“中国古代的名词快不够用了”,我大概数了数大概114个大模型,但是其实这些只能叫做拥有自己业务适配的大模型企业,而不是真的中国有114个原创大模型。
取名类型 | 公司名 | 大模型名字 | 序号 |
---|---|---|---|
旧词新组 | 百度 | 文心一言 | 1 |
阿里 | 通义千问 | 2 | |
知乎 | 知海图 | 3 | |
云知声 | 山海 | 4 | |
中国科学院计算技术研究所 | 百聆 | 5 | |
中工互联 | 智工 | 6 | |
清博智能 | 先问 | 7 | |
第四范式 | 式说 | 8 | |
中国联通 | 鸿湖 | 9 | |
美亚柏科 | 天擎 | 10 | |
拓尔思 | 拓天 | 11 | |
拓世科技 | 拓世 | 12 | |
智臻智能 | 华藏 | 13 | |
京东 | 言犀 | 14 | |
新华三H3C | 百业灵犀 | 15 | |
鹏城实验室 | 鹏城脑海 | 16 | |
历史人物 | 华为 | 盘古 | 17 |
硅基智能 | 炎帝 | 18 | |
度小满 | 轩辕 | 19 | |
澜舟科技 | 孟子 | 20 | |
达观 | 曹植 | 21 | |
IDEA研究院 | 封神榜 | 22 | |
二郎神 | 23 | ||
古词新用 | 腾讯 | 混元 | 24 |
网易伏羲 | 玉言 | 25 | |
丹青 | 26 | ||
网易有道 | 子曰 | 27 | |
商汤 | 书生 | 28 | |
日日新 | 29 | ||
北京语言大学 | 桃李 | 30 | |
星环科技 | 无涯 | 31 | |
求索 | 32 | ||
蚂蚁集团 | 贞仪 | 33 | |
国家超级计算天津中心 | 天河天元 | 34 | |
科大讯飞 | 星火 | 35 | |
上海人工智能实验室 | 书生·浦语 | 36 | |
电信智科 | 星河 | 37 | |
数慧时空 | 长城 | 38 | |
昆仑万维 | 天工 | 39 | |
云从科技 | 从容 | 40 | |
中科闻歌 | 雅意 | 41 | |
宇视科技 | 梧桐 | 42 | |
中国移动 | 九天 | 43 | |
创业黑马 | 天启 | 44 | |
GPT+垂类专属名称 | 京东 | ChatJD" | 45 |
360 | SEEChat | 46 | |
理想汽车 | MindGPT | 47 | |
中国电信 | TeleChat | 48 | |
农业银行 | ChatABC | 49 | |
好未来 | MathGPT | 50 | |
左手医生 | 左医GPT | 51 | |
印象笔记 | 大象GPT | 52 | |
数说故事 | SocialGPT | 53 | |
东北大学 | TechGPT | 54 | |
华东师范大学 | EmoGPT EduChat | 55 | |
北京信息工程大学 | ChatLaw | 56 | |
华南理工大学 | SoulChat | 57 | |
清华大学 | ChatGLM | 58 | |
恒生电子 | LightGPT | 59 | |
医联科技 | medGPT | 60 | |
孩子王 | KidsGPT | 61 | |
清睿智能 | ArynGPT | 62 | |
维智科技 | CityGPT | 63 | |
中医大模型命名特点 | 哈尔滨工业大学 | 本草 | 64 |
华南理工大学 | 扁鹊 | 65 | |
香港中文大学(深圳) | 华佗GPT | 66 | |
智慧眼 | 砭石 | 67 | |
地名大模型 | 慧言科技+天津大学 | 海河·谛听 | 68 |
西北工业大学与华为 | 秦岭·翱翔 | 69 | |
西湖心辰 | 西湖 | 70 | |
首家学派大爆发” | 中科院 | 紫东太初 | 71 |
智源人工智能研究院 | 悟道天鹰 | 72 | |
智子引擎 | 元乘象 | 73 | |
阿里达摩院 | 八卦炉 | 74 | |
超对称技术公司 | 乾元 | 75 | |
理想科技 | 大道Dao | 76 | |
云天励飞 | 天书 | 77 | |
外国人物 | 台智云 | 福尔摩斯FFM | 78 |
赛灵力科技 | 达尔文 | 79 | |
联汇科技 | 欧姆 | 80 | |
沾边动植物 | 上海交通大学 | 白玉兰 | 81 |
出门问问 | 序列猴子 | 82 | |
麒麟合盛 | 天燕AiLMe | 83 | |
容联云 | 赤兔 | 84 | |
云从科技 | 行业精灵 | 85 | |
英文名 | 字节跳动 | Grace | 86 |
贝壳 | BELLE | 87 | |
百川智能 | baichuan | 88 | |
OpenBMB | CPM | 89 | |
虎博科技 | TigerBot | 90 | |
艾写科技 | Anima | 91 | |
稀宇科技 | MiniMax | 92 | |
医疗算网 | Uni-talk | 93 | |
奇点智源 | Singularity OpenAPI | 94 | |
深思考人工智能 | Dongni | 95 | |
微盟 | WAI | 96 | |
上海科技大学 | DoctorGLM | 97 | |
电影角色名 | 实在智能 | 塔斯 | 98 |
复旦大学 | MOSS | 99 | |
与公司名一脉相承 | 智媒开源研究院 | 智媒 | 100 |
佳都科技 | 佳都知行 | 101 | |
长虹 | 长虹超脑 | 102 | |
乐言科技 | 乐言 | 103 | |
晓多科技+国家超算成都中心 | 晓模型XPT | 104 | |
其它 | 企查查 | 知彼阿尔法 | 105 |
香港科技大学 | 罗宾Robin | 106 | |
浪潮信息 | 源 | 107 | |
电科太极 | 小可 | 108 | |
中科创达 | 魔方Rubik | 109 | |
追一科技 | 博文Bowen | 110 | |
竹间智能 | 魔力写作 | 111 | |
浙江大学杭州国际科创中心 | 蛋白质 | 112 | |
聆心智能 | 超拟人大模型 | 113 | |
莫塔社区 | 元语人模说开源 | 114 |
大模型“百花齐放”的奥妙
中国有这么多的大模型的奥妙隐藏下面的这张图里:
在这个图里你会发现,企业使用大模型其实有几种方法,常见的就是个人和小企业,直接使用线上ChatGPT、Claude、Bard或者类似的服务,至多可以用Prompt或者Langchain来Embedding一些预置场景和信息给线上大模型服务。但此时,你所有的数据都在公网上的,而且你也不是真正的让这个大模型适配你的业务知识库和业务逻辑,所以遇到复杂的处理场景或者使用企业内部数据的时候线上大模型服务就无法满足要求。
此时,基于开源大模型的FineTune(优化)出现了,也就是过去有不少企业在网上开放了自己训练的大模型(例如Llama),让大家基于这个模型可以再次优化训练自己的业务模型。这样训练的模型可以解决公网大模型的数据私密问题和深度理解自己业务场景的问题,一下子解决很多问题。不过受限于还有一定的技术门槛,所以,能使用和优化开源大模型的企业还不多。不过也有不少大型企业和实体做了开源大模型优化,并把这个模型再次开发出来,这就成为了国产大模型“百花齐放”的景象。
但是,其实真的从0开始构建大模型,难度是非常非常非常大的,看ChatGPT烧掉那么多钱让GPU训练,Llama2都需要微软这样的大佬背后支撑就知道,真的能做出来中国自主大模型的企业凤毛麟角。
开源大模型生态降低使用门槛,让大模型用户x100倍
但,这并不会影响大模型在中国的普及,为什么我说中国大模型数量会再增100倍呢?这是因为我看到越来越多的开源大模型的生态项目,开始降低企业使用开源大模型的门槛,这就像当年Android的流行一样,开始只有一些大玩家在玩,然后Android开源生态起来之后,所有的企业都会开发Android APP了。
目前看到100多个拥有大模型的企业还都是比较大的实体,很少有中小企业有自己的大模型的。这是因为优化训练大模型,现在还存在着不少门槛:
专业人才:需要大模型算法专家进行调优,不是每个企业都有这样的专家
数据供给:需要给大模型优化准备数据,而且在适当的时候“喂”给大模型
调优效率:调优本身是一个反复的调整测试的工作,没有合适的工具来做
而现在各种开源社区都在进一步降低这个门槛,将大模型变得“人人可用”,例如Apache DolphinScheduler社区发布的文章《用一杯星巴克的钱,训练自己私有化的ChatGPT》,就给出了让普通程序员甚至数据分析师快速用自己的数据优化大模型的方案。而Apache SeaTunnel也在准备做企业内部数据和大模型的打通之间的Langchain《图书搜索领域重大突破!用 Apache SeaTunnel、Milvus 和 OpenAI 提高书名相似度搜索精准度和效率》。这些都会让没有相关人员、处理复杂数据、不知道怎么调优的企业进一步拥有自己的大模型。我相信,未来大模型的门槛曲线是下图虚线这样的,未来每个会使用ChatGPT的企业和个人,都可以拥有自己私有化的大模型:
随着Llama2的发布和商用化的解禁,我相信中国的开源大模型会进一步丰富起来,而中国开源大模型生态也会和中国开源Android生态系统一样,有自己一套开源支撑的生态体系,在拥有这么多数据和人口的国家蓬勃发展起来。
来源:郭大侠说开源
第一时间获取面向IT决策者的独家深度资讯,敬请关注IT经理网微信号:ctociocom
除非注明,本站文章均为原创或编译,未经许可严禁转载。
相关文章: