很久不见这般热闹的春天。
随着ChatGPT的威名席卷全球,大洋对岸的中国厂商也纷纷亮剑,各式本土大模型你方唱罢我登场,声势浩大的发布会排满日程表。 有趣的是,在这些大模型产品初入历史舞台之时,带给世人的第一印象其实不是以亿为单位的参数规模,也不是那些遍布英文缩写的模型特征。
事实上,人们第一眼见到的只是名字。具体来说,是一个又一个奇特甚至稍显玄奥的词组。
文心一言、通义千问、日日新、知海图、天工、星火……数不清的互联网新词跃出水面,于众声喧哗间搅动产业风云。
在普罗大众真正体味到科技革命之前,先行的名称已经开启了一场无声的较量。
刺猬公社制图
花式命名大赏必须承认,对广大用户来说,在“toB内测”“邀请码限量”和“登记预约”的重重限制之下,许多人还未能得到亲自上手体验本土大模型的机会。
可这毫不损害它们无比强烈的存在感,因为崭新的名称不断出现在头版头条中,念不顺溜的人仿佛要被时代当场抛弃,令你不得不诚心记诵。
浪漫地讲,遍历于信息大海的AI就像人类手造的“神明”,其称谓便如赛博时代里诸神的尊名。如今,没有一家中国大厂愿意错过新技术的浪潮,也没有谁甘心在“为神赋名”的竞赛中落于下风。 放眼望去,如今国产大模型的名称究竟有何门道?文绉绉的称谓该怎样解读?什么样的取名思路才是大势所趋?
A、复古潮流
倘若盘点一番,本土大模型及相关产品最具标志性的命名思路,无疑是用最复古的名字包装最现代的技术。从先声夺人的百度到后续跟进的一系列强劲选手,多数都属于这一流派。
1、文心一言——百度
2023年3月16日,百度在北京召开发布会,造势已久的“文心一言”正式亮相。
官网信息显示,文心一言是百度全新一代知识增强大语言模型,“文心大模型家族的新成员”。据百度创始人李彦宏介绍,文心一言在文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成等领域表现突出。
百度对AI产业的多年布局我们暂且按下不表,单名字而言,“文心”与“文心一言”来自何处?
在做客央视财经频道《中国经济大讲堂》时,百度CTO王海峰曾表示:“文”是语言文字,“心”是用心理解,“文心”指致力于理解和运用语言文字的自然语言理解模型,同时也呼应了《文心雕龙》,寓意用雕缕龙纹一样精细的功夫去研究语言文字的内涵和魅力;“一言”既有“一言为定”的寓意,也有对人机之间“你一言我一语”流畅沟通的殷切期盼。文心“一言”既出,即可“一生二、二生三、三生万言”……
这样看来,文心之名根植于汉语语境,还拉上了文学理论家的千古著作背书,整体上颇具中国特色。
2、通义千问——阿里巴巴
4月7日,阿里云宣布自研大模型“通义千问”开始邀请用户测试体验。
此后,阿里巴巴集团董事会主席张勇在云峰会上表示,阿里巴巴所有产品未来将接入“通义千问”大模型,进行全面改造,包括天猫、钉钉、高德地图、淘宝、优酷、盒马等等。
那么,“通义千问”是什么意思?如果我们把这个问题抛给通义千问自己,它会输出一则文心一言那样拆字式的回答。
按照通义千问的自述,“通义”意味着模型具有广泛的知识和普适性,可以理解和回答各种领域的问题。“千问”则代表了模型可以回答各种问题,包括常见的、复杂的甚至是少见的问题。它表达了通义千问致力于满足用户在不同场景下的需求,无论问题多么复杂或者独特。
简而言之,“通义千问”是一个经过文学化润色的名称,本意仍是在强调模型的强功能性。
3、知海图——知乎
4月13日,在2023知乎发现大会上,知乎创始人周源正式发布了“知海图AI”中文大模型。
据介绍,知乎通过联合研发与战略投资的方式,与面壁智能达成深度合作,共同开发中文大模型产品并推进应用落地。目前,知海图AI已经被运用于知乎热榜,首个大模型功能“热榜摘要”上线并开启内测。
图源网络
从命名角度看,“知海图”带有鲜明的企业文化烙印,它既呈现出知识图谱的功能面貌,又像借助海图遨游知识汪洋,如同古时远征。再回看发现大会上知乎CTO李大海的发言,他用“船长”一词称呼周源,更是让这关于大航海的比喻平添声色。
4、混元——腾讯
腾讯系的AI大模型名为“混元”。
4月21日,腾讯对外披露混元AI大模型的研发进展,宣布混元在五大跨模态视频检索数据集榜单中先后取得第一名的傲人成绩。据悉,混元基于腾讯太极机器学习平台进行研发,借助GPU算力,实现快速的算法迭代和模型训练。
太极、混元,这些词汇放在一起体系分明。道家有云,混元即无极,无极生太极,太极生两仪,两仪生四象,四象生八卦,八卦衍万物……
从万物衍生的学说中,腾讯找到了自家AI大模型的文化锚点。
5、玉言/子曰——网易
2023年1月,网易伏羲中文预训练大模型“玉言”系列登顶中文语言理解测评基准CLUE分类任务榜单,在多项任务上超过人类水平。据悉,其自然语言处理能力可应用于语言助手文本创作、新闻传媒、智能客服等多个领域。
在汉语中,“玉言”是指对别人所说话的敬称,常见于成语“金口玉言”。网易伏羲以此命名大模型,与自然语言处理的核心任务相契合,且不失古韵。
另外,天眼查App显示,网易有道申请注册多个“有道子曰”商标。有消息称,网易有道自研的教育场景下类ChatGPT模型将于近期推出,模型名称为“子曰”。
结合“AI英语口语老师”和“中文作文批改”等内测项目来看,“子曰”意在还原古代学子对先贤、老师的尊称,专门适配教育场景,技术上是大模型垂直应用的一次探索,命名亦是如此。
6、言犀——京东
4月8日,京东集团副总裁何晓冬在人工智能大模型技术高峰论坛上表示,京东计划在今年发布新一代产业大模型言犀。言犀将是京东版ChatGPT,预训练参数规模达到千亿级,人工审核通过率超过95%,生成文字超30亿。
事实上,“言犀”对京东来说不算是新词。早在2020年11月的京东全球科技探索者大会上,“言犀”就曾作为京东智能客服品牌名称被正式发布。
彼时,京东将“言犀”一词解读为“言下之意,心有灵犀”——对于智能客服来说,这或许就是沟通交流的理想境界。而如今升级壮大的言犀产业大模型,想必也会延续当初这份“心有灵犀”的憧憬。
7、天工——昆仑万维
4月17日,昆仑万维正式发布大语言模型“天工”,并宣布启动邀请测试。
天工由昆仑万维与奇点智源联合研发,通过自然语言与用户进行问答式交互,可满足文案创作、知识问答、代码编程、逻辑推演、数理推算等需求。其算力基于国内最大的GPU集群之一,采用了千亿预训练基座模型和千亿RLHF模型。
“天工”一词与“人工”相对,指向天然形成的工巧。成语“巧夺天工”多用以形容技艺高超、胜过天然。放在现代大语言模型的语境里,天工便是对AI智能的极致褒扬,以人力造物媲美天然智巧。看得出,昆仑万维对自家旗下的双千亿模型满怀信心。
8、星火——科大讯飞
4月24日,科大讯飞宣布讯飞星火认知大模型将在5月6日举行成果发布会。
官方信息披露,通过海量文本、代码和知识的学习,星火认知大模型拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务,号称“懂你所言,答你所问,创你所需,解你所难,学你所教”。
与这一串排比相呼应的,是微渺的“星火”一词。“星火”本意是大火的火星或一瞬即逝的光,容易联想到的成语是“星火燎原”,指起初力量弱小但生命力旺盛的事物会迅速发展壮大。
科大讯飞以此命名大模型,应当是取其燎原壮大之势,与当今AI智能的高速迭代互文。毕竟,你我都正见证大火燃起。
9、书生/日日新——商汤科技
3月14日,商汤科技发布多模态多任务通用大模型“书生(INTERN)2.5”。
书生大模型的初版由商汤科技、上海人工智能实验室、清华大学、香港中文大学、上海交通大学在2021年11月共同发布,并持续联合研发。官网信息显示,最新的书生2.5致力于构造多模态多任务通用模型,可接收处理各种不同模态的输入,并采用统一的模型架构和参数处理各种不同的任务。
书生2.5处理复杂任务,图源商汤科技官网
看完那豪华的联合研发阵容,“书生”这个名字也就不显得突兀了,它首先恰如其分地展示了模型背后的学院派背景。其次,书生作为中国传统文化中最典型的学子形象,在“寒窗苦读”的叙事里意味着长久苦读、不断进益,这和AI模型不断进化的历程相吻合。
4月10日,在书生2.5发布还不到一个月的时候,商汤科技再度公布了“日日新SenseNova”大模型体系,推出自然语言处理、内容生成、自动化数据标注、自定义模型训练等多种大模型及能力。
针对这个名称,商汤科技联合创始人徐立表示:“我们以AI大装置SenseCore打造AGI时代的基础设施,并基于此将大模型体系命名为‘日日新SenseNova’,寓意‘苟日新、日日新、又日新’,希望在模型的迭代速度及处理问题的能力上可以日日更新,不断解锁AGI的更多可能。”
“日日新”显然延续了“书生”举一反三、持续学习的特质,并进一步强调了自我革新的价值。面临全球AI竞争加剧的大环境,恐怕的确只有日新月异的进步速度,才能在群雄并起时杀出血路。
10、紫东太初——中科院自动化研究所
2021年7月,虚拟人“小初”在世界人工智能大会亮相,展示了图(视觉)、文(文本)、音(语音)三种模态的智能转换和生成。这样的表现得益于跨模态通用人工智能平台“紫东太初”,由中国科学院自动化研究所研发。
图源网络
紫东太初是全球首个图文音三模态预训练模型,同时具备跨模态理解与跨模态生成能力。中科院自动化所构建了中文预训练模型、语音预训练模型、视觉预训练模型,并通过跨模态语义关联,构建了三模态预训练大模型。
起步早、技术硬的紫东太初,顶着一个硬核程度不遑多让的名字。所谓“太初”,是哲学概念中的起始状态。追溯古籍,《列子·天瑞》说:“太初者,气之始也。”《庄子·知北游》里写:“外不观乎宇宙,内不知乎大初。”前者在讲天地未分前的混沌之气,后者谈的是道之本源,若是拿来注解大模型的开拓性或蓝图,似乎都说得通。
在接受观察者网采访时,中科院自动化研究所所长徐波曾回应过关于“紫东太初”名称内涵的提问,他说道:“相当于人工智能走向人类智能的一个混沌初开之际,也是感知智能走向通用智能重要的第一步。”
11、悟道——智源研究院
2021年6月,智源研究院学术副院长唐杰正式发布了“悟道2.0”人工智能模型。
当时,悟道2.0以 1.75 万亿的参数量打破了谷歌Switch Transformer预训练模型创造的 1.6 万亿参数记录,一举创下全球最大预训练语言模型纪录。这之后,悟道大模型持续发展,奠定了智源研究院在中国人工智能领域的重要地位。
“悟道”作为名称,字面上是指领会道理。关键在于,“道”之一字具备丰厚的文化底蕴,既是中国人文智慧的结晶,也是极深奥的考题,千百年来不知曾有多少人苦苦求索一生。
在新时代,让AI悟道,去理解人力难尽之谜,是一场关于人工智能的、真正浪漫的想象。
12、雪湖·海若——毫末智行
4月11日,北京自动驾驶企业毫末智行发布了首个自动驾驶生成式大模型DriveGPT,中文名叫做“雪湖·海若”。据介绍,雪湖·海若未来将逐步应用到城市智能辅助驾驶、捷径推荐、智能陪练以及脱困场景中。
乍一看,人们可能不会想到,这个名字实际上和公司名渊源颇深。“海若”一词出自《庄子·秋水》,河伯请教北海若如何区分事物大小,北海若的回答中有这样一句话:“知天地之为稊米也,知毫末之为丘山也”。
以此为引子,毫末智行把大模型的中文名定为“雪湖·海若”,大略是要表达多智包容之意。看似晦涩的名字背后,愿景倒并不复杂。
B、旧时姓名
第二个大流派很直接,不需要考据字词出处,因为命名直接取用了中国人民无比熟悉的名讳。传奇与史话中的古老代称被重新拾起,冠以21世纪的摩登内涵。
13、盘古——华为
2021年4月,华为云CEO余承东在HDC华为开发者大会上公布了华为云盘古系列AI大数据模型。
两年过去,乘着ChatGPT的东风,耕耘已久的“盘古”重回大众视野。有网友注意到,在华为云官网,NLP大模型、CV大模型等盘古系列AI大模型均呈现即将上线的状态。
盘古的故事不需赘述,其创世神地位给AI技术的革命性再添一笔注脚。与此同时,华为云旗下还有开天aPaaS服务,命名思路与盘古一脉相承,开天辟地的豪气溢于言表。
14、曹植——达观数据
3月,人工智能企业达观数据对外宣布,该公司研发团队正在积极探索大语言模型(LLM)的实践,研发国产版GPT“曹植”系统。
据官网介绍,“曹植”是垂直、专用、自主可控的国产版ChatGPT模型,能够实现专业领域的AIGC智能化应用,且可内置在各类业务系统中提供专用服务。
中国人对三国时期文学家曹植的认知,与他“七步成诗”的典故紧密相关,这大概也正是达观数据如此命名的缘由。想象一下,当AI大模型以空前高效的姿态生成内容,那绝世才学岂不就是当代的“七步成诗”?
图源达观数据官网
15、孟子——澜舟科技
3月14日,认知智能公司澜舟科技宣布完成Pre-A+轮融资。澜舟科技创始人周明在北京创新工场总部宣布,澜舟科技推出孟子对话大模型(MChat)。
据官网介绍,孟子对话大模型(MChat)是一个面向对话场景的可控大语言模型,能够通过多轮的方式帮助用户完成特定场景中的多种工作任务。
在澜舟科技成立一周年之际,周明曾写过一封公开信,其中解释了“孟子”命名的来由。他说:“《孟子》有云:‘以力服人者,非心服也,力不赡也。’这恰好代表了我们认为‘模型不能一味追求大’的观点和轻量化模型的技术追求。”
简而言之,“孟子”是澜舟科技探索轻量化模型的一面旗帜,先人之言回响至今。
16、凤凰——香港中文大学
凤凰(Phoenix)大语言模型来自香港中文大学(深圳)和深圳市大数据研究院的王本友教授团队。
研发团队将多语言的大模型命名为“凤凰”,即百鸟之王。在中国传统文化中,凤凰是祥瑞尊贵的神兽,有百鸟朝凤之荣光。同时,紫金凤凰本就是香港中文大学(深圳)的校徽图腾,能够代表开发团队的背景信息。
作为大模型的凤凰应对解读多种语言,就如同神鸟聆听百雀争鸣,想来也是一幅妙趣横生的图景。
C、功能本位
第三大流派主打一个“朴实无华”,用最简单的字眼让人听懂掌声。对它们最好的解释,也许就是不做解释。
17、360智脑——360
4月9日,360官方正式宣布,基于360GPT大模型开发的人工智能产品矩阵“360智脑”率先落地搜索场景,将于4月中旬面向企业用户开放内测。未来,360智脑计划与浏览器、数字助理、智能营销等场景应用结合。
在360创始人周鸿祎口中,360智脑还是“刚出生的孩子”,不过名字本身倒是清晰展示了其未来愿景,让每个人都能领悟360的雄心。
18、行业精灵——云从科技
3月30日晚间,云从科技发布公告称拟定增募资不超过36.35亿元,用于“行业精灵”大模型研发项目。该项目主要依托公司算法研发能力和大模型理论基础,用于行业大模型的理论研究与构建以及行业大模型下游场景的应用研发。
云从科技指出,公司主要提供高效人机协同操作系统和行业解决方案,助推人工智能产业化进程和各行业智慧化转型升级。在命名上,“行业精灵”可谓开门见山,使人容易理解其发力方向,干脆地与用户向大模型错开了赛道。
D、灵光一现
最后一类国产大模型的命名十分特别,它们另辟蹊径地融入了一些外延知识,绝不肯落入窠臼。初看者一头雾水,懂梗的人则会心一笑。
19、MOSS——复旦大学
MOSS是来自复旦大学的对话式大型语言模型。2月20日,复旦大学自然语言处理实验室透露,MOSS已由邱锡鹏教授团队发布,邀公众参与内测。
尽管“MOSS”这个名字由英文字母构成,但它其实发源于正当红的中国流行文化。在国产科幻电影系列《流浪地球》中,MOSS是一个相当令人难忘的特殊角色——一台属于“550系列”的超级量子计算机550W。
《流浪地球》系列电影中的MOSS,图源网络
电影故事里,550W将自己命名为颠倒过来的MOSS,象征着人造智能体的自主崛起。这种极端理性、趋向完美的艺术形象,正呼应了现代人对AI技术的想象,因而MOSS之名一经发布,就让复旦大模型打破次元壁,引发了热烈反响。
20、序列猴子——出门问问
4月20日,人工智能公司出门问问在北京举办2023 AIGC战略发布会。会上出门问问宣布内测探索大模型“序列猴子”。作为一款具备多模态生成能力的大语言模型,序列猴子支持文字生成、图片生成、3D内容生成、语音生成和语音识别等不同任务。
“序列猴子”这个名字的灵感,来源于数学家埃米尔·波雷尔在20世纪初提出的“无限猴子”定理——如果一群猴子随机地敲打一台打字机,最终一定会产生完整的莎士比亚作品。
这一定理基于概率论和 组合数学,阐释了概率的统一性。对应到大模型身上,就是指海量文本经过算法训练、算力消化,以求练成本领超凡的“序列猴子”。
如此说来,“序列猴子”这个有无限意味的名字,大概是对AI智能涌现的另一种趣味诠释。
E、他山之石
在英文世界里,与AI相连的热门称谓同样是新闻报道的高频词。最前沿的产品正定义着我们对AI服务的认知,它们的代号是迥异于中文的另一种答卷。
21、ChatGPT——OpenAI
首先,当然是那个人人都挂在嘴边的名字:“ChatGPT”。
它由美国OpenAI研发推出,发布于2022年11月30日,定位为优化对话的语言模型。2023年一月末,ChatGPT的月活用户突破1亿,成为有史以来增长最快的消费者应用程序。
至于ChatGPT具体能做什么,恐怕已经不需要任何人再做赘述。
如今我们回看它的名字,能感觉到一份异常的简洁。“ChatGPT”可以拆分为两个部分,前一半“Chat(聊天)”直截了当地点明基本应用场景,后一半“GPT”是“Generative Pretrained Transformer(生成式预训练变换器模型)”的缩写,指代实现方式。
22、TruthGPT——(X.AI)
相似的,马斯克最近宣布的项目名称叫做“TruthGPT”。
作为互联网科技圈的红人,马斯克并非ChatGPT的拥护者,至少今天不是。他认为如日中天的OpenAI已然背离初衷,ChatGPT有很大的风险被用于制造虚假信息、操纵舆论及其他滥用或失控行为。
不仅如此,马斯克还对福克斯新闻表示,ChatGPT缺乏对宇宙本质的理解,也缺乏对真理的追求。于是马斯克近日宣布将推出名为“TruthGPT”的人工智能平台,旨在“寻求真理、尝试理解宇宙本质”,显然是要与ChatGPT同台对抗。
事实上,马斯克已经在美国内华达州成立了一家名为X.AI的人工智能公司,马斯克自己担任唯一的公司董事。而“TruthGPT”的名称足够直白,一方面呼应马斯克“寻求真理”的口 号,另一方面则作为抨击ChatGPT虚假信息的猛烈炮弹。
23、Bard——谷歌
相比于OpenAI给ChatGPT的粗暴命名,谷歌好歹为自家聊天机器人设计了一个带有人格化色彩的称谓:Bard。
Bard背后的技术支撑是谷歌的应用语言模型LaMDA,实操中的功能面貌与ChatGPT大同小异。3月21日,谷歌开始向公众开放Bard的访问权限,目前服务仍在不断更新完善。
倘若译作人名,“Bard”是亲切的巴德。从字面意义上看,“Bard”则代表吟游诗人。需要指出的是,谷歌并不承认 Bard 是搜索引擎的替代品,而是多次强调将其当作一种补充。Bard真正的定位应当是Collaborator,即协作者。
24、New Bing/ Copilot——微软
在ChatGPT掀起热潮后,微软宣布新版必应搜索将搭载ChatGPT,改善用户的搜索体验,是为New Bing。
3月中旬,微软再出杀招,Copilot惊艳四座。这是一款适用于Microsoft 365的AI服务产品,搭载GPT4模型,能够实现多样的办公需求,例如按指令生成PPT、调整表单、生成会议纪要等等,一时间令无数打工人心神往之。
Copilot宣传图,图源网络
Microsoft 365 Copilot,揭开了AI变革生产力的序幕。而它的名称其实相当老实本分,Copilot可以翻译为副驾驶,表明AI只是用户副座的贴心助手,掌握方向盘始终是人类自己。
这种隐含的他者立场,在ChatGPT遭受全球各地监管审视的今天,显得尤其值得玩味。
|