ChatGPT爆火，中美AI差距拉大到什么程度？

Insigne 发表于 2023-3-27 09:31:05

3月16日，李彦宏站在舞台聚光灯下，感受着全球科技从业者目光的注视，风头一时无两。
3年前，同一个场景，他也曾这么出风头过，但当时是因为一瓶从头浇下的矿泉水。
这一次他显然信心十足。预热了几个月，只要“文心一言”一发布，在ChatGPT掀起全球AIGC(生成式AI)狂潮乃至狂热的当下，百度就将成为全球第2个触摸到未来的科技先锋。
没想到，发布当天，李彦宏在台上说，百度股价在板上跌。
无论是发布会前一天OpenAI不讲武德地推出了革新的GPT-4模型，还是发布会上缺少实机演示，亦或是第一批尝鲜的用户输入“爱国”结果画出星条旗，都沉重打击了市场信心。
发布会开始不到20分钟，百度港股股价就暴跌超9.8%，后来股价略有上升，但跌幅仍超5%。不出意料，微博、知乎迅速出现了一片嘲笑声，“百度股价跳水”被送上热搜，线上线下弥漫着快活的空气。
然而，仅过了一晚上，股市完全变了。3月17日港股开盘后，百度几乎是直线拉升，日内继续波动上涨，全天涨幅近15%。随后几天，余威未消，百度股价继续上涨，目前已经回到年内高位。
事实上，业界很快回味过来了。
文心一言虽然比GPT4差得远，甚至比不上GPT3.5的ChatGPT，但依然是能用的。各种让人啼笑皆非的产出结果恰恰证实了技术的真实性，没有弄虚作假，这就够了。只要是真的，花钱花时间，总能迭代到好用的时候。
况且要论落后，落后第1名，那也是行业第2，在一个公认前途无量的领域做到世界第2，不强么?
风向一下子变了，这下压力来到了其他互联网大厂一边：
一直被嘲讽“掉队”的百度做出来了文心一言，你们在干什么?
1、第四波浪潮?
不能完全怪其他大厂不努力，从历史来看，过去AI发展经历了3波高潮，但总体来看，雷声大，雨点小。
人工智能概念的提出始于1956年的美国达特茅斯会议，1959年Arthur Samuel提出了机器学习，推动人工智能进入第一个发展高潮期，但因为对现实问题束手无策而衰退。这个阶段，AI只会依据规则证明中学数学定理。
此后70年代末期出现了专家系统，标志着人工智能从理论研究走向实际应用。80年代到90年代随着美国和日本立项支持人工智能研究，人工智能进入第二个发展高潮期，期间人工智能相关的数学模型取得了一系列重大突破，如著名的多层神经网络、BP反向传播算法等，算法模型准确度和专家系统进一步提升。
然而在这个阶段，AI的能力上限也只是下赢国际象棋。
新世纪以来，互联网将人类代入大数据时代，深度学习算法的出现和强化，GPU、NPU、FPGA等芯片技术带来的算力突破，共同推动了AI第三次浪潮的出现。
https://img3.qianzhan.com/news/202303/24/20230324-5d86cd56e3923a50_760x5000.jpg
2018年，新的里程碑出现。
谷歌推出大规模预训练语言模型BERT，通过3亿参数量的训练，在机器阅读理解顶级水平测试SQuAD1.1的2个衡量指标上全面超越人类，并在11种不同的NLP测试中达到SOTA(业内最佳)表现，宣布了大模型时代的到来。
次年，OpenAI迅速跟进，将GPT-1的1.17亿参数量迭代至GPT-2的15亿，在没有对模型结构做出过多创新的情况下，实现了超强的内容生成能力。
又过了1年，现在已经家喻户晓的GPT-3诞生，大模型参数量暴涨到1750亿，系统出现了从量变到质变的跨越。在优化和熟识1年多后，OpenAI将基于GPT-3.5的ChatGPT推向市场，轰动了全世界。
https://img3.qianzhan.com/news/202303/24/20230324-4fa250c67fbd67ed_760x5000.png
推出短短5天内注册用户量就超过100万，2个月后突破1个亿，平均每天1300万独立访客使用，ChatGPT不仅自己打破记录，还掀起了一波全球性狂潮。
https://img3.qianzhan.com/news/202303/24/20230324-5758d58ffd26b653_760x5000.png
在同行还没反应过来的时候，OpenAI又以迅雷不及掩耳之势推出了GPT-4。虽然没有公布详细参数，但其实际使用体验的巨大提升，再次震动了行业。
在智能化水平上，GPT-4和之前的模型产生了天壤之别。比如说，在美国大学先修课程微积分BC考试中，GPT-4获得4分(满分5分)，而GPT-3获得1分。GPT-3.5是GPT-3和GPT-4的中间模型，也获得4分。
模拟律师考试方面，GPT-4以排名前10%的成绩通过，GPT-3.5的分数徘徊在后10%左右。
GPT-4在各种专业和学术基准上的表现，已经达到了“人类水平”。
GPT-4更有趣的方面之一是多模态。与GPT-3和GPT-3.5只能接受文本提示不同，GPT-4还能接受图像提示来执行某些操作，也就是输入图片，它生成一段相关的文字内容。
而这，很可能还不是OpenAI的全部招式。
从时间上看，GPT-4早在2022年年中就基本完成;从产品上看，OpenAI还有很多，比如其中一款DELL-E2，可以输入文字来一张图片，正好和GPT-4互补。
很难想象，OpenAI到底领先对手几个身位?
作为行业第2，百度在2019年就已开始积累AI预训练模型技术，2021年12月正式发布了全球首个知识增强千亿大模型鹏城-百度·文心，参数规模达到2600亿，比ChatGPT还大。
有人可能会嘲笑，怎么用更大的模型，百度的产品还不如别人。
这里要为百度说句话，模型的参数量不是决定最终产品的唯一因素，模型的架构设计、数据质量、训练策略等因素都会影响模型的能力和性能。
就拿数据质量来说，如果百度是用中文互联网的信息来训练，那必然能起到一种事倍功半的效果。
3月，谷歌正式开放类ChatGPT产品Bard的访问，成为全球第3，其背后的LaMDA模型使用多达1370亿个参数进行训练。而从实际使用来看，这个第3当之无愧——有时候连文心一言都不如。
当然，这还是比一众连产品都没有的厂商要好得多。
2、卷起来了
中国率先做出类ChatGPT产品的为什么不是腾讯、阿里、字节跳动这样顶尖的互联网大厂，而是百度这种“掉队”厂商?
这里引用周鸿祎近期采访时的一段话：
“国内互联网公司花钱多少不一样，聚集人工智能的人才团队大小不一样，但是思路一样——人工智能应该找场景，要解决自己业务中遇到的问题。
所以，为什么中国的人工智能都用来解决人脸识别、图像滤镜做得更漂亮，如果一个人工智能技术和自己的业务不能结合，可能就会认为没太大意义。
所以，没有人想到用GPT NLP的模型解决通用知识理解和推理的问题，更没有人想到大算力大数据，最后做出一个大模型，能够产生一种连OpenAI自己都想不到的智能化的结果。”
总结一下，就是短期看不到变现可能的，就不做。
这段话不一定全对，但一定有正确的地方，因为确实有大厂身体力行地证明了这一点。
比如腾讯。
ChatGPT火了之后，腾讯深藏于血脉之中的本能立刻觉醒，马上宣布成立“混元助手(HunyuanAide)”项目组。
从人员构成来看，腾讯这回是下了血本了。
根据36氪“职场Bonus”消息，项目组Owner张正友是腾讯史上最高专业职级拥有者，首位17级研究员/杰出科学家;下面的3位PM，分别是腾讯在AI算法、AI工程和商业化方面的高管;7位组长是来自内部多个团队的骨干;支持人员更是覆盖广泛，连微信和互娱的也出现在名单人员的业务覆盖面内，可见腾讯之重视。
不过之前可不是这样的。
事实上，如果搜索关键词可以发现，“混元”这个名字并不是第一次出现在腾讯的项目中。
早在去年4月，腾讯就宣布了发布多模态“混元”AI大模型的消息，不过这个模型当时并没有用在类ChatGPT产品上。
用在哪里了呢?当然是能直接看到钱的地方啊。
根据当时的通稿，“混元”大模型“被广泛应用到广告创作、广告检索、广告推荐等腾讯业务场景中”。具体来说，就是利用AI更好地理解广告内容，然后更加精确地推送到你手机上。
只能说，不愧是你啊。
除了腾讯之外，国内还有几个赶晚集的大厂。
首先是阿里。2020年，阿里达摩院和清华大学共同推出了3亿参数量的M6大模型，2021年1月模型参数规模到达百亿;2021年5月，具有万亿参数规模的模型正式投入使用。
2022年10月，M6的参数规模扩展到惊人的10万亿，成为全球最大的AI预训练模型。
在产品方面，和腾讯一样，M6主要应用在阿里业务上，比如增进淘宝、支付宝等平台的搜索及内容认知精度等。去年阿里曾公布其在AIGC方面的成果，生成的实景图片已经十分逼真。
今年2月，据媒体报道，阿里版聊天机器人ChatGPT正在研发中，目前处于内测阶段。
之后是京东。2月10日，京东云旗下言犀人工智能应用平台宣布将整合过往产业实践和技术积累，推出产业版ChatGPT：ChatJD。
不过这个产品也许八字还没一撇，其通稿公布的信息中，参数量用的是“预计”为千亿级别的字眼。
在此前的采访中，京东方面曾透露过自研领域知识大模型K-PLUG的消息，称其生成的商品文案覆盖了京东3000+品类，累计生成30亿字，带来超过3亿元GMV。
就算新产品发布了，也和普通网友没什么关系，因为其定位的领域是零售和金融，服务于京东相关领域。
字节跳动方面发力较晚。据公开报道，到今年2月，ChatGPT已经火遍半边天了，字节还只是“正在大模型方面布局”。知情人士表示，字节跳动语言大模型团队在今年组建，探索方向主要为与搜索、广告等下游业务的结合，语言大模型团队的预期是在今年年中推出大模型。
另外还有华为。2021年4月，华为发布了盘古大模型，包括30亿参数的视觉(CV)预训练模型，以及与循环智能、鹏城实验室联合开发的千亿参数、40TB训练数据的中文语言(NLP)预训练模型。
不过无论是从当时公布的布局，后续通稿，还是近期的回应来看，华为似乎都没有推出类似ChatGPT这样面对普通网民的通用应用的意愿。也许未来我们可以在鸿蒙的车机上体验到华为的技术实力。
还有部分大厂，没有公布模型方面的信息，专攻应用层面。
比如网易有道方面称，未来或将推出ChatGPT同源技术产品，应用场景围绕在线教育。
三六零在互动平台上表示，正计划尽快推出类ChatGPT技术的demo(试用版本)应用。
科大讯飞2月在投资者互动平台回应称，公司在该方向技术和应用具备长期深厚的积累。科大讯飞AI学习机将成为该项技术率先落地的产品，将于今年5月6日进行产品级发布。
有意思的是，去年12月，他们的董秘还说“目前没有类似ChatGPT的产品计划”。
3、胜负未分
必须强调的是，虽然行业的领先者已经出现，但是长期来看，生成式AI其实还在萌芽阶段，未来竞争格局依然可能生变。
Gartner《2022年人工智能技术成熟度曲线》报告预测，广阔的应用场景和需求空间吸引大量资本和技术投入，预计将在2-5年内实现规模化应用。
https://img3.qianzhan.com/news/202303/24/20230324-9008f045dd22c87e_760x5000.jpg
根据Precedence Research，生成式AI将在2022年后迎来应用的爆发，市场空间预计由2022年的108亿美元上涨至2032年的1181亿美元，未来10年的CAGR高达27%。
https://img3.qianzhan.com/news/202303/24/20230324-744834c373d19b57_760x5000.png
在细分领域，目前生成式AI还主要应用在媒体与娱乐上，市场份额占比34%。
不过在此以后，商业和金融服务部门预计将以最快的速度增长 36.4%，该行业的市场扩张归因于人工智能 (AI) 在行业中越来越多地使用，以阻止欺诈、保护数据并满足金融服务中各利益相关者不断变化的需求。
总而言之，这个行业才刚刚起步，机会很多，不确定性也很大。
但有一点可以确定，之前国内大厂的功利主义和商业KPI导向在此刻将会得到教育，接下来可以预期，行业对AI成果商业化的预期会更加宽容和长期主义，对于AI生产力和增长曲线的认知也会更加清晰和坚定。
前瞻网

sunbetterwu 发表于 2023-3-27 09:33:26

人工智能更啊，会是第四次工业革命么？

walkingon 发表于 2023-3-27 10:35:49

对BD没什么好感。

dtltc123 发表于 2023-3-27 11:11:46

前几天与一个在阿里达摩院做人工智能方面的同学聊了一些，我问他为啥阿里没啥动作，他跟我说国内的AI与美国的差距太大了，大到超出你的想象。阿里不敢动，弄出来说不定也会被同行耻笑。。。我想他应该没骗我吧。。。

热青茶 发表于 2023-3-27 11:18:35

记得以前预计机器超越人类智能奇点在2045，现在看来要提前。

卖V导轨V丝杆 发表于 2023-3-27 17:10:43

dtltc123 发表于 2023-3-28 08:10:30

卖V导轨V丝杆发表于 2023-3-27 17:10
这不是很悲哀的一件事情吗？差距大怕笑话不做然后差距越来越大，国内网友也确实对国内公司包容性不够， ...

其实也不是不做，我的理解应该是做出来的不成熟也就不对外公布了。像你说的包容性也确实差些，我这同学要不是媳妇不想去，他自己都想离职去美帝发展了。。。。我当时还问他，阿里是不是在憋大招儿呢？他跟我说不是。。。。唉，我们还是得正视差距，想办法打破技术壁垒，但确实很难。。。。

山野向南cj 发表于 2023-3-28 11:26:09

体验一下文心一言

18元气王向晚 发表于 2023-3-29 13:53:06

笑死了，看看百度搜出了什么玩意，什么“xx工艺怎样怎样，小编也不知道，xx工艺究竟是怎样怎样呢，还请评论区。。。”，还不如用gpt帮忙

铸林邀风 发表于 2023-3-30 17:55:59

山野向南cj 发表于 2023-3-28 11:26
体验一下文心一言

现在个人也能使用了吗

页: [1] 2

机械社区's Archiver

ChatGPT爆火，中美AI差距拉大到什么程度？