国产大模型诸神之战:“三英”战巨头
过去几个月,大模型创业大军也不断扩充。就在阿里“通义千问”发布前一天,搜狗创始人王小川也正式宣布加入大模型创业梯队,拉上老搭档、前搜狗COO茹立云,组建约50人的初创团队。而在王小川之前,最受关注的大模型创业项目是美团联合创始人王慧文旗下的“光年之外”。另一个低调的创业团队,实力同样不可小觑——前商汤科技副总裁、通用智能技术负责人闫俊杰创办的Minimax。
综合分析这三位大佬的项目发展状况、未来规划和团队组成,其特点、优势相当明确:王小川有经验有人脉,对AI技术了解很深;闫俊杰不仅自己拥有博士学位,团队骨干来自全球顶尖学府;王慧文虽然不懂AI,但架不住其背后有强大的资本助力。
王小川的王牌:经验和产品思维
首先看王小川的“百川智能”。根据每经网的报道,该项目目前已收获5000万美元启动资金,计划年内发布“国内最好的大模型和颠覆性产品”。虽然搜狗已成过去式,但王小川在搜狗身上积累的不少成功经验,仍能复制到“百川智能”身上。
在技术上,王小川的前瞻性有口皆碑,搜狗过往的多款产品都带有AI色彩。早在2011年,王小川就在内部探索AI技术,发力语音输入、跨语言信息处理等项目。2017年,搜狗翻译通过综合运用算法大数据和深度学习等技术,将翻译错误率降低10%-20%,错误率足以比肩谷歌同年发布的Transformer架构。
又比如运营上,王小川的产品思维同样令人印象深刻。通过搜狗输入法为浏览器导流,打通浏览器、搜索和输入法流量内循环通道,这一做法甚至被周鸿祎学去,成为360发动“3Q”大战痛击腾讯的王牌。
不过王小川也有自己的问题:不擅长长期规划,制定战略时略显悠游寡断,对团队管理也没有那么得心应手。在“百川智能”创业发布会上,王小川也承认自己更像一个职业经理人。
在创业阶段,王小川还不用太担心管理、长期战略等问题。但随着时间推移、团队规模扩大,他始终要正视自己的不足,并努力改掉这些缺点。
王慧文的“钞能力”:豪华VC天团撑腰
接着了解王慧文的“光年之外”。
没有产品不要紧,一级市场已给这位大佬送上第一份厚礼——10亿美元估值。支撑资本估值逻辑的,是王慧文幕后强大的朋友圈:老搭档王兴出钱出力,初创团队里还有北京智源人工智能研究院副院长刘江、一流科技创始人兼CEO袁进辉,以及王小川的老熟人、“搜狗输入法之父”马占凯。
有趣的是,“光年之外”的办公地点,也选择了王小川熟悉的地方——北京搜狐网络大厦。在开业首日,顺为资本、真格基金、腾讯云纷纷送上祝贺花篮,王慧文背后的资本版图也逐渐明晰。
据报道,在“光年之外”的启动资金中,除了王慧文自己投入的2500万美元和王兴以个人名义投入的1500万美元,真格基金投资额也达到1000万美元。此外,坊间广泛流传腾讯云会成为A轮融资的金主,而拉腾讯云入局的,是另一个资本大鳄红杉中国。
openAI的高管曾多次表示,大模型非常烧钱。有钱就有底气,王慧文的“钞能力”就是最好的护身符。不过王慧文的命门也很明显:没有技术背景,对AI的认识肯定没有王小川、闫俊杰那么深。有鉴于此,王慧文需要加大招募力度,不断充实技术团队。
闫俊杰的护身符:硬核科研团队保驾护航
最后看闫俊杰的Minimax。和前面两个大热项目相比,Minimax胜在起步时间早、规划清晰,实绩也最能打。
在今年2月召开的小型媒体沟通会上,Minimax表示已初步搭建文本到语音、文本到文本、文本到视觉三大模态的基础架构,也是国内第一家拥有这三种模态的大模型初创企业。此外,其面向C端的AI聊天社交软件Glow推出4个月用户量突破百万。
有意思的是,王慧文的优势、不足刚好和闫俊杰相反。论人脉、论经验,闫俊杰和前面两位大佬不在一个级别。成立前期保持低调,也和资本的克制状态,缺乏炒作意愿有一定关系。唯有低调干实事、拿出实绩。而幕后一支强大的研发团队,则是Minimax和闫俊杰致胜的法宝。
闫俊杰本人就是十足的科技大咖。光是在深度学习和计算机视觉领域,其发表的顶级期刊论文就超过100篇,被Google Scholar应用超过一万次。MiniMax的技术合伙人杨斌是闫俊杰的中科院校友,技术团队中三分之一成员拥有博士学位和世界顶尖实验室的工作经历。
事实也证明,做出成绩后资本自然会亲自投诚。
根据资深互联网观察家、天极网创办人林军的爆料,Minimax是国内第一家估值达到10亿美元、迈过独角兽门槛的大模型创业公司,红杉中国、米哈游都是其老股东。此外,林军还透露Minimax新一轮融资信息,除了老股东外,IDG资本跟投4000万美元,腾讯等大鳄也蠢蠢欲动。
有钱、有经验、有技术,在日渐壮大的大模型创业大军中,王慧文、王小川和闫俊杰组成的“三巨头”无疑已领先其他竞争对手一个身位。在AI风口的催化下,王小川们也有望带动中国科技圈新一轮创业热潮。
不过和上一个十年不同,这一批创业大军,越来越老了。
这些人都没听说过...... 什么大模型? 本帖最后由 CDKEY* 于 2023-4-12 13:40 编辑
大模型则是指读取海量数据、参数规模巨大的演算法模型。业界一般认为超过千亿级参数即为大模型
页:
[1]