“帮我以古龙的风格写个朋友圈,介绍我今天参加了篮球比赛的事情。”
8月8日,立秋,百川智能创始人王小川正式对外发布百川新一代大模型Baichuan-53B,并在媒体沟通会上向大家演示模型的真实效果。
“江湖风起,今日吾辈少年于球场相聚,共赴一场篮球之约......”“赛场之上,对手如狼似虎,吾等需全力以赴,方能取胜。”输入问题后,Baichuan-53B在几秒钟时间里就模仿古龙文笔写下了一篇篮球赛小作文,颇有些江湖武侠风。王小川讲,“我们在文科上很强,目前在写作、文本创作能力方面,已经达到行业最好的水平。”
在此之前,百川智能相继发布了参数量130亿的通用大语言模型Baichuan-13B-Base、对话模型Baichuan-13B-Chat及其INT4/INT8两个量化版本。王小川介绍,Baichuan-53B的参数量是530亿,主要面向B端用户提供服务,即将开启内测,预计下个月将开放API。
目前,已有超150家企业申请使用百川智能大模型。谈到下一轮融资进展时,王小川没有透露具体细节,只微笑表示,“融资非常顺利,但现在还不能公布情况。”
一、“超150家企业申请使用百川大模型”
“我刚刚回想,我干了20年的搜索,一直没有一个人说,小川,你特别适合做搜索,而在我这次做大模型后,有些朋友跟我说,你特别适合做大模型。”
王小川讲,做大模型比做搜索引擎时成就感更大。
第一,这个事情更加吸引人,刚刚赶上大的时代变化,从信息时代走向智能时代,有无数多的事情可以做,大家本身认同感更高;第二,搜狗老班底之前有亲密无间的合作,彼此都有很好的信任,包括前搜狗COO茹立云、前搜狗CMO洪涛、前搜狗搜索总经理陈炜鹏均已归队;第三,回报上会不一样,创业成功之后股权回报比搜狗多很多,搜狗到后来挖人都很难,但今天不管字节、阿里、腾讯、百度也好,很多优秀的人才愿意加入。
之所以优先召回搜狗老班底,在王小川看来,是当前应对“百模大战”,百川能够“跑得这么快”,背后重要的原因之一。
他谈到,百模大战下,一起起步的公司动辄5亿美金估值,第二轮可能就是10亿美金的状态,这个竞争不是“小清新”状态,而是要迅速投入到这场大战役之中。“更多的大厂、更多的钱、更多人、更多的算力互相卷,这种情况下要迅速形成战斗力,因此优先把搜狗的老班底拉起来,大家能迅速磨合,才能适应这么大的挑战。”
谈及百川智能的商业模式,王小川坦言,“我们现在是新兵,有的公司已经干了几个月甚至一年时间,作为后发者进入市场,我们现在既有开源大模型也有闭源的大模型,开源对我们来讲,第一是能先给中国的商业生态作一些贡献,第二也是展现我们的技术实力,相信只要持续不断的技术迭代,就会有自己的商业模式。”
他透露,现在有超过150家企业开始申请使用百川模型。“而且很多都是行业头部企业,有的是自己用,有的并没有告诉我们。之后百川的商业化工作会开展起来。”
对于竞争,王小川讲,“中国现在比较好,还是比较开放状态,互相之间没有到二选一的排挤,大家对大模型的理解度还不是很多,没有到共识的状态,未来慢慢会有更多的分层,更多专注在自己的事情,现在还是在群魔乱舞的状态。”
二、决定胜负的关键是资金和组织能力
伴随AI产业的火爆,国内AI相关模型、产品、平台不断涌现,据公开资料显示,国内市场在半年时间里已发布近百个AI大模型,共同掀起一场“百模大战”。
在王小川看来,今天不管是十家、百家、千家参与,最后一定要看两件事情:
第一个,是否能拿出足够好的AGI来,能与GPT3.5、GPT4去比肩,这件事情大家都有相应的距离,我们现在也没做到,往下看今年内有哪些企业能达到3.5甚至逼近4的能力。
第二个,是否能做出超级应用来。有可能中国的超级应用会比美国跑得快,中国做科学问题会差一些,但是应用是我们的强项,能够优先达到国际水平。
在互联网大厂疯狂卷向大模型之际,创业公司是否还存在机会?
王小川对此非常乐观,“我们跟美国不太一样,美国通用大模型闭源模型头部几家已经定下来了,OpenAI的ChatGPT有了,Google有一张门票,在美国做通用大模型已经没有悬念,投资也不会再去投。但是在中国不是,中国谁做出了最好的大模型并没有结论,大家都在争取的机会,且不一定落在大厂里面。”
在他看来,决定胜负的关键因素,一是资金非常重要,二是人才团队,尤其包括人的能力和公司组织能力。“大厂钱多,人多,算力多,但组织效率不一定够好。创业公司组织效率可能好,也可能不好,但我们而言非常容易把效率提上去,如果在钱上能保证的话,我们的能力还是很强的。”
王小川讲,“不管最后剩下是5张、3张还是2张门票,我们都在船上。”(闫妍)