作者 | Ben
编辑 | 石亚琼
近日,国内开源大佬,PingCAP联合创始人&CTO黄东旭发表了“万字长文剖析数据库发展新趋势”,其中特别提到:“在 ChatGPT出来之前,我一直认为 AI 存在过度炒作的成分,但 ChatGPT 真的让我感到惊喜,让我体会到 AI 的价值,它并非直接取代工程师,而是提升工程师的生产效率。这类工具与企业内部现有业务的结合将会是接下来非常值得关注的趋势。”
现在的ChatGPT是人见人爱,花见花开。
可是ChatGPT不开源啊,这意味着在不久的将来,一方面终端用户随时可能要为各种各样的ChatGPT应用付费,另一方面每一家开发ChatGPT应用的公司又要为OpenAI和微软们付费。
就像是层层嵌套起来的苹果税,对终端用户和内容开发者都可能是巨大的负担。
据公开信息,ChatGPT每一次对话的成本是几美分,从商业化产品的角度来说,OpenAI拿到了史上最低的获客成本。
也因此在2月初,仅仅正式上线了2个月的ChatGPT超过Tiktok,成为互联网历史上最快突破1亿月活的应用。为了达成这个小目标,年轻的Tiktok用了9个月,再之前的App Store花了两年时间。
图源:网络
但是对于OpenAI而言,用户量未必能形成门槛,从获客到实现商业价值,既有DeepMind们的直接竞争,同时也会面临开源生态的挑战,如何维护最安全的护城河永远都是个大问题。
在后移动互联网时代,开源是一把双刃剑
开源,或者不开源,再或者于未来的某个时间节点开源,是一道很难,也没有标准答案的选择题(可以试一下ChatGPT给出的答案)。
从历史来看,OpenAI旗下的ChatGPT、DALL·E 2都和开源社区有着千丝万缕的联系。
从现在事实来看,ChatGPT没有开源,DALL·E 2也没有开源。
去年年中开始,DALL·E 2引领的AI图像生成领域经历了一波过山车式的行情,或许可以为ChatGPT提供一些参考。
2022年4月,OpenAI宣布推出用35亿个参数训练的GPT-3转化器模型DALL·E 2,不久后的2022年7月,Midjourney也通过其官方渠道宣布了开放测试版。
他们都是闭源的,虽然吸引到了公众的注意,但是被Stability AI于2022年8月推出的开源Stable Diffusion摘了桃子。在影响力和应用方面,Stable Diffusion迅速超过了与其存在竞争关系的Midjourney和DALL·E 2。
对于一个非完全商业形态的产品而言,开源之后铺天盖地的仿制品会把产品的缺陷放大一万倍。
虽然Stability AI迅速拿到了1亿美元融资,但其摘桃时间有不合理的嫌疑,结果是AI图像生成过早出现在终端市场,在陷入版权、道德、伦理问题的同时,关注度也开始直线下滑。
不开源可能会被开源打败,但过早开源也许确实并不是正确选择。
OpenAI的官方声音语焉不详,不确定未来是否会开源GPT3.5。并且,微软享有ChatGPT的版权,就更不太可能将其开源。
在跃跃欲试的开源社区中,高度相似的产品迟早会出现,即使训练大模型的成本能构成门槛,但有钱的金主怕是已经望眼欲穿。
眼下,谷歌的Bard、百度的文心一言已经拍马杀到,留给ChatGPT的窗口期恐怕也不会很长。
此外,后移动互联网时代已经接近尾声,从Web3在阿尔法世代和Z世代的影响力及接受程度来看,科技巨头对于用户数据的垄断迟早会被打破。
假如用户问ChatGPT的每个隐私问题都被它锁定,那么隐私和安全又将成为无解的难题。重生的AI是否会成为网络平权的切入点,或将交由开源生态来打破。
无论如何,ChatGPT已经开启了大幕的一角,一切或将被重构,资本跃跃欲试,这个时代不容错过。
鲇鱼效应
ChatGPT用光速突破了大众对AI的刻板认知,我们会拭目以待谁将打破其最快月活过亿记录。
如果哪家科技巨头表示不担心ChatGPT会帮助竞争对手超过自己,那一定是言不由衷。
如果哪家巨头真的不担心ChatGPT所带来的变革,那他很可能在不久之后就要面临出局。
就像曾经并称Top3 AI Labs的小群体中,除了OpenAI、DeepMind之外应该还有一家,但是不查一下的话还真想不起来。之前就有人说Top3来自Fair自己的公关,现在看,特别是从能力上来说,大概率Fair确实和它背后的Meta一起掉队了。
ChatGPT上线以来,在外界看来承压最大的一定是谷歌,毕竟除了考试作弊,ChatGPT最先颠覆的很可能就是搜索引擎。
但其实,压力给到了所有人,包括微软,甚至也包括OpenAI自己。
谷歌还有DeepMind可以抵挡一阵,其他很多家大厂就真的是裸奔了。
好巧不巧的是,在ChatGPT上线的这几个月里,北美的科技巨头们共同经历了一轮波澜壮阔的裁员,这也许是巧合,但巧合太多的时候,偶然中势必有其必然性。
ChatGPT像一条鲇鱼,搅浑了池水,它超乎寻常的快,迫使巨头和创业公司今后必须拿出看家本领,加速创新。
图源:网络
ChatGPT或许是未来十年科技领域最大变革的起点,当然,同时代的元宇宙和Web3也很酷,但是没有AI加速,他们可能要五年、十年后才能落地。
此外,少有人关注的是,ChatGPT或将开始影响未来网络产品的UI设计,正如乔布斯所奉行的极简主义:less is more,少即是多。
如果单从视觉角度来说,ChatGPT的极简风绝对是加分项;再从用户体验的角度来看,锋利的工具应该最简单,最直接。
未来,有了AI加持,各种操作系统、应用软件基于现有交互方式的UI恐怕迟早会被时间所抛弃,涉及到元宇宙的各种XR设备和ChatGPT这样的AI太配了。
再考虑到OpenAI旗下还有DALL·E 2这样的怪兽级应用,衷心希望AI加持的计算机图形学能够让宏大、真实的开放世界成为现实。
大力出奇迹
这两年来,每逢开年,就到了微软秀“钞能力”的时刻。
2022年1月18日,微软宣布以687亿美元全现金收购游戏厂商动视暴雪,连夜刷屏朋友圈。并且,从GPT通过不断玩“我的世界”等各种游戏修炼升级来看,沙盒与开放世界之间可能会被AI更快打通。
2023年1月24日,微软宣布与OpenAI扩大合作伙伴关系,作为两家公司合作伙伴关系的第三阶段,微软将向OpenAI进行一项为期多年、价值数十亿美元的投资,以加速其在人工智能(AI)领域的技术突破。
微软未在声明中具体给出投资的具体规模,但此前据知情人士透露,数额将高达100亿美元。
与此相比,据几家科技巨头最新披露的财报测算,裁员11000人大概要花近10亿美元。
从另一个维度看,全球现金储备最多的Top10公司中,微软现金储备1365亿美元,排第二;谷歌1211亿美元排第三;Meta582亿美元排第八。
可以说Top3 AI Labs背后的大佬都不缺钱,但在“好钢用在刀刃上”这件事情上,谷歌和Meta分别都不幸押中了自动驾驶和元宇宙这样的超级现金黑洞,长坡厚雪的花钱,地主家的余粮也会捉襟见肘。
AI无疑也要花很多钱,据公开信息GPT3每训练一次要花近1200万美元,且其原理决定每更新一个新时间段的参数,就要彻底重新训练一次,不但大部分初创公司承担不起,巨头也不会三天两头去训练它。
而这也正是ChatGPT大力出奇迹的佐证,成功试水的同时标志着AI已经来到、或接近“高投入高产出”的时间节点。
在微软和 OpenAI 的战略合作计划中,GPT 3.5的所有模型,包括 ChatGPT,都在Azure的AI超级计算集群上训练,这也盘活了微软在云端的算力资产。
而OpenAI对 ChatGPT所采用的名为“从人类反馈中强化学习”(Reinforcement Learning from Human Feedback,RLHF)全新训练方法,需要大量真人作为对话方提供辅助训练,这在人力成本愈发高企的时代,推高成本的同时,也加高了项目本身的门槛。
慢既是快
同样是大模型,GPT 3.5的参数并不多,为什么它能最先破圈?
来自个人粗浅认知的解答是玩游戏,玩游戏让AI学得快、学得深、学得透。
其实GPT的训练过程相当漫长,但最终诠释了“慢既是快”。
或许万亿级的海量参数可以让大模型无所不知、无所不晓。但算力不代表算法,聪明的AI需要逻辑,而逻辑不单来自让AI干活,还要让它在玩儿中长大。
之前一直很疑惑,为什么GPT要花那么长的时间才能学会玩“我的世界”这种看似幼稚的沙盒游戏。
如果有机会深入了解,或许才有可能解读“慢既是快”这样偏向玄学的问题。
从公开信息可见,DeepMind最喜欢下围棋,Sony的人工智能比较爱玩赛车。
而OpenAI涉猎最广,似乎什么游戏都玩。其实DeepMind等其他家AI实验室也是什么游戏都会涉猎的,但OpenAI的赢面比较大,比如2018年就率先在DOTA 2中击败人类组队。
2019年开始,OpenAI、DeepMind、Microsoft Research(微软自己的实验室早期还在线,渐渐就陷入大厂不如创业公司的问题)等机构就一起组织了玩“我的世界”比赛“MineRL”。
OpenAI为了让模型学会在“我的世界”里最简单的操作刨木头,前后训练了大约7万小时,而这通常是学龄前小朋友看十分钟就能学会的。
OpenAI生生通过视频预训练模型VPT的海量数据标注,让AI像郭靖一样不单背下了全本九阴真经、也学会了降龙十八掌。
玩游戏让OpenAI跑通了大量新模型,经过70000小时训练,OpenAI的行为克隆模型能够理解真人游戏视频中的精髓,从此AI开始有机会成为游戏中的骨灰级玩家。
成立于2015年的OpenAI在2022年成功出圈当然不是偶然的,顶级AI实验室们经过这么多年在学术上互相启发、在课余时间一起打怪升级,已分别训练出大量模型。
而在游戏中所表现出的水准又恰恰真实反映出了AI公司的能力值,虽然看起来不务正业,却和弯道超车的逻辑不谋而合。
虽然国内的AI公司有十倍于GPT3参数的大模型,但是AI的能力更像是太极,在圆润和绵绵不绝中那个出乎意料的发力点。
尾声
这篇文章只是一个小起点,旨在提出不成熟的问题,也不求能够快速找到答案,36氪ToB产业报道希望有机会与关注这个领域的各界人士一起见证、共同探讨人工智能的蜕变。