“历史不会简单重复,它会押着同样的韵脚。”
几经跌宕,人工智能浪潮踏着生成式AI热度与大模型浪潮,再次攀上上升周期。13日,网信办等七部门正式发布《生成式人工智能服务管理暂行办法》(简称“《办法》”),行业人士认为,《办法》的迅速出台一方面证明了政策监管的敏捷高效,同时也佐证了当下大模型技术发展与行业影响的广泛。
为形容当下大模型现状,经纬创投创始管理合伙人张颖引用了一个调研数据——从今年3月到5月,召开业绩电话会议的标普500指数的公司中,有110家公司的高管提到了AI,这是过去十年的3倍。火热如斯,但周期恒在,在达到热度高点后,本次人工智能必然回归冷静波段,寻找商业化路径解决方案,落地商业本质。
对比国内人工智能AI1.0,如今的AI2.0较其有雷同之处,亦有升级迭代的进步。如在行业红利显露初期,大量资本与创业者涌入,百模大战。而在差异性方面,行业尤为关注凭借底层算法的升级、大模型泛化能力,以及2.0时代的人工智能能否解决1.0最为致命的商业化落地难题。
为什么此时火了?
人工智能行业已存在数十年,为什么大模型与生成式AI等到今天才火?
AI教父、图灵奖获得者杰弗里·辛顿早于1986年便在《自然》杂志发表自监督学习语言模型成果,可预测句子最后单词,可谓生成式大模型鼻祖,但当时的辛顿只能使用112个句子的数据,同时缺乏相应算力支持。
辛顿表示,AI领域有两种思路——一种是关于推理与逻辑的主流AI,一种是基于生物学的神经网络。“神经网络在20世纪80年代没有真正奏效的唯一原因是计算机运行速度不够快,数据集不够大。”辛顿称,主流AI派当时认为一个拥有大量神经元的大型神经网络,基于计算节点与它们之间的连接,仅通过改变连接强度便能实现从数据中学习,这个想法十分荒谬。
因此那个时候,计算机科学领域的人们对神经网络失去了兴趣。而现在,计算机速度快了数百万倍,如果用1986年的计算机去学习一些东西,辛顿称,过程只需要几秒钟。
2006年,辛顿团队开始进行所谓的深度学习训练,并找到预训练模式。在ChatGPT中,P代表预训练,T代表转换器,P代表生成。回忆过去,辛顿表示在2012年发生了两件大事——一是语音是被技术改进,并被推广至微软、IBM与谷歌等大型语音识别实验室;二是李飞飞与合作者创建了一个大型图像数据库,并对图像中的主要物体进行猜测。“那些曾坚定反对神经网络的人看到这些方法成功后,发现这种方法更有效,于是他们改变了立场。”辛顿称。
在第四范式联合创始人/首席架构师胡时伟看来,AI从1956年提出历经几次起伏,AI在业界或大众生活当中形成浪潮往往来自里程碑式的事件,如AlphaGO战胜人类,以及ChatGPT可以进行很好的对话等。这中间的沉寂期,来自大众预期无法满足,往往在沉寂期之内是真正数字化产业和AI产业带来价值产生沉淀的部分。
而从技术原理来讲,胡时伟表示,AI应用发展有一个规律——从小的模型到大的模型,整个AI使用从专用到通用。最早人类专家通过写规则让机器程序呈现某种智能特点,这时还是专用小模型。80年代以后,无论是统计学习还是神经网络,行业可以用这些技术让机器写少量的规则,但依然是专用某个小模型的阶段。2010年之后,搜索、推荐电商、人脸识别等场景,可以通过机器用海量数据撰写大量规则解决问题,对生产生活发生的作用。如今,海量规则加上千亿学习与强化学习基数,便出现了单一大模型解决多个问题的通用大模型技术。
大模型落地到哪些领域了?
机器学习是让计算机模拟人类学习行为,系人工智能的核心。作为机器学习领域顶级会议,早期的NIPS(NeurIPS,全称神经信息处理系统大会)上,科学多样性令人惊讶,每个垂直领域用着只有自己能听懂的术语,每个人都像在自说自话。而如今,跨学科研究已经实现,大模型也能够在诸多行业进行落地应用。
据记者观察,目前教育、金融、医疗、电商等领域已逐渐接入大模型技术。以教育行业为例,学而思正在进行自研数学大模型的研发,命名为MathGPT,面向全球数学爱好者和科研机构,以数学领域的解题和讲题算法为核心。
网龙华渔教育CEO梁念坚对记者表示,大模型不需要太多,国内有两三个就够了。我们也不需要去做通用型大模型,只需将其垂直化做好就够了。网龙过去在国内做了大量工作,在课件知识点方面积累了大量资源去训练大模型。“未来我们可能去跟谷歌合作,因为从AI历史来讲,谷歌能做到的可以更强。”对于国内业务而言,梁念坚表示,中国市场有个优势——数据很多,存在大量产品与大量的用户数据,因此长远来看,梁念坚对中国人工智能的发展充满信心。
人力资源领域,6 月,HR SaaS 平台 Moka 发布基于大模型的新产品 Moka Eva。Moka 联合创始人兼 CEO 李国兴在采访中表示,目前企业端应用AI技术还处在比较早期的阶段,ChatGPT诞生时间较短,还是一个偏向于C端生产力的产品,要达到一个企业级工具和产品还需要一点时间构建。
李国兴认为目前企业端主要先将概念与场景引出来,未来半年到一年时间内将诞生更多企业级应用。Moka同样并非自己从事大模型底层研发,而是尝试通过开源模型,训练适合具体场景的应用。目前Moka合作的底层技术架构厂商包括微软、百度、阿里等。
张颖观察到的AI在To B端应用如电商场景中营销物料的生成,质量上不会显著低于人工,但成本会降低1—2个数量级;在消费品行业,AI可以自动化生成多个专业级产品概念,供客户在产品研发初期选择使用,启发早期灵感;在编程领域,GitHub上有41%的代码是AI生成的,这个过程仅用了6个月。
在昆仑万维CEO方汉看来,B端商业大模型一定是碎片化的,至于以ChatGPT为代表的C端,未来一定是免费化的。一方面基于中国人习惯免费,国内的C端一定是以免费的信息服务模式为主,VIP模式为辅。同时办公软件、即时通讯、浏览器会成为主要的C端大模型服务入口。在API方面,中国的中小创业企业对大公司的API心存顾忌,方汉认为中国的中小企业可能更倾向于自己去用开源模型搭自己的服务。
至于海外市场的拓展,目前宏观环境因素使得国内企业出海境况尴尬。方汉表示,海外市场一定是以C端为主,因为B端牵扯到太多的政治因素以及文化因素,最主要的是文化因素,最典型的就是中国的飞书、钉钉,对比海外的最流行的Slack、Teams,可以发现这几个产品在设计文化上有根本的差别。
商业化难题能解决吗?
相较于类似ChatGPT等C端大模型产品,行业更多将希望寄托于B端革新。
第四范式副总裁、主任科学家涂威威对记者表示,大模型在C端上可能有一定空间,但更多的机会是来自对企业软件的改造,其中一个比较大的点是人机交互。这与AI1.0时代的预期相似,但当时预期并未得到满足。表现上是企业商业化程度较低,根本原因是AI1.0未能达到技术泛化的程度。
胡时伟表示,用大模型进行生产力替代和解决生产关系或者是商业模式的问题需要回答五个关键性问题:在何场景下解决哪个客户的需求;在市场上创造新的蛋糕还是抢了谁的蛋糕?成本结构和ROI如何决定?是否具备足够的资源能力?现在的企业最大竞争不是0-1,而是10-100,替代品的威胁怎么应对?能否建立足够的竞争壁垒?
这些问题不论大模型还是创业公司,目前均无法给出明确答案,但基于大模型的技术升级,行业对2.0时代的商业化持有乐观态度。
云知声创始人黄伟对记者表示,AI1.0时代的2012年至2022年,虽有深度学习,但行业所做的事情实际与二三十年前的事情并无本质区别,很难为客户创造充分价值。而今天的大模型具备新的能力——生成式能力,也便可以创造更多商业机会。360创始人兼CEO周鸿祎对记者表示,1.0时代基本上是从零做专业知识的培训,如今的大模型已经经过通识教育,叠加领域知识后,能够做到活学活用。
出门问问CFO孙君博认为让行业客户感受到大模型能力、并为之付费,这一个巨大挑战。具备优势的企业包括:本身了解大模型,能做自有大模型更好;将商业化与大模型技术融入具体场景。
虽然前景乐观,但现如今的国内大模型产业更多聚焦在技术与趋势产品的判断,以及产品的布局分享,距离商业化落地尚有距离,但大模型引领下的AI2.0红利已惠及AI1.0时代的幸存者身上。近半年来,第四范式、出门问问、云知声、声通科技、英矽智能等多家AI企业进入IPO流程,申请在港交所、创业板等资本市场上市。
正如云知声在招股书中所言:“未来的收入增长将取决于(其中包括)能否开发新技术、成功将 AI 技术商业化、提升客户体验、有效竞争及扩大客户群。”
“虽然现在大部分公司还没有通过AI产生可观收入,也还没有大量实践诞生,但一切都在紧锣密鼓的进行中,未来6—8个月是重要的窗口期。”张颖表示。
Copyright © 2012-2018 首页-摩臣-官方注册指定站 琼ICP备xxxxxxxx号