3月23日,“2024全球开发者先锋大会”(GDC)在上海徐汇开幕。美国国家工程院外籍院士沈向洋发表《大模型时代的机遇与挑战》演讲。他表示,大模型将横扫所有垂直行业,并且如果要达到通用模型的性能,都会去到万卡、上万亿参数的规模。他提到,未来,个人化的大模型也将是非常有意思的方向,而将个性化参数与云计算和端设备相结合,将开创出极具价值的新局面。

对于广受热议的以大模型为代表的AGI(通用人工智能),他提出了5点思考。第一,重新审视人际关系。第二,大模型将横扫所有垂直行业。第三,算力将是大模型的重要门槛。第四,AI技术正在经历与社会的融合。从冲击到磨合到融合的过程,与个人、企业、政府都息息相关。第五,创新的三个层次与AI研发的未来。

以下为沈向洋演讲速记(略有删减)

今天非常高兴又回到美丽的上海,心情格外愉悦,有机会与大家分享AI、开发、技术方面的见解与心得,倍感荣幸。本次我主要围绕《大模型时代的机遇与挑战》展开探讨。从AI开发者的视角来看,上海无疑是理想的创新之地。我注意到许多公司如“模速空间”在大模型新技术上取得了令人振奋的进展。

首先,大模型近年来发展迅速,特别是在开源模型方面,如Lama等,其活力和生命力不容忽视。我们应抓住机遇,推动国内开源生态的繁荣。

近期,大模型领域发生了三件令人瞩目的事件:文生图技术让AI画作登上美国时尚杂志封面,ChatGPT提供精准回答,以及Sora系统的震撼视频效果。这些事件不仅引发了社会关注,也给我们带来了深刻的思考。

关于ChatGPT,简单介绍一下一句顶一万句。问一句话可以给你很多非常好的答案,甚至我要来上海做演讲,我问它我来参加全球开发者大会应该讲些什么,ChatGPT可以给出一个非常好的洋洋洒洒的框架,现在我见领导之前会经常问它见领导之前应该说什么。

关于Sora的诞生,如视频所示非常震撼,在悬崖土路上,尘土飞扬的视频效果非常震撼。这三件事情让大家从一个焦虑再到下一个焦虑,文生图、文生文、文生视频。这个视频非常高质量,而且是长视频的结果,这只是他们拿出来的其中一个例子而已,还有很多这样的例子。因为这样的例子对社会冲击太大,Sora真正的系统并没有放出来,相信国内已经有很多单位在做这样的事情,下半年会看到这样一些类似的系统出来。

大模型这个事情出来以后,国内已经有非常多的公司,很多开发者已经在做这方面的工作了。有一个数字说,全中国大概有两百多家做大模型的公司,所以叫百模大战不夸张,我觉得更像是群模乱舞。

大模型对开发者和做科研的人而言,是很振奋的事情,因为它带给了我们机会。实际上,你要把科研做好的话,创新是非常重要而且很有影响力的。那如果从这个角度来说,现在已经有这么多震撼的突破了,开发者可以朝哪一个方向思考接下来最大的技术机会在哪里?

从短期,甚至是长期而言,我个人觉得其中一个可能的方向是多模态的问题。为什么能做出Sora?Sora做出来后,以后3D的东西也会(推出得)很快。

今日,以Open AI为代表,技术上是把不同模态分开来做的。比如说,Open AI做了什么?他们内部肯定有两套体系,一套体系是从DALL-E文生图延展到现在的Sora、文生视频,整体走的是Diffusion的技术路线。而文生文走的是Transformer路线。这个之所以难做,是因为做视频的时候,你只是去预测下一个像素,而做文本的时候,是预测下一个token。到现在为止,这两条线路还没有完全统一下来。相信接下来这个领域里,中国的开发者、世界的开发者很快会有一些突破。

说到这里,简单介绍一下阶跃星辰的例子。他们在多模的理解方面做得相当优秀。

比如第一个例子里,是一位妈妈在看手机,小孩躺在地上打滚。这张照片叫“当代小朋友的无效技能”,不管怎么闹,他妈妈都不理他。多模理解得非常不错。

中间的例子是平面几何问题。比如画了一个X,边是X+15,面积是100,X算出来是多少?第三个例子是法律方面的问题,是判断一个事情有没有违反中国的广告法。

模型要有对这些概念的理解力,才能做出这样的内容。所以在这方面,垂直行业有很多机会。刚才财跃星辰发布的大模型,已经在国泰君安的场景有很好的落地。这是非常振奋人心的事情。

大模型几乎改变了一切。而除了大模型的技术突破,产品的设计也非常重要。举一个例子,在深圳的IDEA研究院过去四年在做一个产品叫“ReadPaper”,理念是“让天下没有难读的论文”,帮你读科研的论文。我们之前就做得挺好,大模型出来后,我们看到了更好的机会,做了相对垂类的大模型,接进去以后体验就更好了。

当今这个通用人工智能的时代,我们的机会到底在哪里?大家一直讨论的,都是同一个词,就是AGI,以大模型为代表的通用人工智能。那么,我们接下来应该怎么思考通用人工智能这件事情?

下面简单讲一下五方面的思考。

思考1:重新审视人机关系。ChatGPT的出现让我们不得不重新思考人机之间的关系。我们需要深入理解机器智能的发展和人机交互的变革,明确人工智能的真正目的是帮助人类更好地使用机器。

思考2:大模型对垂直行业的横扫。随着通用大模型和行业大模型的发展,未来个人大模型也将崛起,云和端的结合将带来个性化参数的变革,对各行各业都将产生深远影响。

思考3:算力是AI发展的关键。强大的算力是支撑大模型发展的门槛,随着模型参数的增加,对算力的需求几乎呈平方关系增长。这需要我们不断投入资源,提升算力水平。

思考4:AI的社会冲击与监管挑战。ChatGPT等AI技术的发展给民众、公司、政府监管和社会发展带来了冲击。我们需要关注其一本正经的胡说八道等问题,并加强立法监管,确保AI技术的健康发展。

思考5:创新的三个层次与AI研发的未来。技术创新、产品创新和商业模式创新是推动社会发展的重要力量。在AI研发领域,我们需要关注技术的突破,同时结合市场需求,实现产品的创新和商业模式的变革。

以前大家常说,大模型大到一定地步,就会出现涌现。为什么?以及是到了多大,会出现涌现呢?这个问题没有人可以回答。去年,我在香港科技大学邀请了一些国际专家做了一个活动,谈涌现智能背后的数学原理。是不是(会有)涌现尚不可知,如果确实有涌现的话,背后是不是有数据原理?是否存在像水到冰的相变的过程?这些都值得大家做数学上的研究。

最后,在结束前我想分享的是,各位都在做创新的事情,而我一直相信,创新有三个层次。一个是技术的创新,一个是产品的创新,一个是商业模式的创新。有计算机和没计算机,是完全两码事。而有了计算机,没有互联网的话,就不存在电商这个概念了。所以这三种创新里,最根本的创新,尤其是对开发者而言,肯定是技术的创新。

所以以前大家会激动地说,要做PMF(product market fit),而在如今的大模型时代,给我们带来更大冲击的是TMF(technology market fit)。

ChatGPT出道即巅峰,一问世的两个月内就有了一亿用户。这些都给我们的开发者们一些鼓励。像我们在上海,把这样一个开发者系统好好地建立起来,大家互相帮助,在上海市政府的支持下,我们一定会把AI研发做得更好。谢谢大家!