美国国家工程院院士沈向洋：通用大模型时代，算力是重要门槛

发布日期：2024-03-25 20:49:53

3月23日，“2024全球开发者先锋大会”（GDC）在上海徐汇开幕。美国国家工程院外籍院士沈向洋发表《大模型时代的机遇与挑战》演讲。他表示，大模型将横扫所有垂直行业，并且如果要达到通用模型的性能，都会去到万卡、上万亿参数的规模。他提到，未来，个人化的大模型也将是非常有意思的方向，而将个性化参数与云计算和端设备相结合，将开创出极具价值的新局面。

对于广受热议的以大模型为代表的AGI（通用人工智能），他提出了5点思考。第一，重新审视人际关系。第二，大模型将横扫所有垂直行业。第三，算力将是大模型的重要门槛。第四，AI技术正在经历与社会的融合。从冲击到磨合到融合的过程，与个人、企业、政府都息息相关。第五，创新的三个层次与AI研发的未来。

以下为沈向洋演讲速记（略有删减）

今天非常高兴又回到美丽的上海，心情格外愉悦，有机会与大家分享AI、开发、技术方面的见解与心得，倍感荣幸。本次我主要围绕《大模型时代的机遇与挑战》展开探讨。从AI开发者的视角来看，上海无疑是理想的创新之地。我注意到许多公司如“模速空间”在大模型新技术上取得了令人振奋的进展。

首先，大模型近年来发展迅速，特别是在开源模型方面，如Lama等，其活力和生命力不容忽视。我们应抓住机遇，推动国内开源生态的繁荣。

近期，大模型领域发生了三件令人瞩目的事件：文生图技术让AI画作登上美国时尚杂志封面，ChatGPT提供精准回答，以及Sora系统的震撼视频效果。这些事件不仅引发了社会关注，也给我们带来了深刻的思考。

关于ChatGPT，简单介绍一下一句顶一万句。问一句话可以给你很多非常好的答案，甚至我要来上海做演讲，我问它我来参加全球开发者大会应该讲些什么，ChatGPT可以给出一个非常好的洋洋洒洒的框架，现在我见领导之前会经常问它见领导之前应该说什么。

关于Sora的诞生，如视频所示非常震撼，在悬崖土路上，尘土飞扬的视频效果非常震撼。这三件事情让大家从一个焦虑再到下一个焦虑，文生图、文生文、文生视频。这个视频非常高质量，而且是长视频的结果，这只是他们拿出来的其中一个例子而已，还有很多这样的例子。因为这样的例子对社会冲击太大，Sora真正的系统并没有放出来，相信国内已经有很多单位在做这样的事情，下半年会看到这样一些类似的系统出来。

大模型这个事情出来以后，国内已经有非常多的公司，很多开发者已经在做这方面的工作了。有一个数字说，全中国大概有两百多家做大模型的公司，所以叫百模大战不夸张，我觉得更像是群模乱舞。

大模型对开发者和做科研的人而言，是很振奋的事情，因为它带给了我们机会。实际上，你要把科研做好的话，创新是非常重要而且很有影响力的。那如果从这个角度来说，现在已经有这么多震撼的突破了，开发者可以朝哪一个方向思考接下来最大的技术机会在哪里？

从短期，甚至是长期而言，我个人觉得其中一个可能的方向是多模态的问题。为什么能做出Sora？Sora做出来后，以后3D的东西也会（推出得）很快。

今日，以Open AI为代表，技术上是把不同模态分开来做的。比如说，Open AI做了什么？他们内部肯定有两套体系，一套体系是从DALL-E文生图延展到现在的Sora、文生视频，整体走的是Diffusion的技术路线。而文生文走的是Transformer路线。这个之所以难做，是因为做视频的时候，你只是去预测下一个像素，而做文本的时候，是预测下一个token。到现在为止，这两条线路还没有完全统一下来。相信接下来这个领域里，中国的开发者、世界的开发者很快会有一些突破。

说到这里，简单介绍一下阶跃星辰的例子。他们在多模的理解方面做得相当优秀。

比如第一个例子里，是一位妈妈在看手机，小孩躺在地上打滚。这张照片叫“当代小朋友的无效技能”，不管怎么闹，他妈妈都不理他。多模理解得非常不错。

中间的例子是平面几何问题。比如画了一个X，边是X+15，面积是100，X算出来是多少？第三个例子是法律方面的问题，是判断一个事情有没有违反中国的广告法。

模型要有对这些概念的理解力，才能做出这样的内容。所以在这方面，垂直行业有很多机会。刚才财跃星辰发布的大模型，已经在国泰君安的场景有很好的落地。这是非常振奋人心的事情。

大模型几乎改变了一切。而除了大模型的技术突破，产品的设计也非常重要。举一个例子，在深圳的IDEA研究院过去四年在做一个产品叫“ReadPaper”，理念是“让天下没有难读的论文”，帮你读科研的论文。我们之前就做得挺好，大模型出来后，我们看到了更好的机会，做了相对垂类的大模型，接进去以后体验就更好了。

当今这个通用人工智能的时代，我们的机会到底在哪里？大家一直讨论的，都是同一个词，就是AGI，以大模型为代表的通用人工智能。那么，我们接下来应该怎么思考通用人工智能这件事情？

下面简单讲一下五方面的思考。

思考1：重新审视人机关系。ChatGPT的出现让我们不得不重新思考人机之间的关系。我们需要深入理解机器智能的发展和人机交互的变革，明确人工智能的真正目的是帮助人类更好地使用机器。

思考2：大模型对垂直行业的横扫。随着通用大模型和行业大模型的发展，未来个人大模型也将崛起，云和端的结合将带来个性化参数的变革，对各行各业都将产生深远影响。

思考3：算力是AI发展的关键。强大的算力是支撑大模型发展的门槛，随着模型参数的增加，对算力的需求几乎呈平方关系增长。这需要我们不断投入资源，提升算力水平。

思考4：AI的社会冲击与监管挑战。ChatGPT等AI技术的发展给民众、公司、政府监管和社会发展带来了冲击。我们需要关注其一本正经的胡说八道等问题，并加强立法监管，确保AI技术的健康发展。

思考5：创新的三个层次与AI研发的未来。技术创新、产品创新和商业模式创新是推动社会发展的重要力量。在AI研发领域，我们需要关注技术的突破，同时结合市场需求，实现产品的创新和商业模式的变革。

以前大家常说，大模型大到一定地步，就会出现涌现。为什么？以及是到了多大，会出现涌现呢？这个问题没有人可以回答。去年，我在香港科技大学邀请了一些国际专家做了一个活动，谈涌现智能背后的数学原理。是不是（会有）涌现尚不可知，如果确实有涌现的话，背后是不是有数据原理？是否存在像水到冰的相变的过程？这些都值得大家做数学上的研究。

最后，在结束前我想分享的是，各位都在做创新的事情，而我一直相信，创新有三个层次。一个是技术的创新，一个是产品的创新，一个是商业模式的创新。有计算机和没计算机，是完全两码事。而有了计算机，没有互联网的话，就不存在电商这个概念了。所以这三种创新里，最根本的创新，尤其是对开发者而言，肯定是技术的创新。

所以以前大家会激动地说，要做PMF（product market fit），而在如今的大模型时代，给我们带来更大冲击的是TMF（technology market fit）。

ChatGPT出道即巅峰，一问世的两个月内就有了一亿用户。这些都给我们的开发者们一些鼓励。像我们在上海，把这样一个开发者系统好好地建立起来，大家互相帮助，在上海市政府的支持下，我们一定会把AI研发做得更好。谢谢大家！

朋湖网

科技产业信息资讯平台

美国国家工程院院士沈向洋：通用大模型时代，算力是重要门槛

朋湖网

香港首家具身智能人形机器人公司落地

机器人企业「艨码科技」完成种子轮融资

行业突破！中科创星成为全国首个成功发行科创债券的民营股权投资机构​

OpenAI与美国国防部签署2亿美元的合同

行业突破！中科创星成为全国首个成功发行科创债券的民营股权投资机构