当前位置: 主页 > 建站知识 > 网站建设

李开复:要允许大模型一本正经地“胡说八道”

发布时间:2023-06-05 05:35   浏览次数:次   作者:小编

  在5月28日举行的2023中关村论坛上,创新工场董事长兼首席执行官李开复发表了主题为“AI1.0到AI2.0的新机遇”的演讲。他表示,在所有APP里面,AI first(人工智能优先)将是最重要的应用,过去,移动互联网是Mobile first(移动优先),今天要在人工智能领域创业或投资,那一定要做非有人工智能不可的APP。

  “大模型真的不只是一个问答引擎,它改变了所有APP的生态,它会让我们今天用的每一个生态通通改写一次”,李开复坦言,要允许今天的大模型一本正经地“胡说八道”,如果把它胡说八道的能力全部降至零,它也就不具备推理能力了。李开复认为,一直以来都是人类学习计算机的语言,大模型时代将是计算机学习人类的语言。未来,用户只需要向AI描述目的就会达到期待。

  李开复还就“大模型公司太多”“只有头部公司才有机会”等论调谈了自己的看法,他指出,国内外的文化习惯、法律法规都不一样,拿海外训练出来的大模型在国内做微调是非常危险的,在大模型领域,大家都还有机会,应该鼓励各种不同的模式去探索。

  近年来,看到整个AI2.0和大模型的启动,创新工厂的投资团队、科技团队都在研究这个领域,为此也到美国去了解一些新态势。今天我介绍的不是创新工场投资的公司或者业务,而是对于最近关于AI2.0和大模型做一个比较通俗的分享,希望对大家有帮助。

  AI 1.0是AlphaGo(阿尔法围棋)之后发生的深度学习,也就是在八九年前开始,进入各行各业,这是我们都熟悉的。到一两年前碰到了一些瓶颈,而这些瓶颈,正好是AI2.0和大模型能够解决的。AI1.0遇到的瓶颈是什么呢?当时还没有大模型,我们要做一个领域的AI应用,要到该领域去收集、清洗、标注数据,再拿去调整模型,这个过程成本是非常昂贵的,对于互联网巨头来说没有问题,因为他们收集的数据实在太多,用来赚钱的机会也很多,但是如果一家工厂想让AI应用落地,就会面临着非常昂贵的成本。

  大模型是人类智慧的累积,有一个很大的特点,就是我们可以一次性训练一个大模型,当要应用的时候可以做一个迁移学习或者微调,也就是说之前AI1.0时代,每个应用都是一个孤岛,有大模型之后,用海量的数据一次性训练一个基础大模型,那么再以这个模型作为基础去做微调,就具备非常大的威力。比如,像音响类似的产品,过去跟它讲话的时候,一旦跳出了它懂的领域就蒙了,做不了很多事情。当放一个类似ChatGPT的东西进去,它的知识就会被激活,只要调整对话,它就会成为一个非常好用的机器人,如果需要它在另外的领域完成其他事情,我们可以把这个大模型再微调,使其进入对应的应用场景。

  今天的大模型还会一本正经地“胡说八道”,这个问题非常难解决,因为它的推理能力,也来自于同样的理由。如果把它的胡说八道全部降到了接近零,那它的推理能力几乎也没有了,所以那些让它聪明的理由也是让它胡说八道的理由,但是我们未来还是可以解决的。

  我们要先接受大模型是非完美的、会胡说八道的,即便一个非完美的大模型还是有相当大的商业价值。例如,不管记者用AI来写作,或者律师用AI来写诉讼,最后负责的还是人类,律师或者记者会很清晰地知道AI可能会犯错,我们不是把它拿来做一个终极的应用。在娱乐领域的应用,是可以允许AI犯一些错误,比如游戏里面的英雄胡子长了一点短了一点,这都无伤大雅。此外,还有很多领域是可以容忍大模型的不完美,基于这个事实,今天大模型的商机已经存在。

  当然我们还要继续努力,让它降低胡说八道的习惯。比如,从预训练的数据到训练对齐,再到之后的后处理,还有一些预警和快速修正的方法,这些需要结合在一起,提高大模型的处理能力。需要重视的是,有些领域是非常关键和严肃的,比如说新闻、政府网站、医疗、教育,这些就不容易做,未来需要化解这些问题。

  用AI写稿子、写诉讼、画图、抠图等都是应用层的,还存在一个中间层,中间层包括两部分,第一个部分是从模型里面往外提供功能,比如说模型做得很大,针对某一个领域,能否把一个大模型变成一个小模型,这是从模型往上的。另一个部分是从应用往下的,用大模型做的很多产品需要去中间化。比如,过去由平面设计师来设计图,以后市场总监用语言就能直接把图做出来。当然这个过程不是一天两天能实现的,但长期来看,相对重复性的工作是可以被技术取代的,同时会产生非常大的经济价值,这样的情况之下才能让应用的数量变多,形成应用带来更多用户,用户带来更多应用的良性循环。

  AI.2.0平台和应用将颠覆许多行业。简单举个例子,比如制造游戏的时候,所有角色、背景、道具、衣服、故事的产生,甚至所有的代码最终都会用AI来写。很可能以后一些小朋友会把他想玩的游戏写出来,大家彼此用文字做一个游戏介绍,几秒钟以后就可以玩了,这跟今天的游戏制作就有巨大的差别。所以,大模型真的不只是一个问答引擎,它改变了所有APP的生态,它会让我们今天用的每一个生态通通改写一次。

  在所有的应用里面AI first(人工智能优先)将是最重要的应用,什么叫AI first?就是说这个应用没有AI就不成立。过去移动互联网是Mobile first(移动优先),比如,在PC时代打车软件滴滴是没有用的,因为你随时可能在不同的地方,当年如果要选择在移动互联网创业或者投资,那一定要选那些非有移动不可的APP,所以今天要在人工智能领域创业或投资,那一定要做非有人工智能不可的APP。简单地说,当我们把大模型抽掉,这个应用就完全瘫痪,那这个应用就特别需要做而且应该做。当然,这个过程中,我们还有很多的挑战,需要监管和技术同时发挥作用去解决。

  最近有几个比较大的声音,如“使用海外的开源大模型就可以做出中国版的openAI”“大模型耗钱且耗人,只有巨头才有入场券”“大模型公司太多了”“不用开发大模型,开发小模型就够用了”等说法。

  开源是非常非常重要的,高校和创业者没有开源很难得到启动力量,但“使用海外的开源大模型就可以做出中国版的openAI”的说法是绝对错误的。开源模型本身有一定局限性,如果直接使用海外的开源大模型,你的天花板决定了永远做不出达到或者超越ChatGPT4.0。很多人做开源大模型训练的时候用ChatGPT4.0来训练,真的不敢保证ChatGPT4.0会让人人都能拿去使用,从商业的角度也没有理由让你占这个便宜,再就是它对有些国家可能也会限制。拿海外训练出来的大模型,在国内来做微调是非常危险的,国内外的文化习惯、法律法规都不一样,每个国家处理方法都不一样,自主创新做大模型是有必要的。

  当然,未来不可能有50家大模型公司存在,会收敛到一个小的数字上。比如,美国的搜索引擎,刚开始的时候有十来家,最后变成五六家。不过,在大模型这个领域,大家都还有机会,我们还在追赶,应该鼓励各种不同的模式去做。

  大语言模型分三步演进,第一步是中等规模的大型语言模型,第二步是跨越“涌现”(备注:涌现在大模型领域指的是当模型突破某个规模时性能显著提升)门槛,成为主流大型语言模型,第三步是领先的大型语言模型。目前ChatGPT和谷歌的大语言模型PaLM处于第三阶段。中国有些公司当然有野心,也可能自认为接近了,但是我觉得主要还是在一个比较中等规模的水平,基本可以工作,但是它可能“涌现”不一定特别强大。这不是说中国公司做得不好,而是起步时间较短,再就是中文的数据质量还不足够。

  大模型训练质量跟数量都重要,但是相比来说质量是不可牺牲的。我觉得有国家力量来推动收集更多更高质量的数据非常重要,要不然的话追赶会比较难。中国这个阶段的经济发展,并没有足够多的人为了公益来把很多好的内容汇集起来,中美以后的差距可能就体现在数据上面。

  多年来,人类需要学习计算机的语言,现在倒过来,计算机学习人类的语言,这会大大把人类解放出来。我们只要把想要做一件事情的目的告诉未来的AI,它就会帮我们完成,不用告诉它如何一步一步去解决。比如我跟未来的智能助手说,明天是我太太的生日,需要鲜花、蛋糕、礼物,它就通通帮我搞定,这就节省大量的时间,现在还没有这样的智能助手,我可能要花几个小时搜索,再逐个下单。

  未来最伟大的应用是必须要有AI大模型,拿掉大模型它就不工作。大模型就是委派式的,用户描述目的就可以达到期望,当然要解决隐私的问题,不能把我们每一个要求都传到云端。最终这天到来的时候,商业模式也会发生变化,当我跟AI说帮我买蛋糕、鲜花、礼物的时候,它会直接把电商当做仓库一样地去帮我搭配。当然,这方面的应用可能还比较长远,需要学术界跟产业的合作。

  AI大模型是中国绝对不能错过的历史机遇,这是有史以来最大的一个平台革命。它会让每个应用都改写,重构人类的工作,让我们的聪明才智被放大10倍或更多。在人才方面,可能顶级的一些人才还在美国,但中国有非常巨大的人才优势,数量非常多,而且很多年轻的科学家都非常厉害。

  最后我想提一句话,来自硅谷顶级投资人对这个领域的预测:这个市场的潜在规模难以把握 ——它将介于所有软件和所有人类的努力之间。