京东AI专家何晓冬
出品|搜狐科技
作者|郑松毅
4月8日,由中国人工智能学会主办的“人工智能大模型技术高峰论坛”主论坛在杭州开幕。主论坛上,京东AI专家、IEEE/CAAI Fellow何晓冬表示,当前社会是在一个新的风口,从搜索信息时代进入智能交互时代,信息更加准确、更加清晰、更加智能,让AI可以理解人深度的意图。很可能在随后十年打开新的智能交互时代,以前的搜索框会变成“ask me anything”的交互框,所有的产品形态都是值得重构的,所有的商业形态也都值得重构。
何晓冬认为,目前人工智能机器生成的水平已经基本上接近或已达到人工水平,主要基于以下三点关键因素:
1.计算算力和硬件:GPU迅速进展,使得硬件计算力得到极大提升,从支撑传统计算升级到进一步支撑复杂交互场景的计算;
2.数据和模型结构:包括以Transformer为代表的新模型结构,它们能更有效率的接受更大量的数据,同时能达到更优的效果;以前数据采集是依赖于网上可扒取的数据资源,但交互性的数据并不多。当ChatGPT作为API(Application Programming Intece,应用程序编程接口)放开以后,在短短几个月内积累了大量强场景驱动的数据,特别是复杂交互智能场景;
3.算法:包括无监督学习和半监督学习,使得机器可以在很少或者没有特定训练的情况下更好的执行某些特定任务。ChatGPT不再简单是发布一个算法,而是一个普通用户可以触摸,且可以直接交互的产品,它带来了极大的数据收集机会,也带来了大量用户反馈的机会。
何晓冬表示,以上三个因素结合,在包括但不限于图形、文字、代码等生成领域中,人工智能生成水平迅速接近甚至超越人工水平。但是,人工智能生成的迅速发展也带来了副作用,例如随着参数规模快速增加,从3年前10亿级模型迅速增长到千亿级模型,计算资源受限,算力和训练成本也成为了发展瓶颈。另一方面,算法优化、硬件优化、芯片优化、数据架构优化也将成为破局的关键因素。
何晓冬认为,ChatGPT之所以能做的成功,并不是因为其中某个技术方向没有人做过,而是在每个方向上都有显著的提升,包括更大的语料库,更好的算力,更通用的训练方式,更高的准确性,更高的适配性,及持续的自我学习能力。
据何晓冬介绍,从产业角度来看,新时代的智能交互将会带来至少万亿美元级别的机会,这个机会带来的影响力会远远超过单一技术的突破,所有的产品形态,及所有的商业形态都值得重构。生成式AI将在文本、图像、视频等每一个模态中都有很好的机会进行进一步商业化的爆发,例如AI数字人直播带货、老年人AI贴心助理等,可以看到未来技术与产品的结合会带来更多社会效益和商业效益。
何晓冬认为,ChatGPT等AI应用需要深入产业,与产业相关的数据深度融合,才能达到闭环的效果。换句话说,通过具体落地场景中对问题的解决,才能够真正把大量通用的技术更好地落实到实用场景中去。
何晓冬在最后表示,ChatGPT不光只是一个新的技术和模型,它更多的是带来了新的生产力革命,它是以AI为主导,以大数据、云计算、物联网一起相结合的新的革命,人们很快将看到智能机器进入到生活的方方面面,将广泛的被用于生产和生活。生成式AI可将全球GDP提升7%,相当于10年期间全球年GDP增长近7万亿美元。