引言
自 ChatGPT 问世以来,以通用人工智能为代表的 AI 技术发展开始“狂飙”,多家企业和研究机构入局大模型赛道,新应用场景不断涌现。如何理解通用人工智能技术将带来的巨大影响,并把握随之而来的机遇和挑战,是我们面临的两大关键问题。
5 月 13 日,「直面 AI 的新一轮变革浪潮」TVP 走进腾讯活动重磅召开,活动邀请了来自产、学、研等领域的技术专家,闭门畅聊 AI 前沿热点、未来趋势,以多元视角碰撞出众多深度观点与精彩火花。
一、大模型时代的学科交叉研究:以政治人物建模为例
复旦大学大数据学院副教授、数据智能与社会计算实验室负责人 魏忠钰带来了题为《大模型时代的学科交叉研究:以政治人物建模为例》的主题分享。
魏忠钰老师首先分享了现如今人类进入大模型时代,大模型为学科交叉研究带来的机遇与挑战,并以政治人物建模为例,剖析大模型对学科交叉研究的影响。
(一)人类进入大模型时代
在自然语言处理领域,每个时代都有对应的范式。经历专家系统、浅层机器学习及深层学习这三个发展阶段,随着 ChatGPT 及 GPT-4 的出现,人类进入新的范式——由基座模型-指令微调-人类反馈形成的框架。
魏忠钰老师分析到,作为当下最前沿的技术力量,相较于传统范式,大模型优势更明显:特征表示上,专家系统是基于规则的办法;浅层机器学习具备明显的手工特征;深层学习采取低维稠密的建模方式;大模型升级到用简单结构化数据,处理大规模高维复杂数据的水平。模型构建上,传统范式只能根据任务,制作对应的定制模型,如分类模型、生成模型、检索模型等;大模型以生成式框架完成多种任务,实现模型的大统一。泛化能力上,过去每个模型只能解决一个指定任务或者一组相关任务;而预训练的大模型可以在几乎所有自然语言处理任务中进行小样本甚至零样本的适配使用。
(二)大模型为学科交叉带来的机遇与挑战
大模型通过构建基座模型、利用交叉数据微调,在人机交互中不断优化,实现快速开发具备一定动态交互能力的智能系统,解决了传统范式在学科交叉领域上存在的数据样式多变、难以泛化与复用、交互能力弱等问题。
魏忠钰老师分析到,大模型为学科交叉带来新机遇,提供统一的建模范式、实现知识迁移、提高建模效果以及重塑学科交叉的技术框架。但大模型也有局限性,它以语言模型为基础,仅能处理文本序列数据,对真实场景中存在的其它蕴含知识的数据形态进行处理,比如行为数据、关系数据等。
魏忠钰老师表示,想要真正发挥大模型在学科交叉研究的影响,需要在强大的语言模型的基础上,考虑如何增强其多数据类型的处理能力,扩展它对于领域知识的理解和使用,只有这样才能达到对真实世界的深层次理解。
(三)以政治人物建模为例,在大模型时代下学科交叉研究的发展
政治人物建模是用数据构建政治人物的全面画像,关键数据来源于公开言论、关系数据及行为数据。魏忠钰老师介绍了在研究过程中的三个阶段:行为建模:基于政治人物的投票数据进行建模,可理解其政治倾向。社会关系建模:构建政治人物之间的互动与合作关系网络,可理解其在政治网络中的角色与地位。言论内容建模:分析政治人物的公开言论与文本数据,提取观点与立场,可理解其思想主张。
三种类型的数据,在政治人物画像的过程中各自有自己的局限性,行为建模的数据易受外界影响,难以清晰表达人的核心理念;社会网络分析仅依赖关系数据,难以深入理解人的思想与主张;言论数据受到开放平台的影响,难以全面反映目标的真实立场。基于图模型的建模方法可以将这三种类型的信息进行有效融合,完成对于目标人物的全面建模。
图模型虽然可以有机融合三种数据,但是在具体的使用过程中,它也有自己的局限性,比如框架难以快速对未见过的议员进行快速的表示学习,从而限制了模型的场景迁移能力。为了进一步完善政治人物建模,魏忠钰老师及相关研究人员利用语言作为政治人物的表示学习基础,构建出一体化的政治人物表征框架,特点如下:不直接学习政治人物节点的表征,而是学习政治人物言论到其表征的映射过程。通过检索政治人物的所有公开言论,构建两种粒度的言论表征:通用言论表征与政治领域言论表征。通过两种自监督任务实现场景知识的注入与优化:结构感知对比学习:利用人物与党派、其他人物的关系作为监督信号更新参数;行为驱动对比学习:利用人物与投票结果的关系作为监督信号更新参数。在大模型基础之上,政治人物表征框架利用大规模语料构建语言模型,通过设计自监督任务,实现外界知识的注入与优化,打开了一条融合多学科与多模态知识的新路径,助推学科交叉领域的进一步发展。
二、引爆:ChatGPT与AIGC带来的思考与应用趋势
腾讯政策发展中心副主任 Darren 老师,带来了《引爆:ChatGPT 与 AIGC 带来的思考与应用趋势》的主题演讲,从变革趋势、产业应用及后续布局角度切入进行分享,探讨 AI 技术发展如何为用户创造更高价值。
(一)从超级个体看 AIGC 的发展
Darren 老师指出,ChatGPT 和 GPT-4 等先进语言模型的出现,标志着 AI 已经初步实现与人类的自然交互。这一突破预示着 AI 将对各行各业产生深远影响。然而,将 AI 视为产品或服务的卖点是片面的,应把 AI 深度融入产品或服务之中,成为核心竞争力。另一大趋势为产品逐渐从适应大多数用户,转向满足每个用户的个性化需求,这意味着“产品适配用户”将取代“用户适配产品”,甚至会出现“一次性使用”的产品。Darren 老师表示,随着技术的进步,个性化定制的 AI 助理即将问世,但这项技术的前提,需要企业掌握海量的用户数据,深度理解用户需求并迅速响应,这意味着企业需有快速的产品设计与迭代能力。
(二)从应用角度看 AIGC 的影响
AI 技术的快速发展正在驱动产业变革,大模型与生成式人工智能的出现显现出强大的生产力。Darren 老师认为,随着大模型参数的增加和泛化能力的提高,AI 可以完成更复杂的任务,生成式人工智能可高效生产各种创意和素材。在人工智能的加持下,电商领域形成了逆向种草现象,通过 AI 生成多样化案例,吸引用户主动提出定制化意见,从而实现快速生产与销售;AI 变声技术通过人工智能赋能音乐创作,实现更丰富多样的音乐体验;AI 生成包装设计可自动生成设计方案,提高效率的同时,满足品牌和用户的个性化定制需求。从 C 端渗透到 B 端,AI 技术为传统行业带来了深刻影响。
(三)大模型的未来布局大模型创新
面临着社会各界缺乏共识以及企业视角局限的挑战,该如何衡量创业赛道是否适合应用 AI 技术呢?Darren 老师指出,关键因素在于赛道对 AI 技术的浓度。所谓“浓度”是指 AI 技术在这一赛道上的实际应用程度与集成度,只有当 AI 技术能够高度融入并在业务流程或领域中发挥关键作用时,才有望将 AI 从辅助工具变成颠覆性武器,从简单的“点缀”变成“改变游戏规则”的力量。AI 的最高境界,就是 AI 与业务场景的深度融合。选择研发通用大模型还是领域模型?Darren 老师表示,通用大模型与领域模型的优势不同,通用大模型具有海量数据,专属模型在特定领域中表现出色,例如 Bloomberg 的金融领域专业模型,需大量金融知识与数据投入,才能超越通用模型的表现。因此若是细分行业,可以尝试建立领域专属模型。预计下半年会有更多垂直领域的 AI 模型问世,这将成为未来企业创造价值的重要途径。
三、圆桌论坛:ChatGPT狂飙,如何应对AI的新一轮技术变革?
本场圆桌论坛以《ChatGPT 狂飙,如何应对 AI 的新一轮技术变革?》为主题,由新浪微博新技术研发负责人、腾讯云 TVP 张俊林老师担任主持,提出众多深度问题,图灵联合创始人、智源研究院前副院长、腾讯云 TVP 创始委员 刘江老师、复旦大学大数据学院副教授、数据智能与社会计算实验室负责人 魏忠钰老师、熵简科技联合创始人、腾讯云 TVP 李渔老师共同参加对话交流。
(一)ChatGPT 引发巨大反响的原因
李渔:这次给我们非常大的震撼,让我们意识到 AGI 的曙光真正来了。我之前一直从事 NLP 方面的研究,这次以 ChatGPT 为代表的技术,相对之前有两个方面的重要突破,第一,有强大的通用学习能力,用一个模型可以做各种各样专业的任务,我们在多个金融场景下测试,效果超出业务人员预期;第二,它有强大的常识与推理能力,具备较为完备的常识知识与理解力,在生成语言表达时可根据上下文做出精准回应。
魏忠钰:学术研究到产品化到商业落地,这个过程一直是非常漫长的,这个过程也给了整个社会接受新技术的时间。然而类似于 ChatGPT 这样的大规模语言模型,本来在技术层面上就是最前沿的,而得益于优秀的产品设计,直接从最前沿的学术理论,一跃成为商业产品,这带来的影响是震撼的。相当于社会对最新技术的理解消化过程急剧缩短了。
(二)通用大模型 VS 领域大模型的关系
魏忠钰:通用模型和领域模型区别在于,通用大模型提供最基本的语义理解与知识表达能力,领域模型针对特定领域数据与任务进行优化,具有更加专业的知识与理解力。虽然大模型具备了强大的泛化能力,但在特定任务的学习过程中仍然存在一定程度的“灾难遗忘”,使得它在具体任务中的表现并非出类拔萃。在一些特定场景下,我们对于模型的宽容度很低,因此,需要对模型进行任务或者场景导向下的定向调优,这给领域模型留出了空间。
张俊林:关于这两者的关系,现在市面上存在两种不同的观点。一种观点认为,未来通用模型将越来越强,领域模型只有建立在非常强大的通用模型上才能发挥最大优势;另一种观点则认为,直接利用领域数据在普通的通用模型上进行修正与优化,可以更快建立适用于该领域的强大模型。目前很多人更偏向于第二种观点。
李渔:我觉得通用模型和领域模型是互补的关系。GPT-4 代表当前通用大模型的天花板,它的背后对应着一个非常强大的认知能力,这种强大的认知和推理能力在小模型或是领域模型上是很难实现的。领域模型的好处在于更专业的场景上有更专业的知识和表达。在特定的任务场景下拥有独特优势。二者互相配合去完成现实世界中的各种复杂任务。
(三)国内大模型研发的现状、机遇与挑战
李渔:大模型整个生态是一个完整的链条,从基础的算力到大模型的研发,再到产品化落地,是一个很广的生态。做基座大模型对资源投入要求确实很高,目前阶段,对于小团队而言,做一些垂直领域的差异化的产品是更好的选择。另外,算力的提升也是影响国产大模型发展很重要的方面。国内研发出与 GPT-4 完全对标的大模型所需要的具体时间目前来看较难确定,这取决于很多因素,但如果某个模型的认知与学习能力不断在进化,它可以反过来调教另外的模型,实现螺旋上升的效果。
魏忠钰:对国内大模型的研发,我保持乐观态度,并且相信在基座大模型方面双方距离是会越来越接近的,在当前的开源环境下,很多的所谓的“护城河”并不坚固,甚至可以说,没有秘密可言。另外一个判断是,目前的大模型依旧难以突破“意识”的天花板,现在我们看到的或许已经是当前技术路径的最终形态了,难以通过迭代实现“阶跃式”的进步。如果是这样的话,那么,我们还有足够的时间去无限靠近当前的最终形态。
张俊林:类似 GPT 水准的模型,我相信国内一定是可以做出来的,只要持续投入计算资源、数据采集与人才团队等方面的成本就可以。我认为明年 6 月之前是可以做出对标 ChatGPT3.5 版本的,但是能达到具备 GPT-4 水准的模型,我的态度不太乐观。因为就目前来说国内整体环境还是相对浮躁,要达到 GPT-4 水准还需要研发攻坚和大量的创新投入。
(四)AI 重构产业形态,如何应对冲击与变革
李渔:我认为我们应持积极拥抱的态度。ChatGPT 作为工具,将为我们的工作效率带来乘数级别的提升。越聪明、越积极主动的人,这个工具给他带来的乘数效应将会越大,这对于个人而言是极其幸运的。对于企业来说,管理层也应当把数字员工计划作为企业的重要议题开始考虑,当然这需要一定的时间。
魏忠钰:我非常赞同超级个体这一概念。在这个时代后,对于个人创业者将会越来越友好。ChatGPT 出来后,可以预见到很多技术门槛将会越来越低,在大模型时代,我们应该发挥主观能动性,想方设法把这个东西用起来,真正去创造价值。
结语
随着大模型技术的日益成熟,未来通用人工智能将引发更多领域的变革与重塑,深层次的人工智能应用将创造更多跨业态、个性化、高效率的商业模式与服务模式。在通用人工智能时代,TVP 将继续秉持着“用科技影响世界”的初心,通过每一场深度分享,携手行业技术专家,共同助推人工智能的健康发展,让技术普惠于人。
现场花絮集锦
服务器托管,北京服务器托管,服务器租用 http://www.fwqtg.net
最近国内的大模型可谓是遍地开花,你瞧瞧: 这么火,我也想搞一个试试,于是就有了这篇文章!对,你没看错,就是白嫖。 毕竟人家清华都开源了,哈哈哈hoho~~ 先把开源地址贴一下,老铁们可以自行去瞧一瞧: https://github.com/THUDM/Chat…