Image 2 Image 3 Image 3 Image 3

搭乘ChatGPT类技术快车 虚拟数字人装上“最强AI大脑”

频道:行业资讯 日期: 浏览:1071

当下,越来越多的虚拟数字人形象出现在金融、文娱、互联网等各个行业中。在文化领域,新华社数字宇航员“小诤”、中央广播电视总台“AI王冠”、美妆博主“柳夜熙”等虚拟数字人应用集中涌现;在政务领域,江西推出了全国首个政务服务数字人“小赣事”;在金融领域,浦发银行打造了行业首位数字员工“小浦”;在电商直播间,百度打造的数字人“度晓晓”在助农活动中,1分钟内便卖光了2吨蜜瓜......

而随着开年以来ChatGPT和GPT-4类AI技术的爆火带来了新的技术变革,或将为虚拟数字人装上“最强AI大脑”,进一步将虚拟数字人产业推向新的热潮。

搭乘ChatGPT类技术快车 虚拟数字人装上“最强AI大脑”

搭乘ChatGPT类技术快车

虚拟数字人装上“最强AI大脑”

虚拟数字人是通过3D建模、深度学习、语音合成、图像渲染等技术生成的智能化产品,它能够模拟人类的形象与行为特征。生成一个虚拟数字人,需要计算机动画、动作捕捉、AI等技术以及高效算力算法的多重支撑。而ChatGPT的横空出世则给由AI驱动的虚拟数字人带来新的发展“拐点”。

《中国虚拟数字人影响力指数报告》第二期提出,以ChatGPT为代表的生成式AI将赋能虚拟数字人的“智能进化”。同时,通过与垂类场景结合的AIGC技术,也将为虚拟数字人拓展应用领域、降低成本、提升变现能力。IDC数据,预计到2026年中国AI数字人市场规模将达到102.4亿元,市场将呈现高速增长态势。

搭乘ChatGPT类技术快车 虚拟数字人装上“最强AI大脑”

有望成为ChatGPT应用的最佳化身

自然语言处理大模型有助于提升虚拟数字人交互体验,真正让虚拟数字人有了灵魂。而ChatGPT所展现出来的高灵活度让人们对AI有了新的认知,它比普通的AI机器人更加像自然人,对信息、知识的挖掘和梳理更充分,对语句的处理更加贴近人类的日常交流表达状态。

多位业内人士表示,接入ChatGPT可以帮助虚拟数字人更深刻理解和响应人类的交互语言,从而大大提升人机对话体验。据财联社统计,截至目前,包括元隆雅图、风语筑、天娱数科等多家上市公司公布称,相关业务已经接入类似ChatGPT技术,或正在研究相关技术与虚拟数字人结合的应用场景。

同时,以往的数字人有着制作成本高、拍摄技术门槛高、制作时间长的”枷锁“。而“ChatGPT+数字人”可以有效打破这三道”枷锁“,过去,建模师们可能需要几个月才能完成的超现实数字人形象,现在短短一周内就能完成。

ChatGPT的嵌入,就仿佛为“拟人化”的虚拟数字人装上了AI大脑。不仅可以实现更加准确、流畅且自然的表达,更能通过快速的学习和适应,为用户提供更具个性化的服务。通过相关数据的针对性训练形成个性化模型,未来虚拟人将有望应用于线下展厅的AI讲解介绍数字人、线上AI主播、AIGC快速短视频系统等多个场景。

虚拟数字人与生成式AI的结合,或将是整个产业发展的关键节点,二者正在产生相互作用。中国传媒大学媒体融合与传播国家重点实验室大数据中心首席科学家沈浩认为,生成式AI的引入将为虚拟数字人赋予“最强大脑”。业内专家也纷纷表示,虚拟数字人有望成为ChatGPT应用的最佳化身和接口。

GPT-4探索AI虚拟数字人

搭乘ChatGPT类技术快车 虚拟数字人装上“最强AI大脑”

此外,打造出ChatGPT的公司OpenAI最新推出的GPT-4,将允许接入API的用户定制AI的“性格”,将相关技术带入虚拟人场景中,使虚拟人成为真正的“人”。

相比ChatGPT固定的语言风格,GPT-4将允许接入API的用户定制AI的“性格”。据相关预测,GPT-4将进一步优化虚拟人的反馈机制,类似于国内AI对话应用Glow可以让用户与“钢铁侠”TonyStark等不同背景、场景的虚拟人对话,将相关技术带入虚拟人场景中,使虚拟人成为真正的“人”。

此外,随着算力的提升以及GPT-4模型升级,虚拟数字人将输出文字、图像、音视频,甚至细微到情绪表达,这将使虚拟数字人集社交、创作、分享能力于一身。因此,在GPT-4推出之后,虚拟数字人有望进一步受益,成为承载多模态的杀手级应用。

装上“最强AI大脑”

搭乘ChatGPT类技术快车 虚拟数字人装上“最强AI大脑”

▲百度各种不同类型的虚拟数字人(图源百度)

不仅仅是ChatGPT,其他这类AI大模型或AIGC技术也将持续对虚拟数字人产业进行赋能。例如,百度数字人与机器人业务负责人李士岩就表示,目前通过大模型等技术支撑,数字人可以根据文本要求自动生成一段颇具个人风格的图文内容、动作视频,甚至“演戏”。比如说,在直播电商场景中,当你告诉数字人带货产品的主要特点、价格以及产品优势,并且让他以爆笑喜剧风设计三种直播讲稿,数字人平台将会直接提供几种不同风格的稿件。

再例如,顺网科技宣布旗下数字人“晓竞”已将AIGC应用于电竞酒店行业,帮助酒店业主实现智能经营,该技术贯穿数字人“晓竞”诞生至场景应用全流程。

搭乘ChatGPT类技术快车 虚拟数字人装上“最强AI大脑”

接入“最强AI大脑”,虚拟数字人的情感体验或将更加丰富。清华大学新闻学院教授沈阳认为,数字人方案的使用成本会逐渐降低,功能指向将进一步向C端拓展,不仅有面向粉丝的虚拟偶像,还会进一步延伸出个性化定制的虚拟数字人,在儿童照料、适老科技、单身经济等领域拥有一片蓝海,甚至每个用户都能拥有自己的虚拟化身,承担一定的功能分身或扮演情感陪伴角色。未来虚拟数字人的发展将不再单独依托技术,将带给用户前所未有的情感体验。

搭乘ChatGPT类技术快车 虚拟数字人装上“最强AI大脑”

为虚拟数字人装上“最强AI大脑”

还面临哪些难点?

外观上,虚拟数字人已经比较接近“人”的样子;功能上,部分实现了“人”的思维和举止。但与此同时,当下数字人在交互上的瓶颈显而易见,现有AI技术还不足以支持数字人养成独立行为,技术瓶颈和其他一系列问题导致数字人尚未打通自身的生存路径。

首先是同质化趋势。当前数量较多的虚拟主持人、虚拟带货主播、虚拟UP主VTuber等,是AI驱动应用最多的场景。中国传媒大学《中国虚拟数字人影响力指数报告》显示,目前虚拟主播技术借力多、自主少,需要关注、提升。“同质化竞争”是虚拟主播的重要挑战,无论是专业媒体经营还是企业或者个人运营,其主持、直播功能雷同。

其次,AI与虚拟数字人的结合引发了它们是否会替代人类的核心议题。3月29日,特斯拉首席执行官埃隆·马斯克等上千人在“生命未来研究所(Future of Life Institute)”网站呼吁,暂停开发比GPT-4更强大的人工智能6个月,并在此期间共同制定实施一套共享的安全协议,交由独立专家进行审计。当生成式AI赋能虚拟数字人,信息安全、法律问题、社会治理风险、伦理问题也随之而来。

搭乘ChatGPT类技术快车 虚拟数字人装上“最强AI大脑”

“数字人的逼真效果将挑战人类‘眼见为实’的认知底线,技术若滥用,很可能会使虚假信息以高度可信的方式通过互联网即时触达用户。”中国信通院云计算与大数据研究所内容科技部高级业务主管颜媚表示。

中国人民大学交叉科学研究院院长杨东提出:“虚拟数字人衍生出的身份认证、法律定位、知识产权、监管等问题目前都处于空白状态,需要不断地研究和探索。”清华大学新闻学院教授沈阳关注深度合成的边界问题,在大量抓取网络视频、图像的深度合成之下,肖像权的保护隐患已初现端倪。

不过,业内专家普遍认为,当前虚拟数字人产业并未到达爆发的临界阶段,还需要一个蓬勃发展和探索的过程,在此过程中才能逐步解决治理层面的问题。

责编:方钰洁

监制:李红梅

文章参考:

1.《ChatGPT 赋予虚拟数字人“最强大脑”?》人民邮电报

2.《GPT-4将允许用户定制AI的“性格” 数字人或成为下一个杀手级应用》财联社

3.《拥抱ChatGPT 虚拟数字人将迎来新爆发》通信信息报

4.《多家公司拟将ChatGPT 融入虚拟数字人》中国证券网

5.《AIGC+ChatGPT成为数字人驱动力,赋能虚拟主播直播形式纵深拓展》世优科技

举报/反馈

0 留言

评论

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。
验证码