对话小冰公司徐元春:虚拟人不是靠噱头就能立足的行业,核心价值是增效
栏目:最新动态 发布时间:2022-05-24

4月初,中科院主管的《互联网周刊》发布2021虚拟数字人企业排名,互联网、流媒体、游戏、音乐、通信等业内巨头纷纷上榜。从某种程度上来讲,虚拟人“破圈”已成为事实。与此同时,有关虚拟人成本高昂、低水平重复、同人类抢饭碗的质疑声也不绝于耳。


已落地多个成功案例的小冰公司,对虚拟人产业有更加谨慎的判断。近日,小冰公司首席运营官徐元春在接受《每日经济新闻》记者专访时表示,从技术角度而言,虚拟歌手、虚拟主播等应用场景并没有太大的发展前景,虚拟人走进千家万户,成为人类生活和工作的辅助,才是产业的未来。


越是竞争激烈的行业,越容易接受和引进新的技术,虚拟人技术亦然。徐元春表示,相较于降低成本,企业更看重虚拟人能带来多大效益,“(企业的)下一代的数字化转型,就是向虚拟人的转型”。


谈前景:拒绝人要比拒绝系统难得多

“元宇宙未到,虚拟人先行”。这句话或许是对时下虚拟人概念走红的最佳注脚。


2021年,虚拟美妆达人柳夜熙首次亮相便吸粉百万,其背后的制作方创始人曾对媒体分析,柳夜熙爆红有50%是因为元宇宙的概念热度。


一时之间,以柳夜熙为代表的虚拟IP成为最火热的商业故事之一。艾媒咨询数据显示,2021年中国虚拟人带动产业市场规模和核心市场规模,分别为1074.9亿元和62.2亿元,预计2025年分别达到6402.7亿元和480.6亿元,呈现强劲的增长态势。


但潮水退去,“数字网红”们的后继表现并不尽如人意。制作成本与质量的难以兼顾、运营能力的短缺、同质化竞争的加剧,成为虚拟人IP的生存难题。随之带来的问题是,虚拟人产业的前景是否被高估了?


从制作角度来看,现阶段虚拟人制作主要涉及建模、驱动和渲染三项步骤。据徐元春介绍,如果使用传统的3D建模技术,再进行真人动作捕捉和后期渲染,一段15秒的视频所耗费的人力可达数十人乃至上百人,而这恰恰是目前很多厂商选择的路径。


“如果虚拟人每做一件事情背后,都需要人类花费几倍的时间去做,那其实是没有意义的。”徐元春认为,虚拟人存在的最大意义就是提高效率。


实际上,从初音未来到柳夜熙,时至今日,很多人聊起虚拟人还是会定义为虚拟歌手、虚拟偶像。但徐元春认为,从技术角度而言,虚拟歌手、虚拟主播等应用场景并没有太大的发展前景,相比之下,他更看重能为人类生活与工作带来实际价值的虚拟人类型,例如虚拟员工、虚拟专家、陪伴型虚拟人等等。


“当所有东西都走向IP和宣传的时候,是因为大家只站在了现在的技术和应用场景而作出的判断,如果你站在一个更长的技术视角来看的话,它必然不是这样。”


在他看来,“下一代的数字化转型,就是向虚拟人的转型。”因为人与机器之间、人与人之间打交道的方式截然不同,“人”的加入将为数字化增加“自然”“温暖”“真实”的部分。这在一定程度上可以解释为何同小冰合作的大都是房地产、传媒和金融这样的传统行业。


以万科虚拟员工崔筱盼为例,当由系统来催办事项时,员工可能隔几天才反馈,但当崔筱盼来催办时,员工的反馈可能会更及时。“拒绝一个人要比拒绝一个系统难得多。”徐元春解释道。


谈成本:虚拟人的核心价值不是降本而是增效

除了人性化,虚拟人的拥趸们常常把“降本”作为虚拟人的优势之一。


据开源证券研报,相比真人明星而言,虚拟人无需考虑时间、精力等因素,影视片酬和代言成本等均可能大幅降低,整体成本或远低于真人偶像。此外,服务型虚拟人主要应用于企业,若使用虚拟人替代真人服务,或能有效节约人员成本。


但现实情况里,虚拟人的制作成本恰恰是企业最头疼的问题之一。次世文化创始人曾在去年接受媒体采访时透露,“目前做虚拟人的公司里,有90%以上的公司盈利都很困难。”


这与现行的虚拟人制作技术直接相关。徐元春直言,如果通过3D建模技术来做虚拟人,高成本就是无法规避的财务问题。


简单拆解3D建模技术虚拟人背后的成本,涉及面部捕捉、动作捕捉、画面渲染等等,除此之外还有模型背后的真人演员带来的人力成本,“你想做一个虚拟人,把它做得越逼真、自然,你生产的内容越长,它的成本也必然高。”徐元春介绍。一通操作下来,60秒的视频可能就要耗资100多万元乃至200多万元。


当然,并不是所有场景下的虚拟人都需要如此“高配”,不过,若要虚拟人能以亲民的价格走进千家万户,就离不开底层技术的发展。


业内的共识是,智能驱动型虚拟人是更具潜力的发展方向。这种技术路径通过引入深度学习技术,减少了真人演员的参与,绕开了3D建模背后的大部分人力成本。以小冰正在开发的深度神经网络渲染技术为例,可以将虚拟人的制作成本降低到3D建模技术的十分之一甚至二十分之一。


不过,目前小冰提供的深度神经网络渲染技术的虚拟人,尚未实现和人的实时交互,只能完成某一领域的特定工作。


但在徐元春看来,至少与市面上存在的技术相比较,深度神经网络渲染技术已经比传统3D建模技术提高了非常多,无论从效能、质量还是后续的时间、财务成本上都发生了非常大的变化。“目前来讲,如果你按这个时间点来看,其实对深度神经网络渲染技术未来的潜在空间,我抱有的希望会更大,因为我觉得它比现在3D建模的技术空间会更大,它更有可能突破——无论是在质量以及在成本上。”


另一方面,徐元春也认为,相较于降低成本,企业更看重虚拟人能带来多大效益。“某种程度上讲,如果你的技术有这么高的价格,那一定是能够帮这个组织极大地提高生产效率,也就意味着这个组织会获得更大的影响力、生产更多的产品。”徐元春说道。


他用小冰过去一年推出的成功案例举例,万科的郁亮发了朋友圈说,崔筱盼提升了整个财务的效率;而《每日经济新闻》的AI电视台内容分发量、直播量增速非常快,这些都不是一个几人的运营团队所能做到的。“从这个角度来讲,它产生了实际的价值,这个事情能够证明这个市场需求都是非常大、而且长期存在的。”


在徐元春看来,企业的预算往往是对风险、成本、未来收益的综合考量,而好的合作场景落地是一个正向循环的过程。换言之,企业可能会先投入一笔资金来测试合作产品的表现,如果有好的效果再持续跟进投入。如果有企业说为了做虚拟人的数字化转型,给多少预算都没问题,他反而觉得不真实。


谈产业:虚拟人不是一次性生意

不过,随着虚拟人市场逐步发展,市场参与者变多,新参与者往往会从比较容易的技术栈切入。徐元春注意到,“今天的市场供应非常普及,供应商很多,这不是一个非常复杂的技术,很多人都可以先做一个。甚至我看到我周围几个朋友,都开始因为这件事情也做了虚拟人,找人做了一个3D模型,然后给他起了个名字,说我要做人了。”


徐元春认为,这对于行业来说,只是其中一个非常小的片段。落到更长的发展周期中,虚拟人究竟具备了怎样的能力和价值?需不需要和人交互?如果交互的话用什么技术来实现?这些问题终究需要行业解决。“这些问题都是实际存在的,只不过大家在某个角度忽略或者忽视了。”


另一方面,随着元宇宙的大热,虚拟人赛道涌现了众多玩家,鱼龙混杂,市场报价跨度大,处于培育期的市场也尚未形成一套标准化的报价方案。对此,徐元春却觉得,从另一个角度看,虚拟人的报价正在趋于透明。客户知道不同的报价代表不同的供应商,也能知道其过去做过的项目。“每个人他报这个价并不仅仅根据他用的软件模型的工时来测算,也包含了他的审美以及其他设计上的一些努力。”


徐元春进一步建议,企业在采购虚拟人时,要考虑几个维度:排在首位的是,要清楚创建这个虚拟人的场景和业务最核心目的是什么?其次,要考察供应商技术的完整度,越完整,提供整体解决方案的能力和集成能力就会更好,将来的可拓展性就更强。此外是风险可控,“因为总比你不知道他转包了几层来去做这件事情要好很多”。他还提示道,虚拟人不仅仅创建这一步,还包含了后续的维护、优化,并不是一次性的支出。


而面向产业端,徐元春认为,“在一个创新特别多、新技术不断凸显的行业和场景里面,必然会发现它的一些法律法规是滞后的,因为它是一个新生的事物。”他呼吁对新兴技术多些包容,同时无论是国家、企业等都应当商讨和解决相关规范、法律问题,以帮助行业合规、健康发展。


“对行业的企业或者个人来讲的话,我们建议大家还是要认知到这是一个需要技术的行业。它并不是一个大家靠噱头,还有宣传点就能够立足的一个行业。”徐元春认为,虚拟人不会是一次性生意,虚拟人企业也需要长期的发展,所以必然要获得市场,市场才会对企业的价值有正向反馈。


“这个赛道也足够大、场景足够多,我觉得我们肯定也希望更多的,有技术、内容、场景、生态的公司一起加入到这个行业里”,从一个技术的理想角度来讲,徐元春觉得,虚拟人这件事,需要很多人共同参与、共同实现,不会只是一家公司就能够实现的这么大的愿景。