2024年2月,Sora横空出世,文生视频瞬间引爆AIGC的新一波火热话题。对于培训从业者来说,刚担心着ChatGPT是否会分走培训师知识付费的蛋糕,文生视频转眼就杀进培训授课的红海。
假设一位从未做过讲师的培训小白,只要会提问,是否完全可以从ChatGPT中生成一份专题内容,然后提供给Sora或Pika等文生视频工具,瞬间生成一堂台风灵活、讲解流畅、可互动可回看的灵境课程?有了文生视频,培训人将面临怎样的机遇和挑战?是机遇大过挑战还是相反?对培训人而言,文生视频究竟是火山口,还是风口?
热潮初起,尚未构成真正威胁
Sora的文生视频,确实让人为之震惊。它可以根据文字描述,自己生成一段符合要求的视频,而且画面、像素、播放流畅性等方面,都可以与摄像机拍摄的真实视频相媲美,甚至还可以按要求生成在现实世界无法产生的视频表达。
其中运用到的人工智能、大规模预训练模型等技术手段,都让视频这一传播媒介进入到一个全新的阶段。就培训行业而言,最直接的一个联想,就是Sora是否会生成无数个Sora老师,来抢培训师的饭碗?
比如,“Sora,请讲一段关于领导力的课程,学员是刚上任的年轻部门经理,内容要有趣,老师颜值还要高!”
“Sora,请来一段关于Presentation Skill(演讲技巧)的培训视频,要有奥巴马和乔布斯合体的感觉,还要提炼出他们最独特的演讲技巧!”
……
是否感到细思极恐?如果真的如此,培训人就真的是处于火山口,随时可能被文生视频的熊熊火焰所吞噬。但观察下来,我认为至少目前还不用担心。
一是机器学习与人类学习天然具有相互排斥性。ChatGPT与Sora等此类应用,需要通过海量数据投喂进行机器学习,才能在知识储备与智能方面达到某种接近或超过人类的水平。
这一过程中,机器学习效果越好,人类学习的动力就会越弱,直至迭代到某一天,人类的大部分智力与体力活动,都可以被人工智能和硅基生命形态所取代。长远来看,这一天或许真的会到来。
但在此之前,机器学习和人类学习将长期共存。人类甚至还需要不断学习提升自身技能水平,以进一步提升机器学习的效果。
目前,包括培训行业在内,都尚处于生产数据以及对人工智能进行投喂的阶段,一旦投喂的数据量不足,机器学习的生成式内容就难以达到可应用的水平,取代人类也就越难,这是一个吊诡的悖论。
举个简单的例子,目前大量机构上线的机器人客服,因为数据量不足,仍然只能进行简单标准化的客户服务。我们仍然需要对人工客服开展多维度培训,包括客户心理学、沟通与谈判技能、产品与服务流程知识等,才能为客户提供真正有效的服务。
二是文生视频尚未找到完全取代培训人的场景。众所周知,一次完美的培训活动,包括培训老师、内容、学员,三方面均要达到高度互动,才能实现同频共振,进而实现心智、知识、技能的全方位交付、吸收、提升。
目前,文生视频应用的技术水准更多是体现在翻译人类语言的精准度,并据此在海量数据中进行搜寻及处理的效率,以及进一步生成视频的流畅度及美感度。
简言之,就是按照人类提供的几句内容,生成一段美轮美奂视频的能力。这与前述培训人的综合能力相比,几乎是二维对三维的升维挑战。
目前市场上专攻培训领域的商用文生视频工具,主流是基于知识生成数字人讲授场景,也有少量供应商提供文本定制培训助教视频服务。
虽然在视觉效果上,这类工具能给予受众比较强的数字感,体现与时俱进的数字化转型尝试,对于部分纯知识讲授型微课,使用上此类工具,未尝不是一次令人耳目一新的尝鲜,但从学习效果上来讲,要想取代培训人,还为时过早。
使用得当,让培训人如虎添翼
培训人天生是学习者,应放眼长远,以开放心态来认识和尝试新生事物,尤其是在科技加速迭代的时代。
培训师:增强视频辅助教学
于培训师而言,传统授课中会大量用到Visual Aids(视频辅助教具)。恰到好处的视频辅助教学,可以让培训效果锦上添花。毫不夸张地说,视频的收集和使用能力,是衡量一个培训师水平的标尺。
在文生视频诞生之前,培训师或者自己策划并拍摄视频,或者从专门的视频供应商处购买,比如英国老牌的影像艺术公司Video Arts,就在这一细分市场赚得盆满钵满。
而现如今,只要有好的创意想法,再精准表述给文生视频工具,就可以瞬间生成一段内容精准、视觉惊艳的辅助教学视频。这既不需要专门的拍摄设备和技能,也不需要额外投资,且与培训主题的贴合程度远胜于从供应商处购买的标准视频。培训师如能对此熟练掌握并运用,确实是如虎添翼。
当然,在这虚实相间的内容生产过程中,培训人的表达能力尤为重要。如同使用ChatGPT要有强大的提问能力,使用Sora等文生视频工具,就需要特别精准的描述能力,才能让AI准确地理解培训师的视频需求。否则,差之毫厘谬以千里,也就画虎不成反类犬了。
其次,培训师还需要解决学员因此产生的信任危机。传统的教学视频之所以有效,主要原因正是解决了学员耳听为虚眼见为实的心理诉求,而文生视频一旦推广到培训领域,学员将不再自然而然地将视频视为真实世界的证据,而更多是一种视觉享受。
在这种情况下,培训师就需要精心设计和注意视频应用场景,更多聚焦于知识分享型视频,而非技能展示型视频。
培训管理者:解决知识萃取痛点
对于培训管理者而言,可以更高效地实现知识萃取、固化及分享。最直观的例子就是内部微课。之前需要在组织内部安排讲师,组织教案撰写,进行微课拍摄制作。这不仅耗时耗力,内部讲师一旦辞职或者离任,如果未获授权,他们的形象将不再能继续被组织使用;如果重新制作,之前的投入则要全部推倒重来。
如今,文生视频可以完美地解决这一痛点:培训管理者可以将萃取的知识投喂给系统,通过定制的数字人形象,流畅地生成视频微课,并通过内部学习平台快速地分享。
组织层面:创新真人视频应用
不单是培训,在企业文化宣导或者制度政策宣导等领域,都可以通过文生视频高效地实现,而且完全不用担心肖像权问题。对于组织来说,甚至还可以通过文生视频与真人视频相结合,实现一些之前科幻小说中才有的场景。
比如,通过Pika,D-ID(AI数字人视频创作工具)等应用,可以让内部高管、意见领袖等,提供照片、文字、语音、录像片段,生成各种主题、风格的演讲视频,主讲者的样貌、表情、口型、动作、口音、语速、情感等都可以进行高保真还原。
又比如Neural frames,可以根据文字描述,生成连续运动内容的视频,一旦拓展应用到诸如设备操作、运动教学等技能培训中,将为培训人带来极大的效率提升。
对未来的两点预判和期待
如果说ChatGPT是人工智能在大语言人机对话领域的一次革命性突破,那么,文生视频将是人工智能在真实与虚拟世界交互的一次颠覆式创新。
今后,它对人类的认知及生活方式会产生怎样的影响,目前尚无法推演,或许会是无数个具体领域的应用共同推动其向前发展。
在培训领域,基于传统培训的原理,以及现有的技术特点,我有如下预测,或者说是期待,以描述文生视频未来在培训领域如何实现价值最大化。
一是技能型生成视频将会取得重大突破。基于前文的分析,目前文生视频主要以对现实视频进行高效替代为主打方向,尚无法高保真地生成技能操作型视频。
比如,如何写出漂亮的书法?如何准确地操作灭火器?如何高效率点钞和识别假钞?这些技能仍需要大量人工数据的投喂训练,才能在文生视频工具中实现高保真还原。
我预计这将催生出文生视频的垂直细分培训市场,类似于Video Arts,专门聚焦于某些专业技能领域来拍摄制作视频,今后一旦文生技能型视频成熟,Video Arts或许会压力山大。
二是与元宇宙技术紧密结合,实现文生视频的交互性。培训,本质上来说是人与人的交互;优秀的培训,更是技能与心能的同频共振。如果文生视频只是用在讲师辅助说明的场景,即便再高效、再精美,其威力也十分有限,因为它无法代替讲师和学员产生连结。
而元宇宙,将是实现这一突破的最大可能性。如果看过国产剧《三体》,大家一定对其中的虚拟交互游戏印象深刻。在该场景中,玩家可以和秦始皇一起实验三千万士兵组成的人列计算机,和哥白尼探讨宇宙的基本结构……
其实,这不正是高互动、高保真、高技术还原度的虚拟培训场景?这款游戏也正是元宇宙和VR虚拟现实技术,以及体感交互技术的融合。
其中的VR虚拟现实,今后一旦和文生视频技术深度结合,再加上大规模的垂直公用型培训元宇宙的投产,那么,每个培训师都可以在元宇宙中实现高度交互的虚拟授课,其效果和真人无异,成本却只要千分之一。那时,培训人的能力边界,将是无远弗届。
文生视频,究竟是培训人的火山口,还是风口,我认为,关键取决于培训人自身的主动性、开放心态,以及学习能力。如果各方面都能紧紧跟上,它就是风口,助你腾飞;如果不能,它将成为某些培训人的火山口,吞噬掉其收入乃至职业发展。
正如目前如火如荼的无人驾驶技术,首当其冲的是司机行业。聪明的司机,会主动实现人机合一,把自己对交通和路况的理解有效投喂给智驾系统,让它更好地为自己服务,让自己获得休息、放松,从而更高效地完成驾驶任务。而驾校,也将一直存在,只不过教的内容和方式会更加有趣,更加令现在的我们眼花缭乱、脑洞大开。这,不正是人类进步的一种体现吗?
来源:培训杂志
作者:梁向锋 东亚银行(中国)学习发展部总经理