首页 / 新闻动态 / 行业新闻-新闻资讯

Sora技术革新：对培训未来趋势的影响

发布时间：2024/07/09 17:26:06 Click：

2024年2月，Sora横空出世，文生视频瞬间引爆AIGC的新一波火热话题。对于培训从业者来说，刚担心着ChatGPT是否会分走培训师知识付费的蛋糕，文生视频转眼就杀进培训授课的红海。

假设一位从未做过讲师的培训小白，只要会提问，是否完全可以从ChatGPT中生成一份专题内容，然后提供给Sora或Pika等文生视频工具，瞬间生成一堂台风灵活、讲解流畅、可互动可回看的灵境课程？有了文生视频，培训人将面临怎样的机遇和挑战？是机遇大过挑战还是相反？对培训人而言，文生视频究竟是火山口，还是风口？

热潮初起，尚未构成真正威胁

Sora的文生视频，确实让人为之震惊。它可以根据文字描述，自己生成一段符合要求的视频，而且画面、像素、播放流畅性等方面，都可以与摄像机拍摄的真实视频相媲美，甚至还可以按要求生成在现实世界无法产生的视频表达。

其中运用到的人工智能、大规模预训练模型等技术手段，都让视频这一传播媒介进入到一个全新的阶段。就培训行业而言，最直接的一个联想，就是Sora是否会生成无数个Sora老师，来抢培训师的饭碗？

比如，“Sora，请讲一段关于领导力的课程，学员是刚上任的年轻部门经理，内容要有趣，老师颜值还要高！”

“Sora，请来一段关于Presentation Skill（演讲技巧）的培训视频，要有奥巴马和乔布斯合体的感觉，还要提炼出他们最独特的演讲技巧！”

……

是否感到细思极恐？如果真的如此，培训人就真的是处于火山口，随时可能被文生视频的熊熊火焰所吞噬。但观察下来，我认为至少目前还不用担心。

一是机器学习与人类学习天然具有相互排斥性。ChatGPT与Sora等此类应用，需要通过海量数据投喂进行机器学习，才能在知识储备与智能方面达到某种接近或超过人类的水平。

这一过程中，机器学习效果越好，人类学习的动力就会越弱，直至迭代到某一天，人类的大部分智力与体力活动，都可以被人工智能和硅基生命形态所取代。长远来看，这一天或许真的会到来。

但在此之前，机器学习和人类学习将长期共存。人类甚至还需要不断学习提升自身技能水平，以进一步提升机器学习的效果。

目前，包括培训行业在内，都尚处于生产数据以及对人工智能进行投喂的阶段，一旦投喂的数据量不足，机器学习的生成式内容就难以达到可应用的水平，取代人类也就越难，这是一个吊诡的悖论。

举个简单的例子，目前大量机构上线的机器人客服，因为数据量不足，仍然只能进行简单标准化的客户服务。我们仍然需要对人工客服开展多维度培训，包括客户心理学、沟通与谈判技能、产品与服务流程知识等，才能为客户提供真正有效的服务。

二是文生视频尚未找到完全取代培训人的场景。众所周知，一次完美的培训活动，包括培训老师、内容、学员，三方面均要达到高度互动，才能实现同频共振，进而实现心智、知识、技能的全方位交付、吸收、提升。

目前，文生视频应用的技术水准更多是体现在翻译人类语言的精准度，并据此在海量数据中进行搜寻及处理的效率，以及进一步生成视频的流畅度及美感度。

简言之，就是按照人类提供的几句内容，生成一段美轮美奂视频的能力。这与前述培训人的综合能力相比，几乎是二维对三维的升维挑战。

目前市场上专攻培训领域的商用文生视频工具，主流是基于知识生成数字人讲授场景，也有少量供应商提供文本定制培训助教视频服务。

虽然在视觉效果上，这类工具能给予受众比较强的数字感，体现与时俱进的数字化转型尝试，对于部分纯知识讲授型微课，使用上此类工具，未尝不是一次令人耳目一新的尝鲜，但从学习效果上来讲，要想取代培训人，还为时过早。

使用得当，让培训人如虎添翼

培训人天生是学习者，应放眼长远，以开放心态来认识和尝试新生事物，尤其是在科技加速迭代的时代。

培训师：增强视频辅助教学

于培训师而言，传统授课中会大量用到Visual Aids（视频辅助教具）。恰到好处的视频辅助教学，可以让培训效果锦上添花。毫不夸张地说，视频的收集和使用能力，是衡量一个培训师水平的标尺。

在文生视频诞生之前，培训师或者自己策划并拍摄视频，或者从专门的视频供应商处购买，比如英国老牌的影像艺术公司Video Arts，就在这一细分市场赚得盆满钵满。

而现如今，只要有好的创意想法，再精准表述给文生视频工具，就可以瞬间生成一段内容精准、视觉惊艳的辅助教学视频。这既不需要专门的拍摄设备和技能，也不需要额外投资，且与培训主题的贴合程度远胜于从供应商处购买的标准视频。培训师如能对此熟练掌握并运用，确实是如虎添翼。

当然，在这虚实相间的内容生产过程中，培训人的表达能力尤为重要。如同使用ChatGPT要有强大的提问能力，使用Sora等文生视频工具，就需要特别精准的描述能力，才能让AI准确地理解培训师的视频需求。否则，差之毫厘谬以千里，也就画虎不成反类犬了。

其次，培训师还需要解决学员因此产生的信任危机。传统的教学视频之所以有效，主要原因正是解决了学员耳听为虚眼见为实的心理诉求，而文生视频一旦推广到培训领域，学员将不再自然而然地将视频视为真实世界的证据，而更多是一种视觉享受。

在这种情况下，培训师就需要精心设计和注意视频应用场景，更多聚焦于知识分享型视频，而非技能展示型视频。

培训管理者：解决知识萃取痛点

对于培训管理者而言，可以更高效地实现知识萃取、固化及分享。最直观的例子就是内部微课。之前需要在组织内部安排讲师，组织教案撰写，进行微课拍摄制作。这不仅耗时耗力，内部讲师一旦辞职或者离任，如果未获授权，他们的形象将不再能继续被组织使用；如果重新制作，之前的投入则要全部推倒重来。

如今，文生视频可以完美地解决这一痛点：培训管理者可以将萃取的知识投喂给系统，通过定制的数字人形象，流畅地生成视频微课，并通过内部学习平台快速地分享。

组织层面：创新真人视频应用

不单是培训，在企业文化宣导或者制度政策宣导等领域，都可以通过文生视频高效地实现，而且完全不用担心肖像权问题。对于组织来说，甚至还可以通过文生视频与真人视频相结合，实现一些之前科幻小说中才有的场景。

比如，通过Pika，D-ID（AI数字人视频创作工具）等应用，可以让内部高管、意见领袖等，提供照片、文字、语音、录像片段，生成各种主题、风格的演讲视频，主讲者的样貌、表情、口型、动作、口音、语速、情感等都可以进行高保真还原。

又比如Neural frames，可以根据文字描述，生成连续运动内容的视频，一旦拓展应用到诸如设备操作、运动教学等技能培训中，将为培训人带来极大的效率提升。

对未来的两点预判和期待

如果说ChatGPT是人工智能在大语言人机对话领域的一次革命性突破，那么，文生视频将是人工智能在真实与虚拟世界交互的一次颠覆式创新。

今后，它对人类的认知及生活方式会产生怎样的影响，目前尚无法推演，或许会是无数个具体领域的应用共同推动其向前发展。

在培训领域，基于传统培训的原理，以及现有的技术特点，我有如下预测，或者说是期待，以描述文生视频未来在培训领域如何实现价值最大化。

一是技能型生成视频将会取得重大突破。基于前文的分析，目前文生视频主要以对现实视频进行高效替代为主打方向，尚无法高保真地生成技能操作型视频。

比如，如何写出漂亮的书法？如何准确地操作灭火器？如何高效率点钞和识别假钞？这些技能仍需要大量人工数据的投喂训练，才能在文生视频工具中实现高保真还原。

我预计这将催生出文生视频的垂直细分培训市场，类似于Video Arts，专门聚焦于某些专业技能领域来拍摄制作视频，今后一旦文生技能型视频成熟，Video Arts或许会压力山大。

二是与元宇宙技术紧密结合，实现文生视频的交互性。培训，本质上来说是人与人的交互；优秀的培训，更是技能与心能的同频共振。如果文生视频只是用在讲师辅助说明的场景，即便再高效、再精美，其威力也十分有限，因为它无法代替讲师和学员产生连结。

而元宇宙，将是实现这一突破的最大可能性。如果看过国产剧《三体》，大家一定对其中的虚拟交互游戏印象深刻。在该场景中，玩家可以和秦始皇一起实验三千万士兵组成的人列计算机，和哥白尼探讨宇宙的基本结构……

其实，这不正是高互动、高保真、高技术还原度的虚拟培训场景？这款游戏也正是元宇宙和VR虚拟现实技术，以及体感交互技术的融合。

其中的VR虚拟现实，今后一旦和文生视频技术深度结合，再加上大规模的垂直公用型培训元宇宙的投产，那么，每个培训师都可以在元宇宙中实现高度交互的虚拟授课，其效果和真人无异，成本却只要千分之一。那时，培训人的能力边界，将是无远弗届。

文生视频，究竟是培训人的火山口，还是风口，我认为，关键取决于培训人自身的主动性、开放心态，以及学习能力。如果各方面都能紧紧跟上，它就是风口，助你腾飞；如果不能，它将成为某些培训人的火山口，吞噬掉其收入乃至职业发展。

正如目前如火如荼的无人驾驶技术，首当其冲的是司机行业。聪明的司机，会主动实现人机合一，把自己对交通和路况的理解有效投喂给智驾系统，让它更好地为自己服务，让自己获得休息、放松，从而更高效地完成驾驶任务。而驾校，也将一直存在，只不过教的内容和方式会更加有趣，更加令现在的我们眼花缭乱、脑洞大开。这，不正是人类进步的一种体现吗？

来源：培训杂志

作者：梁向锋东亚银行（中国）学习发展部总经理

Tag 数字化培训培训项目线上培训平台

上一篇：智能制造行业：关键岗位技能提升与成长型人才培养

下一篇：季末清货的营销策略和技巧