智能影像是随着计算机视觉技术广泛应用而推动形成的一个新的爆发性增长行业,随着人工智能技术的进步和广泛应用,这一新兴的行业引起了各方的关注。在计算机视觉技术中,图像识别、分析和应用走向成熟,当前各方的焦点集中在了动态图像技术领域,包括视频识别和解构、自动化处理和智能化生产,特别是在传媒行业,随着各种人工智能应用的逐步发展,智能影像技术正在深刻的影响着这一传统而又庞大的产业。
根据IABM (国际广播商联合会)的数据显示,在2019年,在传媒行业的人工智能应用的渗透率将超过25%,其中Top 5的应用领域为内容管理,智能影像生产,内容发布,客户服务和智能创意。
基于人工智能技术的智能影像生产最初走向实用阶段是在2016年,二十世纪福克斯与IBM合作,利用Watson完成了第一部由人机协作完成的电影预告片《Morgan》,通过一个人工智能影像智能分析平台,对恐怖电影中的情感模式和类型进行场景识别和分析,形成对视听情感和场景在内的多模式语义理解,并通过建模表征恐怖电影预告片的关键内容场景,最终完成了这一里程碑式的内容创意和制作
在过去为了制作十几分钟的电影预告片,需要录制,审核,选择和整理超过200小时的视频内容,需要大量人力、时间和成本而,通过智能影像的视频理解技术可以由模型来分析大量的视频内容素材并识别关键的内容,从而可以极大地增强创作过程。IBM与20世纪福克斯的这一合作证明了,需要10到30天才能完成的预告片制作,可在几个小时之内完成。不仅如此,在2019年上映的《复仇者联盟4》(Avengers: Endgame)中角色Thanos(见图2),以及 在2018年上映的《星球大战》(Solo:A Star Wars Story)中的由哈里森·福特(Harrison Ford)扮演的汉·索罗(Han Solo),在影片中的形象和一系列的表演都是由基于人工智能工具和模型制作的,使得部分制作流程实现自动化,在过去由专业CG(计算机动画)团队才能完成的复杂VFX(计算机视觉效果),可以通过机器学习快速完成。
“将物理模拟与AI / ML相结合,以及具有领先思维的艺术家和影像创作者的结合将导致VFX领域产生颠覆性转变,从长期来看,这些技术将从根本上改变内容的创建方式”Ziva Dynamics的首席运营官Michael Smit表示。
“影像内容将是继文字、图片之后的主要信息载体,随着信息视频化提速,影像内容产制播将进一步向个性化和智能化演进,智能影像与机器影像并存”, 国内智能视觉技术公司影谱科技则表示,“智能影像技术在流媒体领域的充分应用将推动‘个性化和互动性的智能内容将成为重要组成部分’,并已达到大规模应用的临界点”。
自研的流媒体自动生产系统基于视觉智能技术,可短时间内大规模生成中短易懂、甚至创新的流媒体内容。
“对于流媒体内容产业,许多最耗费劳力和重复性的繁重任务往往需要外包给专业的团队,但随着智能影像技术的最新进展,这些任务中不仅可以实现完全的自动化,从而降低成本并极大的缩短制作时间。例如,阿斯佩拉(Aspera)将智能影像技术用于视频内容的摄取和制作的自动化交付。更为重要的是,通过智能影像技术可以极大的将创意人员从繁琐重复的工作中解脱出来,去将时间和精力放在内容的创意上,而且通过智能影像技术还可以让创意人员在更短的时间内看到更多的创意选择。
国内传媒产业特别是在CG和VFX方面无论是在创意还是在制作方面较国外相对起步较晚,但随着融媒体战略深化、及智能影像技术的大规模成熟应用,中国文化传媒产业迎来变革契机。
目前,智慧传媒关注点主要聚焦在三个领域:
(1)流媒体内容分析和场景商业化:通过对视频内容的多模态理解,识别视频内容中的场景,人物,物体,运动以及剧情,依据场景和内容的受众通过视频浮层等技术嵌入商业素材或载体。
(2)媒体内容自动化制作:例如并针对目标人群定制电影预告片和电视节目的语义/情感内容,对视频内容进行自动化剪辑、编辑和生产,国内的智能影像制作平台可以在数个小时之内完成数百个完全由AI及人机协作完成的视频内容。
(3)内容创意和生产:这个领域在国内相对起步较晚,但发展非常迅速,在视觉效果上融合物理和虚拟达到拟真效果,使得影视内容本身的创意可以无限延伸。
根据IABM2018年的一项研究显示,智能影像技术发展面临的挑战主要来自于缺乏专业的技术能力和专用的智能影像技术平台,相对而言,中国的智能影像技术的发展,更需要平台化和产业化发展的模式,即融合云计算,大数据、AI能力的专用AI平台,影谱科技是典型的智能影像技术系统的开发者及提倡者。例如,其智能影像系列方案集成视频内容生产引擎、机器学习、自动化标注、关键帧抽取、大数据等关键应用技术,确保国内传媒机构可以无缝管理内容生产及内容商业化,并确保商业化内容库存水平和摊销处于平衡状态。