很难忽略所有正在进行的关于 generative AI and how it will impact media technologies. So far, 传统观点认为,它有望使新手更容易、更有效地完成重复性任务, to create better monetization opportunities, to foster new tool development, 而且,无论好坏,它都将以多种不同的方式推动颠覆.

像ChatGPT这样的生成式人工智能模型所训练的智能是巨大的, and, therefore, instead of counting on what a single human can produce, 它可以提供机器在整个学习过程中所能提供的尽可能多的排列. Ask the right questions, and you will be rewarded—maybe.

将生成式人工智能整合到我们的工作流程中有可能影响媒体技术中的几乎所有内容, 我将在本文中研究几种可能性. 从容易实现的目标开始,我将介绍生产,然后转移到 monetization, search, the creation of new tools, and more. Many of the experts I spoke with expect the 将生成式人工智能集成到我们的工作中的直接副产品 提高工作效率,减少花在死记硬背任务上的时间. 他们也看到了一些非常有创造性的解决问题的潜力, while at the same time, 一些伦理问题,我不会试图在这篇文章中充分探讨.

“In media entertainment, I tend to look at things through three lenses,” says Anil Jain, global managing director of strategic consumer industries at Google Cloud. “首先是改进内容创作、生产和管理. 第二是增强和个性化观众体验, and the third is improving monetization.”

Ultimately, Jain contends, 盈利“将成为每个人都关心的一件事,因为它有机会简化内部流程并提高运营效率, 短期内影响最大的可能是什么. When you think about monetization with generative AI, then you start looking at the art of the possible.


It all starts with the data. 传统的人工智能系统在训练的基础上识别模式,然后做出预测. 生成式人工智能使用这些数据来创造一些新的输出.

“Generative AI creates things based on a lot of data,” says Jonas Ribeiro, digital products, platform, and ad tech manager at Globo. “我们需要用这些数据创建模型,这样我们就可以在M中创建东西 & E industry.这可能包括为编辑、图像、音频或视频创建脚本或摘要. “基本上,”里贝罗解释说,“你需要大量的数据和模型.”

里贝罗说,公共和私人数据都有助于这些模型. “For the major initiatives, we are using open data, 但我们需要采取更谨慎的方法,因为互联网可以影响信息”——我们都知道, the internet abounds in inaccurate and suspect information. “We have a lot of people check the outcome. Not everyone can afford to have private data, but for some specific workloads that I can’t disclose, we are trying to use the private data.”

Opinions abound when it comes to language models. 与我交谈过的一位高管谈到,客户不需要对他们的特定产品进行培训, because they can supply data within a search query. 其他人则不那么确信他们想把数据放到开放的互联网上.

“对我来说,这是一种垃圾进垃圾出的情况,”他说 Steve Vonder Haar, senior analyst at IntelliVid Research. “If you’re going to take information from the web, 你不会有一个可信的信息来源. 人工智能的真正未来——至少在商业意义上——将是开发有限的数据集,用于在特定的企业网络中为决策提供信息.”


生成式人工智能驱动的分析似乎正在形成一种类固醇商业分析工具. First Tube 是一个利用人工智能驱动分析的直播平台. 该公司最初的想法是,想要模拟一个项目的成功,以调整交付. “我们正在使用生成服务来创建模拟活动,然后将其拉入我们的分析平台,” notes David Clevinger, First Tube’s VP for products. “我们使用生成式人工智能来创建测试数据,模拟客户看待活动元素和活动结果的方式.”

Clevinger says this could be tied to identifying the best platform for posting content; what kind of content drives better engagement—for example, driving brand awareness or getting people to sign up for a sweepstakes—which social platform is better for that specific live stream; what kinds of measurements can be delivered in views, clicks, impressions, or social media comments; or even evaluating the ROI based on the result.

First Tube正计划在内部建立自己的分析平台,以充分实现这一承诺. 克莱文杰说:“我永远不会把它交给第三方。. “但我们的意图是说,这种方法在过去对这个品牌很有效. 我们如何利用那里的发现将其转化为一项活动,现在要求生成人工智能服务根据上次的效果起草一份媒体计划?”

The next step for leveraging First Tube’s in-house platform, Clevinger states, 是使用生成式AI”在垂直层面进行优化. 什么是最好的策略,什么是最好的活动,什么是围绕活动的最佳参数? 我们的一些工作流片段以前是在电子表格或不同的数据库中,” Clevinger concedes. “What we’re trying to do is build a more comprehensive, 为客户提供基于性能指标的强大分析平台.”

Content Creation

巴雷特-杰克逊拍卖公司(Barrett-Jackson Auction Co .)是另一家决定将部分生产需求交给生成式人工智能处理的组织. “Productivity-wise, 我们每个月都要为我们的上市服务写成千上万的汽车描述,” says Darcy Lorincz, Barrett-Jackson’s CTO. 该公司将过去50年售出的每辆车的汽车信息整合到自己的语言模型中. 巴雷特-杰克逊公司分享了这些信息,因为它想让人们知道拍卖的结果, but, otherwise, this is the company’s own proprietary data model.

“Training your own model isn’t for everybody, and that’s why these open models are great,” Lorincz explains. “Now we can generate that editorial in seconds. We still need people to do some moderation, but as the machines learn more and more, there’s less effort for us so we can scale,” he continues. This allows the company to say, “我们想让这辆车出现在这个背景中,这个人在谈论它, and 5 minutes later, 我们有一个有意义的2分钟视频,描述了一个制作团队需要进行大量研究的东西.”


自动字幕功能在流媒体中变得越来越普遍, VOD, and videoconferencing. 并不是每个人都喜欢AI产生的字幕效果. Thierry Fautier, managing director of Your Media Transformation says, “我有一个朋友在一家法国广播公司使用谷歌的语音转文本功能. Does it work? No. 在一个有说英语的人的实验室里,它得到了一定比例的正确率. 然后你把它搬到法国的环境里房间里有噪音,有非常严格的监管要求, and it doesn’t work.”

在直播领域,人工智能在字幕上的应用非常广泛. “One of our big things is, if you have a political, legal, pharmaceutical, or healthcare client, 你绝对不会想要在标题中使用AI,因为你只会在某些时候失败,” says Corey Behnke, lead producer and co-founder of LiveX. “Oversight is the key thing with AI. 事实上,我相信我们将比以往任何时候都更需要制作人的监督.”

我见过一些实时的软件演示,它们的准确率非常高, 我在工作过程中一直使用不需要的系统. Later in this article, 我将讨论一个有趣的用例,它在某种程度上基于相同的技术, but for a totally different outcome.


“In the world of generative AI, you could actually increase the value of every impression, because now, 广告实际上是根据你分享的所有内容,在合适的时候专门为你制作的,这样CPM就高得多,” says Google Cloud’s Jain. 其他人也认同这种观点,认为这种观点会立即产生吸引力.

While many people speak to me about targeted advertising, 随之而来的成本需要与交付目标结果所需的技术能力一样多的澄清. “我认为你可以用更低的成本制作更有创意的广告,”福捷说. 现在,针对不同群体制作广告会立即面临预算限制. “If I can automate the 10 different subcategories now, you can give a dedicated ad for a dedicated group. 你通常不会接触超过15个群体,所以你做了15个广告,你就完成了.”

另一个正在考虑的领域是在内容中植入数字产品. “我们发现了一些机会,把一个可能是水的瓶子放在桌子上, beer, or soda,” says Globo’s Ribeiro. 这将为更广泛的受众提供机会. “We are not there right now, but we are studying it.”

Advertising Analytics

提供有用分析所需的所有广告数据确实存在:它运行的地方, how it ran, what it ran against, who it was delivered to, what errors occurred, what CPM was paid for it, and so forth. 问题是,这些不同的信息片段目前位于不同的系统中. “On the DSP side, there are disparate systems for combining CRM, delivery, 以及活动创意数据集,看看广告是在Crackle还是在NBC新闻的桌面网站上更好,” according to C.J. Leonard, global media and ad tech consultant at MAD Leo Consulting. “让一个人坐在那里看每个系统的印象记录,并试图将所有这些联系在一起,这是不切实际的.”

生成式人工智能可以用人类永远无法做到的方式来清理这些数据. “With these different datasets brought together,” Leonard says, “we should be able to speak to better outcomes. Instead of putting my finger in the air and saying, ‘Based on my gut …’ I want to be able to say, ‘Based on my gut and this model that is out there …”

Creative Assistance 

到目前为止,在媒体世界中,关于生成AI应用的最常见主题是如何使用这些工具来减少后期制作完成内容所需的时间. 但它在工作流程的其他阶段也同样有用. How do we use it in initial ideation work? How do we use it to summarize content? And if it does play a meaningful role in these areas, 这对传统上从事这些工作的人来说意味着什么?

“我们的客户对纯生成人工智能的使用要谨慎得多,因为他们试图做与创意人员相同的工作,” says Shailendra Mathur, VP of architecture and technology at Avid. 很容易看出这会让很多人感到不舒服, whether they are producers, editors, animators, writers, or actors.

“我们所信奉的哲学之一是创造性的帮助,”Mathur指出. “It’s automating the mundane.“在后期工作流程中有很多平凡的任务,这些任务可能非常重复和耗时, he explains, such as logging the metadata, manual content checking, searching for specific B-roll, and doing research for a script. Another idea is to offload less skilled work. “We have a labor and skills shortage in the industry today, 所以它的一部分实际上是利用一些人工智能模型以及由此产生的一些自动化来驱动我们无法用人类技能填补的领域.”

However, this automation only goes so far. “[ChatGPT] can only guess at what you want,” says Mathur. “You need to know what you’re asking for, 当你没有要求正确的事情时,你不能责怪ChatGPT给出了错误的答案. 如果你要求系统完成一项工作,你总是需要在那里仔细检查.”

虽然以前已经提供了各种级别的元数据搜索, 使用生成式人工智能意味着可以发现通常找不到的相关内容, Mathur explains. 生成式人工智能中使用的大型语言模型基于一种称为语义嵌入的表示方法. “Embedding space models are used to convert text, video, or audio objects into a vector database,” Mathur says. 该数据库可以使用对象数据和语义信息来识别事物.

“当我们看到语义嵌入的核心技术时, this is where the association of multiple pieces of audio, video, etc., all come together,” according to Mathur. “You can say, ‘Is this written in this language?’ ‘Or [show me] a picture or audio about Nadine,’”然后系统会返回与我名字相关的所有媒体对象的列表.

结果是,在训练期间没有观察到的成千上万的图像标签的预测是可能的. 这使得源代码库的访问速度更快,而且比以往任何时候都更详细. Avid有一个研究和高级开发实验室,展示了许多其他正在考虑的概念.

Just-in-Time Advertising

With all of the excitement surrounding ChatGPT in 2023, says Google Cloud’s Jain, “每个人都经历了直接面向消费者的模式转变. But now with generative AI, 在上游内容创作和生产方面也有可能出现颠覆.”

“我们在我们的设施外运行多个FAST频道,”他说 Tulix CEO George Bokuchava. “Why not think about dynamic edge generation? 想象一下,你有一个(品牌),你在直播中占有一席之地. 你可以根据市场情况和世界上发生的任何事情动态地插入人工智能生成的广告. 我们只需要保持开放的心态,从一个全新的角度来思考问题. This is absolutely doable.”

User Experience

Jain说道:“如果你着眼于发行商,你会发现他们既兴奋又害怕. “On the fear side, 生成式人工智能将会减少用户花在发行商网站上的时间, because it’s either summarized somewhere, 或者它减少了个人深入挖掘记者报道内容的需要.”

“令人兴奋的是,我们可以为消费者创造更多种类的内容体验,因为我们可以总结信息,” Jain continues, “我们可以建立更大的社区,因为我们可以在内容上添加对话式人工智能,让体验更像是对话, more dynamic and interactive.”

Using voice could also have a very exciting outcome for any and all software; consider conversational interfaces or using speech to control how a software product will work. “你实际上是在用你自己的自然语言与应用程序对话,”Mathur说.

着眼于内容创造领域,很容易看到如何在生产中创造效率. Google built an OTT proof of concept that uses Bard to help viewers pick content to watch. This functions in place of traditional streaming navigation. 查看器可以根据他们拥有的任何对话输入进行交互以查找内容. 它本质上是一个具有记忆和解析交互能力的推荐引擎.

And then, if users want (and have granted permissions), 他们也可以吃薯条(或者他们可以通过外卖服务点的任何其他类型的食物),继续与“OTT POC的声音”对话.“这是解决消费者内容困境的一个有趣方法.

洛林茨说,巴雷特-杰克逊也在考虑如何为其产品带来更多的交互性. 他指出:“现在,我们正在制作视频背景,让虚拟角色无需脚本就能说话. “我们还有一个客户服务机器人——不是虚拟化身——我可以问它任何关于我们公司的问题, and it can answer me in real time.”

Cautionary Tales

我遇到过很多人,他们要求ChatGPT为他们写一些东西,并对结果感到非常兴奋. So, 为了验证ChatGPT对创造性帮助是否有用——以及对研究的兴趣——我决定尝试一下. 我试图让ChatGPT以我的风格写一段与本文相同主题的文章.

A few questions come to mind. Is there enough data to generate and impersonate my voice? Do I really write like this? 在我所有的文章中,包括这篇文章,直接引用真实人物的话在哪里? 我在ChatGPT上做了同样的研究,得出以下结论:

在一个技术进步以前所未有的速度塑造行业的时代, 媒体行业是人工智能(AI)变革潜力的绝佳证明。. Over the past few years, the media industry has become a crucible for AI innovations, 开创一个创新和运作效率的新时代. From streaming platforms to advertising campaigns, 人工智能和媒体运营的融合正在产生显著的成果.

我想最终的问题是:你能看出这段话是由人工智能生成的吗, 或者它可以被认为是由人类(如果不一定是某个特定的人类)编写的吗?? And for how long will we continue to value that distinction?

“在过去的几个月里,我进行了很多对话,这些对话让我相信,信任和真实性将得到更大的重视,” says Google Cloud’s Jain. “在一个可以用更少的辛劳创造更多内容的世界里, people are going to want to know: Is this AI-generated, or is this something a human put together?”

This article has been fully researched and written by a human.

