- 洞察AIGC:智能创作的应用、机遇与挑战
- 李海俊
- 9751字
- 2024-12-28 12:32:47
第1章 开启AIGC的魔盒
1.1 AIGC的来历与预言
AIGC是三个单词的缩写,即Artificial Intelligence(人工智能)、Generated(生成的)和Content(内容)。AI指的是一种模拟人类智能的技术,可以通过机器学习、自然语言处理和计算机视觉等方法,实现从数据中学习和理解规律、做出决策和完成任务等功能。Generated是动词generate的过去分词形式,表示这些内容是由AI程序生成的而非由人类创作。Content意为“内容”,指文本、图像、音频、视频等各种形式的信息。AIGC是指借助预训练(超)大规模的模型、生成式对抗网络(GAN)等AI技术,对已有数据进行规律性的提取和总结,最终通过释放泛化能力(1)生成多样化内容。2022年,除了越发流行的ChatGPT文本内容生成,在图像生成方面,Disco Diffusion、Midjourney、DALL·E(2)和Imagen AI等也是效果惊人,而这只是AIGC的一个缩影,还有用MusicLM生成音乐、用GET3D生成三维物体等。
如图1-1所示的两张图都是AIGC的杰作,图1-1(a)是AIGC工具NightCafe基于DALL·E创作的中国长城的美图,你会感觉它似乎有哪里不对,但总体的感觉又十分壮观。实际上,生成它的逻辑是基于人们对长城的各种典型概念和印象而形成的。图1-1(b)是2022年美国一家游戏公司的总裁杰森·艾伦(Jason Allen)基于包括Midjourney在内的AIGC工具创作的数字化作品“太空剧院”,这幅画在科罗拉多州博览会上获得数字类第一名。这是基于AIGC生成的艺术品对传统艺术的第一次重大挑战,关于它是否是真正的艺术创作的争论仍在进行,但丝毫不影响AIGC的崛起。
图1-1 AIGC生成的“中国长城”与“太空剧院”
资料来源:NightCafe & The New York Times
简单回顾AIGC发展的历史,可以追溯到20世纪50年代,当时人们开始研究计算机语言和自然语言处理技术,这是AIGC的雏形。在接下来的几十年里,研究人员不断探索和改进各种机器学习算法,并应用于文本、图像、音频和视频等多个领域,随着计算能力的提高和深度学习算法的发展,AIGC取得了重大突破。回顾这些里程碑事件,包括:2014年,谷歌发布了一种基于深度学习的图像识别系统,大幅提升了计算机对图像的理解能力;同年,微软也发布了一种基于机器学习的自然语言处理系统,成功地生成了与人类写作相似的文章;2016年,OpenAI发布了一个名为GPT的自然语言处理模型,由175亿个参数组成,这是当时最大的模型之一(如今已超千亿参数),该模型可用于生成各种类型的文本内容,包括新闻报道、故事和诗歌等;2018年,Facebook的AI系统开发了自己的语言并与其他机器人进行了对话,虽然该事件被关闭,但是它激发了对于AI意识形态的讨论;2020年,OpenAI的GPT3模型推出,成为目前最具代表性的自然语言处理模型之一,其性能超越了以往所有的模型;2022年11月,OpenAI推出轰动世界的AI聊天机器人ChatGPT。现如今,AIGC已经广泛应用于各个领域,随着技术的不断发展,AIGC内容的应用前景也越来越广阔。根据国外商业咨询机构Acumen Research and Consulting预测,若考虑下一代互联网对内容需求的迅速提升,2030年AIGC市场规模将达到1100亿美元。Gartner则预计:到2025年,大型企业30%的对外营销信息将是合成的,在2022年这一比例还不到2%;到2030年,一部重要的大片上映时,影片中90%的文本及视频将由AI生成,而2022年则没有此类影片。
AIGC的两个代表性项目是ChatGPT和DALL·E,它们都是OpenAI的杰作,前者生成文本,后者生成图片,当然OpenAI还有音乐生成器MuseNet。这两个项目自推出以来得到了业界广泛的关注,并在社交媒体上表现突出,不少人将ChatGPT3比喻为推动AI走向工业时代的“蒸汽机”。如图1-2(a)展示了过去一年,ChatGPT与DALL·E在谷歌被搜索的趋势,显然ChatGPT受到极大的追捧。如图1-2(b)则展示了国内在2023年2月对ChatGPT和AIGC的搜索热度的暴增,数据显示,ChatGPT在此期间的整体日均搜索量达到了20万,尤其是在2月9日达到85万,整体环比增长970%。
图1-2 ChatGPT、DALL·E及AIGC的热度
图1-2(续)
资料来源:谷歌与百度搜索引擎生成,2023
最新版本的DALL·E 2于2022年4月公布。DALL·E和DALL·E 2是深度学习模型,可以根据用户的自然语言提示生成图像。与DALL·E相比,DALL·E 2可以生成分辨率更高的图像,更加逼真,并能结合各种风格。令人兴奋的是,2023年3月,谷歌宣布会将类ChatGPT的AI整合到其办公套件Workspace中,微软则紧随其后宣布推出Microsoft 365 Copilot,即在所有的微软办公套件中(Word、PPT、Excel、Outlook、Teams、Microsoft Viva、Power Platform)内置GPT4的功能,通过Microsoft 365 Copilot而不是需要安装额外独立的互联网或桌面软件,用户凭借最通用的界面和自然语言,就能轻松玩转AI工具,如图1-3所示。AI平民化的时代来临了,其冲击就像个人电脑进入家庭时一样。
图1-3 基于ChatGPT4智能生成的PPT
资料来源:微软官网,2023
为了说明内容生成历史的若干阶段,诸多媒体把AIGC定义为一种全新的数字内容生成与交互的形态。它是继专业生成内容(Professional Generated Content,PGC)、用户生成内容( User Generated Content,UGC)之后的新范式。所谓范式是指公认的模式,AIGC来得如此之快,以至于网上已到处可见AIGC生成的文本与图像资料。其实对于AIGC建立统一的定义还为时尚早,随着AIGC的边界不断扩大,通常由它所在领域的领导者提供更为精准的定义。正是由于技术的突破来得着实令人兴奋,业界大多数AIGC的描述更多强调它的技术优势,即围绕高效和高质的自动化与个性化来阐述,这与AIGC技术作为高科技、高估值的属性是相关的。事实上,所有的AI产品并非仅靠技术就能成功,关键还是应用,而应用就需要有庞大的内容与素材基础来训练。即使可以使用混合数据,但也是基于实际数据训练来建模、模拟生成的。
相较于传统的PGC、UGC,除了了解AIGC与它们存在着生成者主体的区别外,更为重要的是了解它们之间的关系。PGC是最早的内容生成形式,在最初的发展阶段中,学会使用个人电脑完成一系列的注册和内容编辑和发布,并不是常人可以做到的。当PGC进入“百家争鸣”时代,这些核心观点或理念需要通过交互来形成热门话题,并形成反馈的热度和流量经济。这种广泛的讨论生成了新的内容,即把一个专业话题作为内容的“树干”,通过众人参与交互形成了一棵完整的“话题树”,从而最终形成一片“话题的树林”,这时关于各领域的内容素材已十分丰富。随着移动互联网的发展,特别是短视频的推出,使全民轻松互动成为现实,由此这个“话题的树林”飞速成长,相互交织,形成了“话题的森林”,甚至达到了信息爆炸的状态。另外,算力提升不仅促成了“话题的森林”,同时也助推了算法的进步。算力由“后摩尔定律”(3)推动前行,即使有所放缓但依然增长迅猛。这时,AIGC出现了,以基于千亿级参数的模型和算法及神奇的输出效果吸引了全球的眼光,机器以超越人类预期的水平与人类展开了内容的对话。我们看到,AIGC的神奇实现固然归功于算力和算法的进步,而更为重要的是归功于它的要素来源——超大规模的内容池——“话题的森林”。例如,如今AIGC也不能生成任意的内容,在用户需要对特定图像进行再造时,依然需要向机器提供素材。可以预见,PGC和UGC并不会消失:一方面AIGC借助前两者的内容基础生成新内容;另一方面,PGC和UGC会聪明地根据AIGC的模型特征产生新的内容,这些内容又会被AIGC捕获或采集,经过再次重组反馈给用户,这样就形成了一个新的循环。那么,为什么PGC和UGC会向AIGC定向生产内容呢?毕竟AIGC已是一种新的门户与入口(Portal),从市场营销的角度来看,任何希望提升品牌地位的组织或个人,都希望他们的信息出现在AIGC生成内容的首屏,那么新的内容就必须根据AIGC生成的规则进行优化,就像今天AIGC工具根据Google的搜索排名规则,来优化用户生成的营销方案的逻辑。总结一下,PGC、UGCT和AIGC的关系如图1-4所示,内容生成的四个阶段并非是相互取代的关系,它是一种升级,后者以前者为基础,前者则更多地融入后者中,而所有阶段综合产生的混合数据又更进一步地推动AIGC的发展。
图1-4 内容生成的四个阶段
资料来源:根据a16z、ShineINFAITH、Muse Labs,2023年提供的图片修改
如果我们需要区分AIGC与人类内容创作的区别,可以用“农夫山泉”的一句广告词来映射AIGC——“我不是内容的生产者,我是内容的智能搬运工”,只是这种搬运确实越发智能了,不仅知道搬运什么,还知道在搬运的时候如何最优化“进销存”。既然AIGC是一种智能的内容搬运工,那么局限性也就容易理解了,混合数据的出现使AIGC不再依赖人类产生的数据,但并不意味着AIGC会产生人类创意的数据。虽然AIGC在某种程度上拟合出了人类未曾思考的领域或维度,但AIGC永远不会像人类那样创新。无论是哪种内容创作,其程序都包括生产者对信息的筛选、过滤、加工、整合等步骤。有些观点认为:在PGC时代,这一系列的过程都是建立在创作者长期独立研究的基础上,花费了大量的时间和脑力。当PGC和UGC的生产潜力被耗尽时,AIGC或许可以弥补内容生态的不足。事实上随着科技的发展,专业的内容始终对人类有着极大的依赖,我们可以通过AIGC生成普适的内容,但不能指望它生成新的知识(AIGC生成的随机的创新内容和专业的创新内容是两回事),而且PGC通过使用AIGC工具,会挖潜其巨大的生产力,而不是在AIGC面前瘫软下来而耗尽精力。AIGC就像AI在诸多领域应用的场景,它确实可以突破很多人为的限制,包括不知疲倦地不断尝试,高效地生成与规定运作的反复执行,它也将逐步学习人类的创作方式,从而创造出更丰富、更多样的内容。理论上,AIGC将实现内容生态的无限供给,考虑到生产效率和专业性,其内容质量将基于PGC和UGC,在特定领域和场景下有可能超过PGC的部分内容,PGC、UGC、AIGC之间的关系见表1-1。
表1-1 PGC、UGC、AIGC之间的关系
资料来源:Renaissance Rachel
基于硅基的二进制机器的智能生成,有可能在基于碳基的优秀人类的训练下,普遍超越基于碳基的一般人类的能力吗?作者认为有一部分是会的,就如通过搜索引擎查询信息,一定比人类在图书馆手动搜索来得强大一样,基于大模型算法在规范性内容的处理上已远超越人类。由2022年苹果公司推出、台积电代工的M1 Ultra芯片含有1140亿个晶体管,而人类大脑中仅有130亿~140亿个细胞,如果将晶体管与细胞都看作一个微观世界的计算单元,那么在数量上,人脑显然已是相形见绌了。即便如此,机器与生命不是一回事,人类的智能的抽象性(这与AIGC基于已有内容生成抽象内容并不一样)和低能耗是机器不可比拟的,AIGC代表的生成式AI会成为卓越的工具,但在各种应用场景中,其背后依然是基于人类智慧,并且为人类所用。因此,在AI走向人类智能的过程中,重要的突破来自两者交叉科学的探索与发现,其主要趋势为:基于硅基物理架构支撑的系统向碳基生物计算突破。反之,也可以理解为,将更多碳基生物思考与运作的方式更多地应用于硅基系统。如图1-5展示了M1 Ultra芯片中的计算单元,其晶体管数量已远超人类大脑中的细胞数量,达到了后者的7倍之多。在我们欢呼人类在芯片产业创举的同时,另一拨科学家正在不断探索大脑的奥秘,例如美国哥伦比亚大学和西奈山伊坎医学院研究人员正在开展一个项目,该项目将生成整个人类大脑及其所有细胞的综合图集。这些数据可帮助揭示大脑的结构和组织如何在疾病和健康中产生行为、情感和认知,这都将为硅基计算提供新范式的参照。芯片科技与生物科技,必然与必定走到一起,对于AI的发展来说更是如此,即AI正在更多地学习人类,探索走向人类智能的道路。
图1-5 芯片的晶体管数量已远超人脑细胞的数量
资料来源:苹果官网& Tamas实验室
由于AI技术的进步和更复杂算法的出现,同时随着质量的上升和成本的下降,AIGC正在不断普及。公司正越来越多地转向AI生成的内容,以减少人工创建内容的负担并节省成本。具体应用包括AI写作、AI配乐、AI视频生成、AI语音合成以及近段时间火遍全网的AI绘画——只要简单输入几个关键词,几秒钟时间一幅画作就能诞生,这可以更有效地节省时间和资源,并提高内容的质量。除了图片的生成,更常见的是输入一篇文章的描述,或者只是故事的开头,让AI为你完成文章。凡是需要写作或内容创作的地方,它都有广泛的应用,如撰写财务报告、开发代码、创建销售/营销材料。AIGC可以帮助人们更快地理解和分析复杂的信息,从而帮助他们做出更好的决定并产生重大价值。AIGC还可以用于创建可量化的内容,并使用数据驱动的方法来给出建议,以提高内容的质量。此外,AIGC可以更有效地分析和汇总数据,以便更好地理解客户的行为和需求,为客户提供更个性化的内容。AIGC可以用于创建丰富的多媒体内容,如图像、视频和音频。它可以用于创建自动化的新闻报道或分析,以及动态的广告内容。此外,AIGC还可以用于创建和管理大量的内容,包括社交媒体内容,以满足客户对个性化与时效性等方面更高的需求。
如表1-2所示,展示了AIGC与人类角色的特点,AIGC首先是人类的智能助理,而人类承担了真正的知识管理工作,AIGC是人类知识管理工作的一部分,需要人类的训练、监督和优化。AIGC体现在上述内容的诸多专业的领域,而人类代表了通用智能,AIGC正在更多地学习人类,向人工通用智能进化;AIGC是完成了知识编纂,而更复杂、非常规以及在互动过程中的隐性知识的传递是人类完成的。最后,AIGC是拿来即可,它试图回答知识“是什么(what)”及“如何(how)”的问题,“如何(how)”是指人类在处理(大)数据时容易忽略的维度,总有一些影响的过程与环节容易被疏漏,但人类善于想象、比喻、解释、推论、预测,培养下一代专家并承担人类特有的职责。
表1-2 AIGC和人类在管理知识方面的共生关系
资料来源:根据人工智能和知识管理,Mohammad Hossein Jarrahi等,2023改编
随着与用户的交互越来越多,每个用户都在所使用的AIGC中形成了用户画像,这使AIGC的个性化成为可能,AIGC得以从用户的问题中判断其性别、性格、年龄、职业、兴趣爱好,甚至目前的工作重点和职业发展需求,这都使AIGC提供充分满足个人需求的自动化服务流程,提供更为精准的深度定制。定制又使AIGC生成的内容更有吸引力,如互动故事、互动视频和互动游戏。当然,AIGC可以使用深度学习算法来创建更加自然的内容,更好地模仿人类语言表达,这样就可以改善和完善客户对产品的体验,并在更多渠道上推广产品与服务,吸引更多的用户。
AIGC能够实现如此强大的功能,主要是因为它由以下三大前沿技术支撑:
· 数字内容孪生能力:构建现实世界到虚拟世界的映射,孪生能力包括智能增强与转译技术,其中增强技术弥补内容数字化过程中的信息损失,转译技术在理解基础上对内容进行多种形式呈现。
· 数字编辑能力:打通现实世界到虚拟世界的交互通道。编辑能力包括智能语义理解与属性控制,语义理解帮助实现数字内容各属性的分离解耦,属性控制则在理解基础上对属性进行精确修改、编辑与二次生成,最终反馈于现实世界,形成孪生—反馈闭环。
· 数字创作能力。从数据理解向数据创作转变,创作能力可分为基于模仿的创作与基于概念的创作,前者基于对某一类作品数据分布进行创作,后者从海量数据中学习抽象概念,并基于概念创作出现实世界不存在的内容。
AI内容生成器的工作方式是通过自然语言处理(4)和自然语言生成(5)方法生成文本。这种形式的内容生成有利于为企业提供数据,根据用户行为定制内容并提供个性化的产品描述。文本生成模型一般通过无监督的预训练,语言转换模型从大量的数据集中学习和捕捉无数有价值的信息。在这样的海量数据上进行训练,可以使语言模型动态地生成更准确的矢量表示和带有上下文信息的单词、短语、句子和段落的概率。由于梯度消失问题(6),传统的递归神经网络(RNN)深度学习模型在长期建模的背景下步履蹒跚。转换器(Transformers)则不同,它克服了梯度消失问题,因为语言模型随着数据和架构规模的扩大而扩大,转换器实现了并行训练并能够捕获更长的序列特征,使更全面有效的语言模型的突破成为可能,因此转换器正在迅速成为NLG的主导架构。今天,像GPT3/4这样的AI系统被设计为生成类似人类创造力和写作风格的文本,而大多数人类一般难以分辨。这样的AI模型也被称为生成式AI,即可以为广泛地使用案例创建新颖的数字媒体内容和合成数据的算法。生成式AI的工作原理是生成一个物体的许多变体,并对结果进行筛选,以选择那些具有有用的目标特征的变体。AIGC基于算法生成内容,而算法是在大量的数据上训练出来的。然后根据这些数据和一点点用户的输入返回输出结果,关键是,内容是新的,而且是自动生成的。生成式AI算法最常见的例子是ChatGPT。GPT3/4在互联网中的大量人类文本上进行训练,并“教导”语言模型在与用户互动时如何回应。其他生成式AI程序的工作方式与此类似,它们被训练来发展一套知识体系,并使用这些知识来创造新的输出。目前许多商业生成式AI产品都是基于OpenAI的生成式AI工具,如ChatGPT和Codex,下面我们大致了解一下不同内容的生成形式和目前所处的阶段。
· 文本与代码:文本是最先进的领域。自然语言曾经是一项巨大的挑战,它对质量要求很高。今天,这些模型在通用的短篇/中篇写作方面还算不错(但即便如此,它们通常也是用于迭代或写出一个初稿)。随着时间的推移,模型越发健壮,高质量的成果正在输出——质量更高、内容更长以及更好地面向用户特定市场或需求的调整。如GitHub CoPilot所示,代码生成在短期内可能会对开发者的生产力产生很大影响。它也将使非开发人员更容易获得对代码的创造性使用。
· 图形图像:相对于文本来说是一个较新的应用,但它的娱乐性显然好过文本,因此像病毒一样传播开来,这些应用和ChatGPT 一样易于使用,创意力非常惊人。在Twitter上分享生成的图像比文字要有趣得多,可以看到具有不同审美风格的图像模型,以及编辑和修改生成图像的不同技术。例如,设计一个logo,未来的大部分人,包括设计师第一时间都会通过AIGC辅导设计,这并不是说机器真的具备智慧,但算力的构建能力可以在人脑出现疲惫的时候持续给出质量稳定的呈现。
· 语音合成:它的出现已有近十年时间了(还记得“你好,Siri!”吗?),但消费者和企业应用才刚刚开始。对于像电影和播客这样的高端应用来说,要想获得听起来非机械化的、具备一次性完整表达能力的、类似人类质量标准的语音是非常困难的。但未来是令人期待的,就像图像生成,今天的语音合成模型将为持续完善以达到高质量输出的商业性应用提供一个快速发展的起点。
· 视频和3D建模:这个更为复杂的领域正在迅速崛起。人们为这些模型通过大量生成创意内容所能创造出的新型市场的潜力感到兴奋。例如,电影、游戏、VR、建筑和物理产品设计。研究性组织正在发布基础的视频和3D模型,以便于形成新的产业链以衍生出不同应用,未来的大部分视频作品均可能借助AIGC生成。
如图1-6所示,我们通过AI图片自动生成引擎Midjourney在十几秒的时间内分别生成了上海春天的冬天的鲜花,图片清晰地呈现了城市和季节的特征,其美感和质量已超过了很多美工PS出来的效果。我们可以看到,当我们给出不同的指令(极其简单的英文关键词命令,通常以/imagine呈现)之后,类似的图片会持续生成出来,新的图片视角不同,但美感依然。对于那些十分模糊的指令,通常图片的生成是虚幻的,但并不是没有内容,一个模糊的指令会对应一个模糊的图片渐变地产出,图片呈现的内容可能什么都不像,却有一种神秘感。其实面对这种模糊,可以不断增加清晰的关键词,直到做出自己满意的图片,比如不再用关键字,而是用一段文字,比如“朝阳冉冉升起,一条弯弯的河流穿过一条中国特色的古镇,河流上飞过几只欢快的鸟儿”。
图1-6 AI生成图片:上海的鲜花
资料来源: Midjourney
除如上几个经典的应用场景,许多领域都在进行基础模型的研发,从音频和音乐到生物和化学。这些应用五花八门,不胜枚举。
· 文案写作:市场对个性化网络和电邮内容的需求日益增长,它可以用来促进销售和营销策略以及客户支持,这些都是语言模型的完美应用。公司在市场竞争中面临时间和成本的压力,更为快速、简明扼要且具有个性风格的言语表达,在应用中已出现。
· 细分市场的写作助手:今天的大多数写作助手都是横向的,或称大众化的,AIGC正在为特定的专业领域建立更好的生成性应用,从法律合同写作到编剧,这里的产品差异化在于对特定工作流程的模型和用户体验模式进行微调。
· 代码生成:目前的应用为开发者提供“涡轮增压”的助力引擎,使他们的工作效率大大提升。GitHub Copilot现在在安装它的项目中生成了近40%的代码。但更大的机会可能是为消费者打开了编码的通道。
· 艺术的产生:整个艺术史和流行文化被编码在大型模型中,允许任何人随意探索以前需要用一生才能掌握的主题和风格。
· 媒体/广告:想象一下将代理工作自动化的潜力,并为消费者优化广告文案和创意。这里有多模式生成的巨大机会,将销售信息与互补的视觉效果配对。
· 设计:数字和实体产品的原型设计是一个劳动密集型和反复的过程。粗略的草图和提示的高保真渲染已经成为现实。随着3D模型的出现,下一代的iPhone到新款的高尔夫球鞋都可能是由机器设计的。
· 游戏。梦想是使用自然语言来创建复杂的场景或可操纵的模型。最终状态可能还很遥远,但有一些更直接的选择在短期内可操作,如生成纹理和天空盒艺术。
为了发挥一下ChatGPT的功能,我们总结了在过去一年多的时间中,诸多知名研究院发布的AIGC报告,根据发布的时间顺序让ChatGTP来对这些资料做一下介绍,见表1-3。与ChatGPT的问答形式很简单,通常通过以下列出的几种方式让ChatGPT做出回答(这些报告中比较重要的图表由笔者整理)。
(1)输入资料名称;
(2)介绍一下×××;
(3)×××的主要内容是什么?
(4)再试一下;
(5)请补充更多内容。
当ChatGPT找不到内容而回答“抱歉”时,可以重复同样的问题。
表1-3 关于各大媒体或研究院发表AIGC报告的总结
续表
续表
续表
续表
续表
资料来源:ChatGPT及各大机构的报告
在过去的几年里,对AIGC的投资大幅增长。根据CB Insights的一份报告,自2015年以来,全球AIGC领域的投资规模一直呈增长趋势。AIGC初创公司的总投资资本从2018年的73亿美元增加到2020年的199亿美元,增长了近两倍。2019年全球AIGC领域的投资金额达到了近440亿美元,2020年受新冠疫情影响有所下降,但仍然接近350亿美元。这种增长主要是由于对AI和自动化产生的内容的需求增加,以及自然语言处理(NLP)和自然语言生成(NLG)技术的进步。AIGC领域的主要参与者,如Persado、Automated Insights和Narrative Science,在过去几年都有大量投资。从投资类型来看,种子轮和天使轮投资仍占据着较大的比重,但随着行业的发展,中后期和上市融资的投资也在逐步增加。从投资领域来看,图像识别、语音识别、自然语言处理等技术是最受关注和投资的领域。此外,医疗健康、金融、教育等行业的应用也成为投资的热点。亚洲地区在全球AIGC领域的投资中日益发挥着重要的作用。中国、印度等亚洲国家的AIGC企业和初创公司正在吸引越来越多的国内外投资者,其中,中国是全球最大的AIGC投资市场之一,2019年中国AIGC领域的投资规模约为150亿美元。
除了AIGC领域的专业投资机构之外,越来越多的传统行业企业也开始涉足AIGC领域的投资。这些企业希望通过投资AIGC技术和企业,加速自身数字化转型的进程,提升自身的竞争力。另外,政府在推进数字经济发展的过程中,也将AIGC技术视为重要支撑。因此,在一些国家和地区,政府会设立专项资金用于支持AIGC领域的研究和应用,并鼓励民间投资。需要注意的是,尽管AIGC领域的投资呈现出较快的增长态势,但由于该领域的技术和商业模式还比较复杂,投资具有一定的风险性。因此,投资者需要通过深入的调研和分析,选择具备实力和潜力的AIGC企业进行投资。同时,监管部门也需要制定相应的政策和标准,规范AIGC领域的投融资活动,维护市场的稳健运行。
如图1-7所示,2023年1月23日,微软宣布与OpenAI展开全新合作,未来将追加投资数十亿美元,2月2日,微软宣布旗下产品将全线整合ChatGPT,对于微软而言,ChatGPT在拟人化交流、即时生成内容等方面对必应(Bing)的赋能有望助其突破谷歌的桎梏,作为回应,谷歌即刻投资Anthropic并计划推出类似ChatGPT的大型语言模型。除了加码AI文本、代码生成以外,海外巨头如Meta、Netflix亦着力布局音频、视频等内容生成,未来人机协同或是大势所趋。
图1-7 AI海外巨头争相加码AIGC
资料来源:慧博智能投研
麦肯锡的报告显示,全球数字化劳动力市场规模将迅速扩大,2030年有望达到1.7万亿元,其中交互应用、企业流程优化、工业应用、特殊应用规模分别达6247亿元、5213亿元、3215亿元、2583亿元。AIGC是数字化劳动力的又一次爆发和最主要的组成部分,其领域的投资规模也在不断扩大。未来,随着技术的进一步成熟和应用场景的拓展,AIGC领域的投资规模还将继续增长。
最后,我们利用ChatGPT来挖掘一下目前关于AIGC报告内容的共性。
(1)技术原理:介绍AIGC的技术原理,包括机器学习、深度学习、自然语言处理等相关技术。
(2)应用领域:探讨AIGC在不同领域的应用情况,如广告、新闻、文学创作、音乐、视频等。
(3)优缺点分析:对于AIGC的优势和局限性进行分析,包括生成效率、内容质量、版权问题、道德风险等方面。
(4)行业趋势:展望AIGC未来的发展趋势,探讨其可能带来的变革和影响,包括人类创作角色、版权保护、产业链变革等方面。
(5)投资价值:评估AIGC的商业化前景和投资价值,对相关公司及市场进行分析和预测。
总之,现在关于AIGC的报告内容主要围绕着技术原理、应用领域、优缺点分析、行业趋势和投资价值这几个方面展开,旨在为读者提供全面的了解和参考。