生成式人工智能工具正在迅速改变多个领域,从营销和新闻到教育和艺术。
这些工具使用算法从大量培训材料中获取新的文本、音频或图像。虽然 ChatGPT 和 Midjourney 之类的工具可以用来实现超出人类能力或想象力的艺术效果,但目前它们最常用于比人类更轻松地制作类似人类的内容。结果是不可思议的——让许多人质疑我们是否(或何时)可以认为人工智能已经变得真正智能,甚至有感知能力。
尽管如此,无论他们将其用作工具、作弊还是实验性的新艺术形式,那些将要使用生成式人工智能的人都会使用它。出于对哪些文化最渴望采用这些诗意算法的好奇,Electronics Hub分析了 Google 搜索数据,以确定搜索文本、语音、音频和图像机器人最多的国家/地区(因为这份数据是基于Google 搜索量进行统计,因此本文中的区域未涉及到中国地区)。
随着 GPT3.5 和 4 的发布以及 Google 工程师 Blake Lemoine 等头条新闻宣布他相信该公司的聊天机器人已经变得有感知力,文本生成在 2022 年成为超新星。此类工具迄今为止具有最广泛的适用使用价值。它的搜索量远高于图像生成工具,因为求职者和受人尊敬的网站使用它来生成书写工整(尽管实际上存在缺陷)的句子。
然而,考虑到人工智能模型很快就会在大量人工智能生成的互联网内容上进行自我训练,人工智能文本工具的可持续大规模使用还有待观察:“就像我们在海洋中撒满了塑料垃圾并填满了塑料垃圾一样。”剑桥大学安全工程教授罗斯·??安德森(Ross Anderson)警告说,“大气中充满了二氧化碳,所以我们将让互联网充满废话。”
文本到图像生成的突破是 2022 年人工智能的故事。Dall-E 2 的出现引发了一场人工智能军备竞赛,迫使 Midjourney 和 Stable Diffusion 等竞争对手的工具公开,并放大了文本生成进步的影响。
尽管随着这些发展,新兴的“提示主义”艺术技术蓬勃发展,但文本转图像的用户群体比文本生成的用户群体要窄得多,因为语言是我们每天都使用的东西。例如,新加坡的文本和图像人工智能搜索量位居第二,但新加坡文本生成的搜索量比文本到图像的搜索量高出近十倍。
“这是艺术家冒险之旅的一部分:发现自己的声音,并努力寻找使自己独一无二的品质组合,”音乐家汤姆·威茨 (Tom Waits) 说道。“现在我遇到了这些不择手段的分身——我邪恶的双胞胎,他们正在破坏我所做的每一个举动。” 碰巧的是,威茨在 2006 年就使用人类模仿者发表了这样的言论,当时远远早于用人工智能复制他的声音是可行的。
然而,正如最近的假 Drakes 和 Weeknds所表明的那样,由于可以通过应用程序制作音频假货,因此它们可能会飙升。拉丁美洲国家在人工智能音频技术的搜索方面处于领先地位。也许Facebook 和 Google 推出的新的样本友好型人工智能工具将推动下一波拉丁音乐热潮。
视频是人工智能的圣杯——但目前还没有实现。无论有没有人工智能,制作每秒移动 20 次以上的令人信服的图像都是昂贵且困难的。迄今为止,合成视频的最佳用例包括自动生成移动图像的一部分(例如,深度伪造视频中的面孔)或为企业目的创建简单的、以头像为主导的视频。这就是Synthesia的卖点,它是全球搜索次数第二多的视频 AI 工具。
视频人工智能是英语国家搜索量最大的一个类别,其中新加坡(其官方商业语言是英语)位居第一。与此同时,Vimeo 大力发展人工智能,宣布推出一套由人工智能驱动的脚本生成和编辑工具,即使文本到视频仍处于开发阶段。
大约 200 年前,阿达·洛夫莱斯 (Ada Lovelace) 就预见到了计算机算法生成图像和声音的能力:“例如,假设和声科学和音乐创作中音高的基本关系容易受到这种表达和适应的影响,引擎可能会创作出任何复杂程度或程度的复杂而科学的音乐作品。” 然而,就目前而言,生成式人工智能的重大突破和关键使用价值是其理解和利用自然语言的能力,这是顶级图像和声音工具以及文本生成的基本要素。
文本工具是全球 129 个国家最受欢迎的人工智能解决方案,因为它们有效且适用范围广泛。除了引人注目的 ChatGPT 之外,Quillbot 也因其简单的界面而大受欢迎,尤其是在非英语国家,它有望以 20 多种语言快速、整齐、流利地重写粘贴的文本。
虽然像 Dall-E 2 和 Midjourney 这样引人注目的工具对于大多数人来说只不过是新奇的玩具,但它们具有不可思议的能力,可以在想象它们已经拥有了一系列风格的时间内(大部分)以各种风格变出令人信服的图像。对设计师和插画师产生了巨大的影响。一些人寻找人工智能解决创造性(或管理)问题的方法,一些人将其整合到实验工作流程中,而另一些人——那些处于最不稳定职位的人——正在失去工作,或者面临着对人工智能时代“生产力”不切实际的期望。
我们发现,图像生成搜索量最高的地区是世界上最富裕的国家。这与国际货币基金组织的担忧不谋而合,即“新技术可能会将更多投资转移到已经建立自动化的发达经济体,从而扩大富国与穷国之间的差距”。
与此同时,最新的尼康相机广告活动旨在说服摄影师——或者那些雇用他们的人?——人工智能图像所展示的一切都无法捕捉到“自然智能”的奇迹。
洛夫莱斯 (Lovelace) 在 1843 年写道:“分析机没有任何自命不凡的创造能力。 ” “它可以做任何我们知道如何命令它执行的事情。它可以遵循分析,但它没有能力预测任何分析的启示或真相。它的职责是帮助我们提供我们已经熟悉的东西。” 洛夫莱斯无意中强调了当今生成式人工智能的一些最好和最差的地方:它是一个递归机器,只根据我们给它的东西进行训练,但结果仍然让我们震惊,因为它们将熟悉的东西与新颖的或以前不可能的东西结合起来。
目前,人类对人工智能的主要用途似乎是完成日常写作任务:最流行的人工智能工具 Quillbot 和 ChatGPT 分别是搜索最多的图像工具(Midjourney)的十倍和六倍。排名前五的文本工具的平均搜索量是排名前五的图像工具的6.6倍。历史正在我们眼前被书写——或者说被重写。