行业焦点
人工智能:2023年科技界的主角
浏览量:752
技术的大规模发展不仅要有故事,更重要的是还得有用。
神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。
编者按:一项革命性的技术不但要有故事可讲,还要有实用性。资本需要故事,但社会需要的是有用。2023 年的科技主角,还得看人工智能(而不是区块链、Web 3.0 和元宇宙,等等)。本文来自编译,希望对您有所启发。
每年科技领域都会出现新鲜事物:可穿戴设备、移动设备、3D 打印、区块链、Web 3.0 和元宇宙。有些技术达到了炒作的效果,但大多数都没有,不过也有少数技术超过其炒作的效果。那么,2023 年的科技主角是什么?更重要的是,这项技术是会支持社会的进步,还是仅仅将更多的资本转移到那些行动迅速的人和已经富有的人身上呢?我相信,2023 年的科技主角是人工智能。我认为人类正处在人工智能的大跃进之中,由于其实用性,这项技术将是革命性的,而不仅仅是为了创造利润。
就在过去的几个月里,我们已经看到了人工智能能力的进步,甚至让怀疑论者都感到印象深刻。一位研究人员称之为人工智能的“黄金十年”。马克斯·普朗克研究所(Max Planck Institute)的一位科学家说:“人工智能将改变医学,改变研究,改变生物工程。它将改变一切。”今年的《人工智能状况报告》展示了 100 张人工智能加速进展的幻灯片。2020 年,在临床试验中没有一种药物是采用人工智能优先的方法开发的。如今,这一数字达到了 18 个。疫苗先驱 BioNTech 开发的人工智能系统,在世卫组织的跟踪系统标记之前几个月,就成功识别出了许多高风险的 Covid 变体。乌克兰使用人工智能,将下令发动炮击的时间从 20 分钟缩短到不到 60 秒。
投资也随之而来。自 2020 年以来,已有超过 1000 亿美元投资于人工智能初创企业,2021 年的投资翻了一番。美国有 102 家人工智能独角兽公司,亚洲有 38 家。
1. AI 能做什么?
人工智能没有严格的定义,但粗略地讲,它是一种以独立和灵活的方式做出决策的计算机系统。人工智能在解决问题的类别和程度上,都区别于其他计算过程。计算机处理数字的速度和精度是人类无法复制的,但它是完全基于自身的内部逻辑产生机械的、不变的结果。这并不“智能”。我手机上的系统为我输入的每个单词提供了三个选项,所以可以说它是“智能”的,因为可以根据不断变化的输入做出复杂的决定。计算机经常做人类无法做到的事情。与之相比,人工智能的区别在于,它能做人类能做的事情,但通常做得更好、更快、更便宜。
人工智能已经在流行文化中存在了好几代。而且,它在我们的生活中也悄然存在了几乎同样长的时间。人工智能目前正在影响的一些领域包括:1)导航应用:规划穿过城市的更佳路线,评估不同的道路和条件,并提供到令人发指的到达时间。2)欺诈检测:人工智能系统可以在你知道自己丢失信用卡之前,就发现欺诈费用并拒绝支付。3)社交媒体:TikTok 能够识别我们的喜好,让用户上瘾。科技巨头之间的战争选择的武器是人工智能。
人工智能对交通、金融和媒体的贡献已经超过了加密货币的价值。一个有趣的事实是,在巴哈马注册的人工智能公司很少。人工智能将带来跨学科的持续进步,就像互联网和个人电脑一样。这是有新闻价值的,但不是激发数十亿投资的原因。
人工智能的不同之处在于,它解决的是现实世界的问题,特别是那些“模糊的问题”。事实证明,传统计算技术很难解决这些问题。模糊的问题无处不在,尤其是在交流和通信过程中。例如,语音识别技术几十年来一直停滞不前,而如今人工智能正在推动它向前发展,我们正在接近实质性的自然语言交流(例如,Siri 将不那么糟糕,Alexa 将更加出色)。内容审核也是一个模糊的问题,对人类来说很困难。投资、驾驶和许多半技能任务也很模糊。生活中的大多数挑战和问题都没有一个正确的答案,但额外的数据采集,会让我们得到更好的答案。
人工智能可以识别模式并评估选项。哪条 Twitter 帖子会让我想要参与讨论,亚马逊上的什么价格会激励我点击购买按钮,以及我是否可能将 AirPods 落在家里。过去几个月见证了“生成式人工智能”的爆炸式增长。
2. 看看我用 AI 做了什么
在几个月内,三种不同的图像生成人工智能相继问世:Dall-E、Midjourney 和 Stable Diffusion。你输入文本,几秒钟后系统就会生成一张图像。Dall-E 是由 OpenAI 公司开发的,该公司最初由埃隆·马斯克等人资助,还获得了微软 10 亿美元的投资。该应用程序有 150 万用户,每天生成 200 万张图片。上个月,Stability AI 完成了 1 亿美元的融资。Midjourney 已经开始盈利了,该模型生成的一张图片成为了《经济学人》的封面,还有一张图片在科罗拉多州博览会上获了奖。这是未来的一个趋势,AI 生成的图片正在获得大型图片公司所享有的网络流量。
生成文本的人工智能也正在推出之中。用户输入一个文本提示,要求输出一种类型的文件(如促销邮件、博客文章、常见问题解答,等等),系统会自动输出。人工智能写作工具 Jasper 最近完成了 1.25 亿美元的融资。微软的 GitHub CoPilot 已经在该领域投入了一年时间,它可以在程序员编写代码时为他们提供建议,这是谷歌 Docs 的提前输入推荐功能的更强大版本。GitHub 声称,在程序员启用了 CoPilot 之后,他们会让 CoPilot 编写 40% 的代码。这些系统在结构化环境(如编码)中表现得更好,但在更自由的领域,如幽默方面,则很挣扎。艾伦·图灵(Alan Turing)建议对人工智能进行这样的测试:人工智能能让我们相信它是人类吗?但我认为,一个更好的测试可能是它是否能让我们发笑。
这些系统可以在许多领域补充或取代人类创造者。它们可以成为强大的创意工具,在一个主题上产生许多变化,特别是一些随后可以由人类艺术家调整和改进的东西,例如设计标志和撰写标语。人工智能已经被一些媒体机构用于生成体育报道,其中的信息包含大量的数据,而系统可以根据数据来创建文本。视频生成技术正在开发之中,定制媒体也会随之而来。比如,“Siri,给我看一部 110 分钟的电影,讲的是一个英俊的秃头男克服重重困难,成为世界上最伟大的调酒师的故事。而且要斯坦利·库布里克(Stanley Kubrick)风格的电影。”
生成式人工智能系统的大量涌现,源于几年前 Alphabet 旗下谷歌大脑研究小组的研究人员取得的技术突破。这些系统是“神经网络”模型,它通过回顾实例(如诗歌、食谱、面孔、歌曲)来进行“训练”,从而建立一个内部的模型。在系统回顾了几百万张面孔之后,它就能可靠地将一张新面孔与它以前见过的面孔区分开来,或者,在更先进的形式下,生成一张全新的面孔。
谷歌的突破被称为“转换器”(transformer),它比以前的系统更能关注到整个画面。计算机,甚至是人工智能,都喜欢一步一步地进行,不擅长处理上下文。这就是为什么许多人工智能生成的艺术看起来都像毕加索风格一样难以理解,比如,鼻子从头的一侧长出来,人没有胳膊,腿又太多。系统知道一张脸有一个鼻子,但它不善于保持鼻子相对于眼睛和嘴巴的正确位置。“转换器”的设计使用了巧妙的技巧,因此系统可以同时“思考”鼻子、眼睛和嘴巴。“转换器”神经网络的上线很快带来了改进,下面两张图像的生成时间仅相隔几个月,虽然两张图像都不完美,但能看出有所改进。
3. 炒作周期
泡沫伴随着动荡,随着人工智能步伐的加快,炒作机器正在启动。毫无疑问,会有人工智能骗局的出现,或者拥有大量社交媒体粉丝的人,会大量投入和倾销以人工智能为中心的投资、代币、项目等。我们有必要将人工智能与加密货币进行比较,这在一定程度上是一个警世故事。
人们以为加密货币会改变世界。在陷入崩溃之前,FTX 把自己比作以下发明:轮子、马桶、咖啡、宪法、灯泡、洗碗机、太空旅行和 MP3 播放器。Crypto 是一项革命性技术的一半,一个承诺的一半:消除中介的数字货币。它由一个名叫中本聪(Satoshi Nakomoto)的实体创建,运行在一个叫做区块链的东西上,足够不透明,看起来有巨大的前景,有着未实现的潜力,所有这些都吸引了资本。更多的资本意味着更多讲故事的人,更多讲故事的人意味着更多的承诺,更多的承诺意味着更多的资本,于是轮子就这样转动起来了。
迄今为止,这个新轮子是一个高度杠杆化的庞氏骗局,因为加密货币缺少任何持久技术创新的另一半:实用性。我们知道,人工智能是有用的,它为我们的搜索引擎、医学研究和欺诈检测提供了动力。判断一场技术革命要看它的实用性,而不是炒作。“2022 年的加密货币”和“2000 年的互联网”并不一样,因为 2000 年的时候我们大多数人都在使用互联网。
类似于任何规模化的技术,或任何创造经济价值的机制,人工智能带来了外部性。人工智能既有故事,也有实用性,这是 2021 年和 2022 年的技术(Web 3.0 和元宇宙)没有提供的东西。
译者:Jane