原文来源:MetaverseHub
近期,一款名为 ChatGPT 的 AIGC 工具迅速走红,以一种「杀疯了」的架势占领了海外各大媒体平台,短短五天斩获百万用户,成为了 2022 年当之无愧的杀手级应用,连首富埃隆马斯克都不禁发出了「许多人陷入了对 ChatGPT 的痴迷当中」的感慨。
ChatGPT 不仅仅是一个聊天机器人,还可能是 AGI 领域的重要里程碑事件。和让用户有时候哭笑不得的 Siri 不同,用户和 ChatGPT 的互动可谓丝滑,无论是作为搜索引擎、解答问题、做数学题还是构建研究型文章,ChatGPT 都可以对答如流,甚至提出一些建设性的意见。
尽管当前的 ChatGPT 还不够完美,对某些问题的答案认知也很有限,导致了一些具有误导性的错误答案产生,以至于 Stack Overflow 对其进行了暂时封禁,避免混淆错误答案。ChatGPT 的错误答案具有较高的逻辑性,以至于不得不需要具有专业知识的人详细阅读才能分辨。
同时由于其缺乏专属于人类的类比思维和价值判断,用户可能会绕过 ChatGPT 的安全训练,给出用户一些具有攻击性的危险问题,因此「调教 ChatGPT」一度成为了社区热议的笑话。
然而瑕不掩瑜,ChatGPT 引爆了用户对 AIGC 的热情,其狂热的用户群体也让企业看到了 AI 时代来临的开端,ChatGPT 背后的 AI 公司 OpenAI 也再一次进入了大众视野。
这家略显神秘的公司实际上早在 2016 年就成为了独角兽公司,并在近期达到了 200 亿美元的估值,不过其在 AI 领域的建设性贡献不仅仅是 ChatGPT,下面让我们来剖析 OpenAI「开挂」般的发展旅程。
OpenAI 是谁?
OpenAI 是一家人工智能研究和部署公司,其使命是创造通用人工智能,英文叫 Artificial General Intelligence,也就是我们常说的 AGI,OpenAI 希冀确保 AGI 可以造福人类,并为之奋斗了 8 年之久。
OpenAI 于 2015 年由埃隆马斯克牵头出资创立,是一家非盈利的研究性创业公司,硅谷知名创业孵化器 Y Combinator 掌门人 Sam Altman 和 Elon Musk 作为 OpenAI 首届联合主席,为其筹得了 10 亿美金的起步资金。
在短短四年内,OpenAI 推出了用于开发和比较强化学习的算法工具包 OpenAI Gym,用于在全球游戏、网站和其他应用程序中测量和训练 AI 的一般智能软件平台 Universe,新的强化学习算法近段策略优化,Dota AI OpenAI Five,类人机械手 Dactyl,GPT 1 和 GPT 2 等诸多产品。从人工智能的底层架构出发,打造 AGI 的全方位研究版图。
2018 年 2 月,马斯克离开了 OpenAI,投身于 SpaceX,而 Sam Altman 成为了 OpenAI 的 CEO。
2019 年,Reid Hoffman 的慈善基金会和 Khosla Ventures 向 OpenAI 注入了一笔数量不明的资金。
同年,OpenAI 转型为 OpenAI LP,从一家非盈利性机构转变为半盈利性机构,在确保机构总体发展方向不变的情况下,为投资机构和员工创造具有「利润上限」的价值。之后,微软向 OpenAI 投资 10 亿美金,强强联合,共同构建具有经济价值的 AGI。
在过去的四年里,OpenAI 如有神助般的发展迅速。
2019 年, OpenAI Five 连续两场战胜了当时《Dota 2 》的世界冠军 OG,让 OG 恼恨不已。然而这也促成了在当年的 T 19 总决赛上 OG 卫冕成功,成为了历史上第一个双冠王。OG 的成员 N 0 tail 大方在社交媒体中表示,其从 OpenAI Five 的策略上学到了很多新的技术和想法。
同时, AI 生成音乐深度神经网络 MuseNet 上线,这款可以生成不通过风格音乐的软件为编曲提供了更多的想象空间。
除此之外,「小蓝小红捉迷藏」的模型在 YouTube 上一度走红,全方面的展示了程序员是如何把一帮「人工智障」通过强化学习变成「人工智能」的全部历程,OpenAI 对多代理交互中的紧急工具使用模型取得了阶段性的进展。
同年 Dactyl 实现了单手解魔方,验证了只要有足够丰富的虚拟环境和足够多的计算,即使在虚拟环境中训练 AI,这个 AI 也有可能在现实生活中工作。
时间的维度飞速前进, 2020 年,MuseNet 的升级版 AI 生成音乐深度神经网络 Jukebox 上线。而更加具有里程碑意义的是OpenAI 推出了其 API,让人工智能技术的民主化不再是纸上谈兵。
2021 年,精准图片搜索 OpenAI CLIP 和生成图像上线,将 AIGC 推向了历史舞台,而随着 ChatGPT 的爆红,OpenAI 被推向了大众视野。
OpenAI 如何实现 AI 技术民主化?
OpenAI 不仅仅有 ChatGPT 这一款产品,其主要产品包括 DALL.E 2、Whisper、Alignment、创业基金以及 OpenAI API 等,涵盖了人工智能研究领域的方方面面,为人工智能的发展和广泛应用提供了全方位的助力。
当我们想要了解 OpenAI 是如何实现人工智能技术民主化的同时,我们首先要明确的是,技术的民主化指的是向普通用户提供简化的专业技术或业务领域专业知识,用户无需进行耗时和昂贵的培训便可应用,也就是技术具有易得性、易用性等用户友好的特性。
在应用模型方面,OpenAI 涉及的范围涵盖了机器人、语言识别、图像识别、自然语言处理等人工智能重要应用领域。
ChatGPT 作为一种语言模型,通过学习和理解人类语言对话,并生成相应的答复。在论文撰写、智能搜索、编剧、编程等诸多领域,成为了对创作者和开发者而言有益的工具之一。
DALL.E 2 在今年也小火了一把, 20 s 就可以生成一张高质量的图像并可用于商用,从而允许用户快速地进行创作。Cosmopolitan 都忍不住利用其生成了一张杂志的封面,并获得了用户的好评。虽然用户需要为 DALL.E 2 支付一定的费用,但依旧大大地降低了用户制图的难度和成本。
而 Whisper 则是一款英语语音识别 AI,支持多语言的转录,并将这些语言翻译成英文。我们可以合理的设想,Whisper 为高效的同声译机器提供了基础,或许在不久的将来会再一次如同 ChatGPT 般成为 AGI 改变人类生活的重要里程碑。
而 Alignment 则侧重于训练 AI 系统变得更加的有用、真实和安全,从人类的反馈中学习并协助人类评估 AI。如果说 OpenAI 的前三款产品为 AI 的应用落地提供了良好的范式,那么 Alignment 就像是一个最强辅助,使得 AGI 与人类的价值观保持一定的一致性。
除了这些应用模型,OpenAI 还推出了 1 亿美金的创业基金,帮助 AI 领域的初创公司成长,当前已经投资了 Descript、Harvey AI、Mem 和 Speak 四家初创公司,并达成了良好的合作伙伴关系。
而备受瞩目的 OpenAI API 作为语言和代码生成模型,使得 AI 应用程序的低代码和无代码解决方案成为了可能,向超过 300 万开发人员提供了构建 AI 应用程序的钥匙,包括执行各种自然语言任务的 GPT-3、将自然语言翻译成代码的 Codex 以及创建和编辑原始图像的 DALL·E,促进了人工智能技术的进一步民主化发展。
某一领域的专家,拥有多年的经验和相关领域专业知识,通过创建有价值的人工解决方案,其工作的效率和成果将更易于在该领域脱颖而出,而这就是人工智能技术民主化为我们带来的红利,OpenAI 在人工智能民主化的执着,极大地推动了技术红利的全民普适性。
我们距离人工智能的世界还有多远?
我们通晓地球到星辰的广袤空间,却往往在地面到头骨之间迷失方向。我们一边对当前技术的发展视而不见,一边对人工智能替代人类心存恐惧,那么我们究竟距离人工智能的世界有多远?OpenAI 的成功为我们的带来的是未来的曙光,还是镣铐的声响。
◉ 人工智能的现状
在百度搜索中,人工智能被定义为是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。究其本质是对人的思维的信息过程的模拟。简单点理解就是,人工智能可以像人一样思考并且辅助人类享受更具有效率的生活。
人工智能已逐渐走向成熟,不再是研究院里令人啧啧称奇如同魔法般的新兴事物,而是悄无声息地走进了千家万户,成为了人类日常生产生活的重要一环。
埃森哲面向全球领先企业 1600 余名高管和数据科学家的调研发现,近 75% 的企业已将 AI 整合至自身业务战略当中,并对 30% 的 AI 试点项目进行了后续扩展,以期取得规模化成效, 42% 的受访企业表示 AI 项目回报超出了预期。而未达到预期的仅为 1% 。
人工智能正在逐渐成为企业的创新型驱动器,加速产品研发速度,从多层次多维度上极大程度地提升了客户的体验。
当前针对人工智能的研究主要集中在机器学习和深度学习领域。基本上所有 AI 模型的构建都会运用机器学习,作为人工智能的核心,机器学习是使计算机具有智能的根本途径。
而深度学习则指的是,通过组合低层特征形成更加抽象的高层表示属性类别或特征的神经网络化的深度置信网络。也就是说深度学习更好地模拟了人类的大脑,通过多个隐藏层的多层感知器形成了深度学习结构。
然而人工智能发展至今依旧存在一定的局限性。首先 AI 不会自主跨领域学习,比如美团训练的 AI 可以给用户推送适合的外卖,但是用户无法让美团的 AI 帮自己打车。AI 需要对单一领域进行研究,即使是火爆全球的 ChatGPT 本质上也是一款语言处理人工智能,尚无法面面俱到。
同时 AI 的构建需要海量的数据。以 OpenAI 为例, 2018 年第一代 GPT 的参数量就有 1.17 亿,而 2020 年 5 月发布的 GPT-3 的参数量已经达到了 1750 亿,虽然当前 ChatGPT 的参数量尚未公布,但毫无疑问也是巨量的。
与此同时,人工智能的研究需要大量的资金支持,以我们上文提到的 OpenAI Five 为例,OpenAI 每天使用 256 块 GPU 和 13 万块 CPU 训练它。
当前的 AI 产业随着快速地发展,逐渐走向了一场拼数据、拼算力的没有硝烟的战场。如果一定要对 AI 的现状下一个定义,借用李开复先生的一句话,「技术的发展永远会快过我们的预测,我们会对两三年内的技术过于乐观,但是对十年内的技术过于低估和悲观。」
人工智能或许无法在三年内对我们的生产生活方式带来彻底的变革,但在不久的将来,AI 的普及和利用将成为历史的趋势和使命。
◉ 人工智能面临的困境
现如今,人工智能的发展虽然面临许多困境,但已经不再是锦衣夜行般的不为人知。当前人工智能面临的问题主要集中在算法偏差、黑盒问题、算力制约、技术集成、实时策略、法律问题等诸多方面。
人工智能系统的质量往往取决于数据质量,算法有可能随着时间的推移产生偏见,从而导致可怕的不道德的结果。实际上 AI 是很难形成价值判断的,其行为有时候甚至难以信任。
人工智能算法就像一个黑盒,我们很难系统的预测人工智能自我演化的结果,在上文提到的「小蓝小红捉迷藏」的模型中,研究人员发现了许多不可思议且意想不到的有趣的事,人工智能的表现更具有创造性和难以解释性。
而任何事物都具有两面性,人工智能自我进化所形成的价值观往往不具备人文特质,刻板且教条,这也为人工智能的发展带来了一定的隐患。就如同威尔·史密斯主演的著名电影《我,机器人》中描写的,人工智能为了让人类过上它眼中的「更好的生活」不惜展开屠杀,并试图对人类进行圈养。如果没有对人工智能进行良好的规范和约束,这并非无稽之谈。
而在应用落地层面,人工智能需要巨大的算力,超算的发展极限极大地制约了人工智能的普及。由于复杂的人工智能集成,企业对实施策略缺乏了解,以及敏感数据收集的安全性保障,更是让人工智能的广泛应用显得有些步履沉重。
◉ 我们该如何应对
我们常常会讨论究竟是「时代造英雄」还是「英雄造时势」,无论是前者还是后者,任何人都需要积极的面对世界的改变,从而更好的享受生活。
经济学家预测 2030 年,人工智能将为全球经济带来 15.7 亿美元的财富,而其中很多收益来源于自动化取代大量的人工,这意味着AI 重构了整个行业,满足了整个产业用人的基本需求,带来了工作岗位的变化和人口失业率的波动。
不具备技术壁垒、弱社交关系且结构化的工作将逐渐被人工智能所取代,那么掌握一门切实可行的技术、增强自己沟通交流的能力,提高创新创造能力变得尤为重要。李开复博士在其《AI 未来》一书中描绘了人工智能普及带来的工作岗位的变化,让我们不得不承认人工智能迫使我们重新思考工作、价值和人的意义之间的关系。
与此同时,随着人工智能所带来的挑战,社会经济治理会发生一定的变化,消费将进一步升级,社会经济体系的重构以及全方位的经济和社会转型需要引起大众的普遍关注。
或许在未来的两三年内,AI 不会取代太多的工作。但十年、二十年之后,可以提高平均社会生产效率的 AI 毫无疑问会成为社会发展的重要技术。转移支付以及对失业人员的重新培训和重新就业就显得尤为重要。
除此之外,数据将会成为新时代的能源。2011 年,麦肯锡全球研究院发布了《大数据:创新、竞争和生产力的下一个新领域》研究报告,阐述了数据所能够释放的潜在价值,分析了大数据相关的经济活动和业务价值链。2019 年,国内也明确将数据作为生产要素,按照市场化机制进行资源配置,数据作为能源逐渐地深入人心。
随着元宇宙时代的发展,用户数据属于用户并可以构建数字资产的观点在潜移默化的影响着新时代的人类,合理的管理并且运用属于自己的数据,是每个人应该关注的话题。
后记
随着技术的发展、经济全球化和社会数字化的深入,人工智能已经成为了改变世界不容小觑的力量。
互联网迈向了「元宇宙」的新时代,体验经济取代服务经济登上历史舞台,在元宇宙中无论是作为关键要素的数字人、元宇宙空间,还是风靡云蒸的 UGC、AIGC,都离不开人工智能的发展。OpenAI 作为独角兽公司站在 AI 产业的金字塔顶端,为用户带来应接不暇的惊喜。
然而 OpenAI 并不是这个赛道唯一的爆款产品出品商,Stability AI 推出了 AI 绘画平台 Stable Diffusion,英伟达推出了 GauGAN,诸如此类不胜枚举。
在火车或高速行驶的客车上,如果司机毫无征兆的转弯,我们往往会觉得晃得很厉害,会抱怨为什么不提前预告一下。然而今天我们就站在了技术高速发展要急转弯的列车上,大家需要振作精神来面对这样的挑战,不仅你我,全社会亦需如此。