
1.1.2 大模型发展简史
今天,ChatGPT几乎已成为AI的代名词。这一切源于OpenAI将ChatGPT推向社会,进而引发了生成式人工智能的爆发式增长。从ChatGPT问世到现在,AI已迅速成为全社会关注的焦点,甚至上升至国家战略层面。围绕AI衍生出的相关产业,也逐步成为全球经济发展的重要一环。
正如“罗马不是一天建成的”,ChatGPT的出现并非偶然,而是基于由Transformer演化而来的LLM。大模型为AI发展提供了核心基础框架,被广泛认为是迈向AGI的必经之路。
然而,生成式人工智能达到今天的高度,并非一蹴而就。
早在2017年,DeepMind便提出了RLHF(基于人类反馈的强化学习)概念,而Transformer的起源则可以追溯到20世纪90年代。其突破性进展发生在2017年,当时谷歌研究团队正式发布了Transformer架构,为LLM奠定了技术基础,也为GPT的诞生铺平了道路。随后,OpenAI抓住了这一关键契机,经过多个版本的迭代与优化,最终在2022年底发布了ChatGPT,成为AI时代的引领者。OpenAI的联合创始人Sam Altman因此被誉为“AI之父”。
因ChatGPT和Sora的成功,OpenAI几乎成为AI的象征。如今提到AI,几乎无法绕过OpenAI的名字。甚至,在通往AGI的道路上,世界模型被广泛讨论时,Sora被部分人认为是其具体形态之一。
凭借ChatGPT与Sora,OpenAI已牢牢站在AI技术发展的前沿。这也显著提升了其最大投资者微软的市值。反观谷歌,这位曾经的AI领域霸主,在这一轮AI技术浪潮中却成为失意者。谷歌发布的Gemini模型因存在严重错误,在网络平台上饱受争议,成为讨论的焦点。
如果将世界模型视为通往AGI的关键钥匙,现阶段OpenAI的领先地位尚不稳固。例如,2024年3月4日,由OpenAI创始团队的部分成员创建的公司Anthropic发布了多模态Claude 3模型,其技术水平被认为领先于OpenAI的GPT-4。这使得AI先进模型的竞争越发白热化。同时,苹果公司在放弃汽车业务后,也全力投入AI领域,这进一步表明AI已成为科技公司竞争的关键战场。
更引人注目的是,在模型之争激烈进行的同时,AI技术的跨领域应用也成为科技公司的重要战略方向。2024年2月23日,包括OpenAI、微软和英伟达在内的科技巨头联合投资了机器人公司Figure AI。而在此之前,微软已在材料科学领域推出了生成式人工智能模型MatterGen,展现了“AI+”技术在各领域的广阔前景。可以说,“AI+”已成为新一轮技术革命的关键词和重要实践方向。