智东西
作者 | ZeR0
(资料图片)
编辑 | 漠影
智东西7月7日报道,在2023世界人工智能大会(WAIC)启明创投论坛“生成式AI与大模型:变革与创新”上,启明创投联手未尽研究共同发布重磅报告《生成式AI》| State of Generative AI 2023。
该报告的撰写基于启明创投团队一年内与近200家GPT-3发布后成立的生成式AI企业的交流、对超过600家美国生成式AI创新企业的追踪与研究、对超过100名全球科技大厂和顶级研究机构的业界AI领域的访谈,以及基于未尽研究对数百篇研究论文的梳理和分析等来源。
2022年被称为生成式AI之年,扩散模型应用取得突破,ChatGPT出世,一系列开创性的研究论文发表。2023年则把大模型推向了一个高峰,以GPT-4发布为标志,生成式AI朝着通用人工智能的方向,进入了创新应用的阶段。 这一阶段最重要的特征,是应用、研究、监管,合力开辟着生成式AI的创新之路。
在启明创投微信公众号后台回复“生成式AI报告”即可获取完整报告下载方式。
人们很快从生成式AI中看到了新的商业生态的出现。生成式AI在中国似乎受到了更加热情的接纳和鼓励,不及政府鼓励支持,大厂争相布局,许多从事知识工作的中小企业也已经积极使用。
企业们被卷入这一革命性的技术浪潮节奏不同、介入程度不同,它们成为新技术浪潮下的守成者、创新者、采纳者,利润率被永久改变。
1. 守成者: 既得利益者,转型缓慢。能否采纳生成式AI是第一个关键,采纳后能否提价是第二个关键。
2. 创新者: 新技术积极拥抱者。将通过生成式AI打造新产品和新服务,获得新的溢价。
3. 采纳者: 公司内部业务和流程中采纳新技术。降低研发、管理和销售成本。优化流程,提高工作效率。
算力目前是最稀缺的资源,也处于最容易获利的要津。算力是大模型成本结构中最大的一块,GPU的性能,实际上决定了这个新兴行业的步调。随着算力与模型的进步,更多初创企业正在涌入,它们抢到了时间的红利,但也面临竞争和可能的巨头碾压。可以说,这是初创企业的蓝海,也有航道下的暗礁。
竞争促进了创新。与2022年快速涌现出的生产力工具方向的创业公司不同,2023 年,有更多比例的新公司聚焦在底层技术的创新;大模型创业公司也开始分化,在通用大模型创业公司方兴未艾的同时,许多面向医疗、电商、科研、工业、自动驾驶和机器人等特定方向的垂直大模型公司开始出现。
与截至2023年Q1基于启明创投团队交流过的100余家生成式AI企业的统计相比,截至2023年上半年基于启明创投团队交流过的近200家生成式AI企业的统计结果显示,聚焦底层技术的生成式AI企业占比显著增长,聚焦大模型研发的企业占比从7%增至14%。
2022年和2023年,是生成式AI技术取得突破的两年,启明创投和未尽研究团队梳理了论文,发现生成式AI领域的一个突出特征,是研究与创新过程的密切结合,许多在企业内部实现,迅速推出用例和产品。
这种研究与创业的一体化,初创企业和风险资本起到了重要的作用,而美国科技巨头和主要AI企业的研究投入与人才,包括一些底层技术的研究,这些年来已经超过了大学等研究机构。
尽管从GPT-4的技术报告,到微软的研究论文,都展示出它所具有的接近于人类的文字处理能力、数学推理能力,以及诸多专业领域的知识。“我们认为它可以合理地被视为人工通用智能(AGI)系统的早期(尽管仍不完整)版本。”但在通往通用人工智能的道路上,需要研究和解决的问题反而更多了。如信心校准、长期记忆、持续学习、个性化、规划和概念跨越、透明度、认知谬误和非理性,等等。
过去半年最重要的研究方向,是破解和理解大模型神秘而又令人兴奋的智能“涌现”。大模型既需要超越对下一个词的预测能力,也需要一个更丰富、更复杂的“慢思考”深层机制,来监督“快思考”预测下一个词的机制。
那些最好的前沿研究,一定是研究和解决技术规模应用中遇到的问题。
研究如何减少幻觉,调教大模型更加准确地输出真实的内容,训练出更强的推理能力;如何更集约地训练模型,降低门槛,推出新产品,让更多的各行各业和消费者都能用上;如何能像人一样,与真实的物理世界互动;如何成为人类复杂工作的助手,设计并帮助执行科学实验;如何影响就业,从而做出政策的响应;如何让人工智能安全和可信。
各国政府对于生成式AI的监管呈现出不同的特点。
中国在迅速推出生成式人工智能的监管办法并征求意见的同时,也在鼓励发展通用人工智能,北京、上海、深圳是最具雄心的第一梯队,均提出了较具雄心的人工智能科研、创新与产业目标。
欧盟继续在监管和立法方面领先,一如其5年前率先推出GDPR。美国更在意人工智能技术的领先地位,正在形成以风险管理为原则的监管框架。
长期来看,人才对AI未来的影响超过了算力。中国研究人员发布的论文在数量上已经超过了美国,但金字塔顶端,无论是研究还是创业,美国仍然占据明显的优势。
在全球范围内,AI研究创新的重心正从高校转移至企业,美国拥有顶尖学者最多的前三大机构,分别是谷歌、微软与Meta,合计招揽了美国顶级学者的30%。中国仍以高校为主,仅阿里巴巴跻身前10。
科技部已经提出了AI企业应该接受科技伦理审查;审查主体应该设立科技伦理(审查)委员会。
美国AI企业较早开始设立负责任与可信人工智能部门,从去年到今年以来经过一些调整,反映出在生成式AI发生变革之际,企业正在寻求用更好的技术和方案,来安全和负责地部署新技术。
《生成式AI》报告还发布了面向大语言模型、多模态模型、商业机会的十大展望。
(一)大语言模型
1. 2024年中国将出现比肩GPT-4的多语言通用大模型;
2. 超长上下文(Long Context)将引领下一次LLM技术突破;
3. 在出现更有前景的大语言模型之前,为实现垂直领域更好的效果,以下三种方式将共存:
i)在不改变数据分布的情况下,利用更多通用数据进行通用大模型预训练,不特别引入行业数据,
ii)利用行业专属数据微调(Fine-Tuning)通用大模型,
iii)利用行业数据占比更高的数据集进行垂直模型预训练。
(二)多模态模型
4. 当前CLIP + Diffusion的文生图模型是过渡态,未来2年内将出现一体化的模型结构;
5. 下一代Text-to-Image模型将具备更强的可控性,它将结合底层模型能力和前端控制方式,对模型的设计将注重与控制方式的结合;
6. 2025年之前,Video和3D等模态将迎来里程碑式的模型,大幅提高生成效果;
7. 以PALM-E为代表的具身智能(Embodied AI)展现出在机器人的感知、理解和决策等方向上的巨大潜力,但当前训练和可靠性存在较大挑战;
8. 短期内Transformer正成为多个模态的主流网络结构,但压缩整个数字世界的通用方法尚未出现,Transformer并不是人工智能技术的终点。
(三)商业机会
9. 3年内,颠覆式的AI应用的核心驱动力来自于底层模型的创新,两者无法解耦,模型的作用将大于产品设计的作用;
10. 当前生成式AI市场处于技术主导的早期阶段,存在千亿美元市值的平台性企业的机会。
标签:
Copyright @ 2015-2018 南极it网版权所有 备案号:粤ICP备2022077823号-13 联系邮箱: 317 493 128@qq.com