一、人工智能架构

人工智能架构目前有众多分类方法,虽然架构分层有些许切分上的差异,但总体来看,包括应用层、技术层,基础层。

其中应用层,按按照服务的对象和功能进行分类,包括解决方案和应用平台。

解决方案层可从产品端分析分为软件 / 硬件,从用户对象属性,分为 b 端和 c 端,从用户行业,细分为行业场景。

技术层可以从感知层、认知层、平台层分类,其中感知层主要是通用技术,例如语音识别等,认知层包括推理、逻辑、学习判断等。

对于技术层分类也可以从通用技术层、算法层、框架层进行分类。

平台层包括技术开放平台和基础开源框架等。

AI大模型架构与产业链浅析

基础层包括数据和算力。

数据层负责数据的收集、存储与处理,确保数据质量。

技术能力层提供强大的计算资源和算法支持,包括高性能计算、云计算及硬件加速设备,为 AI 系统的稳定运行和高效性能奠定坚实基础。

应用层:解决方案 + 应用平台

解决方案层:智能客服、智能助理、无人车、机器人和自动写作等场景应用。这些解决方案直接面向市场和用户需求,提供定制化的服务。解决方案层的分析维度,可以从行业、软件 / 硬件产品、业务方向(营销、生产、人力)等角度分类。

应用平台层:这类平台负责整合和管理 AI 解决方案,能被更广泛的用户群体所使用。

技术层:感知层 + 认知层 + 平台层

感知层:语音识别 ( ASR ) 、语音合成 ( TTS ) 、计算机视觉 ( CV ) 、自然语言处理 ( NLP ) 、即时定位与地图构建 ( SLAM ) 等。

认知层:机器学习、深度学习和增强学习等算法,这些算法是 AI 模型的“大脑”,用于指导模型进行学习和推理。

平台层:提供了一系列用于构建 AI 系统的工具和平台。常见框架:TensorFlow、Caffe、Theano、Torch、DMTK、DTPAR 和 ROS 等,这些框架简化了开发流程,让开发者可以更容易地实现复杂的 AI 应用。

基础层:数据 + 计算算力

数据层:数据层是 AI 系统的基础,负责数据的收集、存储、预处理和标注。它包括数据管理、安全、治理和访问,确保数据质量,支持模型训练和系统运行。

计算能力层:计算能力层提供了运行 AI 所需的强大算力:覆盖了云计算、GPU/FPGA 等硬件加速以及专门的神经网络芯片。这些资源使得大规模的数据处理和复杂的模型训练成为可能。云计算:提供可扩展的计算资源。GPU/FPGA:提供硬件加速,用于并行处理大量数据。神经网络芯片:专门为 AI 计算设计的芯片,如 TPU。

二、AI 大模型架构

AI 大模型架构在人工智能架构的基础上,对数据层和计算能力层提出了更高的要求,以适应大模型的复杂性和规模。同时,它在应用层和技术层也进行了扩展,以适应更广泛的行业应用和更高级的 AI 功能。

例如,在应用层,AI 大模型更侧重于行业特定的解决方案,需要更多行业数据进行定制化训练,同时平台层趋向于发展更高级的 AI agent 能力;在技术层,AI 大模型更加集中于深度学习算法和大型模型专用框架,以支持复杂的模型训练和推理;在基础层,AI 大模型需要处理更大量的数据,并且要求更强大的计算能力来支持大模型的训练和部署。

应用层:当前 AI 大模型的行业应用呈现两种趋势,包括通用大模型和垂类行业大模型

解决方案层:更贴近垂类行业大模型,需要更多行业专业知识数据进行二次训练,基于通用大模型打造垂类行业模型

应用平台层:例如通用类的 ChatGPT,它是一种基于 Transformer 架构的大型语言模型,能够进行文本生成、对话交互等任务,并且可以通过微调来适应特定的应用场景。通用类大模型的趋势是向 AIagent 能力发展,即具备更强大的交互、理解和决策能力。

技术层:集感知、深度学习算法与专用框架于一体

感知层:基于计算机视觉(CV)的图像识别、视频分析,以及基于自然语言处理(NLP)的文本生成、语言理解、对话系统等。这些感知技术为 AI 大模型提供了丰富的输入信息。

算法认知层:作为 AI 大模型的核心算法,是 AI 大模型是大脑,深度学习算法是 ALLMA 架构的核心技术,深度学习使得 AI 大模型能够自动从数据中学习并提取特征,从而提高模型的准确性和鲁棒性。

平台层:AI 大模型的框架层可能包括专门为大模型设计的框架,如 TensorFlow、PyTorch 等。这些框架能够处理大规模的模型训练和部署,并提供丰富的工具和库来支持开发者进行模型开发和优化。同时,AI 框架层还提供了构建 AI 系统的其他工具和平台,如模型管理、版本控制、部署服务等。

基础层:整合多源数据,提供高性能算力,确保模型训练与运行的高效与准确

数据层:典型的数据层数据类型,包括垂类知识库、动态数据集、第三方数据集。对于 AI 大模型而言,数据层的重要性更加凸显,因为大模型需要大量的数据来训练。数据的质量和数量直接影响模型的性能和效果。数据层主要包括多源训练数据脱敏 / 清洗 / 平台化,以及评测数据和标准共建。

计算能力层:AI 大模型的计算能力层需要更强大的算力支持,因为大模型通常参数众多,计算密集。这可能包括高性能的 GPU/FPGA、云计算资源以及专门的神经网络芯片。而 AI 计算能力层则提供了运行 AI 所需的基本算力。

三、基于 AI 大模型架构的行业现状浅析

从前文的 AI 大模型架构,我们可以明确 AI 大模型产业链的组成部分,并浅要分析产业链的差异。部分市场参与者可能已经结合公司战略,进行类全产业链布局,部分市场参与者聚焦在部分产品及解决方案,高度占有市场份额。本文是总览浅析,后续将从应用层、技术层、基础层选取相关部分产品进行详细的分析。

应用层 – 解决方案:

进入门槛:进入门槛较低,大量行业数据形成模型,竞争相对激烈

短期价值 & 长期价值:短期价值高,长期价值受市场变化影响大,市场更新速度快,低投入,变现快

演化路径:垂直行业应用或跨行业应用

应用层 – 应用平台:

进入门槛:进入门槛较较高,需要有较高的行业影响力和号召力,需要构建开发者生态和用户群

短期价值 & 长期价值:短期价值较低,长期价值较高

演化路径:向 app store 的方向发展

技术层 – 算法 & 框架:

进入门槛:需要一定规模的工程团队,算法、框架及工具研发难度大

短期价值 & 长期价值:短期价值较高,长期价值较低,投入适中,适合中长期布局

演化路径:向算法工具平台和开发者生态发展

基础层 – 数据:

进入门槛:入口被拥有流量的公司占据

短期价值 & 长期价值:短期和长期价值天花板较高,高投入、高回报、适合长期布局

演化路径:数据资产化

基础层 – 计算能力:

进入门槛:大模型算力成本较高

短期价值 & 长期价值:短期和长期价值天花板较高,高投入、高回报、适合长期布局

演化路径:通用计算平台和计算服务生态发展趋势

题图来自 Unsplash,基于 CC0 协议。