行业报告 | ChatGPT与人工智能技术发展报告

191次阅读

原创 | 文 BFT 机器人

前言: 人工智能市场现状与发展回顾

(一)人工智能整体回顾

2021-2022 年，全球人工智能市场呈现出蓬勃发展的态势:

应用领域不断扩大:人工智能应用领域已经不再局限于传统的图像和语音识别自然语言处理等领域，而是涵盖了金融、医疗、制造业、物流、零售等各个行业，并且在这些领域中得到了广泛应用。

技术创新不断推进: 随着深度学习、自适应系统、自主学习技术的不断发展人工智能技术不断向前推进，越来越多的企业开始尝试将人工智能技术应用到其核心业务中。

产业生态加速形成:人工智能已经成为一个拥有完整产业链的领域，从芯片、算法、平台、应用等方面都有相应的企业存在，并且这些企业之间形成了一定的合作与竞争格局。

政策不断推动: 各国政府都将人工智能视为未来的重要战略领域，出台了一系列支持政策和计划，以促进人工智能技术的发展和应用。

未来随着技术不断提升和应用广泛，人工智能市场将会变得更加成熟和完善。

（二)全球及中国人工智能市场规模

近年来，随着计算机技术的不断进步和应用领域的扩大，全球人工智能市场正在快速发展。据预测，到 2022 年，该市场规模已达 1290 亿美元，其中中国市场规模预计达到 130.3 亿美元, 超过全球市场规模的十分之一。未来 2022-2026 年，中国人工智能市场预计将以 19.6% 的年复合增长率稳步发展，2026 年将有望超过 266.9 亿美元。

(三)人工智能投融资情况与企业上市情况

在 2014 年以前，多数重要模型都是由学术界发布。然而，随着先进人工智能系统的构建越来越依赖于大量数据、计算机能力和资金资源，相较于非营利组织和学术界，行业参与者拥有更丰富的资金资源，因此成为研发重要模型的主要力量。到 2022 年，已经有 32 个重要的机器学习模型诞生在工业界，而学术界仅有 3 个。

2022 年, 全球人工智能领域的私人投资经历了十年来的首次下降。相比于 2021 年，2022 年 919 亿美元的投资金额下降了 26.7%。中国的人工智能领域的投资情况与全球趋势类似。

在 2020 年至 2021 年期间，中国的人工智能领域一级市场总融资金额从 991.79 亿元增长至 2187.92 亿元，实现了 120% 的增长。然而，截至 2022 年 11 月 10 日，总体呈现下降趋势。

2015-2022 年 11 月 10 日，中国人工智能领域一级市场的平均单笔融资金额是呈波动增长的趋势，在 2017 年后，单笔融资金额平均不低于 1 亿元，在一定程度上表明人工智能领域平均估值有所提升，投资门槛越来越高。

2015 年至 2022 年 11 月 10 日，中国人工智能领域早期投资呈现显著下降趋势，波动范围最大，从占比 60% 下降至 25%。相比之下，成长期投资占比变化较小，基本保持稳定; 而战略投资和中后期投资则有一定程度的增加。

值得注意的是，从 2019 年开始，成长期投资的占比开始高于早期投资，且一直保持这种趋势至 2022 年 11 月 10 日。在一定程度上表明国内人工智能领域的风险投资偏好正在逐渐走向成熟的态势。

(四)人工智能专利技术情况

4.1 全球人工智能专利公开与申请情况

全球人工智能领域每年专利公开数量呈逐年上升趋势,2022 年达到 3 万项以上。从专利数量上看，人工智能在不断的发展进步。

4.2 全球人工智能专利来源国分布情况

2018-2023 年 4 月 10 日，我国在人工智能专利公开数量上处于绝对领先地位，远超美、日韩等其他国家。

（五）全球人工智能部分政策及规划

(六)人工智能部分重要进展更新

6.1 国外最新进展

2023 年 1 月 3 日，Meta 发布自监督算法 data2vec 2.0: 通过整合语音视觉和文本三种数据模态，使用一个框架进行训练，可以在保持相同精度的情况下，将训练效率提高 16 倍。

2023 年 1 月 27 日，谷歌公布文字 - 图像生成模型 Muse (缪斯)、MusicLM 等: 文字可以直接生成高保真的音乐。

2023 年 1 月 28 日斯坦福团队推出 DetectGPT: 旨在帮助教育工作者识别出 ChatGPT 生成的论文。

2023 年 1 月 28 日，马斯克合伙人研制大脑“第七层”: 瘫痪病人可用意念操作电子设备。

2023 年 1 月底，GPT-3 核心成员打造 ChatGPT 竞品 Claude: 目标成为一款安全、符合人类价值观且遵循道德规范的人工智能系统。

2023 年 2 月 24 日，Meta 公布一款新的人工智能大型语言模型 LLaMA: 能支持研究人员在多项复杂任务中取得进展，如生成文本、进行对话、撰写总结性文件、证明数学定理或预测蛋白质结构等。

6.2 国内最新进展

2022 年 12 月 28 日，新型智能皮肤可实现手部任务快速识别: 未来或许可实现在隐形键盘上打字，实现沉浸式触摸。

2023 年 1 月 25 日，中山大学联合团队实现机器人液化越狱: 在未来，医疗保健、精准货物运输以及电子维修等领域可能会受益于该新技术的发展。

2023 年 1 月底，中山大学研发“数字流式”系统 DeepFundus: 促进人工智能在临床方面的应用。

2023 年 3 月 16 日，百度推出中国式的 ChatGPT 服务: 为中国提供了一个更加便捷和高效的自然语言处理平台，有助于推动中国在人工智能领域的发展和应用。

2023 年 4 月 7 日，阿里云自研大模型“通义千问”开始请用户测试体验每一家企业未来都能够在阿里云上调用通义千问的全部功能，同时利用自身的行业知识和应用场景训练自己的企业大模型。

2023 年 4 月 10 日，商汤科技宣布推出自研的中文语言大模型应用平台“商量”: 它具备自然语言生成、文本生成图、感知模型标注和模型研发功能，能够理解多轮对话和超长文本。

第一章: 爆红的 ChatGPT

(一)chatGPT 基本概念

ChatGPT 是由 OpenAI 开发的一种 AI 语言模型，它可以根据给定的输入生成类似于人类的文本。该模型经过在大量文本数据集上的训练，具备生成问题回答、长文本总结、故事创作等能力。通常情况下，它被用于对话式 AI 应用中，以模拟与用户进行类人对话。

(二)发展历程

第二章: 相关行业发展之自然语言处理

(一)基本概念及作用

自然语言处理 (NaturalLanguage Processing，简称 NLP)，是指利用人类交流所使用的自然语言与机器进行交互通讯的技术，通过人工智能技术对自然语言进行处理，使得计算机对其能够可读并理解，也是 chatGPT 类的 AI 文本生成功能的核心技术之一。

自然语言处理涉及细分领域很多，其核心任务涉及两部分，自然语言理解 (Natural-language Understanding，简称 NLU) 和自然语言生成(Natural-language generation，简称 NLG)。

ChatGPT 和自然语言处理之间是相辅相成的关系:

首先，自然语言处理作为 chatGPT 的核心技术之一，它的研究启发了大规模语言模型的构建，使得 ChatGPT 能够更好地理解自然语言, 生成更加优质的文本其次，自然语言处理任务中的数据集和评估指标也为 ChatGPT 的训练和评估提供了基础和参考。此外，自然语言处理还促进了 ChatGPT 在多任务学习、迁移学习等方面的应用，进一步拓展了 ChatGPT 的应用范围和性能。

反之，ChatGPT 的出现也深刻地影响了自然语言处理领域。一方面，大规模语言模型中蕴含的信息使得传统自然语言处理任务 (如分词、词性标注、句法分析等) 不再需要专门的研究。另一方面，ChatGPT 将各种自然语言处理任务转化。

为序列到序列生成问题，打破了任务间的界限，促进了多任务学习和迁移学习的发展。此外，工业界拥有丰富的计算资源、用户信息和反馈数据，这与学术界进行系统级研究形成互补，产生了相互促进的作用。

(二)发展阶段

自然语言处理的发展过程对人类具有重要意义。自然语言处理最早可以追溯到 20 世纪 50 年代，随着自然语言处理技术的不断进步，我们可以更好地利用自然语言与计算机进行交互，从而实现更高效、更便捷的信息处理和沟通方式 ChatGPT 就是自然语言处理技术应用的优秀代表。

第三章: 相关行业发展之 AI 数据

(一)基本概念及作用

数据是 AI 的三大基石 (算法、算力)之，ChatGPT 在对语言做出反应时需要的不仅仅是在不同行业数据的采集和利用，还包括数据准备、模型选择、训练、评估、参数调整、预测等流程。

AI 数据对 chatGPT 的重要性在于为 ChatGPT 提供了大量的训练数据和算法评估服务，从而使其在自然语言处理方面表现更出色。A 数据平台可以提供海量的对话样本和其他类型的 NLP 数据，这些数据可以用来训练和优化 ChatGPT 模型，并使其能够更好地理解和回答用户的问题。

此外，A 数据平台还可以提供常规任务数据，如文本分类、实体识别等，这些任务可以帮助 ChatGPT 实现更复杂的应用场景。同时，Al 数据平台还可以提供精准的模型评估服务, 以评估 ChatGPT 模型的准确度和效果

(二)发展阶段

AI 数据的发展经历了四个阶段: 数据收集阶段、数据标注和整理阶段、数据共享和开放阶段、AI 数据平台阶段。AI 数据为 A 模型提供了用于训练、测试和优化的数据，使它们能够更快地学习和适应新的任务。

A 数据的广泛应用和使用有利于提高 AI 模型的准确性和效率。这些数据比如包括从标准低级任务 (如图像分类) 到复杂高级任务 (如对话生成) 的各种数据来源，可以为 AI 模型提供足够的知识和内容，促进 AI 模型逐步提升到能够解决高级任务的水平。

AI 数据行业正在迅速发展，AI 数据市场正在扩大，对于推动 AI 技术发展、提高 AI 模型能力促进 AI 应用落地和促进整个 AI 行业的发展方面都具有重要的作用。

第四章: 相关行业发展之 AI 芯片

(一)基本概念及作用

AI 芯片是 ChatGPT 实现的基础，更是承载人工智能行业发展的基础设施为模型训练提供算力支持。

广义上讲，能够运行人工智能算法的芯片都叫做 AI 芯片，但是通常意义上的 AI 芯片指的是针对人工智能算法做了特殊加速设计的芯片。AI 芯片也被称为 A 加速器或计算卡，即专门用于处理人工智能应用中的大量计算任务的模块。深度学习模型与推荐式系统模型复杂度进一步提升，对芯片算力提出了更高的要求 AI 芯片算力已步入蓬勃发展阶段。

根据机器学习算法步骤，可分为训练 (training)芯片和推断 (inference)芯片。从技术架构来看，AI 芯片主要分为图形处理器 (GPU)、现场可编程门阵列 (FPGA)、专用集成电路(ASIC)、类脑芯片四大类。