国家网信办发布意见稿,进一步规范生成式人工智能发展

127次阅读

原标题:国家网信办发布意见稿,进一步规范生成式人工智能发展

至顶发布

热点速评—生成式人工智能服务管理办法(征求意见稿),2023 阿里云峰会

2023 年 3 月 30 日,至顶智库发布视频,对近日国家互联网信息办公室发布的《生成式人工智能服务管理办法(征求意见稿)》中重点内容以及 2023 阿里云智能峰会上的重大发布作出解读。

解读视频请参见“潜流研究所”视频号:

热点速评—生成式人工智能服务管理办法(征求意见稿),2023 阿里云峰会

国家网信办发布意见稿,进一步规范生成式人工智能发展插图

国家网信办发布意见稿,进一步规范生成式人工智能发展插图1

图片来源:热点速评—生成式人工智能服务管理办法(征求意见稿),2023 阿里云峰会

行业政策

国家互联网信息办公室印发《生成式人工智能服务管理办法(征求意见稿)》

2023 年 4 月 11 日,国家互联网信息办公室印发《生成式人工智能服务管理办法(征求意见稿)》,面向全社会公开征求意见。《办法》指出生成式人工智能产品或服务应当遵守法律法规的要求,并对个人信息保护,预训练、优化训练数据要求以及处罚标准作出规定,旨在促进生成式人工智能技术健康发展和规范应用。

第四条 提供生成式人工智能产品或服务应当遵守法律法规的要求,尊重社会公德、公序良俗,符合以下要求:

(一)利用生成式人工智能生成的内容应当体现社会主义核心价值观,不得含有颠覆国家政权、推翻社会主义制度,煽动分裂国家、破坏国家统一,宣扬恐怖主义、极端主义,宣扬民族仇恨、民族歧视,暴力、淫秽色情信息,虚假信息,以及可能扰乱经济秩序和社会秩序的内容。

(二)在算法设计、训练数据选择、模型生成和优化、提供服务等过程中,采取措施防止出现种族、民族、信仰、国别、地域、性别、年龄、职业等歧视。

(三)尊重知识产权、商业道德,不得利用算法、数据、平台等优势实施不公平竞争。

(四)利用生成式人工智能生成的内容应当真实准确,采取措施防止生成虚假信息。

(五)尊重他人合法利益,防止伤害他人身心健康,损害肖像权、名誉权和个人隐私,侵犯知识产权。禁止非法获取、披露、利用个人信息和隐私、商业秘密。

第五条 利用生成式人工智能产品提供聊天和文本、图像、声音生成等服务的组织和个人(以下称“提供者”),包括通过提供可编程接口等方式支持他人自行生成文本、图像、声音等,承担该产品生成内容生产者的责任;涉及个人信息的,承担个人信息处理者的法定责任,履行个人信息保护义务。

第七条 提供者应当对生成式人工智能产品的预训练数据、优化训练数据来源的合法性负责。

用于生成式人工智能产品的预训练、优化训练数据,应满足以下要求:

(一)符合《中华人民共和国网络安全法》等法律法规的要求;

(二)不含有侵犯知识产权的内容;

(三)数据包含个人信息的,应当征得个人信息主体同意或者符合法律、行政法规规定的其他情形;

(四)能够保证数据的真实性、准确性、客观性、多样性;

(五)国家网信部门关于生成式人工智能服务的其他监管要求。

第二十条 提供者违反本办法规定的,由网信部门和有关主管部门按照《中华人民共和国网络安全法》《中华人民共和国数据安全法》《中华人民共和国个人信息保护法》等法律、行政法规的规定予以处罚。

成都市发改委正式印发《成都市产业建圈强链优化调整方案》

近日,成都市发改委正式印发《成都市产业建圈强链优化调整方案》,着力布局构建 电子信息、数字经济、航空航天、现代交通、绿色低碳、大健康、新消费、现代农业 8 个产业生态圈,捕捉前沿技术和热点赛道主攻28 条重点产业链,推动成都迈向高质量发展。

聚焦“四链融合”构建评价指标体系

推动产业建圈强链需要体制机制保障,成都进一步明确链长、重点产业链牵头市级部门、主要承载地和协同发展地的工作责任,构建部门协同、上下联动的工作格局。

发挥链长作用

· 链长将牵头组织研究产业前沿发展趋势,指导编制重点产业链“产业图谱”、形成“5+N”产业生态清单,对产业发展方向、空间布局等进行指导;

· 牵头推动产业联盟建设,搭建政府与“链主”企业、“四上”企业交流平台,推动科技成果对接转化,听取市场主体意见,完善专项产业政策。

成都产业生态圈和重点产业链

国家网信办发布意见稿,进一步规范生成式人工智能发展插图2

图片来源:成都市发展和改革委员会官网

企业动态

2023 阿里云峰会在京举办,正式推出“通义千问”大语言模型

2023 年 4 月 11 日,2023 阿里云峰会在京举办。主论坛上,阿里巴巴集团董事会主席兼 CEO、阿里云智能集团 CEO 张勇等做主旨演讲,并带来包括“通义千问”大语言模型在内的多项重大发布。

与时俱进,为创新提速—阿里巴巴集团董事会主席兼 CEO、阿里云智能集团 CEO 张勇

让算力更普惠

· 普及:推动低代码及 Serverless 发展,提升开发者服务,降低开发门槛,覆盖 1,000 万 开发者,且所有云服务全面走向 Serverless 化;

· 优惠:加大软硬一体技术研发、提高规模化运营效率、持续释放技术红利,过去十年单位算力成本 下降 80%,存储成本 下降 88%。

让 AI 更加普及

· 基础大模型的核心目标是支撑各行各业的发展,让客户、合作伙伴和开发者拥有属于行业、产业、服务范式的模型,并且使门槛更低、可以更好地被各行各业使用;

· 不仅要支撑好这些基础大模型的训练和服务,也要利用在各行各业生成和训练的模型为客户的专属模型的服务提供保障。

未来,阿里巴巴所有产品将接入“通义千问”大模型,进行全面改造

国家网信办发布意见稿,进一步规范生成式人工智能发展插图3

图片来源:2023 阿里云峰会,至顶智库

云智一体,让智能创新触手可及—阿里云智能 CTO 周靖人

技术使用门槛持续降低,产品服务更加易用实惠

· 平台产品 All in Serverless:降低资源使用和运维门槛,让开发者更关注核心业务问题,按效果和价值付费,而非按资源消耗付费;

· 基础产品使用更便利、更实惠:提供简化和通用的规格,降低使用复杂度,提供更高性价比的基础产品。

国家网信办发布意见稿,进一步规范生成式人工智能发展插图4

图片来源:2023 阿里云峰会,至顶智库

MaaS(Model-as-a-Service): 以云为基础,以模型为中心

· 去年 11 月阿里在云栖大会上首次提出 Model-as-a-Service 概念,以云为基础,以模型为中心;

· 要把模型的整个生命周期有效支撑起来,从模型研发、数据清洗,到模型训练、测试,以及形成模型的标准网站,让大家快速查找模型、使用模型、降低模型的使用门槛,让更多人通过几行代码便能真正享受人工智能带来的一系列实惠。

全栈布局 AI 技术体系

从 Infrastructure as a Service 到 Platform as a Service 再到 Model as a Service,这清晰的三层架构定义了新时代云计算的标准技术体系。

· 在 Infrastructure 上,专门为 AI 设计云的基础设施,包括异构集群、高效网络和高速存储,在训练方面有灵骏计算集群,在推理方面应用强大的通用计算 ECS;

· 在 Platform 上,阿里提供丰富的大数据和机器学习产品,能够从数据清洗开始、从特征工程的训练开始、从模型训练的方方面面开始,帮助大家有效训练模型,解放对系统的依赖,能够让大家关注模型本身,从而能够真正做好模型的训练、调优等;

· 在 Model 上,阿里提供非常丰富的模型层,各式各样的基础模型和各行各业的模型都提供给广大开发者,让大家有效地集成在自己的业务开发体系中。

国家网信办发布意见稿,进一步规范生成式人工智能发展插图5

图片来源:2023 阿里云峰会,至顶智库

灵骏:为 AI 提供高性能算力

· 灵骏能够支持 10 万张卡 的 GPU 规模,所有高性能的算力机器通过阿里自研 800GRDMA 的网络连接,实现低延迟互联;

· 提供高效存储方案,让数据的处理更加有效,宽带 每秒钟 20TB

· 包含多级存储缓存,在训练中重新阅读数据时,网络延迟达1.5 微秒以下

· 训练过程中有大量梯度需要互相传递,自研网络拥塞算法使得模型的训练通信效率 提升 17%。

PAI×灵骏:高性能分布式模型训练平台

· 全平台可训练 10 万亿 参数规模的模型,让几千张甚至上万张卡联合起来训练超大规模的模型,实现 10 倍 的训练性能提升。

· 在增加规模的过程中,取得接近线性扩张的扩展性能力。

PAI×灵积:低延时模型推理与服务平台

· 一键式模型部署,不需要耗时在寻找底层资源、模型上载等操作,通过一行代码,便可把模型在云平台有效部署;

· 通过 model 的 ID 和 API 的 key 的方式,有效使用各个模型,并把模型能力结合在应用开发里。

· 在模型压缩方面投入大量工作,包括减脂、蒸馏等压缩手段,在不影响模型的情况下快速降低模型服务成本,令模型的服务成本 降低 8 倍。

“通义千问”大语言模型正式发布

国家网信办发布意见稿,进一步规范生成式人工智能发展插图6

图片来源:2023 阿里云峰会,至顶智库

“通义千问”能力非常突出,能解决各行各业的技术问题

1. 可以进行多轮对话,不只日常问答,还能理解提问者在问答中想表达的意图,根据上下文语义理解,回答问题更精准;

2. 具有非常强文案创作能力,可进行小说续写、邮件编写、文案创作等,极大提高工作效率;

3. 推理能力方面,可以解决数学题和相关代码编写,让开发者在整个开发流程中不断提效;

4. 结合视觉和视频等多模态知识,融入语言知识体系,真正实现知识融会贯通;

5. 能够自动进行语言之间的交互和转接,能进行中文交谈,也能通过其他语种进行自动转接。

目前,钉钉、天猫精灵等产品已接入通义千问测试,将在评估认证后正式发布新功能。

接入“通义千问”后,钉钉可实现近 10 项新 AI 功能

· 在钉钉文档中:可创作诗歌小说、撰写邮件、生成营销策划方案等,全面辅助办公;

· 在钉钉群聊中:可以帮助自动总结未读群聊信息中的要点;

· 在钉钉会议中:能够随时生成会议记录并自动总结会议纪要、生成待办事项;

· 拍照生成小程序:在钉钉中上传一张功能草图,无需写代码,可立刻生成订餐轻应用。

接入“通义千问”后,新天猫精灵更拟人更聪明,知识、情感、个性、记忆能力大幅跃升

· 新天猫精灵支持自由对话,可以随时打断、切换话题,能根据用户需求和场景随时生成内容;

· 用户可以在跑步时要求天猫精灵“合成 1 小时歌单,50% 穿插摇滚风格的歌曲”,也可以和天猫精灵聊文化、谈人生;

· 新天猫精灵不仅能回答各种刁钻问题,还可以一起创作故事。

商汤科技推出“日日新 SenseNova”大模型体系

2023 年 4 月 10 日,商汤科技举办技术交流日活动,分享以“大模型 + 大算力”推进 AGI(通用人工智能)发展的战略布局,并公布商汤在该战略下的“日日新 SenseNova”大模型体系,可提供自然语言处理、内容生成、自动化数据标注、自定义模型训练等多种大模型及能力。

“商量 SenseChat”语言大模型

“商量 SenseChat”具有出色的多轮对话和超长文本理解能力,且支持多项创新应用:

· 编程助手,可帮助开发者更高效地编写和调试代码;

· 健康咨询助手,为用户提供个性化的医疗建议;

· PDF 文件阅读助手,能轻松从复杂文档中提取和概括信息等。

“商量 SenseChat”功能演示

国家网信办发布意见稿,进一步规范生成式人工智能发展插图7

图片来源:商汤科技 SenseTime 官方公众号

“秒画 SenseMirage”文生图创作平台

· 包含商汤自研 AIGC 大模型和便捷的 LoRA 训练能力,并提供第三方社区开源模型加速推理;

· 融合 超 10 亿 参数,具备展现光影真实、细节丰富、风格多变的文生图能力,可支持 6K 高清图生成;

· 客户还可根据自身需求训练生成模型。

“如影 SenseAvatar”AI 数字人视频生成平台

· 以数字人物生成技术为核心,基于商汤多种 AI 生成能力打造的应用平台,包括 文本生成、语音生成、动作生成、图片生成、NeRF等;

· 让用户摆脱专业拍摄设备的束缚,在视频创造领域,快速打造各种视频创作;

· 在直播带货场景,打造独属的直播间和百变虚拟主播;

“琼宇 SenseSpace”“格物 SenseThings”3D 内容生成平台,可以高效低成本生成大规模三维场景和精细化的物件,为元宇宙、虚实融合应用打开新的想象空间。

毫末智行发布业内首个自动驾驶生成式大模型“DriveGPT 雪湖·海若”

2023 年 4 月 11 日,毫末智行举办第八届“HAOMO AI DAY”,发布业内首个自动驾驶生成式大模型“DriveGPT 雪湖·海若”,数据智能体系 MANA 也将对外开放。

“DriveGPT 雪湖·海若”

·“DriveGPT 雪湖·海若”输入是感知融合后的文本序列,输出是自动驾驶场景文本序列,最终完成自车决策规控、障碍物预测以及决策逻辑链的输出等任务;

· 通过引入驾驶数据建立 RLHF(人类反馈强化学习)技术,对自动驾驶认知决策模型持续优化;

· 目标是实现端到端自动驾驶,现阶段主要用于解决自动驾驶的认知决策问题,后续持续会将毫末多个大模型的能力整合到其中;

· 预训练时使用量产车 4,000 万公里 驾驶数据,参数规模达到1,200 亿;

· 开启对限量首批生态伙伴开放合作,北京交通大学计算机与信息技术学院、高通、火山引擎、华为云、京东科技、四维图新、魏牌新能源、英特尔等高校与企业加入毫末雪湖·海若生态;

· 将携手生态伙伴率先探索四大应用能力,分别是:智能驾驶、驾驶场景识别、驾驶行为验证、困难场景脱困

· 场景识别能力对外开放,将行业当前 5 元 / 张的价格降至0.5 元 / 张。

MANA 视觉感知能力持续提升

国家网信办发布意见稿,进一步规范生成式人工智能发展插图8

图片来源:毫末智行官方公众号

· 同时识别纹理和结构:以恢复真实世界的三维结构和纹理分布为监督目标,悬链数据集包含 400 万Clips, 感知性能 提升 20%,可适配所有主流视觉感知任务;

· 纯视觉感知能力:使用鱼眼相机结合接地线等装置,在 2 米范围内精度可 达 10 厘米

· 三维重建:单趟纯视觉 NeRF 三维重建支持完成自动标注;

· 障碍物编辑:支持障碍物编辑可以生成全新场景,将 Corner Case 的构造成本 降低 100 倍以上,真正实现数据自由。

行业会议

人工智能大模型技术高峰论坛

2023 年 4 月 8 日至 9 日,“人工智能大模型技术高峰论坛”在杭州萧山成功举办。来自北京、上海、杭州、南京、合肥等地的近 50 位专家学者聚焦大模型,全方位梳理大模型技术热点、展现大模型应用实践、洞察智能产业未来。

盘古大模型的进展及其应用

演讲人:国际欧亚科学院院士,华为云人工智能领域首席科学家,IEEE/CAAI Fellow 田奇

大模型阶段划分

华为提出将大模型像自动驾驶一样划分为 L0 基础模型、L1 行业模型、L2 细分场景模型 三个阶段。同时,大模型已成为应对 AI 应用碎片化的一种方式,将导致市场向大公司集中,产业规则及格局也可能随之改变。

华为云于 2020 年预判 AI 发展趋势

1.AI 会从传统小模型发展到大模型的趋势,对应算力需求过去十年中增加40 万倍。大模型成为应对 AI 应用碎片化的一种方式,可能收编高度定制化的小模型,导致市场向大公司集中,产业规则及格局也可能改变;

2.AI for Science(AI 赋能科研),AI 与科学计算交汇。包括传统的气象、海洋、农业、地球科学、航空航天等领域开始从偏微分方程的方法拓展到 AI 方法,在这一领域华为云推出气象、药物分子领域多个行业大模型。

华为盘古大模型诞生过程

· 预训练阶段:由海量数据来运行链路的通用底座基础模型;

· 模型微调:针对下游千行百业的具体任务;

· 大模型迭代:实现大模型的增量学习、终身学习、应用全生命周期迭代。

从发展关键节点来看,华为于 2021 年开始立项盘古大模型;2021 年 4 月发布盘古 NLP 大模型、盘古视觉大模型、盘古科学计算大模型;2021 年 9 月,推出用于药物研发细分场景的大模型;2022 年,与能源集团合作发布 盘古矿山大模型、盘古气象大模型、盘古海浪大模型、盘古金融 OCR 大模型

CV 大模型落地矿山,NLP 大模型落地智能文档检索等

2022 年,华为盘古大模型主要在 AI for Industries 方面做好行业应用,希望为煤矿、水泥、电力、金融、农业等行业创造更多产业价值,目前已有多个案例。

· 盘古 CV 大模型目前覆盖 工业质检、物流仓库监控、时尚辅助设计 等行业;

· 盘古 NLP 大模型覆盖 智能文档检索、智能 ERP、小语种大模型 等领域,如去年交付阿拉伯语的千亿参数大模型;

· 盘古科学计算大模型也用在 气象预报、海浪预测 等方向。

国家网信办发布意见稿,进一步规范生成式人工智能发展插图9

图片来源:人工智能大模型技术高峰论坛

盘古大模型应用案例

· 在与能源公司合作案例中,矿井现场 40 米长,宽度仅 2 米左右,传统相机很难捕捉到全部画面,只能用九宫格视频画面。而通过 5G+AI 全景视频拼接综采画面卷,传输到地面,地面工作人员将来可以实现地面控制机器进行采矿,实现矿下无人少人安全作业;

· 在煤矿的主运输皮带作业监控场景中,煤矿被采集后,通过主运输皮带,从地下传输到地上。按传统方法通过工人配合作业,华为提出通过视频对作业的安全规范进行巡检,主运场景异物识别精度 达 98%,煤矿作业场景动作识别准确率 达 95%,助力井下安全事故 减少 90% 以上

· 在轨道机车缺陷检测场景中,对掉链、脱落、裂痕等潜在不安全因素的人工检测成本较高,盘古大模型提供图像质量自动评估、小样本故障定位与识别等。

从 ChatGPT 到言犀:大模型发展及产业落地

演讲人:京东集团副总裁,IEEE Fellow,CAAI Fellow 何晓东

许多生成模型在某些指标上接近甚至超过人类基准

硬件:摩尔定律和 Denard Scaling 的结合,结合并行化和改进的 GPU 架构,能够用大量数据训练更大模型;

数据架构:Transformer 模型架构的出现,催化 LLM 快速发展和成功。Transformer 的“Self-Attention”机制使其能够学习远程连接并最终找到跨领域的通用用途,包括计算生物学(AlphaFold2)和自然语言(基于 Transformer 的 LLM);

无监督学习 + 半监督学习 + 人类反馈学习:可以在很少或没有特定训练情况下执行某些任务。

每次人类获取信息与服务的变迁,都带来巨大商业机会

国家网信办发布意见稿,进一步规范生成式人工智能发展插图10

图片来源:人工智能大模型技术高峰论坛

京东在任务型智能对话交互方向上取得一系列成果

1. 极简条件下智能行为感知与数字外观重建

提出一系列高精度人体外观感知与重建方法,达到国际领先水平,算法效率 提升 1 个数量级,应用于数字人交互服务场景。

2. 多轮对话决策推理

提出多模态融合的话语权决策技术,达到国际领先水平,获国际竞赛 Wikihop、HotpotQA 冠军,应用于客服对话场景。

针对真实的产业需求,京东将在今年发布新一代产业大模型

1.2021 年推出 十亿级模型 K -PLUG;

2.2021 年推出 百亿级模型 Vega;

3.2023 年将推出 千亿级大规模预训练语言模型“言犀”。

国家网信办发布意见稿,进一步规范生成式人工智能发展插图11

图片来源:人工智能大模型技术高峰论坛

人机与环境的协同交互:混合增强智能的新机遇

演讲人:CAAI 智能控制与智能管理专委会主任,安徽大学副校长、教授,杰青,CAA Fellow 孙长银

人工智能新焦点

· 2023 年 3 月,OpenAI 公司推出 GPT 系列语言模型最新版本 GPT-4,先前版本 GPT-3.5 发布于 2022 年 11 月,为该公司广受欢迎的 ChatGPT 聊天机器人提供支持;

· GPT- 4 预计将有 超过 100 万亿 参数,数量约为 GPT- 3 的500 倍,意味 GPT- 4 可处理更多数据,生成更长、更复杂、更连贯、更准确、更多样化和更有创造力的文本。

GPT- 4 与混合增强智能的交叉点

· GPT 系列模型的技术原理是通过海量的语料库数据来训练神经网络,使其能够“理解”并生成自然语言从而模拟人类语言交流;

· ChatGPT 的核心进展不仅是大模型的扩展,也是与人协同和交互学习能力的提升;

· 提升人工智能系统协同与交互能力,让人工智能通过交互学习人的意图、做复杂推理,通过协同让人更擅长做决策,是未来人工智能的发展方向,同时也是混合增强智能的主要研究目标。返回搜狐,查看更多

责任编辑:

原文链接:http://news.sohu.com/a/666829679_114765

正文完
 
不知道
版权声明:本站原创文章,由 不知道 2023-08-19发表,共计7819字。
转载说明:声明:本站内容均来自互联网,归原创作者所有,如有侵权必删除。 本站文章皆由CC-4.0协议发布,如无来源则为原创,转载请注明出处。