在过去的几年中,AI 技术的飞速发展已经改变了我们的生活和工作方式。近日,天旦正式发布 OpsGPT,它是业界首个懂运维的大语言模型,可以解答复杂的技术知识、进行推理分析,就像 ChatGPT 可以为你提供各种信息和建议一样。
近日,天旦正式发布业界首个运维大语言模型 OpsGPT,为大语言模型在运维领域 的应用 带来技术落地实例。OpsGPT 是一款具备运维专业知识的大语言模型,它能够解答复杂的运维技术知识点并进行推理分析,就像 ChatGPT 为用户提供各种信息和建议一样。这一创新将通过人工智能为运维工程师在专业技术知识学习、复杂的故障分析等多方面提供智能化的支持。
在大语言模型技术的快速发展中,ChatGPT 以其全知全能的回答能力引起了广泛的关注。随后,各行业开始研发自己的语言模型,如 BloombergGPT 成为首个大型金融语言模型,谷歌的 Med-PaLM2 模型在医疗领域的测试中达到医疗专家的水平等。而运维领域呢?因此,天旦决定以研究为目的,开发一款专注于运维领域的大语言模型,以满足运维工程师们借助人工智能高效解决复杂技术问题的需求。
在 330 亿参数的 Pretrain 大模型基础上,通过指令微调(finetune)的方式,OpsGPT 模型在运维领域的数据和任务上进行训练,覆盖了应用和业务场景,网络协议、流量分析等专业领域知识,使其获得更高的准确率和推导能力。目前,用于训练的高质量运维数据样本已经超过 30 万条,但受限于数据总量和硬件资源,天旦的 OpsGPT 会采用低阶适应、迭代发展的模式,逐步进行强化大模型能力。
运维知识加强
让 OpsGPT 成为运维专家
运维领域是一个专业且严谨的领域,要让通用语言模型在运维领域发挥作用,我们需要让其具备更专业、更广泛的运维知识。为了持续增强 OpsGPT 的能力,天旦人工智能团队为其量身制定了一套学习认证计划去掌握各类专业知识。因为通过了产业内必须的考试认证,这样将来人工智能才有机会面试上岗呀。而 OpsGPT 面临的第一个目标,就是通过 CCNA 考试。CCNA 是思科认证的入门级别,主要面向网络技术的初学者和初级网络工程师,涵盖了网络基础知识、路由和交换、无线网络、安全等方面的内容。如果参加 2022 年的 CCNA 考试(去除必须依赖图形才能做的题目),OpsGPT 的正确率可以达到 94.1%,而与之对应的 GPT- 4 能达到 78%,ChatGPT(3.5)只能达到 59%。CCNA 的通过分数为 750/1000,即所有题目的 75%。因此,如果忽略那些依赖图例的题目,我们大致可以认为 GPT- 4 和 OpsGPT 是可以得到 CCNA 认证的。
在经过训练后 Netis OpsGPT 的成绩优秀
让我们通过一个例子,来检验一下 OpsGPT 在具体问题上的回答效果。
选择题
An engineer must configure a /30 subnet between two routers. Which usable IP address and subnet mask combination meets this criteria?
A. interface e0/0
description to HQ-A370:98968
ip address 10.2.1.3 255.255.255.252
B. interface e0/0
description to HQ-A370:98968
ip address 192.168.1.1 255.255.255.248
C. interface e0/0
description to HQ-A370:98968
ip address 172.16.1.4 255.255.255.248
D. interface e0/0(正确答案)
description to HQ-A370:98968
ip address 209.165.201.2 255.255.255.252
以下是 GPT-3.5、GPT-4、OpsGPT 的回答:
GPT-3.5 的回答选择 AD,错误
GPT- 4 的回答选择 A,错误
OpsGPT 的回答选择 D,正确
虽然 ChatGPT/GPT- 4 在提供丰富信息和建议方面表现出色,但在专业知识领域仍然需要更多的专业积累和训练。天旦将积累了十多年在运维领域的知识,应用到 OpsGPT 模型的训练中,取得初步成效。
逻辑和计算能力加强
让 OpsGPT 学会严谨推理
除了知识的积累,运维领域更需要严谨的数理推导能力。在模型微调的过程中,OpsGPT 背后的天旦人工智能团队也进行了一系列实验:到底能不能让大语言模型具备足够强的计算能力?在训练一段时间后,效果让人振奋。以二进制转换为例,让我们来看一个问题:十进制的数字 87453 转换为二进制。
问题
Please convert 87453 to binary.
GPT-3.5 的回答:
GPT- 4 的回答:
OpsGPT 的回答:
为了便于比较三者的结果,我们将 GPT-3.5、GPT- 4 和 OpsGPT 的回答汇总如下图所示。
GPT-3.5/GPT-4/OpsGPT 转换结果汇总
可以看出,在超过 5 位数的二进制转换问题上,GPT-3.5 和 GPT- 4 的表现并不理想,而 OpsGPT 可以达到几乎 100% 的正确率。这一提升反映出 OpsGPT 在进一步训练后,能够实现严谨推理能力的潜力。
大语言模型正在改变这个时代,生成式 AI 的思维能力正日渐增长,是实现 AGI(通用人工智能)的关键技术。天旦相信,目前 OpsGPT 所取得的成效仅仅是冰山一角。要让 OpsGPT 真正具备 AGI 的能力,让人工智能在运维领域可靠地发挥作用,仍需要不断积累专业知识,并持续训练以提升人类推理能力。天旦发布 OpsGPT 模型,虽然只是 LLM 大语言模型领域的一小步,却会是运维领域的一大步,并最终实现 AGIOps 通用人工智能运维。经过一些完善的工作,天旦会将 OpsGPT 模型发布到公开平台上,与大家一起分享天旦的研究成果,也诚挚地邀请您加入我们,共同探索 OpsGPT 模型在运维领域的未来潜力!
_创·记 |6 月新闻速递
原文链接:https://new.qq.com/rain/a/20230710A03EIB00