中国石化集团公司网站
胜利版“ChatGPT”来了

本报记者 王维东 于 佳 通讯员 陈天婧

“既能信息检索,又能知识咨询”“既能代码编程,又能公文写作”“既能查询数据,又能辅助分析”……12月11日,胜利油田发布第二代“胜小利”油气大模型,不少员工“不明觉厉”,纷纷用“震撼”“惊喜”来形容他们的体验感受,甚至有人惊呼:“胜利版‘ChatGPT’来了!”

具有20多项技能

自2023年ChatGPT破圈以来,大模型在国内外呈现出百舸争流的竞发态势。胜利油田抢占技术发展前沿,成立油气人工智能课题组,进军行业大模型建设,加快人工智能技术和油气产业融合发展。

目前,“胜小利”油气大模型具有油气专业知识查询、图件查询、生产信息查询、工作进度查询、生产异常分析、公文辅助写作等20多项技能,显著减少了员工查数据、查资料、查系统的烦琐工作。

自然语言大模型是指基于深度学习技术训练的大规模神经网络模型,主要用于自然语言处理任务。这些模型具有巨大的参数量和强大的语言理解能力。“小模型AI,一个模型只能解决一个特定场景问题;而大模型AI能准确理解问题,自动调用各种数据、App,解决不同学科、不同场景的复杂问题,具有通用人工智能的巨大潜力。”油气人工智能课题组负责人、胜利油田信息化技术服务中心技术总监王振介绍。

“石油知识的百科全书”

数据是大模型成长的养分,只有不停给大模型投喂海量数据进行训练,才能保证准确性和生成效果。据悉,3.5版本的ChatGPT“学习”了上百亿通用知识,参数量已达1750亿,相当于3平方厘米大脑皮层的神经元量。

作为油气专业大模型,“胜小利”在学习通用知识的基础上,又强化学习了60万条油气勘探开发专业知识,完成了油藏工程、采油工程等石油相关专业本科基础课程,被喻为“石油知识的百科全书”。目前,“胜小利”的参数量已达930亿,每周接受2000条数据投喂。

通过对勘探开发数据、方案等资料的学习,“胜小利”可以良好地掌握油田的勘探开发、地质工程和生产过程等知识,帮助有需求的员工随时、全面查询油田发展历史、开发现状和未来趋势,加快数据提取速度,提高了工作效能。胜利油田还利用油气勘探开发基础资料、研究成果等内容对大模型进行微调训练,形成勘探开发应用模型,辅助科研人员编制方案,大幅度缩短研究周期和方案设计时间,全面提升勘探开发科学化决策水平。

2.0版本面向全油田开放

在王振眼里,“胜小利”犹如一个超级助理。经过大模型训练后,“胜小利”可以在油气行业不同岗位上发挥作用,提供知识问答、信息查询、问题研判、方案编制等服务,全面助力油田数字化、智能化转型。

当然,“胜小利”并非无所不能。对于超出认知范围的问题,它虽然仍能给出一个答案,但并非是正确答案,说明“它已经觉醒了,但会产生幻觉,不知道自己不知道”。

为每一次交互节省3分钟,是王振团队追求的目标。据测试,相比传统查数据库、登录系统的模式,“胜小利”每次交互可节省3分钟。如果在全系统全面推广,预计每日可节省交互时长2.5万小时,仅人工效率提高方面,可创造200万元/天经济效益。

1.0版本的“胜小利”仅局限于内部小范围进行测试,内测期间累计回答提问8000余次。而2.0版本的“胜小利”面向全油田开放,各单位和员工通过专业微调、强化训练,能够形成不同专业的应用大模型和个人定制专属大模型,加快大模型应用的落地。

信息来源:中国石化报
2023-12-20