几个月研究ChatGPT的总结和思考-群英

几个月研究ChatGPT的总结和思考

Admin发表于 2023-06-06 10:30:31365 次浏览

这篇文章主要给大家介绍“几个月研究ChatGPT的总结和思考”的相关知识，下文通过实际案例向大家展示操作过程，内容简单清晰，易于学习，有这方面学习需要的朋友可以参考，希望这篇“几个月研究ChatGPT的总结和思考”文章能对大家有所帮助。

title: ChatGPT研究总结
author: 杨杰
date: 20230206

ChatGPT学习研究总结

———— 杨杰 20230206

ChatGPT研究总结

ChatGPT是一种由OpenAI训练的大型语言模型，它可以生成人类语言文本。在编写小段代码、书写描述功能介绍等等方面有一定的帮助，但因为工具本来存在一些错误现象，所以还需要人工审核，用其精华。同时，使用过程中还需注意对结果中可能存在的版权风险。

目前ChatGPT使用中主要存在如下问题：

慢：因为计算量巨大，速度较慢，通常一个问题需要几分钟才有答案
错：因为只是文本语言模型分析，存在回答结果错误现象
广度待提升：模型训练的领域广度还待提升

一、程序接入用途不大

程序接入的用途不大，因为通过sdk只是封装出一个软件界面，核心的计算代码还是部署在服务器上的训练代码，而目前通过微信公众号（ChatChatGPT）等接口输入也能达到使用ChatGPT，所以没有必要来接入程序，做一个“软件壳”，作用不大。

二、思考：如何构建一个类似ChatGPT的自定义模型

例如，能否构建一个压裂监测模型，根据监测的电磁信号来推测压裂缝隙的走向?

关于这个问题，先总监一下 ChatGPT 模型构建中的几个关键点：

1、大数据训练:

基于2021年所拥有的数据集，预训练数据量可能超过百T级，非常巨大
ChatGPT参数量达到了1750亿，模型设定的参数非常多

2、人工对结果标注
ChatGPT进行了人工标反馈和奖励，以辅助人工智能程序不断优化（进化）

3、训练费用

“GPT-3 模型训练一次需要花费 460 万美元”

见附录：《chatGPT 的 49 种应用场景介绍，各开发语言接入 chatGPT 参考指南》一文。

综合这几点，我们可以构建出一个预测压裂监测缝隙的模型，但前提是有足够的数据，也需要人工来验证相应数据的结果，提供充足的资金，来进行模型训练。

一些ChatGPT研究学习资料（来源网络）

（1）一文读懂ChatGPT模型原理

一文读懂ChatGPT模型原理

https://zhuanlan.zhihu.com/p/589621442

不光是做人工智能、机器学习的人关注，而是大量的各行各业从业人员都来关注这个模型，真可谓空前盛世。
所谓语言模型的训练和学习，就是从大量的数据中学习复杂的上下文联系。

与此同时，OpenAI 早于 Bert 出品了一个初代 GPT 模型。

在 NLP 领域，人们使用语言一般包括三个步骤：
接受听到或读到的语言 -> 大脑理解 -> 输出要说的语言。

GPT-3 的模型所采用的数据量之大，高达上万亿，模型参数量也十分巨大，上千亿，学习之复杂，计算之繁复，
如此巨大的模型造就了 GPT-3 在许多十分困难的 NLP 任务，诸如撰写人类难以判别的文章，甚至编写SQL查询语句，React或者JavaScript代码上优异的表现。

ChatGPT 模型上基本上和之前 GPT-3 都没有太大变化，主要变化的是训练策略变了，用上了强化学习。
几年前，alpha GO 击败了柯洁，几乎可以说明，强化学习如果在适合的条件下，完全可以打败人类，逼近完美的极限。
强化学习非常像生物进化，模型在给定的环境中，不断地根据环境的惩罚和奖励（reward），拟合到一个最适应环境的状态。

这里重点是第二步中，如何构建一个 reward 函数，在alpha go 里，这个reward 函数就是下完一盘围棋之后判断谁输谁赢，只需要一个程序函数即可完成。
而在ChatGPT里，具体就是让那40名外包人员不断地从模型的输出结果中筛选，判断哪些句子是好的，哪些是低质量的，这样就可以训练得到一个 reward 模型。

一个语言文字训练的人工智能程序

存在问题：