OpenAI 的 AI 安全方法

原文：www.kdnuggets.com/2023/06/openai-approach-ai-safety.html

作者图片

你可能看到过 OpenAI CEO 山姆·奥特曼在 16 日的美国参议院委员会上的视频。如果没有，山姆·奥特曼呼吁美国立法者对人工智能（AI）进行监管。CEO 就新技术的担忧和可能的陷阱进行了作证。

我们的前三个课程推荐

1. 谷歌网络安全证书 - 快速进入网络安全职业

2. 谷歌数据分析专业证书 - 提升您的数据分析技能

3. 谷歌 IT 支持专业证书 - 支持您的组织进行 IT 工作

自从 ChatGPT 发布以来，市场上涌现了大量的大语言模型以及其他 AI 模型。在过去几个月里，政府之间关于 AI 及其对社会安全的监管有了各种讨论。欧盟正在推动他们的 AI 法案，其他大陆也在效仿。

山姆·奥特曼一直关注人工智能使用中的伦理问题和担忧，并推动更多的监管。他发表声明说：

“我认为如果这项技术出现问题，可能会变得非常严重……我们希望对此大声疾呼。我们希望与政府合作，防止这种情况发生。”

OpenAI 的安全承诺

OpenAI 一直坚持其保持 AI 安全和有益的承诺。他们理解，像 ChatGPT 这样的工具已经提升了许多人的生产力、创造力和整体工作体验。然而，安全仍然是他们的主要优先事项之一。

那么，OpenAI 是如何确保他们的 AI 模型安全的呢？

严格测试

在任何 AI 系统发布之前，OpenAI 都会进行严格的测试，借助外部专家并不断寻找改进系统的方法。他们使用如人类反馈强化学习等技术来改善模型的行为，从而建立更好的安全和监控系统。

OpenAI 在发布其最新模型 GPT-4 之前，花费了超过 6 个月的时间确保其安全。

现实世界应用

没有什么比实际应用更好的测试了。创建一个新的系统并尽力防止所有可能的风险是好的。但是你不能在实验室中控制这些风险，你必须让它真正投入公众使用。

不幸的是，对于 AI 系统，你无法限制或预测公众如何使用它——是受益还是滥用。OpenAI 发布 AI 系统时设置了多项保护措施，并且一旦扩大了能够访问其 AI 系统的人群，他们会确保持续改进。

提供给开发者的 API 也使 OpenAI 能够监控潜在的滥用行为，并利用这些信息来构建缓解措施。OpenAI 认为，社会应在 AI 继续发展的过程中发挥重要作用。

保护儿童

OpenAI 在 AI 安全方面的一个主要关注点是保护儿童。他们目前正在研究用户必须年满 18 岁，或在 13 岁以上并获得父母同意的验证选项。他们已经表示不允许其技术用于生成任何形式的仇恨、暴力或成人内容。

他们还制定了更多工具和方法来保护儿童，例如，当用户尝试将已知的儿童性虐待材料上传到我们的图像工具时，OpenAI 已经部署了 Thorn 的 Safer 来检测、审查并报告给国家失踪和被剥削儿童中心。

为了确保儿童从 ChatGPT 等工具中获益，OpenAI 与 Khan Academy 合作，建立了一个AI 驱动的助手，作为学生的虚拟导师和教师的课堂助手。

隐私

大型语言模型已在各种公开可用的来源上进行训练，有些人认为这存在隐私问题。OpenAI 已声明：

“我们不使用数据来出售我们的服务、做广告或建立个人档案——我们使用数据来使我们的模型对人们更有帮助。”

他们的目标是让像 ChatGPT 这样的工具了解世界，而不是个人隐私。为了确保这一点，在可行的情况下，OpenAI 从训练数据集中删除个人信息，并微调其模型以拒绝任何有关个人信息的请求。它还会要求个人从 OpenAI 的系统中删除其个人信息。

准确性

对 ChatGPT 等工具的用户反馈使 OpenAI 能够标记被认为不正确的输出，并将其作为主要数据来源。提高事实准确性是他们的重点之一，GPT-4 产生事实内容的可能性比 GPT-3.5 高 40%。

总结

随着 OpenAI 阐述其 AI 安全方法，并且 CEO Sam Altman 解决了 AI 系统的潜在问题，敦促政府制定相关法规，这是解决 AI 安全问题的开始。

这将需要更多的时间、资源以及从市场上最有能力的模型中学习。OpenAI 等待了超过 6 个月才部署 GPT-4，然而，他们已经表示为了确保安全，可能需要更长时间。

你认为接下来会发生什么？

如果你想观看 OpenAI 的萨姆·阿尔特曼在 16 日星期二的听证会，你可以在这里查看：ChatGPT 首席萨姆·阿尔特曼在国会就 AI 作证。

尼莎·阿雅 是一名数据科学家、自由技术写作人以及 KDnuggets 的社区经理。她特别关注提供数据科学职业建议或教程及理论知识。她还希望探索人工智能如何有助于延长人类寿命的不同方式。作为一个热衷学习的人，她寻求扩展她的技术知识和写作技能，同时帮助指导他人。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

openai-approach-ai-safety.md

openai-approach-ai-safety.md

OpenAI 的 AI 安全方法

我们的前三个课程推荐

OpenAI 的安全承诺

严格测试

现实世界应用

保护儿童

隐私

准确性

总结

更多相关话题

Files

openai-approach-ai-safety.md

Latest commit

History

openai-approach-ai-safety.md

File metadata and controls

OpenAI 的 AI 安全方法

我们的前三个课程推荐

OpenAI 的安全承诺

严格测试

现实世界应用

保护儿童

隐私

准确性

总结

更多相关话题