Skip to content

Latest commit

 

History

History
93 lines (47 loc) · 6.51 KB

openai-approach-ai-safety.md

File metadata and controls

93 lines (47 loc) · 6.51 KB

OpenAI 的 AI 安全方法

原文:www.kdnuggets.com/2023/06/openai-approach-ai-safety.html

OpenAI 的 AI 安全方法

作者图片

你可能看到过 OpenAI CEO 山姆·奥特曼在 16 日的美国参议院委员会上的视频。如果没有,山姆·奥特曼呼吁美国立法者对人工智能(AI)进行监管。CEO 就新技术的担忧和可能的陷阱进行了作证。


我们的前三个课程推荐

1. 谷歌网络安全证书 - 快速进入网络安全职业

2. 谷歌数据分析专业证书 - 提升您的数据分析技能

3. 谷歌 IT 支持专业证书 - 支持您的组织进行 IT 工作


自从 ChatGPT 发布以来,市场上涌现了大量的大语言模型以及其他 AI 模型。在过去几个月里,政府之间关于 AI 及其对社会安全的监管有了各种讨论。欧盟正在推动他们的 AI 法案,其他大陆也在效仿。

山姆·奥特曼一直关注人工智能使用中的伦理问题和担忧,并推动更多的监管。他发表声明说:

“我认为如果这项技术出现问题,可能会变得非常严重……我们希望对此大声疾呼。我们希望与政府合作,防止这种情况发生。”

OpenAI 的安全承诺

OpenAI 一直坚持其保持 AI 安全和有益的承诺。他们理解,像 ChatGPT 这样的工具已经提升了许多人的生产力、创造力和整体工作体验。然而,安全仍然是他们的主要优先事项之一。

那么,OpenAI 是如何确保他们的 AI 模型安全的呢?

严格测试

在任何 AI 系统发布之前,OpenAI 都会进行严格的测试,借助外部专家并不断寻找改进系统的方法。他们使用如人类反馈强化学习等技术来改善模型的行为,从而建立更好的安全和监控系统。

OpenAI 在发布其最新模型 GPT-4 之前,花费了超过 6 个月的时间确保其安全。

现实世界应用

没有什么比实际应用更好的测试了。创建一个新的系统并尽力防止所有可能的风险是好的。但是你不能在实验室中控制这些风险,你必须让它真正投入公众使用。

不幸的是,对于 AI 系统,你无法限制或预测公众如何使用它——是受益还是滥用。OpenAI 发布 AI 系统时设置了多项保护措施,并且一旦扩大了能够访问其 AI 系统的人群,他们会确保持续改进。

提供给开发者的 API 也使 OpenAI 能够监控潜在的滥用行为,并利用这些信息来构建缓解措施。OpenAI 认为,社会应在 AI 继续发展的过程中发挥重要作用。

保护儿童

OpenAI 在 AI 安全方面的一个主要关注点是保护儿童。他们目前正在研究用户必须年满 18 岁,或在 13 岁以上并获得父母同意的验证选项。他们已经表示不允许其技术用于生成任何形式的仇恨、暴力或成人内容。

他们还制定了更多工具和方法来保护儿童,例如,当用户尝试将已知的儿童性虐待材料上传到我们的图像工具时,OpenAI 已经部署了 Thorn 的 Safer 来检测、审查并报告给国家失踪和被剥削儿童中心。

为了确保儿童从 ChatGPT 等工具中获益,OpenAI 与 Khan Academy 合作,建立了一个AI 驱动的助手,作为学生的虚拟导师和教师的课堂助手。

隐私

大型语言模型已在各种公开可用的来源上进行训练,有些人认为这存在隐私问题。OpenAI 已声明:

“我们不使用数据来出售我们的服务、做广告或建立个人档案——我们使用数据来使我们的模型对人们更有帮助。”

他们的目标是让像 ChatGPT 这样的工具了解世界,而不是个人隐私。为了确保这一点,在可行的情况下,OpenAI 从训练数据集中删除个人信息,并微调其模型以拒绝任何有关个人信息的请求。它还会要求个人从 OpenAI 的系统中删除其个人信息。

准确性

对 ChatGPT 等工具的用户反馈使 OpenAI 能够标记被认为不正确的输出,并将其作为主要数据来源。提高事实准确性是他们的重点之一,GPT-4 产生事实内容的可能性比 GPT-3.5 高 40%

总结

随着 OpenAI 阐述其 AI 安全方法,并且 CEO Sam Altman 解决了 AI 系统的潜在问题,敦促政府制定相关法规,这是解决 AI 安全问题的开始。

这将需要更多的时间、资源以及从市场上最有能力的模型中学习。OpenAI 等待了超过 6 个月才部署 GPT-4,然而,他们已经表示为了确保安全,可能需要更长时间。

你认为接下来会发生什么?

如果你想观看 OpenAI 的萨姆·阿尔特曼在 16 日星期二的听证会,你可以在这里查看:ChatGPT 首席萨姆·阿尔特曼在国会就 AI 作证

尼莎·阿雅 是一名数据科学家、自由技术写作人以及 KDnuggets 的社区经理。她特别关注提供数据科学职业建议或教程及理论知识。她还希望探索人工智能如何有助于延长人类寿命的不同方式。作为一个热衷学习的人,她寻求扩展她的技术知识和写作技能,同时帮助指导他人。

更多相关话题