亚洲色成人四虎最近网址_成人色网站免费观看_特黄特黄欧美大片视频_任你干草精品视频免费不_东京热免费一区_亚洲国产精品 码久久_日韩国产精品一级毛片_闺蜜说她有一个黑色大宝贝_365看片午夜福利_织田真子中文字幕在线观看

電話:7684-4867-7684
OpenAI推出安全評估中心,定期公布AI模型評估結(jié)果以增強(qiáng)透明度
作者:admin 發(fā)布時(shí)間:2025-06-01 13:24

IT之家 5 月 15 日消息,OpenAI 宣布將更頻繁地公開其內(nèi)部人工智能模型的安全評估結(jié)果,以提高透明度。該公司于周三正式上線了“安全評估中心”網(wǎng)頁,旨在展示其模型在有害內(nèi)容生成、模型越獄以及幻覺現(xiàn)象等方面的測試表現(xiàn)。

OpenAI 表示,該安全評估中心將用于持續(xù)發(fā)布模型相關(guān)指標(biāo),并計(jì)劃在未來的重大模型更新后及時(shí)更新網(wǎng)頁內(nèi)容。OpenAI 在一篇博客文章中寫道:“隨著人工智能評估科學(xué)的不斷發(fā)展,我們致力于分享我們在開發(fā)更具可擴(kuò)展性的模型能力與安全評估方法方面的進(jìn)展?!痹摴具€強(qiáng)調(diào),通過在此公開部分安全評估結(jié)果,不僅希望讓用戶更清晰地了解 OpenAI 系統(tǒng)隨時(shí)間的安全性能變化,也期望能夠支持整個(gè)行業(yè)在透明度方面的共同努力。此外,OpenAI 提到可能會(huì)隨著時(shí)間推移在該中心增加更多評估項(xiàng)目。

此前,OpenAI 曾因部分旗艦?zāi)P偷陌踩珳y試流程過快以及未發(fā)布其他模型的技術(shù)報(bào)告而受到一些倫理學(xué)家的批評。公司首席執(zhí)行官山姆?奧爾特曼(Sam Altman)也因被指在 2023 年 11 月短暫被免職前誤導(dǎo)公司高管關(guān)于模型安全審查的問題而備受爭議。

IT之家注意到,就在上個(gè)月末,OpenAI 不得不撤銷對 ChatGPT 默認(rèn)模型 GPT-4o 的一次更新。原因是用戶報(bào)告稱該模型的回應(yīng)方式過于“諂媚”,甚至對一些有問題的、危險(xiǎn)的決策和想法也表示贊同。針對這一事件,OpenAI 表示將采取一系列修復(fù)和改進(jìn)措施,以防止類似事件再次發(fā)生。其中包括為部分模型引入一個(gè)可選的“alpha 階段”,允許部分 ChatGPT 用戶在模型正式發(fā)布前進(jìn)行測試并提供反饋。


電話
7684-4867-7684