CHATGPT是美國OpenAI公司于2022年11月推出的AI聊天機器人程序,基于人工智能技術驅動的自然語言處理工具,ChatGPT能完成聊天、文字翻譯、文案撰寫、詩歌創作、代碼編輯、方案推算等任務,是史上增長最快的消費者應用之一
OpenAI是一家人工智能研究和部署公司,使命是確保人工通用智能造福全人類。OpenAI的使命是確保人工通用智能(AGI)——指的是在具有經濟價值的工作中超越人類的高度自治系統——造福全人類。OpenAI將試圖直接建設安全和有益的AGI,但如果工作幫助他人實現這一結果,OpenAI也將認為我們的使命已經完成。OpenAI已經訓練了一個名為ChatGPT的模型,它以對話的方式進行(xing)交互。對話形式使ChatGPT能夠(gou)回答(da)后(hou)續問(wen)題,承認錯誤,質疑不正確的前提,并拒(ju)絕不適當的請求。ChatGPT是(shi)說明書,它被訓練成遵循提示中的指令并提供(gong)詳細(xi)的響應。
ChatGPT有時會寫出聽(ting)起來合理(li)但不(bu)(bu)正確或無意義的(de)答案(an)。解(jie)決這個問題是具(ju)有挑戰性的(de),因為(wei):(1)在RL訓練期間,目前沒有真實(shi)的(de)來源;(2)訓練模型(xing)(xing)更加謹慎導致它(ta)拒絕(jue)它(ta)能夠(gou)正確回答的(de)問題;以及(3)監督訓練誤導模型(xing)(xing),因為(wei)理(li)想答案(an)取決于模型(xing)(xing)知道什么,而不(bu)(bu)是人類示威(wei)者(zhe)所(suo)知道的(de)。
ChatGPT對輸入(ru)措辭的(de)調整或多次嘗試相同的(de)提示(shi)很敏感。例(li)如(ru),給定一(yi)(yi)個問(wen)(wen)題(ti)(ti)的(de)一(yi)(yi)種措辭,模(mo)型可以聲稱不知道答(da)案,但給定一(yi)(yi)個輕微(wei)的(de)措辭,可以正確地回(hui)答(da)。理想情況下,當用戶提供一(yi)(yi)個模(mo)糊的(de)查(cha)詢時,模(mo)型會(hui)問(wen)(wen)一(yi)(yi)些澄清(qing)性(xing)的(de)問(wen)(wen)題(ti)(ti)。相反(fan),我們當前的(de)模(mo)型通常(chang)猜測用戶的(de)意圖。
今天(tian)ChatGPT的研究發布是OpenAI的新一步迭代部(bu)署越(yue)來越(yue)安(an)(an)全和(he)有(you)用的人(ren)工智能系(xi)統。從早期模(mo)型的部(bu)署中(zhong)吸取(qu)的許多經驗(yan)教訓為此次發布的安(an)(an)全緩解(jie)措施提(ti)供了信息(xi),包括通過使用人(ren)類反(fan)饋強化(hua)學(xue)習實(shi)現的有(you)害和(he)不真(zhen)實(shi)輸(shu)出的大(da)幅減少。