CHATGPT是美國OpenAI公司于2022年11月推出的AI聊天機器人程序,基于人工智能技術驅動的自然語言處理工具,ChatGPT能完成聊天、文字翻譯、文案撰寫、詩歌創作、代碼編輯、方案推算等任務,是史上增長最快的消費者應用之一
OpenAI是一家人工智能研究和部署公司,使命是確保人工通用智能造福全人類。OpenAI的使命是確保人工通用智能(AGI)——指的是在具有經濟價值的工作中超越人類的高度自治系統——造福全人類。OpenAI將試圖直接建設安全和有益的AGI,但如果工作幫助他人實現這一結果,OpenAI也將認為我們的使命已經完成。OpenAI已經(jing)訓練了一個名為ChatGPT的(de)模型,它(ta)以對話的(de)方式進行(xing)交互。對話形式使ChatGPT能夠回答后(hou)續(xu)問題,承認錯誤,質疑(yi)不正確的(de)前提(ti),并(bing)拒絕不適(shi)當的(de)請求。ChatGPT是說明(ming)書,它(ta)被訓練成(cheng)遵循提(ti)示中的(de)指令并(bing)提(ti)供詳(xiang)細(xi)的(de)響應。
ChatGPT有(you)時會寫出(chu)聽(ting)起(qi)來(lai)(lai)合理但不正確或無意義的答案。解(jie)決(jue)這(zhe)個問題是具有(you)挑戰性的,因為:(1)在(zai)RL訓練期間(jian),目前沒有(you)真實的來(lai)(lai)源;(2)訓練模(mo)(mo)型(xing)更加(jia)謹慎導(dao)致(zhi)它拒絕它能夠(gou)正確回答的問題;以(yi)及(3)監督訓練誤導(dao)模(mo)(mo)型(xing),因為理想答案取決(jue)于(yu)模(mo)(mo)型(xing)知道什(shen)么(me),而(er)不是人(ren)類示威者所知道的。
ChatGPT對輸入(ru)措辭(ci)的(de)(de)調整或多次嘗(chang)試相(xiang)(xiang)同的(de)(de)提示(shi)很敏感。例如,給定一(yi)個問(wen)題的(de)(de)一(yi)種措辭(ci),模型可(ke)以聲稱不知道(dao)答案,但給定一(yi)個輕微的(de)(de)措辭(ci),可(ke)以正確地回(hui)答。理(li)想情況(kuang)下(xia),當用(yong)戶(hu)提供一(yi)個模糊的(de)(de)查詢時,模型會問(wen)一(yi)些澄清性(xing)的(de)(de)問(wen)題。相(xiang)(xiang)反,我們當前的(de)(de)模型通常猜測用(yong)戶(hu)的(de)(de)意圖。
今天ChatGPT的研究(jiu)發布是(shi)OpenAI的新一步(bu)迭代部(bu)署(shu)越來越安全(quan)和有用(yong)的人工智能系統(tong)。從早期模型的部(bu)署(shu)中吸(xi)取的許多(duo)經驗(yan)教訓為此次(ci)發布的安全(quan)緩解措施提供了信息,包括通過使用(yong)人類反饋強(qiang)化學習實(shi)現(xian)的有害和不真實(shi)輸出的大(da)幅減少。