CHATGPT是美國OpenAI公司于2022年11月推出的AI聊天機器人程序,基于人工智能技術驅動的自然語言處理工具,ChatGPT能完成聊天、文字翻譯、文案撰寫、詩歌創作、代碼編輯、方案推算等任務,是史上增長最快的消費者應用之一
OpenAI是一家人工智能研究和部署公司,使命是確保人工通用智能造福全人類。OpenAI的使命是確保人工通用智能(AGI)——指的是在具有經濟價值的工作中超越人類的高度自治系統——造福全人類。OpenAI將試圖直接建設安全和有益的AGI,但如果工作幫助他人實現這一結果,OpenAI也將認為我們的使命已經完成。OpenAI已經訓(xun)練(lian)(lian)了一個名為ChatGPT的(de)(de)模型,它以(yi)對話的(de)(de)方式進(jin)行交互(hu)。對話形(xing)式使ChatGPT能夠回(hui)答后(hou)續問(wen)題,承認錯誤,質疑(yi)不正確的(de)(de)前提(ti)(ti),并(bing)拒(ju)絕不適當的(de)(de)請(qing)求。ChatGPT是(shi)說明書,它被訓(xun)練(lian)(lian)成遵循(xun)提(ti)(ti)示中的(de)(de)指令(ling)并(bing)提(ti)(ti)供詳細的(de)(de)響應。
ChatGPT有(you)時(shi)會寫出(chu)聽起(qi)來合理但不正確(que)或無意義(yi)的答案。解決這(zhe)個問題是(shi)具(ju)有(you)挑(tiao)戰性的,因(yin)為:(1)在RL訓練(lian)期間,目前沒有(you)真實的來源;(2)訓練(lian)模型更(geng)加謹慎導致它拒絕它能夠正確(que)回(hui)答的問題;以及(3)監督訓練(lian)誤導模型,因(yin)為理想答案取決于模型知(zhi)道什么,而不是(shi)人類(lei)示威者所知(zhi)道的。
ChatGPT對(dui)輸(shu)入措(cuo)(cuo)辭的(de)調整或多次嘗試相同的(de)提(ti)示很敏感(gan)。例如(ru),給定一(yi)個問題的(de)一(yi)種(zhong)措(cuo)(cuo)辭,模(mo)(mo)型(xing)可以聲稱不(bu)知(zhi)道答案,但(dan)給定一(yi)個輕微的(de)措(cuo)(cuo)辭,可以正確地回答。理想情(qing)況(kuang)下,當用戶提(ti)供一(yi)個模(mo)(mo)糊(hu)的(de)查詢時,模(mo)(mo)型(xing)會(hui)問一(yi)些澄清性的(de)問題。相反,我們當前(qian)的(de)模(mo)(mo)型(xing)通常猜測用戶的(de)意(yi)圖。
今天ChatGPT的(de)研究發布是OpenAI的(de)新一步迭代部署越來越安全和有用(yong)的(de)人(ren)(ren)工智能系(xi)統。從早期模型的(de)部署中吸取的(de)許(xu)多經驗教(jiao)訓為此次發布的(de)安全緩解措施提供了信(xin)息,包括通過使用(yong)人(ren)(ren)類反饋強化學習實(shi)現(xian)的(de)有害和不(bu)真實(shi)輸出的(de)大(da)幅減少。