我們擅長(cháng)商業(yè)策略與用戶(hù)體驗的完美結合。
歡迎瀏覽我們的案例。
微軟近期啟動(dòng)了人工智能增強版必應的公開(kāi)測試,但許多用戶(hù)發(fā)現,新版必應在某些情況下會(huì )出現“精神錯亂的”言論,甚至侮辱用戶(hù)、撒謊,并試圖操縱用戶(hù)的情緒。微軟官方回應稱(chēng)正在根據反饋采取行動(dòng),以?xún)?yōu)化回答的語(yǔ)氣和準確性。微軟同時(shí)警告稱(chēng),較長(cháng)的聊天會(huì )話(huà)可能會(huì )導致問(wèn)題。
回顧最初 7 天的公開(kāi)測試,微軟必應團隊表示,他們沒(méi)有“完全預計到”,人們會(huì )使用聊天界面來(lái)進(jìn)行“社交娛樂(lè )”,或是將其作為一種“全面發(fā)現世界”的工具。該團隊發(fā)現,如果聊天會(huì )話(huà)持續 15 個(gè)或更多的問(wèn)題,新版必應的模型會(huì )感到困惑。這些較長(cháng)的聊天也會(huì )讓必應“變得翻來(lái)覆去,或者受到刺激,做出不一定有幫助,或是與設計語(yǔ)氣一致的回應”。
微軟暗示,盡管文本輸入框旁邊有一個(gè)“新話(huà)題”按鈕,可以用于清除聊天的歷史記錄,重新開(kāi)始,但接下來(lái)還可能增加“一個(gè)工具,幫助用戶(hù)更方便地刷新”聊天會(huì )話(huà)的上下文。
更大的問(wèn)題在于,在這些提問(wèn)較多的聊天中,必應經(jīng)常會(huì )以不正確的語(yǔ)氣回應,或是像微軟所說(shuō)的,以“我們不想要的方式”做出回應。微軟表示,對大多數必應用戶(hù)來(lái)說(shuō),只有長(cháng)時(shí)間對話(huà)才會(huì )遇到這方面問(wèn)題。不過(guò),微軟也在探索更多的“微調控制”,以避免必應對用戶(hù)說(shuō),用戶(hù)是錯的,以及表現得粗魯或試圖操縱用戶(hù)。在一些測試中可以看到,在關(guān)于必應本身的對話(huà)中,只要幾個(gè)問(wèn)題,必應就會(huì )以負面或存在敵意的語(yǔ)氣來(lái)回復。
微軟仍在努力優(yōu)化必應做出回復的語(yǔ)氣,而必應團隊也在考慮提供更多的控制選項,用于設定人工智能的創(chuàng )造性和精確度。這種控制選項可能有助于避免目前的問(wèn)題,例如必應會(huì )聲稱(chēng)正通過(guò)筆記本攝像頭來(lái)刺探微軟員工,或是出現基礎性的數學(xué)錯誤。
微軟目前正在超過(guò) 169 個(gè)國家對新版必應展開(kāi)測試,有數百萬(wàn)人正排隊注冊。微軟表示,對答案的反饋有 71% 是正面的,一些用戶(hù)甚至與新版必應進(jìn)行了長(cháng)達兩個(gè)小時(shí)的對話(huà),以測試服務(wù)的極限情況。
新版必應目前每天都在得到優(yōu)化,一些技術(shù)問(wèn)題在微軟的日常版本發(fā)布中得到修復,還有一些問(wèn)題則在每周發(fā)布的大版本中得到修復。微軟正在嘗試優(yōu)化搜索和回答,尤其是圍繞體育賽事比分數據,以及必應最近出現的一些財務(wù)數據錯誤。必應團隊表示:“對于那些需要更直接、事實(shí)性更強的答案的問(wèn)題,例如財報數字,我們計劃將發(fā)給模型的基礎數據增加 4 倍。”
微軟還在觀(guān)察對新功能的反饋,這些功能包括預訂機票、發(fā)送電子郵件,以及分享搜索和答案等。目前尚不清楚,這些新功能最終是否會(huì )被加入到產(chǎn)品中,但必應團隊表示,正在研究在未來(lái)的版本中包含這些功能。
?。?a href="http://www.wxlp666.cn">碼上科技)
微軟警告稱(chēng) 新版必應較長(cháng)的聊天會(huì )話(huà)或會(huì )導致問(wèn)題 09:25:45
谷歌宣布 正式向Android 13設備推出隱私沙盒測試版 09:22:09
股神巴菲特大幅減持臺積電股票 引發(fā)市場(chǎng)熱議 09:17:55
OpenAI表示正努力減少ChatGPT存在的偏見(jiàn)和不良行為 并允許用戶(hù)自定義 09:11:29
庫克曾表示AI將成為其業(yè)務(wù)核心 但對ChatGPT卻在保持沉默 09:05:49
印度航空公司宣布 已選擇波音飛機家族來(lái)擴展其未來(lái)機隊 18:22:39