我們擅長(cháng)商業(yè)策略與用戶(hù)體驗的完美結合。
歡迎瀏覽我們的案例。
“深度思維”團隊利用大語(yǔ)言模型(LLM)對一個(gè)著(zhù)名的數學(xué)問(wèn)題提出了“新見(jiàn)解”,并通過(guò)系統的、迭代的評估框架確保其正確。這一研究或可改進(jìn) LLM 用來(lái)解決問(wèn)題和學(xué)習新知識的途徑。相關(guān)論文發(fā)表在 14 日的《自然》雜志上。
基于人工智能的工具(例如 LLM)有時(shí)受制于“幻覺(jué)”,導致作出看似合理但實(shí)際是錯誤的陳述。加入一個(gè)評估步驟,系統地衡量潛在解決方案的準確性,使得利用 LLM 應對復雜問(wèn)題成為可能。這些問(wèn)題一般需要可驗證且定義明確,從而使這一工具在數學(xué)科學(xué)中有潛在價(jià)值。
研究團隊此次介紹了一種方法,稱(chēng)為“FunSearch”。他們將一組產(chǎn)生創(chuàng )造性解決方案的 LLM 和一個(gè)作為檢查者以避免錯誤建議的評估程序結合起來(lái)。接著(zhù),將一個(gè)多次迭代此過(guò)程的演化方法,作為輸入來(lái)引導 LLM。結果表明,這種方法可以得到新的、可驗證的正確結果。他們將“FunSearch”應用到了著(zhù)名的上限集問(wèn)題(數學(xué)中涉及計數和排列領(lǐng)域的一個(gè)中心問(wèn)題),發(fā)現了超越最著(zhù)名上限集的大上限集新構造。
研究人員表示,“FunSearch”的成功關(guān)鍵是它會(huì )尋找那些描述怎樣解決問(wèn)題的程序,而非直接尋找解決辦法。因為“FunSearch”的結果易于被解釋和驗證,這意味著(zhù)這一方法有望激發(fā)科學(xué)家在該領(lǐng)域的進(jìn)一步思考。
數學(xué)真要成為首個(gè)借助 AI 實(shí)現突破的學(xué)科嗎?一方面,數學(xué)家越來(lái)越頻繁地使用 AI;另一方面,AI 也很“配合”——既可用于解決編程等應用學(xué)科的問(wèn)題,也可用來(lái)攻克包括數學(xué)在內的自然學(xué)科。本文中這項成果,現階段可能還不適合解決大多數類(lèi)型的挑戰,但研究團隊提出了未來(lái)改進(jìn)的可能?;蛟S在不久之后,“FunSearch”將可用于破解數學(xué)界更大范圍、更多種多樣的難題。