本報訊 (記者李冰)7月28日,在世界人工智能大會論壇上,螞蟻數科正式發(fā)布金融推理大模型Agentar-Fin-R1,為金融AI應用打造“可靠、可控、可優(yōu)化”的智能中樞。Agentar-Fin-R1基于Qwen3研發(fā),在FinEval1.0、FinanceIQ等權威金融大模型評測基準上超越DeepSeek-R1等同尺寸開源通用大模型以及金融大模型,顯示其更強的金融專業(yè)性、推理能力以及安全合規(guī)能力。
“通用大模型距離產業(yè)實際應用存在‘知識鴻溝’。構建專業(yè)的金融大模型是推進金融與AI深度融合的必然路徑,未來,金融大模型的應用深度將成為金融機構競爭力的關鍵要素。”螞蟻數科CEO趙聞飆在演講中表示。
據悉,螞蟻數科通過構建全面的金融任務數據體系以及模型訓練算法創(chuàng)新,實現模型更強的金融推理能力及可信性。評測結果顯示:相較于通用開源模型及其他金融模型,Agentar-Fin-R1在FinEval1.0、FinanceIQ兩大主流金融基準測試中均取得最高評分。并且模型在金融能力顯著增強的同時,通用能力也表現出較高水準。
在數據層面,螞蟻數科構建了業(yè)內最全面與專業(yè)的金融任務分類體系,包括6大類、66小類場景,覆蓋銀行、證券、保險、基金、信托等金融全場景?;谇|級金融專業(yè)數據語料,通過可信數據合成技術以及結合專家標注的金融長思維鏈(CoT)構造機制,顯著提升模型處理復雜任務的能力,讓大模型“天生懂金融,出廠即專家”。
在訓練層面,創(chuàng)新的加權訓練算法,提高大模型對復雜金融任務學習效率與性能。在后續(xù)業(yè)務應用中,可顯著減少二次微調的數據需求與算力消耗,有效降低大模型在企業(yè)落地的門檻與成本。此外,Agentar-Fin-R1還能不斷更新迭代,吸收最新的金融政策、市場動態(tài)等關鍵信息,并通過配套評測工具進行針對性優(yōu)化,讓模型能力在真實業(yè)務場景中不斷進化。
為了考察大模型在實際金融場景中部署的能力,螞蟻數科還聯合工商銀行、寧波銀行、北京前沿金融監(jiān)管科技研究院、上海人工智能行業(yè)協會等機構聯合推出Finova大模型金融應用評測基準,深度考察智能體能力、復雜推理以及安全合規(guī)能力。在Finova評測中,Agentar-Fin-R1也取得最高評分,甚至超越更大參數規(guī)模的通用模型。目前Finova已經全面開源,推動行業(yè)共同提升大模型在金融領域的應用水平。
甬城證券期貨機構共探財富管理轉型 聚力提升投資者服務質效2025-07-29 17:25
| 00:43 | 一季度我國貨物貿易進出口增速創(chuàng)近... |
| 00:43 | 中國人民銀行縮量續(xù)做6個月期買斷... |
| 00:43 | 從展會流量到發(fā)展增量:透視消博會... |
| 00:43 | 油價波動 航空業(yè)以變應變 |
| 00:43 | 優(yōu)化結構布局、“向新而聚”行業(yè)協... |
| 00:43 | 首例新三板“幫助造假”民事賠償案... |
| 00:43 | 商務部、中國進出口銀行:加大進出... |
| 00:43 | 優(yōu)化融資并購制度 護航創(chuàng)業(yè)板改革... |
| 00:43 | 存儲行業(yè)前沿技術受關注 相關企業(yè)... |
| 00:43 | 債基管理人加強風控調整凈值精度 |
| 00:43 | 多家銀行密集停發(fā)多款信用卡產品 |
| 00:43 | 消博會觀察:“新”元素釋放新價值 |
版權所有《證券日報》社有限責任公司
互聯網新聞信息服務許可證 10120240020增值電信業(yè)務經營許可證 京B2-20250455
京公網安備 11010602201377號京ICP備19002521號
證券日報網所載文章、數據僅供參考,使用前務請仔細閱讀法律申明,風險自負。
證券日報社電話:010-83251700網站電話:010-83251800 網站傳真:010-83251801電子郵件:xmtzx@zqrb.net
安卓
IOS
掃一掃,加關注
掃一掃,加關注