作者|長亮科技研發(fā)中心
文章導(dǎo)讀:
本文從銀行核心系統(tǒng) AI 轉(zhuǎn)型的挑戰(zhàn)出發(fā),分享了長亮科技基于銀行核心系統(tǒng)多年經(jīng)驗(yàn)積淀給出的破局思路,提出在“N+M”大模型協(xié)同策略支持下探索人機(jī)協(xié)作新范式的漸進(jìn)式路徑,并展示了在 DeepSeek-R1 加持下,智能化需求分析場景中的技術(shù)實(shí)踐階段成果。未來,長亮科技將從深化智能體協(xié)作和拓寬多場景應(yīng)用兩方面入手,打造銀行智能化核心系統(tǒng)研發(fā)新范式。
01
新核心挑戰(zhàn)
在金融業(yè)智能化變革的臨界點(diǎn)上,銀行核心系統(tǒng)正經(jīng)歷從"功能引擎"向"認(rèn)知中樞"的質(zhì)變。尤其是近兩年,大模型技術(shù)的迅猛發(fā)展,不斷重塑行業(yè)對(duì) AI 落地的想象空間,為銀行核心系統(tǒng)的智能化轉(zhuǎn)型帶來新的可能性。
然而,銀行核心系統(tǒng)作為銀行的 “大腦” 和 “心臟”,在準(zhǔn)確性、高可用性以及合規(guī)性方面有著極為嚴(yán)苛的要求,使大模型技術(shù)在銀行核心系統(tǒng)中的應(yīng)用面臨諸多挑戰(zhàn)。主要問題集中在:
1、通用知識(shí)專業(yè)性局限:通用大模型缺乏銀行核心系統(tǒng)領(lǐng)域的專業(yè)業(yè)務(wù)知識(shí),面對(duì)核心系統(tǒng)復(fù)雜的專業(yè)場景需求時(shí),效果通常不及預(yù)期。
2、大模型落地困境:大模型部署和運(yùn)行所依賴的高算力資源,以及模型調(diào)優(yōu)的專業(yè)度要求,增加了落地難度。
3、復(fù)雜系統(tǒng)的跨域協(xié)同挑戰(zhàn):銀行IT架構(gòu)復(fù)雜,核心系統(tǒng)往往需要跟上百個(gè)外圍系統(tǒng)交互,對(duì)大模型能力提出嚴(yán)峻挑戰(zhàn)。
針對(duì)這些問題,長亮科技提出以下破局思路:構(gòu)建"N+M"大模型協(xié)同策略,通過N個(gè)通用大模型與M個(gè)場景小模型的有機(jī)組合,全面提升金融領(lǐng)域的大模型應(yīng)用效果,拓寬大模型應(yīng)用場景。
“N”:精選適配銀行核心場景的通用大模型
基于長亮科技深入的通用大模型能力評(píng)估和適用性研究,針對(duì)銀行核心系統(tǒng) AI 賦能場景的具體需求,甄選通用大模型組合,實(shí)現(xiàn)價(jià)值快速落地。
“M”:構(gòu)建專業(yè)場景小模型
聚焦銀行核心業(yè)務(wù)高價(jià)值高復(fù)雜的細(xì)分場景,深度融合長亮科技核心產(chǎn)品知識(shí)和行業(yè)最佳實(shí)踐,打造輕量級(jí)的場景小模型。

這種創(chuàng)新的“N+M”大模型協(xié)同策略,可以根據(jù)任務(wù)特性靈活適配,通過大模型、小模型甚至傳統(tǒng) AI 技術(shù)的靈活組合,有效實(shí)現(xiàn)核心系統(tǒng)復(fù)雜場景的智能化作業(yè),提高 Al Agent 輸出結(jié)果的準(zhǔn)確性和可靠性,從而精準(zhǔn)滿足銀行核心領(lǐng)域 AI 賦能的深度應(yīng)用需求,加速價(jià)值落地。
02
新范式探索
基于“N+M”大模型協(xié)同策略的破局思路,長亮科技以打造銀行智能核心一體化方案為目標(biāo),制定了三階段研發(fā)規(guī)劃:

模型試水:驗(yàn)證通用大模型,探索場景小模型
? 目標(biāo):探索通用大模型在不同場景下的能力邊界和適用性。
? 策略:選擇多個(gè)通用大模型快速驗(yàn)證其原子能力,針對(duì)特定場景嘗試微調(diào)場景小模型進(jìn)行增強(qiáng),保留關(guān)鍵能力,降低部署門檻。
? 實(shí)踐:從領(lǐng)域知識(shí)問答、文檔修訂等場景入手,采用 Copilot 模式快速驗(yàn)證知識(shí)檢索、結(jié)構(gòu)化文本和代碼生成等原子能力,為構(gòu)建領(lǐng)域?qū)<抑悄荏w提供必要前提。
領(lǐng)域深耕:構(gòu)建領(lǐng)域?qū)<抑悄荏w,自主完成任務(wù)
? 目標(biāo):構(gòu)建專家智能體,驗(yàn)證模型分工組合策略。
? 策略:根據(jù)不同場景和大模型能力特性,設(shè)計(jì)模型分工策略,如 DeepSeek-R1+DeepSeek-V3 組合,分別負(fù)責(zé)推理規(guī)劃和執(zhí)行。通過微調(diào)和知識(shí)蒸餾等技術(shù),進(jìn)一步提升場景小模型執(zhí)行專項(xiàng)任務(wù)的能力。
? 實(shí)踐:重構(gòu)需求、設(shè)計(jì)、開發(fā)、測試端到端工作流,打造 AutoBA、AutoDesign、AutoTest 等領(lǐng)域?qū)<抑悄荏w,即能自主完成各領(lǐng)域工作任務(wù),也能與專家人員協(xié)作完成垂直領(lǐng)域復(fù)雜任務(wù)。
生態(tài)構(gòu)建:從 AI4SE 到 AI4Biz,打造銀行智能核心一體化方案
? 目標(biāo):構(gòu)建多智能體協(xié)作生態(tài),打造智能化核心系統(tǒng)。
? 策略:完善“N+M”大模型體系,構(gòu)建全場景多智能體協(xié)作生態(tài),打造銀行智能化核心系統(tǒng)研發(fā)新范式。
? 實(shí)踐:打通銀行核心系統(tǒng)研發(fā)全鏈路,優(yōu)化人機(jī)協(xié)作模式,全面提升復(fù)雜任務(wù)執(zhí)行效率和質(zhì)量。
03
新技術(shù)實(shí)踐
長亮科技從銀行核心系統(tǒng)研發(fā)場景和部分業(yè)務(wù)場景入手,率先完成了第一階段通用大模型能力驗(yàn)證的目標(biāo),目前已邁入第二階段,正聚焦銀行核心系統(tǒng)智能化研發(fā)提效,構(gòu)建 AutoBA、AutoDesign、AutoTest 等多個(gè)領(lǐng)域?qū)<抑悄荏w,這些智能體將覆蓋接口差異分析、需求問答、代碼解讀、測試案例等多個(gè)場景。
DeepSeek-R1 的出現(xiàn),無疑為長亮科技的技術(shù)實(shí)踐進(jìn)程按下了加速鍵。下文將以需求分析智能體AutoBA為例,向大家介紹長亮科技的技術(shù)實(shí)踐成果。
AutoBA 介紹
需求分析智能體AutoBA,與長亮科技需求分析平臺(tái)打通,實(shí)現(xiàn)智能感知任務(wù)場景、提取關(guān)聯(lián)資產(chǎn)、調(diào)用需求分析工具、多角色Agents協(xié)作和交互式人機(jī)協(xié)作反饋,旨在為核心系統(tǒng)需求分析全場景賦能。
AutoBA 工作任務(wù)示例
任務(wù)1:找到要改動(dòng)的需求差異點(diǎn)(滿分10分,期望分?jǐn)?shù)≥8分)
- 基礎(chǔ)評(píng)分:根據(jù)文檔改動(dòng)點(diǎn)數(shù)量平均分配基礎(chǔ)分值
- 扣分項(xiàng):錯(cuò)誤識(shí)別(-2分/處),無效修改(-1分/處)
- 加分項(xiàng):識(shí)別出標(biāo)準(zhǔn)答案范圍外的有效內(nèi)容(+2分/處)
任務(wù)2:準(zhǔn)確生成需求修改指令(滿分6分,期望分?jǐn)?shù)≥5分)
- 生成準(zhǔn)確的指令(1分)
- 準(zhǔn)確找到目標(biāo)文件(1分)
- 精確定位修改位置(1分)
- 做出了正確的操作(1分)
總體評(píng)價(jià)
- 整體準(zhǔn)確率60%以上(1分)
- 指令完全正確(2分)
AutoBA 效果展示
1. AutoBA獨(dú)立完成需求差異分析
a. 任務(wù)規(guī)劃:AutoBA 制定了分析計(jì)劃,可跟蹤具體任務(wù)執(zhí)行
b. 深度推理:通過檢索需求文檔,分析系統(tǒng)現(xiàn)狀分析,識(shí)別需求差異,并給出解決方案建議
c. 修改操作:生成修改指令,對(duì)識(shí)別到有需求差異的需求文檔進(jìn)行針對(duì)性內(nèi)容修改

2. 人機(jī)協(xié)作交互式反饋
a. 智能標(biāo)注:基于對(duì)需求變更內(nèi)容的理解,AutoBA 自動(dòng)完成需求改寫,并在需求文檔中以色塊形式標(biāo)注修改內(nèi)容
b. 快速?zèng)Q策:提供"接受修改"和"拒絕修改"的按鈕,方便用戶快速?zèng)Q策

AutoBA 效果評(píng)測
長亮科技選取了 DeepSeek-R1、DeepSeek-R1-Distill-Qwen-32B和Qwen2.5-32B-Instruct 三個(gè)候選模型作為 AutoBA 的底層支撐,旨在更好的實(shí)現(xiàn)大模型在復(fù)雜需求分析場景的應(yīng)用效果。

評(píng)測結(jié)果分析:
? 引入 DeepSeek-R1 后,智能體的深度思考能力和推理能力得到提升,使 AutoBA 在核心系統(tǒng)需求分析過程中,不僅能更清晰地展示分析的思考過程,還能提升分析質(zhì)量,輔助BA更高效地完成需求分析工作。
? DeepSeek-R1 推理能力可通過知識(shí)蒸餾方式遷移至小尺寸模型上(如上表 DeepSeek-R1-Distill-Qwen-32B),證明了增強(qiáng)小尺寸模型推理能力、思考能力以滿足 AutoBA 場景需求的可行性。
04
新場景展望
未來,在大模型體系構(gòu)建的過程中,長亮科技將持續(xù)聚焦銀行核心系統(tǒng)研發(fā)復(fù)雜場景,依據(jù)多智能體跨領(lǐng)域協(xié)作優(yōu)化模型分工策略,重點(diǎn)增強(qiáng)各類協(xié)作場景小模型的能力,從而全面提升復(fù)雜任務(wù)執(zhí)行效率和質(zhì)量,進(jìn)一步降低部署門檻。同時(shí),長亮科技將結(jié)合多種人機(jī)協(xié)作模式建立持續(xù)學(xué)習(xí)機(jī)制,使場景應(yīng)用中產(chǎn)生的新知識(shí)不斷反饋到模型訓(xùn)練中,形成知識(shí)積累的良性循環(huán)。
在應(yīng)用場景的拓展層面,長亮科技在繼續(xù)豐富軟件工程全場景智能體生態(tài)的同時(shí),還將結(jié)合自身在核心系統(tǒng)業(yè)務(wù)建模、實(shí)施工藝等領(lǐng)域沉淀的專家經(jīng)驗(yàn)和數(shù)字資產(chǎn),推動(dòng) “N+M大模型協(xié)同策略” 的技術(shù)和應(yīng)用最佳實(shí)踐,從軟件工程領(lǐng)域向銀行核心系統(tǒng)更多業(yè)務(wù)場景遷移,最終打磨形成為銀行業(yè)數(shù)字化轉(zhuǎn)型賦能的 AI4Biz 一體化解決方案,助力銀行邁入更加智能、高效、靈活的新時(shí)代。
參考資料:
1.中國信息通信研究院人工智能研究所, & 華為云計(jì)算技術(shù)有限公司. (2024.9). 智能化軟件開發(fā)落地實(shí)踐指南.
http://www.caict.ac.cn/kxyj/qwfb/ztbg/202409/t20240919_493348.htm?S0OMlgNm0r2m=1740013164777
2. DeepSeek-AI. DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning. URL
https://arxiv.org/pdf/2501.12948
3. Sail-sg. There May Not be Aha Moment in R1-Zero-like Training — A Pilot Study. URL
https://github.com/sail-sg/oat-zero
4. Zichen Liu*, Changyu Chen*, Wenjun Li*, Tianyu Pang, Chao Du, Min Lin. There May Not be Aha Moment in R1-Zero-like Training — A Pilot Study. URL
https://oatllm.notion.site/oat-zero#192dba9c0091817491e3fc3a217ee7ea
5. YueWang?,1,2 ,QiuzhiLiu?,1 ,JiahaoXu?,1 ,TianLiang?,1 ,XingyuChen?,1,3 ,ZhiweiHe?,1,3 , LinfengSong1 ,DianYu1 ,JuntaoLi2 ,ZhuoshengZhang3 ,RuiWang2 , ZhaopengTu?1 ,HaitaoMi1 ,andDongYu1. Thoughts Are All Over the Place: On the Underthinking of o1-Like LLMs. URL
https://arxiv.org/pdf/2501.18585
6. Niklas Muennighoff*134 Zitong Yang*1 Weijia Shi*2 Xiang Lisa Li*1 Li Fei-Fei1 Hannaneh Hajishirzi23 Luke Zettlemoyer2 Percy Liang1 Emmanuel Candès1 Tatsunori Hashimoto1. s1: Simple test-time scaling. URL
https://arxiv.org/pdf/2501.19393