招商銀行“低代碼+大模型”創(chuàng)新實(shí)踐
當(dāng)前位置:點(diǎn)晴教程→知識(shí)管理交流
→『 技術(shù)文檔交流 』
文 / 招商銀行信息技術(shù)部副總經(jīng)理? 陳曦 招商銀行信息技術(shù)部? 楊勉 任軻 王玖華 大模型的迅猛發(fā)展,正逐漸成為各行業(yè)創(chuàng)新變革的關(guān)鍵驅(qū)動(dòng)力。招商銀行敏銳洞察到這一技術(shù)趨勢(shì),對(duì)大模型與低代碼開發(fā)的融合創(chuàng)新進(jìn)行了深入探索。利用大模型在語義理解、文本生成、知識(shí)檢索等方面所展現(xiàn)出的優(yōu)異特性,我們進(jìn)一步降低了低代碼開發(fā)的門檻、提升了開發(fā)者的體驗(yàn),有力地推動(dòng)了招商銀行科技平民化進(jìn)程。 招商銀行信息技術(shù)部 副總經(jīng)理? 陳曦 招商銀行在低代碼領(lǐng)域的實(shí)踐與建設(shè),主要經(jīng)歷了三個(gè)階段。 1.早期探索 招商銀行在早期的諸多業(yè)務(wù)系統(tǒng)建設(shè)中,就已體現(xiàn)了“可視化”“組件化”等設(shè)計(jì)思想。通過各領(lǐng)域組件的沉淀及復(fù)用,有效提升了業(yè)務(wù)系統(tǒng)的開發(fā)效率。此做法可視為招商銀行在低代碼領(lǐng)域的早期實(shí)踐。 2.企業(yè)級(jí)低代碼開發(fā)平臺(tái)建設(shè) 自2019年起,招商銀行啟動(dòng)了企業(yè)級(jí)低代碼開發(fā)平臺(tái)(以下簡(jiǎn)稱低代碼平臺(tái))的建設(shè)工作。經(jīng)過5年發(fā)展,低代碼平臺(tái)已成長(zhǎng)為組織級(jí)的基礎(chǔ)開發(fā)平臺(tái)之一,上線應(yīng)用數(shù)過萬。低代碼平臺(tái)同時(shí)支持零代碼開發(fā)與低代碼開發(fā)兩種模式,滿足業(yè)務(wù)與IT用戶不同層次的需求。當(dāng)前,業(yè)務(wù)用戶占比達(dá)50%以上。 3.低代碼和大模型融合 2023年,招商銀行開始探索低代碼與大模型的融合,利用大模型的新特性為低代碼平臺(tái)在開發(fā)輔助、應(yīng)用生成、運(yùn)營(yíng)問答、交互體驗(yàn)等方面帶來顯著提升。 低代碼與大模型融合的思路 在尋找低代碼與大模型的融合點(diǎn)上,我們從以下兩個(gè)方向相向而行。 從低代碼開發(fā)的全旅程去分析:在需求分析、數(shù)據(jù)表設(shè)計(jì)、界面設(shè)計(jì)、流程編排、測(cè)試上線這些環(huán)節(jié)上,有大量節(jié)點(diǎn)可借助大模型降低開發(fā)門檻和簡(jiǎn)化流程。 從大模型的典型應(yīng)用模式去分析:智能問答、知識(shí)檢索、文本生成、總結(jié)摘要等大模型典型應(yīng)用模式,能夠?yàn)殚_發(fā)帶來效率和質(zhì)量的提升。 當(dāng)對(duì)這兩條路徑進(jìn)行矩陣式交叉分析后,一系列可供探索的場(chǎng)景便隨之呈現(xiàn)出來。通過對(duì)這些場(chǎng)景的價(jià)值與優(yōu)先級(jí)進(jìn)行排序,我們確定了以下重點(diǎn)場(chǎng)景并付諸實(shí)踐。 低代碼下的大模型場(chǎng)景實(shí)踐 我們依據(jù)以上思路,將重點(diǎn)聚焦在“低開Copilot”“低開應(yīng)用生成”“低開運(yùn)營(yíng)”這三大場(chǎng)景之中(如圖1所示)。 圖1? 三大場(chǎng)景實(shí)踐 1.低開Copilot (1)前端開發(fā)Copilot:JS和CSS生成。低代碼平臺(tái)通常提供了默認(rèn)操作和樣式,若要改動(dòng)默認(rèn)操作或樣式,則需要開發(fā)者具有一定JS和CSS技能。 在實(shí)踐中我們發(fā)現(xiàn),低代碼平臺(tái)的一類典型用戶為后端開發(fā)者,他們往往對(duì)JS語法不熟練,不會(huì)使用CSS的情況也很普遍。 因此,在前端頁面的開發(fā)中利用Prompt生成JS和CSS代碼,能夠極大簡(jiǎn)化定制過程。該功能上線一周便迅速躍居平臺(tái)所有功能使用量前三,有效提高了應(yīng)用開發(fā)效率。 (2)后端開發(fā)Copilot:數(shù)據(jù)表創(chuàng)建和業(yè)務(wù)編排生成。低代碼平臺(tái)能生成低代碼應(yīng)用的核心是DSL。DSL是抽象描述業(yè)務(wù)功能邏輯和交互規(guī)則的一種領(lǐng)域語言。數(shù)據(jù)表和業(yè)務(wù)編排都是通過DSL進(jìn)行描述的。 大模型加入后,后端數(shù)據(jù)表的創(chuàng)建過程由原來的“界面交互生成DSL”轉(zhuǎn)變?yōu)椤巴ㄟ^自然語言描述生成DSL”:即通過自然語言描述其包含的字段,大模型提取出這些字段生成建表的DSL。業(yè)務(wù)編排也是類似的,通過自然語言描述編排流程,大模型提取到流程的各種節(jié)點(diǎn),生成業(yè)務(wù)編排的DSL。 上述工作的關(guān)鍵在于生成有效的DSL。由于DSL是低代碼的私域知識(shí),不在基礎(chǔ)模型的知識(shí)范圍內(nèi)。而低代碼平臺(tái)配套的用戶手冊(cè)里僅能描述其規(guī)則,而無法窮盡其組合。所以讓大模型生成隨場(chǎng)景變化的DSL具有一定難度。 在解決這個(gè)難點(diǎn)上,我們?cè)赑rompt中傳入了從私域知識(shí)庫中召回的與問題相關(guān)度最高的知識(shí)樣本,利用Few-shot learning方法讓大模型能夠基于給定的知識(shí)樣本生成內(nèi)容。這在部分場(chǎng)景上可以生成符合標(biāo)準(zhǔn)的DSL。 上述方案也有一定局限性,例如有每次要帶入上下文、Token傳入過長(zhǎng)、無法記憶的限制等。下一階段我們計(jì)劃通過微調(diào)來解決這些問題,進(jìn)一步提升在DSL生成方面的準(zhǔn)確度。 2.低代碼應(yīng)用生成 當(dāng)建立了前文所述的一系列“點(diǎn)”上的智能能力,我們?cè)偌尤牍ぷ髁鲗⑦@些單點(diǎn)進(jìn)行串聯(lián),進(jìn)而形成“端到端的解決方案”。 低代碼應(yīng)用開發(fā)的一個(gè)大類需求來自于“原手工臺(tái)賬工作的線上化及系統(tǒng)化”。在這類場(chǎng)景中,大量需手工整理的數(shù)據(jù)以“Excel表”或“紙質(zhì)圖表”的形式存在。為了提高這類需求的開發(fā)效率,我們推出了端到端的應(yīng)用生成“Excel生成應(yīng)用”和“圖片生成應(yīng)用”(如圖2所示)。 圖2? 智能應(yīng)用生成 “Excel生成應(yīng)用”,用戶僅需上傳本地Excel數(shù)據(jù)表,即可構(gòu)建出具備全套CRUD功能的應(yīng)用,并生成表單和表格兩種交互視圖?!皥D片生成應(yīng)用”相較于Excel生成更進(jìn)一步,能夠先識(shí)別紙上的圖片,提取關(guān)鍵表格要素,進(jìn)而生成應(yīng)用。 端到端生成應(yīng)用的要解決兩個(gè)難點(diǎn):難點(diǎn)一是能夠有效識(shí)別Excel或圖片中的實(shí)體,并判斷實(shí)體對(duì)應(yīng)字段類型。若僅采用大模型,判斷準(zhǔn)確率并不滿足工程要求;我們實(shí)踐中把大模型和傳統(tǒng)工程數(shù)據(jù)字典相結(jié)合,準(zhǔn)確率提升到95%以上;難點(diǎn)二是要實(shí)現(xiàn)實(shí)體到數(shù)據(jù)表、頁面組件及方法的正確綁定。為了提高綁定的準(zhǔn)確性,我們建立一系列應(yīng)用模板,并由模板引擎去選擇合適的模板來生成應(yīng)用。通過模板固化資源綁定,最終實(shí)現(xiàn)應(yīng)用的準(zhǔn)確渲染。 端到端應(yīng)用構(gòu)建的功能上線后,開發(fā)一個(gè)完整應(yīng)用的時(shí)長(zhǎng)從小時(shí)級(jí)壓縮至分鐘級(jí)。我們后續(xù)還會(huì)陸續(xù)推出“多輪對(duì)話創(chuàng)建應(yīng)用”“需求文檔創(chuàng)建應(yīng)用”等端到端解決方案。 3.低代碼運(yùn)營(yíng) 低代碼平臺(tái)的主知識(shí)庫主要由產(chǎn)品文檔和幫助文檔構(gòu)成。隨著運(yùn)營(yíng)的推進(jìn),逐漸積累了豐富的問答QA、解決方案、匯報(bào)材料等文檔。然而,運(yùn)營(yíng)人員常常存在知識(shí)盲區(qū),在處理較為復(fù)雜的問題時(shí),提供的解決方案有時(shí)質(zhì)量欠佳。 而大模型RAG技術(shù)可有效解決上述問題。例如,當(dāng)用戶向運(yùn)營(yíng)同事咨詢應(yīng)用中的SQL異常應(yīng)如何解決時(shí),由于運(yùn)營(yíng)同事并非SQL方面的專家,所以較難快速準(zhǔn)確地定位SQL異常問題的原因。基于RAG的低開運(yùn)營(yíng)小助手投產(chǎn)后,其不僅能夠?yàn)橛脩糁赋鯯QL中存在的問題,還可以直接給出優(yōu)化后的SQL供用戶復(fù)制使用。 目前,利用大模型運(yùn)營(yíng)的應(yīng)答準(zhǔn)確率已達(dá)到75%左右。 低代碼與大模型融合的技術(shù)亮點(diǎn) 1.數(shù)據(jù)飛輪 招商銀行的低代碼平臺(tái)歷經(jīng)幾年發(fā)展,當(dāng)前上線應(yīng)用數(shù)量過萬,涉及的DSL片段超過百萬,沉淀了大量的低開資產(chǎn)。項(xiàng)目組利用規(guī)模龐大且具有私域特性的數(shù)據(jù),持續(xù)對(duì)大模型微調(diào),來提升大模型的表現(xiàn)。 為提高私域數(shù)據(jù)清洗、標(biāo)注的效率和質(zhì)量,我們采用“AI自動(dòng)標(biāo)注+人工復(fù)檢”的方案。利用規(guī)則引擎工具,低代碼平臺(tái)基于大模型構(gòu)建了AI自動(dòng)標(biāo)注機(jī)器人,通過定時(shí)任務(wù)和跑批的模式對(duì)語料進(jìn)行標(biāo)注。然后,將這些標(biāo)注后的語料以任務(wù)形式下發(fā)給數(shù)據(jù)標(biāo)注人員,采用“作業(yè)即標(biāo)注”的方式對(duì)自動(dòng)標(biāo)注的語料進(jìn)行校正。校正后的數(shù)據(jù)用作大模型微調(diào)的語料進(jìn)一步提升模型的表現(xiàn),實(shí)現(xiàn)了數(shù)據(jù)自動(dòng)化的閉環(huán)。 2.約束大模型的幻覺 在大模型應(yīng)用過程中生成的DSL片段,少則幾百個(gè)字符,多則上萬字符,極易產(chǎn)生“一本正經(jīng)胡說八道”。如何確保大模型輸出內(nèi)容的穩(wěn)定有質(zhì)量,約束大模型的幻覺,是低代碼平臺(tái)所面臨的技術(shù)難題。 項(xiàng)目組對(duì)DSL片段進(jìn)行數(shù)據(jù)分析后發(fā)現(xiàn),同類場(chǎng)景下生成的DSL其主體內(nèi)容變化有限。例如最為常見的“查詢表單”和“帶CRUD的表格”所對(duì)應(yīng)的DSL片段80%是不變的?;诖耍覀儗?duì)變化部分的DSL進(jìn)行場(chǎng)景化的分類,構(gòu)建了其場(chǎng)景化的生成邏輯,限制大模型生成DSL內(nèi)容變化的范圍。同時(shí)生成時(shí)采用了反思、思維鏈等模式以提高準(zhǔn)確率。通過以上技術(shù)改造,顯著降低了大模型產(chǎn)生幻覺的概率,使得生成的DSL片段能夠被平臺(tái)所使用。 總結(jié)與展望 當(dāng)前,招商銀行在低代碼與大模型的實(shí)踐方面,已取得初步的成果?;贏I能力,如何不斷升級(jí)低代碼平臺(tái)并助力數(shù)字招行的建設(shè),依然任重道遠(yuǎn)。未來,我們將進(jìn)一步拓展大模型在低代碼領(lǐng)域應(yīng)用的邊界,通過模型的不斷微調(diào)構(gòu)建更精準(zhǔn)的DSL,并挖掘更多的端到端場(chǎng)景。同時(shí),在多模態(tài)方面深入探索,借助文本、圖像、語音等多種交互方式,打造更為卓越的用戶體驗(yàn)。 (此文刊發(fā)于《金融電子化》2024年9月下半月刊) 該文章在 2024/11/7 10:43:08 編輯過 |
關(guān)鍵字查詢
相關(guān)文章
正在查詢... |