大模型應用落地的熱潮正以前所未有的力度席卷千行百業。
如今產業界已經釋放出一個清晰的信號:當大模型的價值真正成為破解行業難題的利器,各行各業開始思考,如何才能讓大模型的“智慧”為己所用?
商湯科技與中鐵第一勘察設計院集團有限公司(以下簡稱“鐵一院”)的深度合作,正是解開這一行業命題的關鍵答案之一。
中國鐵路諸多工程奇跡的背后,都鐫刻著“鐵一院”的印記。鐵一院成立于1953年,是新中國成立的第一批大型綜合性鐵路勘察設計單位,是世界500強中國鐵建股份有限公司的全資子公司。
自建院以來,鐵一院設計創造了數以百計的國內第一和世界之最,奉獻了我國第一條電氣化鐵路、第一條沙漠鐵路、世界第一條高原凍土鐵路、第一條濕陷性黃土地區高速鐵路等卓越工程。在發展過程中,鐵一院積累了70余年的寶貴經驗,然而這數十年積累的技術經驗受限于口口相傳,海量有價值數據無法被快速、準確利用起來,且傳統的數據存檔方式效率低下,知識折損率高。
大模型的出現,為鐵路勘察設計領域的知識傳承提供了新的解法。
商湯大裝置與鐵一院打造國鐵價值工程多模態大模型應用平臺,首次將多模態大模型應用于鐵路工程設計知識的智能傳承與應用,其融合文本、圖紙、公式等異構數據,為設計人員提供了知識檢索、智能問答、文本生成、文本審核、多模態對話五大功能。
在內部測試中,該平臺針對28000條問答測試的準確率都維持在90%以上。
當大模型的技術紅利與各行各業的需求相接,一場關于智能變革的序幕已然被拉開。這一背景下,智東西總編輯張國仁與鐵一院數智化部總工張守利、商湯科技大裝置事業群解決方案副總裁楊松進行了深入交流,從國鐵價值工程多模態大模型應用平臺出發,提煉大模型在實際場景中落地的典型范式。
商湯科技大裝置事業群解決方案副總裁楊松、鐵一院數智化部總工張守利、智東西總編輯張國仁(從左至右)
數據桎梏、經驗斷層、效率瓶頸待破
大模型解鎖鐵路勘察設計新可能
今年春節期間DeepSeek走紅,使得大模型成功破圈,在這之后開箱即用的DeepSeek一體機扎堆上新,讓企業可以低成本驗證、嘗試大模型的價值。
這一現象不僅加速了AI在更廣泛行業的深度融合及落地應用,更進一步釋放了大模型在復雜領域的應用潛力。
以鐵路勘察設計為例,其特征是工作流程復雜、數據密集、精度要求嚴苛且涉及多專業協同,因此需要高效處理海量信息、精準應對復雜變量,而大模型憑借強大的數據處理、深度學習與推理能力,能夠精準匹配這些核心需求。
具體來看,首先,鐵路勘察設計領域屬于知識密集型行業,數據量大。張守利談道,鐵一院已經成立70余年,這期間技術人員攻克了沙漠、高原凍土、高寒地帶的鐵路修建技術難題,積淀下海量且寶貴的實踐經驗。
其次,數據利用率低。此前這些數據的處理、保存完全依靠人工,如人工按照原始格式將圖紙、文件存檔,電子文件則建立大型數據庫等,很難在后續工作中快速檢索到相應信息。
最后,經驗傳承依賴口口相傳,導致經驗、知識在傳承過程中被折損,面對沙漠、高原等地質條件建鐵路時,現在的技術人員無法快速、完整學習先前經驗。
張守利稱,大模型的迅猛崛起,為他們破解知識傳承的難題提供了一個全新的工具視角。
一方面,自2022年底ChatGPT發布至今,大模型的多模態數據處理與理解、知識整合與推理等能力持續提升,讓鐵路勘察設計領域看到了其在知識傳承方面的能力;另一方面,正如楊松所說,AI走到今天,正在經歷深入場景實際解決問題的階段。
在行業痛點與大模型產業發展的綜合影響下,大模型深入鐵路勘察設計成為可能。
在此基礎上,商湯和鐵一院此次打造的國鐵價值工程多模態大模型應用平臺,成為開啟用AI解決鐵路工程問題這扇門的一把鑰匙。
從知識生成、檢索問答到審核
每位員工都有資深專家助力
國鐵價值工程多模態大模型應用平臺是鐵路工程領域首次采用多模態大模型技術,缺乏先例參考的同時就更需要找準痛點“對癥下藥”。
因此,結合鐵路勘察設計領域的痛點,商湯大裝置為鐵一院提供了覆蓋數據服務、算法模型、應用開發平臺等在內的端到端大模型私有化整合方案。
這一應用平臺的知識庫體量達到420GB,文本類數據量超130GB、標準規范涵蓋1400多冊、歷史項目數據超20萬份,同時在鐵路勘察設計領域中,摘錄了30個具有高價值的項目場景、項目資料,包含從可行性研究、初步設計到施工圖設計環節各個環節。
在此之上,這一平臺為設計人員提供了知識檢索、智能問答、文本生成、文本審核、多模態對話五大功能。張守利做了一個形象的比喻,這相當于為每個技術員工引入一個集幾十年經驗為一身的權威專家。
從模型具體表現來看,在檢索問答層面,技術人員可以通過語義檢索更快捷找到數據庫中的資料,如果對答案存疑,也可以通過生成頁面的標注來源再次進行確認。
知識問答與檢索示例
對于報告輔助編寫,該平臺可以幫助技術人員搭建報告框架、草稿,為了解決大模型一次性吞吐量限制,其還會分框架填充章節內容,分段生成文本。
在審核過程中,此前的報告需要經歷設計者、復核者、審定者三輪人工審核才能最終成型,這種方式耗時耗力,且無法快速比對同系列不同文件內容。大模型就可以將審核人員的經驗化審核方法轉化為計算機可識別的算法邏輯,并進行跨專業的一致性審核,實現信息對齊,最后再進行人為把關。
報告輔助編寫示例
這五大功能正串聯起了鐵路設計人員日常工作中的核心需求。這背后串聯大模型能力與鐵路設計領域核心痛點的橋梁,最核心的支撐點正是數據難關的突破。
深入理解場景,是讓數據發揮更大價值的前提。
楊松提到,商湯在接觸項目之初,需要人工先理解數據在哪些業務環節產生、將為后續業務環節提供什么價值、解決什么問題,然后針對性對數據進行清洗、整理、拆解。
商湯基于此前的數據處理經驗以及基于LazyLLM開發平臺等進行數據調優,最后實現更精準的向量化檢索。在多模態層面,商湯原生多模態模型可以將圖片作為知識的一部分,使得大模型基于自己對文字知識、對圖像的理解加以判斷。
系統整體架構
張守利補充說,面對語言類數據,其在處理鐵路工程的技術報告中相對容易,包含圖表、公式的多模態信息,基于商湯的工具及成熟算法可以解決80~90%的問題,剩下10%多模態信息依靠工程師進行專業標注解讀。
其最終的目標就是讓模型真正成為一個懂行的專家,才能真正讓大模型在業務環節中被利用起來。
商湯與鐵一院在大模型與鐵路工程上的實踐,正是當下大模型深入行業的一個縮影。
AI從炫技到實用
商湯探索大模型落地實踐樣本
上周剛結束的世界人工智能大會,最突出的特點就是“應用為王”。AI不再是隔空炫技,而是真正走向實用主義。
商湯與鐵一院在鐵路工程領域的合作僅是一個起點。圍繞價值工程大模型應用平臺,他們會加快知識庫的更新迭代,每個工程師都可以對本專業知識庫進行更新,以及模型更新、對新增專業詞匯的向量化等。
但更為關鍵的是,其為從鐵路勘察設計的單點應用到全產業鏈應用,以及其他行業的復用都提供了一個實踐樣本。
張守利談道,下一階段他們的計劃是將大模型從勘察設計推廣到施工、運營維護的全產業鏈應用,并結合各環節的特性重構知識庫體系。
而這種探索的最大價值就在于,大模型作為一項通用技術,一旦在某一行業跑通驗證,其技術邏輯與應用模式便能快速復用到其他領域。
與此同時,為了驗證模型解決問題的能力以及何時才能落地部署,他們已經積累出一套方法論。楊松解釋說,以商湯和鐵一院的合作為例,他們通過前置POC過程得到正確率50%的結果,證明模型可以解決問題,然后通過算法工程、數據、數據庫調優使得準確率達到95%,最終實現大模型部署。
在深入應用的過程中,商湯不僅再次驗證了其技術、工具在大模型落地過程中的可用性,同時進一步積累了從挖掘痛點需求、技術創新到解決痛點的閉環經驗。
大模型在千行百業落地的需求有共通性,這種共通性既源于技術應用的底層邏輯,也根植于各行業對智能化升級的核心訴求,包括對數據處理、知識與經驗復用、場景適配、靈活迭代的共性要求。
因此,當下商湯在選擇深入合作的賽道邏輯非常清晰:場景可以明確被AI解決、數據積累足夠多、具備一定可擴展性。
這也是在大模型進入應用落地深水區的當下,技術方突破概念驗證階段、實現規模化價值的核心路徑,鎖定需求明確、數據扎實、可復制延伸的場景,讓大模型真正從實驗室走向產業實踐。
因此,這一價值工程大模型在鐵路工程領域的落地,就是商湯交出的一份最新答卷。
結語:在技術競速與場景耦合中
破解大模型落地痛點
大模型應用落地加速,這背后是企業需求與大模型技術迭代之間的深度契合。一方面,大模型技術迭代仍在加速,另一方面,企業需要找到適配自己核心痛點、真正解決實際問題的模型。
商湯與鐵一院的此次合作項目,既是對鐵路工程智能化進行持續探索的開始,同時也是尋找讓大模型真正成為破解行業痛點利器的起點,其仍需要在挖掘行業痛點與技術迭代的實踐中不斷校驗、完善,最終交出更貼合行業需求的答案。
*本文轉載自智東西
作者 | 程茜
編輯 | 漠影
【免責聲明】【廣告】本文僅代表作者本人觀點,與和訊網無關。和訊網站對文中陳述、觀點判斷保持中立,不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。郵箱:news_center@staff.hexun.com
最新評論