近日,京東技術總監翟周偉在公開場合深入探討了電商大模型及搜索應用實踐,為電商領域的AI技術發展帶來了新的視角與啟示。這份詳盡的實踐報告,共計33頁,全面覆蓋了電商行業的最新發展、大模型應用所面臨的挑戰及其解決方案,以及在搜索場景中的具體應用實例。
首先,翟周偉介紹了電商行業的整體發展狀況。他指出,過去十年間,實物商品的網上零售額實現了高速增長,電商模式也從傳統的貨架電商逐步發展為與內容電商并存的多元化格局。技術的不斷創新,不僅降低了商品流通的成本,還顯著提升了零售效率。在用戶消費決策鏈中,包括購前、購中、購后的各個環節,搜索始終扮演著至關重要的角色。電商搜索的目標,是基于用戶的實際需求,精準分發商品,以實現GMV(商品交易總額)和UCVR(用戶點擊到實際購買轉化率)的最大化。
技術演進方面,翟周偉指出,從文本檢索到機器學習,再到深度學習和大模型階段,電商搜索技術經歷了多次變革。從最初的規則引擎應用,到基于深度神經網絡(DNN)的精準理解,再到如今的多模態交互和AGI導購助手,每一步都旨在追求更低成本、更高效率和更優的用戶體驗。
然而,大模型在電商場景下的應用并非一帆風順。翟周偉坦言,盡管大模型具備邏輯推理、多語言理解等顯著優勢,但在電商領域仍面臨諸多挑戰,如商品知識的專業性不足、個性化推薦的難度、時效性的局限、高昂的成本以及安全性風險等。為此,京東構建了文本大模型底座和多模態大模型底座,通過DataPipeline提升數據質量,進行持續預訓練和通用及領域對齊學習,同時從被動和主動兩個方面保障安全性,并建立了一套完善的評估體系。
在電商搜索場景下的應用實踐中,京東充分利用了大模型的強大能力。例如,通過大模型優化搜索交互,提升效率,如智能糾錯、搜索建議等功能。同時,利用電商知識增強的大模型,結合搜索交互日志,不斷優化目標,通過多指令學習迭代改進。在電商意圖理解方面,京東通過指令學習,利用搜索用戶反饋和RAG技術,顯著提升了商品召回的相關性和多樣性。大模型還被廣泛應用于文案創意生成,如商品標題、文案、賣點的自動生成,大幅降低了商品素材的成本。

在電商搜索相關性的改進方面,京東采用了多種主流模型,如孿生網絡和交互式匹配。同時,結合prompt工程應用、數據增強蒸餾或增強預訓練以及相關性對齊方案,進一步提升了用戶需求與商品之間的匹配精度。













