天眼查App顯示,2月7日,騰訊科技(深圳)有限公司申請的“大語言模型的訓練方法、裝置、計算機設備及存儲介質”專利公布。
摘要顯示,在該方法中,通過在大語言模型的訓練過程中引入第一摘要文本和第二摘要文本,為模型訓練提供了更多可學習信息,同時由于第一摘要文本和第二摘要文本包含的信息量不同,且第一摘要文本中包含正確語句和錯誤語句,通過對同一樣本文本的兩個不同摘要文本進行對比學習,并區分學習第一摘要文本中的正確語句和錯誤語句,避免了由于摘要文本單一而導致的模型過擬合和生成不準確等問題,不僅提高了模型的泛化性能,還提高了模型的準確性。
【免責聲明】本文僅代表作者本人觀點,與和訊網無關。和訊網站對文中陳述、觀點判斷保持中立,不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。郵箱:news_center@staff.hexun.com
最新評論