人工智能分為計算智能、感知智能、認知智能三個發展階段。感知智能指的是“感知”的能力,包括聽覺、觸覺和視覺,認知智能則包括語言理解能力、知識運用能力以及在語言和知識基礎上的推理能力。
創新工場首席科學家、北京瀾舟科技創始人兼CEO周明稱,自然語言處理是認知智能最大的一個瓶頸,而預訓練模型會使自然語言處理進入到可以大規模、可復制的大工業施展階段,如果能落地應用,會推動認知智能實現飛躍。
據了解,預訓練模型是利用大規模語料庫、通過無監督方式訓練出的一個大規模的語言模型,根據上下文定義每個詞的語義表達,并基于模型做下游的任務,比如說機器翻譯問答搜索等。
周明表示,過去幾年,預訓練模型在自然語言領域得到非常廣泛的重視,各大公司學校都開展了預訓練模型的研究,出現了模型越大越好的趨勢。可是模型越大,訓練成本越高,要求機器設備的能力也就越大,這就產生了環保和節能的問題。中小企業可能還會因為硬件制約無法使用。
基于以上考慮,瀾舟科技研發出了大規模預訓練模型《孟子》,實現了用更小的模型規模比肩超大模型的性能,并且具備靈活的領域和場景適應能力,有利于快速、低成本地落地現實業務場景。
“以力服人者,非心服也,力不贍也;以德服人者,中心悅而誠服也,如七十子之服孔子也。”周明在談及為何會給模型起名為《孟子》時引用了這樣一句話。
周明解釋稱,很多大公司依賴自身強大的運算能力和大數據能力,不停地推出大模型,瀾舟作為初創公司,比算力是比不過的,那我們就應該去比智慧、比算法、比知識。
事實證明了周明的思路是正確的。今年7月,《孟子》預訓練模型在CLUE中文NLP權威排行榜戰勝百億、千億參數規模級模型取得冠軍,刷新三項榜單世界紀錄。
此外,瀾舟科技基于《孟子》預訓練模型,推出了瀾舟文本生成引擎、瀾舟行業搜索引擎、瀾舟翻譯引擎三大產品。目前翻譯引擎和文本生成引擎已經通過合作伙伴實現落地應用,搜索引擎則和頭部公司達成合作,正在不斷完善迭代中。
周明介紹,瀾舟科技下一步的業務重心是開發建立SaaS模型、獨立行業搜索引擎、開源社區,并進行本地定制。
公開資料顯示,瀾舟科技今年1月入駐由李開復創辦的創新工場開始孵化,8月完成天使輪融資,投資方也是創新工場;9月獲 HICOOL 2021全球創業大賽人工智能/金融科技賽道一等獎,HICOOL全球創業大賽是以海內外人才創業大賽為主體的綜合性國際人才活動,兩年已累計吸引全球84個國家和地區創新項目6044個,匯聚創業人才8162名。據官方透露,HICOOL 2022年新一季賽事招募將于近期全面啟動。
最新評論