好未來(lái)獲得2024年“錢偉長中文信息處理科學技術獎”技術發明類一(yī / yì /yí)等獎
2024-12-06
日前,清華大(dà)學聯合好未來(lái)完成的(de)《面向開放場景的(de)自然語言生成關鍵技術及應用》項目,獲得2024年“錢偉長中文信息處理科學技術獎”技術發明類一(yī / yì /yí)等獎。
開放場景的(de)自然語言生成是(shì)指針對同一(yī / yì /yí)輸入的(de)生成結果具有較強多樣性的(de)任務,比如對話生成、故事生成等,是(shì)當前最重要(yào / yāo)也(yě)是(shì)最具挑戰性的(de)應用場景之(zhī)一(yī / yì /yí)。在(zài)開放場景的(de)生成任務上(shàng),即便是(shì)現有最好的(de)大(dà)模型在(zài)魯棒性、高效性、長文本生成、質量評價等方面也(yě)還存在(zài)不(bù)少核心挑戰。
針對這(zhè)些挑戰,本項目從生成理論、生成方法、評價體系三個(gè)方面系統性地(dì / de)突破關鍵技術,取得了(le/liǎo)一(yī / yì /yí)系列成果,并應用于(yú)智慧教育、智能助手和(hé / huò)實時(shí)翻譯,服務了(le/liǎo)上(shàng)億用戶并取得了(le/liǎo)顯著的(de)經濟效益。
在(zài)生成理論上(shàng),項目分析了(le/liǎo)生成文本和(hé / huò)人(rén)類文本的(de)分布偏差,提出(chū)基于(yú)全變分距離的(de)生成模型優化目标,使其對噪聲更魯棒,并探索非自回歸模型的(de)學習理論,得出(chū)訓練損失的(de)重要(yào / yāo)性質,同時(shí)引入代理分布以(yǐ)構建非自回歸模型的(de)統一(yī / yì /yí)訓練框架;在(zài)生成方法方面,聚焦于(yú)知識驅動的(de)長文本自然語言生成方法,圍繞知識表示和(hé / huò)知識規劃開展了(le/liǎo)系統性研究;在(zài)評價體系方面,從數據資源、評價方法、評價模型到(dào)應用平台,全面地(dì / de)構建了(le/liǎo)通用語言生成模型的(de)生成質量評價體系。
“錢偉長中文信息處理科學技術獎”是(shì)中文信息處理領域最高科學技術獎,該獎項授予在(zài)技術上(shàng)有重大(dà)創新或突破,技術難度很大(dà),總體技術水平和(hé / huò)主要(yào / yāo)技術經濟指标達到(dào)國(guó)内領先水平和(hé / huò)國(guó)際先進水平,對推動全國(guó)中文信息處理行業技術的(de)進步起到(dào)重要(yào / yāo)作用,創造出(chū)較大(dà)的(de)經濟效益或社會效益的(de)項目或個(gè)人(rén),由中國(guó)中文信息學會錢偉長中文信息處理科學技術獎評獎辦公室評定、頒發獎項。

作爲(wéi / wèi)國(guó)家新一(yī / yì /yí)代人(rén)工智能開放創新平台承建單位,好未來(lái)一(yī / yì /yí)直重視在(zài)科技創新領域的(de)投入,重視産學研合作。截止目前,好未來(lái)已與多所高校開展深入合作,獲得了(le/liǎo)一(yī / yì /yí)系列技術成果,并成功應用到(dào)好未來(lái)多款産品中,順利完成産、學、研、用一(yī / yì /yí)體化。
未來(lái),好未來(lái)将繼續加強與高校、科研機構的(de)合作,構建“共生”“互生”“創生”的(de)智慧教育生态,助力我國(guó)高質量教育體系建設,促進我國(guó)教育信息化、智能化進程。
相關鏈接:清華大(dà)學 https://www.cs.tsinghua.edu.cn/info/1088/6488.htm
上(shàng)一(yī / yì /yí)篇:用AI教會孩子(zǐ)獨立思考?學而(ér)思“随時(shí)問”已經邁出(chū)關鍵一(yī / yì /yí)步
下一(yī / yì /yí)篇:學而(ér)思CTO田密在(zài)G20教育峰會上(shàng)發表演講:借助人(rén)工智能技術推動全納教育