世界人工智能大會舉辦首場語料論壇,開啟中國AI新時代

人民網(wǎng)上海7月6日電 (記者唐小麗)高質(zhì)量、大規(guī)模、安全可信的語料數(shù)據(jù)資源是AI時代的重要基石。7月6日上午,2024世界人工智能大會語料主題論壇在上海世博中心舉辦。
論壇現(xiàn)場。人民網(wǎng)記者 王初攝
上海市各相關(guān)部門代表、上海人工智能實驗室、人民網(wǎng)、上海報業(yè)、上海圖書館、上海信投、上海算法創(chuàng)新研究院、中國信通院、復(fù)旦大學(xué)、華東師范大學(xué)以及近1000家大模型語料生態(tài)企業(yè)參會。
本次論壇以“語料筑基,智生時代”為主題,圍繞高質(zhì)量語料數(shù)據(jù)如何高效供給賦能大模型產(chǎn)業(yè)發(fā)展,向市場傳遞專業(yè)化、鏈接型、前瞻性的語料生態(tài)設(shè)計理念。
大模型與大數(shù)據(jù)庫雙輪驅(qū)動,讓其成長為符合人類共同價值的“好孩子”
隨著AI技術(shù)的不斷進步和生態(tài)合作的深化,未來數(shù)據(jù)庫將更加智能、靈活和強大,為人工賦能千行百業(yè)的實體經(jīng)濟發(fā)展提供堅實基礎(chǔ)。
主旨演講環(huán)節(jié)中,中國科學(xué)院院士鄂維南帶來主題為“大模型與大數(shù)據(jù)庫雙輪驅(qū)動的人工智能方法”的演講。鄂維南院士分享了如何將大模型方法和高性能的通用AI數(shù)據(jù)庫方法相結(jié)合,來建立高效率、高準確率、低門檻、低成本的人工智能系統(tǒng)。
鄂維南發(fā)表主旨演講。人民網(wǎng)記者 王初攝
與價值對齊是大模型可持續(xù)演進的基石。主旨演講環(huán)節(jié)中,人民網(wǎng)黨委書記、董事長葉蓁蓁分享了“基于價值對齊的模型發(fā)展與語料數(shù)據(jù)的創(chuàng)新供給”。他重點分享了人民網(wǎng)在主流價值對齊方面的實踐與經(jīng)驗,基于多維度價值對齊體系的語料庫,讓大模型像人一樣“有德、有趣、有序、有品、有用”,成長為符合人類共同價值的“好孩子”。
語料運營平臺1.0上線,首批十大高質(zhì)量語料產(chǎn)品發(fā)布
今天的論壇上,發(fā)布了“語料運營平臺1.0”,實現(xiàn)了面向語料數(shù)據(jù)“采、洗、標、測、用”五位一體的工具鏈能力。旨在對照最高標準、最好水平,打造世界一流的語料樞紐,實現(xiàn)更高效率、更高質(zhì)量的語料供給。
語料運營平臺1.0發(fā)布。大會主辦方供圖
為打響高質(zhì)量語料品牌,進一步激發(fā)市場主體語料創(chuàng)新活力,增強供給側(cè)能級,加速醫(yī)療健康、城市交通、消費零售等重點行業(yè)的大模型產(chǎn)業(yè)發(fā)展,會上,上海庫帕思科技有限公司攜手咪咕視頻、寶信軟件、復(fù)旦大學(xué)智能醫(yī)學(xué)研究院、上海工創(chuàng)中心等集中發(fā)布了十大語料數(shù)據(jù)產(chǎn)品。
語料數(shù)據(jù)產(chǎn)品發(fā)布。人民網(wǎng)記者 王初攝
首個語料庫建設(shè)導(dǎo)則面世,三大領(lǐng)域技術(shù)白皮書發(fā)布
語料數(shù)據(jù)是人工智能研究和應(yīng)用不可或缺的資源,高質(zhì)量語料庫更是人工智能賦能新質(zhì)生產(chǎn)力的關(guān)鍵。大模型賦能千行百業(yè),需要構(gòu)建與場景適配的語料體系,需要規(guī)則與實踐的“并跑”。本次論壇中還發(fā)布了金融、生命健康、教育三項行業(yè)語料技術(shù)白皮書。
三大領(lǐng)域語料技術(shù)白皮書發(fā)布。人民網(wǎng)記者 王初攝
為實現(xiàn)“語料數(shù)據(jù)資源共建共享”“鼓勵多元主體共同推動高水平語料數(shù)據(jù)要素建設(shè)”的目標,庫帕思公司會同覆蓋多模態(tài)數(shù)據(jù)資源供應(yīng)、加工、應(yīng)用和運營全鏈的近二十家企業(yè)共同發(fā)布了團體標準《語料庫建設(shè)導(dǎo)則》。
《語料庫建設(shè)導(dǎo)則》發(fā)布。人民網(wǎng)記者 王初攝
50余家單位共同發(fā)起語料倡議,2024語料風(fēng)云榜發(fā)布
為進一步強化語料生態(tài)全產(chǎn)業(yè)鏈各主體間的交流合作,營造有利于我國大模型產(chǎn)業(yè)生態(tài)健康發(fā)展的環(huán)境,會上,50余家單位共同發(fā)起“語料生態(tài)服務(wù)大模型可持續(xù)發(fā)展倡議”,共同倡導(dǎo)攜手為我國大模型產(chǎn)業(yè)發(fā)展持續(xù)提供高質(zhì)量語料。
50余家單位共同發(fā)起語料倡議。大會主辦方供圖
為加速促進大模型語料生態(tài)企業(yè)按照高標準發(fā)現(xiàn)“好產(chǎn)品”、培育“好企業(yè)”,本次論壇上,大模型語料數(shù)據(jù)聯(lián)盟正式發(fā)布“2024語料風(fēng)云榜”,該榜單經(jīng)過前期征集,嚴格評選,最終遴選出10家上榜企業(yè)。分別是:上海恒生聚源數(shù)據(jù)服務(wù)有限公司、上海本原智數(shù)科技有限公司、北京云測信息技術(shù)有限公司、上海蜜度科技股份有限公司、星環(huán)信息科技(上海)股份有限公司、數(shù)據(jù)堂(北京)科技股份有限公司、整數(shù)智能信息技術(shù)(杭州)有限責(zé)任公司、標貝(青島)科技有限公司、北京海天瑞聲科技股份有限公司、天娛數(shù)字科技(大連)集團股份有限公司。
2024語料風(fēng)云榜發(fā)布。人民網(wǎng)記者 王初攝
共話未來,我們需要怎樣的語料供給?
企業(yè)案例分享環(huán)節(jié)中,上海階躍星辰智能科技有限公司副總裁李璟、游族網(wǎng)絡(luò)CEO陳芳兩家大模型語料生態(tài)企業(yè)代表,從企業(yè)如何在生成式人工智能時代通過提升高質(zhì)量語料的開發(fā)利用來賦能業(yè)務(wù)發(fā)展。
圓桌論壇現(xiàn)場。人民網(wǎng)記者 王初攝
語料數(shù)據(jù)在大模型開發(fā)中起到了決定性作用,是模型能力提升的關(guān)鍵基礎(chǔ)。在提升通用大模型及垂直行業(yè)模型應(yīng)用能力方面,什么樣的語料供給是最有價值又最被需要的?
在圓桌環(huán)節(jié)中,來自上海本原智數(shù)的創(chuàng)始人李逆勇作為圓桌主持人,提出了大模型的出現(xiàn)對于語料供給帶來了哪些新的機會和挑戰(zhàn)、數(shù)據(jù)的自動化標注與人工標注現(xiàn)況趨勢及合成數(shù)據(jù)的未來三個問題。華為上海代表處戰(zhàn)略官房思哲,北京星塵紀元智能科技有限公司總裁章磊,標貝(青島)科技有限公司聯(lián)合創(chuàng)始人、首席技術(shù)官李秀林,智境云創(chuàng)創(chuàng)始人、CEO王智武,中云開源數(shù)據(jù)技術(shù)(上海)有限公司創(chuàng)始人、CEO陳剛進行了觀點分享和思想碰撞。
分享讓更多人看到