人工智能未來十年走向何方? “CSIG企業(yè)行”合合信息專場聯(lián)合專家學(xué)者開啟“頭腦風(fēng)暴” 全球聚看點
3月18日,由中國圖象圖形學(xué)學(xué)會(CSIG)主辦,合合信息、CSIG文檔圖像分析與識別專業(yè)委員會聯(lián)合承辦的“CSIG企業(yè)行”系列活動成功舉辦。此次活動以“圖文智能處理與多場景應(yīng)用技術(shù)展望”為主題,特邀來自上海交大、廈門大學(xué)、復(fù)旦大學(xué)、中科大的知名學(xué)府的學(xué)者與合合信息技術(shù)團隊一道,面向行內(nèi)研究者分享圖像文檔處理中的結(jié)構(gòu)建模、底層視覺技術(shù)、跨媒體數(shù)據(jù)協(xié)同應(yīng)用、生成式人工智能及對話式大型語言模型等研究及實踐成果?!?/p>
“CSIG企業(yè)行”活動旨在匯集產(chǎn)學(xué)研各界資源,探討圖文智能信息技術(shù)領(lǐng)域的最新發(fā)展動態(tài)和未來趨勢,共同推動圖像圖形領(lǐng)域的發(fā)展。會上,合合信息科技股份有限公司董事長、總經(jīng)理鎮(zhèn)立新博士發(fā)表致辭,并提到希望通過這次活動,創(chuàng)造產(chǎn)學(xué)研合作機會,為推動圖像圖形及人工智能行業(yè)的發(fā)展和進步貢獻智慧和力量;CSIG文檔圖像分析與識別專業(yè)委員會主任金連文教授向與會代表介紹了中國圖象圖形學(xué)學(xué)會的組織架構(gòu)、開展的學(xué)術(shù)會議、成果鑒定等服務(wù),鼓勵參會者積極參加學(xué)會的學(xué)術(shù)活動。
理論探索:生成式人工智能將成為未來十年的研究重心
(資料圖)
據(jù)國際IT研究機構(gòu)Gartner預(yù)測,到2025年,生成式人工智能產(chǎn)生的數(shù)據(jù)將占據(jù)人類全部數(shù)據(jù)的10%。生成式人工智能技術(shù)正加速數(shù)字經(jīng)濟的發(fā)展?!捌髽I(yè)行”活動中,上海交通大學(xué)人工智能研究院常務(wù)副院長、長江學(xué)者楊小康分享了團隊在生成式人工智能領(lǐng)域的工作,并表示,目前的生成式人工智能還存在解空間巨大、宏觀一致性差、微觀清晰度受限等問題,需要通過數(shù)學(xué)、物理、信息論、腦認知、計算機等學(xué)科交叉研究,進一步夯實生成式人工智能的基礎(chǔ)理論,通過“物理+數(shù)據(jù)”聯(lián)合驅(qū)動, “虛擬+現(xiàn)實”深度融合,助力科學(xué)發(fā)現(xiàn)的加速。
楊小康認為,以“識別——分析”為代表的判別式人工智能推動了人工智能前十年的發(fā)展,接下來十年,以“合成——重建”為代表的生成式人工智能將成為主流。
近期頻頻上“熱搜”的ChatGPT是生成式人工智能的典型代表。復(fù)旦大學(xué)計算機學(xué)院教授、上海市計算機學(xué)會自然語言處理專委會主任邱錫鵬提到,強大的情景學(xué)習(xí)能力、思維鏈能力和自然指令學(xué)習(xí)能力是以ChatGPT為代表的對話式大型語言模型的主要特點,將加速通用人工智能的實現(xiàn)。
據(jù)悉,今年2月,復(fù)旦大學(xué)自然語言處理實驗室發(fā)布了國內(nèi)第一個對話式大型語言模型“MOSS”,引發(fā)業(yè)內(nèi)廣泛關(guān)注,邱錫鵬是主要作者之一?!拔谋舅休d的知識只是冰山一角,還有很多‘暗知識’并不是以文本形式記錄的。在未來的發(fā)展里,人工智能還有‘具身學(xué)習(xí)、跨模態(tài)學(xué)習(xí)’等更多知識領(lǐng)域需要學(xué)習(xí)?!鼻皴a鵬說。
學(xué)術(shù)前沿:復(fù)雜場景多模態(tài)數(shù)據(jù)分析與理解進展迅速
人工智能要實現(xiàn)多場景“通用”,需要解決多源數(shù)據(jù)的問題?!拔谋?、圖像、視頻是互聯(lián)網(wǎng)上存量最大的數(shù)據(jù),需研發(fā)相關(guān)算法對其進行有效管理?!睆B門大學(xué)科技處處長、人工智能研究院負責(zé)人紀榮嶸教授認為,社交媒體等信息渠道包含了海量非合作、異構(gòu)化、跨模態(tài)的數(shù)據(jù),既蘊藏了大量的人類知識與高價值信息,也包含了各種自然與人為的噪聲,對其分析與處理需要融合類腦計算、計算機視覺、自然語言處理等多個維度的智能技術(shù)。
紀榮嶸指出,連接視覺與自然語言的“視覺描述”領(lǐng)域,是最受關(guān)注且最具潛力的人工智能研究任務(wù)之一 。視覺和語言的研究應(yīng)是雙向的,各自的新發(fā)現(xiàn)、新方法可以互相迭代促進??缈臻g、跨領(lǐng)域、跨任務(wù)知識遷移方面有較大探索空間,易于發(fā)現(xiàn)新的科學(xué)問題 。
落地實踐:圖像文檔結(jié)構(gòu)分析、底層視覺技術(shù)發(fā)展受關(guān)注
語言文字和視覺研究的融合也為技術(shù)落地創(chuàng)造出新的發(fā)展空間。近年來,人工智能與OCR(光學(xué)字符識別)技術(shù)的結(jié)合愈發(fā)緊密,圖像文檔中涉及的復(fù)雜結(jié)構(gòu)如漢字結(jié)構(gòu)、表格結(jié)構(gòu)、文檔總體結(jié)構(gòu)的建模問題,逐漸成為研究熱點。中國科學(xué)技術(shù)大學(xué)語音及語言信息處理國家工程研究中心副教授杜俊就團隊在文檔結(jié)構(gòu)層次化重建領(lǐng)域的最新進展進行分享。
“現(xiàn)階段文檔分析任務(wù)中,大多數(shù)研究是針對單頁內(nèi)的文章要素的解析,但從內(nèi)容角度看,許多文檔頁與頁之間內(nèi)容有關(guān)聯(lián)。”杜俊表示,圖像文檔處理能力要達到“篇章級”,突破手寫、自然場景下的漢字建模難點,做好跨頁文檔的要素分類、文檔結(jié)構(gòu)恢復(fù)是團隊的主要研究目標。
底層視覺是智能文檔處理的重要研究方向之一,主要研究如何提高或恢復(fù)各類場景下的圖像、視頻內(nèi)容,如清晰度提升,低質(zhì)量及破損圖像恢復(fù)等,相關(guān)理論和方法在手機圖像采集與處理,醫(yī)療圖像分析等領(lǐng)域發(fā)揮著至關(guān)重要的作用。合合信息圖像算法研發(fā)總監(jiān)郭豐俊博士針對目前底層視覺技術(shù)在處理形變、模糊、陰影遮蓋、背景雜亂的文檔時遇到的典型問題,就公司技術(shù)團隊在智能圖像處理技術(shù)模塊、融合技術(shù)典型應(yīng)用、圖像安全領(lǐng)域等領(lǐng)域的研究成果進行了分享。
郭豐俊提到,合合信息智能文檔處理技術(shù)基于對圖像目標區(qū)域的精準裁剪,對彎曲、傾斜透視的頁面進行形變矯正,在去除陰影、摩爾紋后,通過人工智能技術(shù)對文檔圖像進行增強銳化和清晰度提升,達到“圖像質(zhì)量增強”的效果,在改善閱讀體驗的同時,也提升了識別轉(zhuǎn)換、圖像分析等文檔處理下游任務(wù)的質(zhì)效,相關(guān)技術(shù)已通過“掃描全能王”等智能文字識別產(chǎn)品,服務(wù)全球上百個國家和地區(qū)的上億用戶。
相關(guān)閱讀
- (2023-03-24)人工智能未來十年走向何方? “CSIG企業(yè)行”合合信息專場聯(lián)合專家學(xué)者開啟“頭腦風(fēng)暴” 全球聚看點
- (2023-03-24)今熱點:今日外匯市場主要貨幣阻力支撐位預(yù)測(2023/3/24)
- (2023-03-24)3月24日亞盤外匯市場行情走勢分析:美元指數(shù)6連跌 黃金一度重回2000大關(guān)
- (2023-03-24)今日重點關(guān)注的財經(jīng)數(shù)據(jù)和事件及主要數(shù)據(jù)解讀(2023年3月24日)|信息
- (2023-03-24)環(huán)球熱文:恒指夜期收盤(3.24)︱恒生指數(shù)夜期(3月)收報19872點 低水178點
- (2023-03-24)天津發(fā)展(00882):力生制藥年度凈利同比減少23%至9360.66萬元
熱點推薦
- (2023-03-24)人工智能未來十年走向何方? “CSIG企業(yè)行”合合信息專場聯(lián)合專家學(xué)者開啟“頭腦風(fēng)暴” 全球聚看點
- (2023-03-24)今熱點:今日外匯市場主要貨幣阻力支撐位預(yù)測(2023/3/24)
- (2023-03-24)3月24日亞盤外匯市場行情走勢分析:美元指數(shù)6連跌 黃金一度重回2000大關(guān)
- (2023-03-24)今日重點關(guān)注的財經(jīng)數(shù)據(jù)和事件及主要數(shù)據(jù)解讀(2023年3月24日)|信息
- (2023-03-24)各地積極探索,數(shù)字人民幣應(yīng)用場景擴至養(yǎng)老、科創(chuàng)、跨境消費等
- (2023-03-24)每日觀察!天津:“三力”報春來
最近更新
- (2023-03-24)人工智能未來十年走向何方? “CSIG企業(yè)行”合合信息專場聯(lián)合專家學(xué)者開啟“頭腦風(fēng)暴” 全球聚看點
- (2023-03-24)今熱點:今日外匯市場主要貨幣阻力支撐位預(yù)測(2023/3/24)
- (2023-03-24)3月24日亞盤外匯市場行情走勢分析:美元指數(shù)6連跌 黃金一度重回2000大關(guān)
- (2023-03-24)今日重點關(guān)注的財經(jīng)數(shù)據(jù)和事件及主要數(shù)據(jù)解讀(2023年3月24日)|信息
- (2023-03-24)各地積極探索,數(shù)字人民幣應(yīng)用場景擴至養(yǎng)老、科創(chuàng)、跨境消費等
- (2023-03-24)每日觀察!天津:“三力”報春來
- (2023-03-24)世界要聞:扎堆資本運作 航司換季搶市
- (2023-03-24)工信部:前兩月電信業(yè)務(wù)收入2803億元 新興業(yè)務(wù)快速增長|速讀
- (2023-03-24)全球微資訊!河北2022年累計退減緩稅費1436億元 惠及經(jīng)營主體427萬戶次
- (2023-03-24)中國新疆代表在聯(lián)合國人權(quán)理事會第52屆會議 介紹事實真相
- (2023-03-24)羅定市氣象臺發(fā)布雷雨大風(fēng)黃色預(yù)警【III級/較重】【2023-03-24】|播資訊
- (2023-03-24)九品中正制誰提出的?察舉制與九品中正制有何特點?
- (2023-03-24)環(huán)球熱文:恒指夜期收盤(3.24)︱恒生指數(shù)夜期(3月)收報19872點 低水178點
- (2023-03-24)天津發(fā)展(00882):力生制藥年度凈利同比減少23%至9360.66萬元
- (2023-03-24)焦點快看:智通ADR統(tǒng)計 | 3月24日
- (2023-03-24)金川國際(02362)公布2022年業(yè)績,股東應(yīng)占溢利102.8萬美元 同比減少99%
- (2023-03-24)最新快訊!國華(00370):貿(mào)易業(yè)務(wù)的兩名客戶被發(fā)現(xiàn)撤銷注冊
- (2023-03-24)第三屆消博會籌備工作有序推進
- (2023-03-24)三類自主海洋衛(wèi)星融合產(chǎn)品發(fā)布 世界新消息
- (2023-03-24)我省首家公證處公民遺產(chǎn)服務(wù)中心掛牌|環(huán)球觀速訊
- (2023-03-24)C羅:進球的感覺真是太棒了 自豪成為國家隊歷史出場最多的球員
- (2023-03-24)3月24日重點數(shù)據(jù)和大事件前瞻
- (2023-03-24)報道:東曜藥業(yè)-B(01875)2022年商業(yè)化營銷策略顯著 首年實現(xiàn)“開門紅”佳績 營收同比增長479%至4.42億元
- (2023-03-24)今日紐盤歐元/美元、英鎊/美元、美元/日元行情走勢交易策略(2023年3月23日)-全球熱頭條
- (2023-03-24)美聯(lián)儲降息信號出現(xiàn) 白銀期貨沖高回落
- (2023-03-24)銀價首個看漲目標達成
- (2023-03-24)【速看料】今日晚間白銀行情分析(2023年3月23日)
- (2023-03-24)銳財經(jīng)丨這些企業(yè)年報釋放積極信號|微速訊
- (2023-03-24)新鄉(xiāng)師范學(xué)院二本錄取分數(shù)線_新鄉(xiāng)師范學(xué)院-今日熱門
- (2023-03-24)英鎊/美元行情綜述(2023年3月23日)_今日熱訊