紅周刊 本刊特約 | 李欣妍
在今年大紅大紫的AI產業鏈中,投資者目光大多被算力、算法、光模塊等吸引,但實際上數據是迭代AIGC模型的核心要素,中國有全球最大的數據量。數據流通是數據資源體系構建的關鍵,是數據要素建設重點方向。
(相關資料圖)
不過,穩定的流通就要確定數據的權利歸屬,才有可能產生交易的價值,并且保證安全可追溯。當前,國家層面正在加速這一方向的發展,數據相關的上市公司有持續關注的價值。
從二級市場看,截至6月15日收盤,人工智能板塊指數連續第三個交易日創年內新高。從中期維度看,AI板塊的投資人氣仍可能維持較高熱度。在整個AI領域中,市場非常關注算力和算法,AI芯片、光模塊、服務器、PCB龍頭股在6月以來的上漲中率先反彈。隨著行情不斷演繹,數據確權相關板塊股價出現異動,截至6月15日,相關板塊指數過去一個月漲幅11.02%。
AI驅動數據需求爆發
數據要素相關公司景氣度上揚
通過國有企業搭建的平臺,國內的數據確權服務得到推動和支持。隨著數字經濟快速發展,這些平臺有望在數據確權領域發揮更重要的作用,推動數據產業繁榮和創新。而以ChatGPT為代表的人工智能加速發展,數據要素市場需求爆發。
拆分來看,數據要素產業鏈包括數據生產、流通和使用三大環節。數據是以ChatGPT為代表的人工智能進一步發展不可或缺的基礎。數據相當于AI算法的“飼料”,用于AI的數據越多,AI的算法能力則越強。作為數據的一大需求方,未來人工智能領域的加速發展,有望驅動數據需求的爆發,同時有望增加數據要素交易,促進數據要素市場建設。
據國家工信安全中心測算數據,2020年我國數據要素市場規模達到545億元,“十四五”期間,這一數值將突破1749億元,整體進入高速發展階段。隨著數據要素相關政策進一步落地,技術發展使得數據要素交易易于實現,數據要素相關公司將迎來較大的機會。
從投資細分的角度來看,數據要素產業鏈及數據交易所,數據存儲、采集、處理、運營、確權及安全環節,數據所有者等幾類參與者。
例如浙數文化位于經濟及信息發達省份,目前持有浙江大數據交易中心48.2%股份。易華錄經營重點由數據湖建設轉向數據要素運營;云賽智聯以云服務與大數據、行業解決方案及智能化產品三大板塊為核心業務,布局數據要素產業鏈多個環節。上海鋼聯植根大宗商品數據服務業23年,對大宗商品幾乎全覆蓋,目前公司已在上海數據交易所掛牌相關數據產品。深桑達中國電子云為中國電子旗下惟一云平臺。
實際上,高質量數據對模型性能提升至關重要,預計大模型廠商將加大高質量數據需求,擁有高質量數據庫的相關公司,價值有望提升。當前時點,就AI驅動下的數據要素而言,短期有望迎來做多窗口,但對結構牛市來說,勝負手的關鍵在于主線選擇和篤定追隨。
數據確權是數據交易的前提
人民網、新華網專業對接優勢彰顯
從ChatGPT面世以來,AIGC產業迎來爆發式發展,國內企業加快擁抱大模型時代,百度、360、阿里等互聯網公司以及商湯、科大訊飛等人工智能企業相繼發布自研大模型,大模型軍備競賽拉開序幕。
今年4月,國家互聯網信息辦公室發布了《生成式人工智能服務管理辦法(征求意見稿)》,公開征詢管理建議,這是國家首次向生成式人工智能領域發布產業規范性政策文件,其把數據安全、數據確權、數據隱私等數據有關內容放在較為重要的篇幅。由此,我們能明確看到其利好數據確權細分賽道。從文件發布以來,截至6月14日,AIGC指數漲幅達到10.28%。
實際上,對于AI大模型而言,數據為貫穿其全身的血脈,對AI發展影響重大;除通用數據外,行業數據也是各垂類模型的關鍵。在整個AI貫穿的領域里面,算力和算法關注度最高。毋庸置疑,單純比拼算力,我國尚且存在一定差距,但是投資者不應忽視我國的數據資源優勢,這是我們的長板所在。
關于數據,坊間有一種觀點認為AI文本生成較高質量的數據來源于學術論文、專業書籍、專業新聞、專業的全球數據庫、各細分領域龍頭數據庫以及高質量的論壇,而目前高質量數據庫仍以英文為主,給中文大模型訓練提升了難度。其實這是狹義的定義數據,中國互聯網數據龐大,沉積下來全球最大的數據量,海量優勢無可比擬。
根據《國家數據資源調查報告(2021)》,我國2021年數據產量6.6ZB,同比增加29.4%,其中個人數據產量為1.4ZB,各類行業機構產生數據5.2ZB。從行業分布看,數據產量排名前五位的行業分別為政府、互聯網、媒體、公眾服務及專業服務、交通,前五大行業數據產量占全國行業機構數據總產量的65%。
從具體架構來看的話,不僅有頂層制度設計,各地也紛紛成立數據交易所。面對各級政府在數據大開發上面的發力,未來或許有可能先于其他國家挖掘出更深的數據價值。
從邏輯關系上看,AI訓練的核心資源是數據,AIGC想要取得好的生成結果,離不開基于海量數據的訓練,而數據確權應該是人工智能能夠持續發展的基石之一。嚴格意義上講,確定數據的權利屬性即做好數據確權,一方面可解決AIGC作品的知識產權保護或規避侵權等問題;另一層面其不僅影響和制約著數據流通環節,還涉及到數據資產的入表問題。
結合二級市場看,從事數據確權的相關公司并不多,目前國內的數據確權服務工作主要由一些國有企業搭建的平臺承擔,比較典型的平臺包括人民網旗下的人民數據確權流通平臺和人民數保平臺,自2019年起,人民網就開始積極研究和創新應用區塊鏈技術,并將其運用于數據確權業務的探索中。
具體說來,人民數據資產服務平臺是我國首個數據確權平臺。它作為國家隊具有先發優勢,不過數據確權目前尚屬較新的數字產業,我們能看出相關業務自2019年布局后,2020年在財報中已經有所體現,但具體能給公司帶來多少產出目前還無法得知。從年報數據及信息服務相關財務指標中,可以看到相關營收過去三年均有下降,分別為3.31億元、2.82億元、2.56億元;然而毛利率有所攀升,分別為47.03%、47.44%、49.02%。
無獨有偶,新華網通過持有新華智云(與阿里合資)39%的股份來推動數字資產中心的建設,并利用區塊鏈技術提供數據確權服務。對此有券商預計2022-2023年,公司歸母凈利潤分別為2.52億元/2.90億元,同比增長19.61%/15.02%,6月15日收盤價對應PE分別為78.71/67.31x。
(作者為深圳某基金公司基金經理。本文已刊發于6月17日《紅周刊》,文中觀點僅代表作者個人,不代表《紅周刊》立場。文中提及個股僅做分析,不做投資建議。)