国产精品亚洲综合久久,久久精品re,激情五月开心婷婷,久久亚洲日本不卡一区二区,高清一区二区三区,欧美日本日韩aⅴ在线视频

可信數據空間是“有圍欄的數據沙箱” 機械制造、汽車等行業有望率先建設
來源:每日經濟新聞作者:張蕊2025-02-18 07:45

大企業,想開發數據又擔心數據泄露?

小企業,想用數據卻不會用,還沒有渠道?

別擔心,可信數據空間將有效解決這些問題。國家數據局發布《可信數據空間發展行動計劃(2024~2028年)》,這是國家層面首次針對可信數據空間這一新型數據基礎設施進行系統布局,將實施可信數據空間能力建設行動,開展可信數據空間培育推廣行動。

為什么要加快發展可信數據空間?它可以解決哪些問題?跟我們普通人又有怎樣的關系……帶著這些問題,《每日經濟新聞》記者(以下簡稱NBD)專訪了中國工程院院士、中國工程院原副院長鄔賀銓。

作為我國通信與信息系統領域的杰出專家,鄔賀銓是中國最早從事數字通信技術研究的骨干之一,多次參與了中國通信發展的決策。

在鄔賀銓看來,可信數據空間就是一個“有圍欄的數據沙箱”,數據使用方以數據“可用不可見”的方式互惠或有償使用數據。建設可信數據空間就是要解決多個難題,包括數據流通、共享和利用的問題,同時消除對數據泄露、網絡安全和個人隱私保護的擔憂,并且可以解決跨境數據流動中的合規性問題。

他表示,目前可信數據空間在國際上尚無體系化部署和應用的經驗,德國的汽車行業在做,但也尚未大規模推廣,中國也會先做一些試點。可信數據空間建成后,對企業來說,有利于數字化轉型;對政府數據來說,可以更好地開放利用。

很多企業在數據使用上存在不會用等難題

NBD:您提到,目前可信數據空間在國際上尚無體系化部署和應用的經驗,那我國提出來發展可信數據空間是出于什么考慮?它主要是為了解決什么問題?

鄔賀銓:近年來,人工智能發展迅速,其發展需要算力、數據、算法來共同支撐,人工智能的快速發展更進一步凸顯了數據的重要性。中國高度重視數據,并首先提出數據是生產要素。過去支撐經濟增長的主要生產要素是土地、勞動力以及全要素生產率(即科技貢獻)等,這幾年傳統的全要素生產率和勞動力的貢獻均有所下降。因此,我國提出了數據驅動的數字化轉型戰略,旨在發揮數據的作用。

中國擁有龐大的人口和全球最多的工業門類,從這個意義上說,我們生活和生產的數據量巨大。因此,發揮數據作為生產要素的作用是一個正確的方向,也是我國未來經濟發展的希望所在。

然而,很多企業盡管有數據,但在數據使用上存在幾個問題:首先是不敢用,由于擔心數據泄露,大企業認為其數據與國民經濟密切相關,不能隨意使用。而且許多大型央企擁有大量數據,但在數據挖掘能力上仍然不足。本來正確的方向是與具有這種能力的信息技術企業合作,但又擔心數據拿出來會泄密。

其次是不會用,特別是很多中小企業,有一些數據,但是不知道怎么用。即便政府開放了一些數據,但開放的數據真正被利用的比例仍然很低,因為要充分利用好這些數據,也有技術門檻。

第三,一些單位不一定不會用,也不一定不敢用,它擁有的數據本來應該是可以開放的,但是它想壟斷,以不安全為借口不去共享,這是“不愿用”。

另外就是沒數據。很多企業的數字化改造尚未達到較高水平,沒有數據可用。當然,沒數據不等于不想用行業的數據和社會的數據,是缺乏獲取這些數據的途徑。因此,盡管中國表面上擁有全球最多的工業行業數據,但實際上利用率很低。有資料表明,中國每年產生的數據只有不到3%被存儲,被利用的比例更低。

盡管語言數據很多,但存儲下來的不多,能夠被公開檢索的更是少之又少。中國的語言數據庫,一些高校和研究機構中有,但并不開放,開源的很少。ChatGPT訓練時需要全球各種語言的數據,其中中文數據僅占千分之一,比例非常低。因此,很多國內公司在開發大模型時使用的是美國開源數據庫的數據,這其實存在價值觀對齊的風險,他們的數據并不一定都是安全的。

所以,可信數據空間的提出就是要解決數據流通、共享和利用的問題,同時消除對數據泄露、網絡安全和個人隱私保護的擔憂。此外,在未來跨境數據流動中,還需確保合規性。這是可信數據空間提出的愿景。

可信數據空間是“有圍欄的數據空間”

NBD:文件中明確了可信數據空間的定義,如何通俗地理解可信數據空間?在這個空間里可以干什么?

鄔賀銓:可信數據空間實際上可以被視為一個“有圍欄的數據空間”,在這個空間內,可以放入加密和非加密的數據,但訪問這些數據需要經過接入認證。在這個空間內,相關主體可以利用算力支持,引入大模型進行計算,提取有用信息,計算結果可以帶走,但數據本身無法帶走。這是一個“有圍欄的數據沙箱”,數據不出域,相當于一個貨物的保稅區或自貿區,貨物放入其中,在這里可以有很多工人進行生產加工,加工的最終成品可以拿出去,但最原始的東西是拿不走的。

可信數據空間有什么用處:第一種,比如大企業自己有數據,但未能充分利用,那么大企業就可以和互聯網企業或者具有大模型能力的企業合作,與其簽訂合同,你可以進入我的數據空間,用你的大模型按我的要求幫我分析這些數據。比如石油企業擁有大量地下探礦得到的地震測繪圖形和視頻數據,要想知道哪里有油、有多少,人工分析效率很低,企業就希望使用大模型來分析數據,并給出明確結論,比如這個井有沒有油、大概有多少油。

這些數據在空間內無法帶走,企業不必擔心數據被泄露。同時,分析過程中的數據可以是加密的,企業可以與合作伙伴共享密鑰,但未經允許,合作伙伴無法再次使用密鑰,下次密鑰又變了。比如采用同態加密技術,合作企業可以進來對加密數據進行計算,其計算的結果與對不加密的原始數據進行計算是一樣的,這種即使合作企業知道了加密密鑰,但是沒有大企業的密鑰配合也無法使用。所以這完全是一種可控的、可以放心地將數據與他人進行合作計算的方式。

第二種,比如產業鏈的龍頭企業希望掌握上下游企業的生產和庫存數據,“全線拉通”就可以實現整個供應鏈的精準生產,我需要多少你生產多少,這樣就可以做到上下游企業零庫存、少庫存,也能更準確地知道資金的需求量,進而提高整個產業鏈的效率。但是對產業鏈上下游的企業來說,要把所有數據都告訴這個龍頭企業,很多企業也很擔心,因為這一家企業可能同時是幾個不同龍頭企業的供應鏈企業,一家龍頭企業掌握了是不是其他家也會掌握?利用可信數據空間就可以解決這種問題,所有企業的數據都可以放入空間,我只是要得出一個優化排產的方案,這對產業鏈上的企業都有利,而并不會泄露上下游企業的原始數據。

第三種,政府擁有大量高質量數據,比如戶口信息。這些數據非常重要,比如一個小區有多少老人、有多少適齡兒童,這對安排學校、養老院和醫療機構非常有用。當然,政府在公開數據時,需要進行脫敏處理,以保護個人隱私。

盡管政府數據現在公開不少,但是能用的很少。要會用這些數據,也有一定門檻。普通人即便看到這么多數據也不會用,所以將數據放到可信數據空間,不但要解決脫敏問題,還要提供很多附帶的開發數據的軟件。

例如政府公布了北京市某個區的相關數據,我如果想要查看不同年齡段的人口比例,再跟全市不同區域老齡人口、學齡兒童、學齡前兒童的比例及相對應的養老機構、小學、托幼機構分布等結合,靠人去算工作量很大,如果這里面有一些工具軟件,只要使用者提出需求,就可以自動生成相應的圖表。比如我要買房子,位置選在哪里合適?最近各個片區房價怎樣?這些都可以分析,從而幫購房者作出決策。這也是可信數據空間的一個作用。

第四種,企業在進行國際貿易時,需要跨境傳輸數據。國家對出境數據有管理要求,特別是涉及個人信息和隱私的數據。企業要跟境外通信,但是又擔心不合規,因為目前對出境數據的要求是即便數據不包含機密信息,接收方經過審查是合格的,但是出境以后的數據仍然要可控。接收方不能把數據再轉給別人,并且只能為其商業目的應用,而不能用于其他目的。

通過可信數據空間就可以解決類似問題,數據可以加密傳輸,接收方可以解密使用。一旦違規,企業可以遠程更改數據密鑰,使接收方無法訪問。這樣,即使數據出境,也能實現“長臂管轄”,滿足跨境數據合規的要求。因此,可信數據空間既能促進數據流通應用,同時又能保證數據安全,避免泄露隱私,并符合跨境數據合規要求。

有加密和解密計算等八個功能

NBD:可信數據空間有哪些功能?

鄔賀銓:概括來講,可信數據空間有以下八個功能:

一是數據源和數據接入者的身份驗證。進入這個空間要進行審查,不是誰都能進來。

二是數據目錄。這個空間里有哪些數據要有個目錄,方便查找。現在政府開放了很多數據,實際上沒有給目錄,所以使用者是不好查找的。

三是數據脫敏處理。舉例來說就是只能讓大家知道這個小區的群體數據,而不涉及具體的個人。

四是數據格式轉換。數據有文本、圖表、照片、視頻、PDF文件、Excel文件等不同類型和格式,空間里可以提供格式轉換工具,方便數據應用。

五是提供數據開發工具。比如通過低代碼方法可實現僅用鼠標拖拉軟件就可以生成一些簡單的分析,一般人是不具備這些工具的,空間里可以提供。

六是提供加密和解密計算。

七是提供數據安全軟件。可信數據空間也要防止外部攻擊、竊取數據等。

八是有償應用時要進行一些結算、清算。

通過提供這些功能,可信數據空間就可以免除大企業的后顧之憂,同時能輻射到很多沒有數據的中小企業,從而更好地激活數據。所以國家推動發展可信數據空間,就是要落實發揮數據作為生產要素的作用,真正驅動數字化轉型。

當然,要實現這些目標,需要一些體制機制的配合,但可信數據空間提供了一種技術手段,可以讓大家免除不敢用、不會用和沒有數據的擔憂和難題。

要對數據的提供者和使用者認證

NBD:剛才您提到并非任何人都能進入可信數據空間,需要對數據進行認證,那是誰來對數據進行驗證呢?

鄔賀銓:這個數據空間將來要有標準,不是對數據進行認證,而是對數據的提供者和使用者進行認證,進入空間需要登記。我們不核對數據是否準確,因為沒有這個能力,比如工業上的數據怎么能核查里面哪個對哪個不對?數據源提供者需要對其提供的數據負責,不能放入錯誤或虛假的數據。因此,放入的數據將有標記,比如A公司提供的數據,具體存在哪個位置會有標記,如果使用A公司提供的數據計算結果總是錯誤,說明A公司有問題,最后可以追溯到A公司。另外,A公司提供的數據,大企業要請互聯網企業進來幫助計算,企業信任并與之簽訂合同的互聯網企業可以進入,未簽訂合同的企業不能進入,這是可以識別的。

NBD:所以并不是有一個專門的機構(獨立的第三方)來進行認證?

鄔賀銓:不需要。企業之間的數據存在供方和需方,有協議、合約關系,沒有協議的第三方就不能進來。當然,政府的數據是開放給公眾的,那就不需要有接入認證,只要登記即可使用。

NBD:可信數據空間是不是類似于一個“數據超市”,只要在超市內的數據就是合法的、受保護的,只要花錢就能用?

鄔賀銓:不完全像超市,政府的數據面向社會公開,只要登記一下就可以用,這有點像超市,但是企業的數據不是超市,不是敞開的,誰進來是要有協議的,必須得是跟我這個企業簽了合同的,你才能用我的數據。

NBD:以后是不是只要用這些數據就需要付費?

鄔賀銓:可能付費,也可能免費。比如一個垂直行業的企業請一個互聯網企業進來,這個企業反而要給互聯網企業付費,因為互聯網企業要利用他的知識、大模型等幫垂直企業進行計算。另一種情況,供應鏈的上下游企業,大家在一起,那是互利的,不存在付費問題。

但如果是行業內的聯盟建設此類數據空間,把行業共性數據放進去,則涉及收費問題。比如機械制造行業很多零部件是通用的,完全可以把相關數據都放在空間內,將來只需要對不同零部件進行組合,相當于“工業淘寶”,行業中的企業可以在該平臺上隨便選用。這種方式可能收費,也可能不收費。如果零部件公司愿意展示相關零部件信息,以供大家選擇,這樣可以擴大市場,那零部件公司甚至要給平臺付費。另外,零部件公司也可能提供一些設計圖紙和軟件工具,如果行業中的其他企業要調用這些圖紙工具以簡化其設計工作量,那可能就需要付費。所以根據不同的應用場景,收費也會有不同的模式。

可信數據空間是一個大模型計算的過程

NBD:《計劃》提出主要布局企業、行業、城市、個人、跨境五類可信數據空間建設和應用推廣。這五類可信數據空間的建設有沒有優先級?

鄔賀銓:政府應當帶頭。其次企業是主體,無論企業還是行業,都更有利于推動經濟發展。我不太贊同將“個人”作為一個獨立的類別,企業、行業和政府是可信數據空間的建設者,而個人不會建可信數據空間,此處提到的“個人”實際上是指專門提供個人數據的平臺,這類數據需要特別重視脫敏處理。實際上,政府的數據就包含個人數據了。

跨境數據有特殊場景,對于有跨境需求的企業,他們需要進行跨境數據處理,但需求量不會很大。很多時候,企業自建的數據平臺可能就已經包含了跨境管理能力,因此是否有特定必要一定建立跨境可信數據空間也是值得商榷的。

NBD:政府在可信數據空間的建設中扮演什么樣的角色?

鄔賀銓:掌握公共數據資源的相關部委以及地方政府,按照國家規定,在確保國家機密、企業秘密、個人隱私的前提下,原則上能夠開放的數據都應開放。從另一個角度,國家在政策上鼓勵和引導可信數據空間的建設,并進行規范管理。同時,還要督促建設可信數據空間的機構承擔保障可信數據空間數據安全的責任。

NBD:企業參與可信數據空間建設的動力是什么?會不會增加它的成本?企業能否從建可信數據空間的過程中實現盈利?

鄔賀銓:我剛才提到,許多垂直行業的企業擁有數據,但不會挖掘。他們現在需要建立可信數據空間,以吸引外部公司參與挖掘,而不是依賴可信數據空間來盈利,這是他們實現數字化轉型的一個重要環節,數據盤活以后會直接提升企業的生產效率、降低成本,這些足以彌補企業的投資成本。至于在供應鏈中,如果能夠在可信數據空間中實現零庫存或小庫存,所有參與者都能獲益,因此并不需要單純依賴可信數據空間來獲得直接的投資回報。政府建立可信數據空間是出于義務,而不是直接追求回報。只有行業組織建立的可信數據空間,類似于“工業淘寶”,可以面向使用方或提供方收費,類似于阿里、京東這樣的平臺,也能運營得很好。

NBD:所以對企業來說,并不是建可信數據空間就有一個明確的商業模式。

鄔賀銓:不是,絕大多數企業不是靠可信數據空間直接收回投資回報。除非行業的聯盟可能需要從中回本。

NBD:建設可信數據空間成本會很高嗎?

鄔賀銓:對于許多大企業來說,它們已經擁有云,包括私有云、公有云等。實際上,可信數據空間主要涉及一些軟件、網絡安全能力的配套以及算力支持,在現有的基礎設施上并不需要過多的投入。小企業是建不起的,因為它們能夠投入的資源有限,并且缺乏影響力,作為供應鏈上的小企業,不可能讓所有大企業都參與到其發起的可信數據空間建設中。

NBD:有沒有一個大概可以量化的成本?

鄔賀銓:這取決于空間的規模,可信數據空間規模有大有小,如果只放入少量數據來計算,現有的云平臺算力就足夠了,剛起步時也沒必要非要建很大。比如垂直行業的大企業有私有云,在云平臺上就可以做,無需額外的投入。實際上很多大企業已經自建了一些算力平臺,雖然最初不是為可信數據空間建的,但是可以支持做可信數據空間。

NBD:所以可信數據空間里面是要進行大量的數據計算,其實是會消耗很多算力的,它消耗的算力跟大模型消耗的算力比如何?

鄔賀銓:它就是大模型。企業有這么多數據,它可能會有大模型,也可能沒有,需要讓互聯網公司帶進來,企業有的模型基本上是跟企業所在行業相關的模型,而互聯網企業帶進來的是基礎大模型,比如語言大模型、視頻大模型等,這些模型企業是沒有的。帶進來以后,用企業的數據來進行優化、微調,所以可信數據空間就是一個大模型計算的過程,只不過吸引了外部公司來共同參與。如果企業什么都懂,那就不需要請互聯網公司進來。

汽車等行業有望率先建設可信數據空間

NBD:在行業可信數據空間方面,文件提到了科技創新、農業農村、工業、服務業等領域,這些領域可信數據空間的建設重點有哪些?

鄔賀銓:行業可信數據空間主要是由行業龍頭、行業聯盟或者行業中領先的研發機構來發起建設的可信數據空間,它們能夠號召行業中供需雙方的參與。顯然現在有一些比較強勢的行業聯盟在這些領域中將發揮重要作用。像能源石化行業,中石油、中石化等企業規模都很大,它們完全可以自行建設,不需要聯合建設。而像機械制造行業通用性比較強,制造行業本身比較分散,所以這種行業聯盟發揮作用可能更大。包括汽車行業,以及目前比較熱的風電、太陽能等產業,這些產業的上下游供應鏈很長,它們可能會率先行動。

NBD:剛才您也提到個人的可信數據空間,您怎么看個人數據在可信數據空間當中的應用前景?

鄔賀銓:單一個體的數據屬于隱私,但是無數個體的數據就構成了社會數據、公共數據,對國計民生具有重大影響。通過這些數據,可以了解人們的需求、年齡段分布、日常消費品的消耗量等,這些數據對市場分析等都十分有用。政府掌握的這些數據,在脫敏處理后應當且必須公開。

我不認為需要單獨建立一個個人數據的可信數據空間,但可以理解為它是政府建設的個人數據空間的一部分,專門提供個人數據,為社會所用。

NBD:個人數據跟公共數據的關系是怎樣的?

鄔賀銓:個人數據就是公共數據。我剛才提到,脫敏后的數據不再涉及個人隱私,那就是社會數據、公共數據。個人數據是政府掌握的公共數據,無數的個人數據的集合就是公共數據。

NBD:普通人用這些數據是免費的嗎?

鄔賀銓:政府的公共數據都是免費的。即便個人不會直接利用這些信息來決策,公共服務機構也總會充分利用這些信息。比如發現某個地區不能做到15分鐘生活供應,那就可以盡快建一個生活超市;分析某條城市公交線路什么時段乘客最多或最少,哪個站點上下站乘客多,交管部門就可以優化公交線路等。

NBD:在建設可信數據空間的過程中,會帶動哪些產業的發展?

鄔賀銓:建設可信數據空間直接服務于整個經濟社會,同時也會帶動算力、算法、網絡安全等相關產業的發展。

責任編輯: 胡青
聲明:證券時報力求信息真實、準確,文章提及內容僅供參考,不構成實質性投資建議,據此操作風險自擔
下載“證券時報”官方APP,或關注官方微信公眾號,即可隨時了解股市動態,洞察政策信息,把握財富機會。
網友評論
登錄后可以發言
發送
網友評論僅供其表達個人看法,并不表明證券時報立場
暫無評論
為你推薦
時報熱榜
換一換
    熱點視頻
    換一換
    主站蜘蛛池模板: 九九热这里只有精品6 | 最新99热 | 免费黄色在线视频 | 日本高清视频一区二区 | 精品人成电影在线观看 | 久久精品国产影库免费看 | 久久网色 | 色五婷婷| h视频在线免费看 | 欧美一级片在线观看 | 开心激情综合 | 日本aⅴ精品一区二区三区久久 | 男人亚洲天堂 | 国产精品人成人免费国产 | 国产二区精品 | 高清免费毛片 | runaway在线观看免费韩国动漫 | 日韩欧美在线观看 | 国产免费播放一区二区 | 欧美精品三区 | 国产成人h综合亚洲欧美在线 | 99香蕉视频 | 97在线观免费视频观看 | 亚洲国产成人在线视频 | 四虎影视色费永久在线观看 | 五月婷婷六月合 | 日本久久网| 2021国产精品最新在线 | 亚洲综合日韩在线亚洲欧美专区 | 婷婷看片| 国产成人网 | 久久久免费观看视频 | 国产精品视频免费看 | 一级毛片在线免费看 | 一级毛片在线视频 | 九久精品| 激情丁香婷婷 | 95免费观看体验区视频 | 色交视频 | 久久免费香蕉视频 | 伊人高清视频 |