你有沒有想過,為什麼像 Reddit、X(前 Twitter)這樣的社群媒體可以免費使用?答案其實就藏在你每天發的貼文、點的讚,甚至只是停留的時間裡。
曾經,這些平台將你的注意力當作商品賣給廣告商。如今,它們找到了一個更大的買家——AI 公司。據報道,光是 Reddit 與 Google 的資料授權協議,就能為前者帶來每年 6,000 萬美元的收入。而這筆巨額財富,卻與身為數據創造者的你我無關。
更令人不安的是,用我們的資料訓練出來的 AI,未來可能會取代我們的工作。儘管 AI 也可能創造新的就業機會,但這種數據壟斷所帶來的財富集中效應,無疑加劇了社會的不平等。我們似乎正在滑向一個由少數科技巨頭控制的賽博朋克世界。
那麼,身為一般人,我們該如何在這個 AI 時代保護自己的利益呢? AI 興起之後,許多人將區塊鏈視為人類抵抗 AI 的最後一道防線。正是基於這樣的思考,一些創新者開始探索解決方案。他們提出:首先,我們要奪回對自己資料的所有權和控制權;其次,我們要利用這些數據,共同訓練一個真正為普通人服務的 AI 模型。
這個想法看似理想主義,但歷史告訴我們,每一次科技革命都始於一個「瘋狂」的構想。而今天,一個名為「Vana」的全新公鏈計畫正在將這個構想變成現實。作為第一個去中心化資料流動性網絡,Vana 試圖讓你的資料轉化為可自由流通的代幣,並以此推動實現真正由用戶掌控的去中心化人工智慧。
事實上,Vana 的誕生可以追溯到麻省理工學院(MIT)媒體實驗室的一間教室。在那裡,兩位懷抱改變世界理想的年輕人——Anna Kazlauskas 和 Art Abal——相遇了。
左:Anna Kazlauskas;右:Art Abal
Anna Kazlauskas 在 MIT 主修電腦科學和經濟學,她對資料和加密貨幣的興趣可以追溯到 2015 年。那時的她正在參與以太坊的早期挖礦,這段經歷讓她深刻地意識到去中心化科技的潛力。隨後,Anna 在聯準會、歐洲央行和世界銀行等國際金融機構進行數據研究,這些經驗讓她意識到在未來的世界裡,數據將成為一種新的貨幣形式。
同時,Art Abal 在哈佛大學攻讀公共政策碩士學位,並在貝爾福科學與國際事務中心深入研究資料影響評估。在加入 Vana 之前,Art 在 AI 訓練資料提供者 Appen 公司主導了創新的資料收集方法,這些方法為當今許多生成式 AI 工具的誕生做出了重要貢獻。他在數據倫理和 AI 責任方面的洞察,為 Vana 注入了強烈的社會責任感。
當 Anna 和 Art 在 MIT 媒體實驗室的課程中相遇時,他們很快就發現彼此對數據民主化和用戶數據權益有著共同的熱忱。他們意識到,要真正解決資料所有權和 AI 公平性的問題,需要一個全新的範式——一個能讓使用者真正掌控自己資料的系統。
正是這種共同的願景,促使他們攜手創立了 Vana。他們的目標是打造一個革命性的平台,不僅要為使用者爭取資料主權,還要確保使用者能從自己的資料中獲得經濟利益。透過創新的DLP(Data Liquidity Pool)機制和貢獻證明(Proof of Contribution)系統,Vana 讓用戶能夠安全地貢獻私有數據,共同擁有並受益於由這些數據訓練出的AI 模型,從而推動用戶主導的AI發展。
Vana 的願景迅速地得到了業界的認可。截止目前,Vana 宣布已經完成了總計2500 萬美元的融資,其中包括由Coinbase Ventures 領投的500 萬美元戰略輪融資、Paradigm 領投的1800 萬美元A 輪融資,以及Polychain 領投的200 萬美元種子輪融資。其他知名投資者還包括 Casey Caruso、Packy McCormick、Manifold、GSR、DeFiance Capital 等。
在這個數據就是新時代石油的世界裡,Vana 的出現,無疑為我們提供了一個奪回數據主權的重要機會。那麼,這個充滿潛力的計畫究竟是如何運作的呢?讓我們一起來深入了解 Vana 的技術架構和創新理念。
Vana 的技術架構堪稱一個精心設計的生態系統,旨在實現數據的民主化和價值最大化。其核心組成部分包括資料流動性池(DLP)、貢獻證明機制、名古屋共識、使用者自託管資料以及去中心化應用層。這些元素共同建構了一個既能保護用戶隱私,又能釋放資料潛在價值的創新平台。
數據流動性池是Vana 網路的基本單位,可以將其理解為資料版的「流動性挖礦」。每個 DLP 本質上都是一個智慧合約,專門用於聚合特定類型的資料資產。例如,Reddit 資料 DAO(r/datadao)就是一個成功的 DLP 案例,吸引了超過 14 萬 Reddit 用戶加入。它聚合了用戶的 Reddit 貼文、評論和投票歷史。
使用者向DLP 提交數據之後,可以獲得該DLP 特定的代幣獎勵,例如Reddit 資料DAO(r/datadao)的特定代幣就是RDAT。這些代幣不僅代表了用戶對資料池的貢獻,也賦予了用戶對 DLP 的治理權和未來收益分配的權利。值得注意的是,Vana 允許每個 DLP 發行自己的代幣,這為不同類型的資料資產提供了更靈活的價值捕獲機制。
在Vana 的生態系統中,前16 名的DLP 還能獲得額外的VANA 代幣排放獎勵,這進一步刺激了高品質數據池的形成和競爭。透過這種方式,Vana 巧妙地將零散的個人資料轉化為具有流動性的數位資產,為資料的價值化和流動性奠定了基礎。
貢獻證明是Vana 確保資料品質的關鍵機制。每個 DLP 都可以根據自身特點,定制獨特的貢獻證明函數。這個函數不僅驗證資料的真實性和完整性,還評估資料對 AI 模型效能提升的貢獻度。
以 ChatGPT 資料 DAO 為例,其貢獻證明涵蓋了四個關鍵維度:真實性、所有權、品質和獨特性。真實性透過驗證OpenAI 提供的資料導出連結連結來確保;所有權則透過使用者的郵箱驗證;品質評估則藉助LLM 對隨機抽樣的對話進行評分;獨特性則透過計算資料的特徵向量並與現有資料比對來確定。
這種多維度的評估確保了只有高品質、有價值的數據才能被接受並獲得獎勵。貢獻證明不僅是資料定價的基礎,也是維護整個生態系資料品質的關鍵保障。
名古屋共識是Vana 網路的心臟,它藉鑒並改進了Bittensor 的尤馬共識(Yuma Consensus)。這機制的核心思想是透過一群驗證節點對資料品質進行集體評估,採用加權平均的方式來得出最終分數。
更具創新性的是,驗證節點不僅要評估數據,還要對其他驗證節點的評分行為進行評分。這種「雙層評估」機制大大提高了系統的公平性和準確性。例如,如果一個驗證節點給一份明顯低品質的資料打了高分,其他節點會對這個不當行為作出懲罰性評分。
每隔 1800 個區塊(約 3 小時)為一個週期,系統會根據這一期間的綜合評分,向驗證節點分配相應的獎勵。這種機制不僅激勵了驗證節點保持誠實,還能迅速識別和淘汰不良行為,從而維護整個網路的健康運作。
Vana 的一大創新在於其獨特的數據管理方式。在 Vana 網路中,使用者的原始資料從未真正「上鍊」,而是由使用者自行選擇儲存位置,例如 Google Drive、Dropbox,甚至在 Macbook 上運行的個人伺服器。
當使用者向 DLP 提交資料時,他們實際上只是提供了指向加密資料的 URL 和一個可選的內容完整性雜湊。這些資訊被記錄在 Vana 的資料註冊合約中。驗證者在需要存取資料時,會要求解密金鑰,然後下載並解密資料進行驗證。
這種設計巧妙地解決了資料隱私和控制權的問題。用戶始終保持對自己數據的完全控制,同時又能參與數據經濟。這不僅確保了資料的安全性,也為未來更廣泛的資料應用場景提供了可能。
Vana 的頂層是一個開放的應用生態系。在這裡,開發者可以利用 DLP 累積的資料流動性來建立各種創新應用,而資料貢獻者則可以從這些應用中獲得實際的經濟價值。
例如,一個開發團隊可能會基於 Reddit 資料 DAO 的資料訓練一個專門的 AI 模型。參與資料貢獻的使用者不僅可以在模型訓練完成後使用它,還可以按照各自的貢獻比例獲得模型產生的效益。實際上這樣的AI 模型已經開發出來了,詳情可閱讀《觸底反彈,AI 賽道老幣r/ datadao 為何起死回生? 》。
這種模式不僅激勵了更多高品質資料的貢獻,也創造了一個真正由使用者主導的 AI 開發生態系統。使用者從單純的資料提供者,轉變為 AI 產品的共同所有者和受益者。
透過這種方式,Vana 正在重塑資料經濟的格局。在這個新的典範中,使用者從被動的資料提供者轉變為積極參與、共同受益的生態系統建構者。這不僅為個人創造了新的價值獲取管道,也為整個 AI 產業注入了新的活力和創新動力。
Vana 的技術架構不僅解決了當前資料經濟中的核心問題,如資料所有權、隱私權保護和價值分配,也為未來的資料驅動創新鋪平了道路。隨著更多的數據 DAO 加入網絡,更多的應用在平台上構建,Vana 有潛力成為下一代去中心化 AI 和數據經濟的基礎設施。
隨著Satori 測試網於6月11 日的推出,Vana 向公眾展示了其生態系統的雛形。這不僅是技術驗證的平台,更是未來主網運作模式的預演。目前,Vana 生態為參與者提供了三個主要路徑:運行 DLP 驗證節點、建立新的 DLP,或向現有 DLP 提交資料參與「資料挖礦」。
驗證節點是Vana 網路的守門人,負責驗證提交到DLP 的數據品質。運行驗證節點不僅需要技術能力,還需要足夠的運算資源。根據 Vana 的技術文檔,驗證節點的最低硬體需求為 1 個 CPU 核心、8GB RAM 和 10GB 高速 SSD 儲存空間。
有意成為驗證者的使用者需要先選擇一個 DLP,然後透過該 DLP 的智能合約註冊成為驗證者。一旦註冊獲得批准,驗證者就可以運行特定於該 DLP 的驗證節點。值得注意的是,驗證者可以同時為多個 DLP 運行節點,但每個 DLP 都有其獨特的最低質押要求。
對於那些有獨特資料資源或創新想法的用戶,創造新的DLP 是一個極具吸引力的選擇。創建 DLP 需要深入理解 Vana 的技術架構,特別是貢獻證明和名古屋共識機制。
新 DLP 的創建者需要設計特定的資料貢獻目標、驗證方法和獎勵參數。同時,他們也需要實現一個能準確評估數據價值的貢獻證明函數。這個過程雖然複雜,但 Vana 提供了詳細的範本和文件支援。
對於大多數使用者來說,向現有DLP 提交數據參與「數據挖礦」可能是最直接的參與方式。目前,已經有 13 個 DLP 得到了官方推薦,涵蓋了從社群媒體數據到金融預測數據的多個領域。
· Finquarium:匯集金融預測數據。
· GPT Data DAO:專注於 ChatGPT 聊天資料匯出。
· Reddit Data DAO:聚焦 Reddit 用戶數據,已正式啟動。
· Volara:專注於 Twitter 資料的收集和利用。
· Flirtual:收集約會資料。
· ResumeDataDAO:專注於 LinkedIn 資料匯出。
· SixGPT:收集和管理 LLM 聊天資料。
· YKYR:收集 Google Analytics 資料。
· Sydintel:透過眾包智慧揭示網路的黑暗角落。
· MindDAO:收集與使用者幸福感相關的時間序列資料。
· Kleo:建構全球最全面的瀏覽歷史資料集。
· DataPIG:專注於代幣投資偏好數據。
· ScrollDAO:收集和利用 Instagram 資料。
這些 DLP 有的還在開發,有的已經上線,但是都處於預挖礦階段。因為只有等主網上線之後,用戶才能正式提交資料進行挖礦。不過,用戶現在可以透過多種方式提前鎖定參與資格。例如,使用者可以參與Vana Telegram App中的相關挑戰活動,或是在各個DLP 的官方網站上進行預註冊。
Vana 的出現,標誌著資料經濟正在迎來一場典範轉移。在當前 AI 浪潮中,數據已然成為新時代的「石油」,而 Vana 則試圖重塑這一資源的開採、精煉和分配模式。
本質上,Vana 正在建構一個資料版的「公地悲劇」解決方案。透過巧妙的激勵設計和技術創新,它使得個人資料這一看似無限供給卻難以變現的資源,轉變為一種可管理、可定價、可流通的數位資產。這不僅為一般用戶參與 AI 紅利分配開闢了新途徑,更為去中心化 AI 的發展提供了一個可能的藍圖。
然而,Vana 的成功仍面臨許多不確定性。技術上,它需要在開放性和安全性之間尋找平衡;經濟上,它需要證明其模式能夠產生持續的價值;社會層面,它還需應對潛在的資料倫理和監管挑戰。
更深層來看,Vana 代表了一種對現有資料壟斷與 AI 發展模式的反思與挑戰。它提出了一個重要問題:在 AI 時代,我們是選擇繼續強化既有的資料寡頭,還是嘗試建構一個更開放、公平、多元的資料生態?
無論 Vana 最終能否成功,它的出現都為我們提供了一個重新思考資料價值、AI 倫理和技術創新的窗口。在未來,類似 Vana 這樣的計畫或許會成為連結 Web3 理想與 AI 現實的重要橋樑,為數位經濟的下一階段發展指明方向。
欢迎加入律动 BlockBeats 官方社群:
Telegram 订阅群:https://t.me/theblockbeats
Telegram 交流群:https://t.me/BlockBeats_App
Twitter 官方账号:https://twitter.com/BlockBeatsAsia