Phi tập trung lưu trữ: từ sự thổi phồng khái niệm đến sự tiến triển thực tiễn
Lưu trữ từng là một trong những lĩnh vực nóng bỏng của ngành công nghiệp blockchain. Filecoin, với vai trò dẫn đầu trong đợt tăng giá trước đó, có giá trị vốn hóa thị trường từng vượt 10 tỷ USD. Arweave, với điểm nhấn lưu trữ vĩnh viễn, đạt giá trị vốn hóa tối đa 3,5 tỷ USD. Tuy nhiên, khi tính khả thi của lưu trữ dữ liệu lạnh bị nghi ngờ, sự cần thiết của lưu trữ vĩnh viễn cũng bị thách thức, liệu lưu trữ Phi tập trung có thực sự có thể phát triển hay không trở thành một câu hỏi lớn. Sự xuất hiện của Walrus đã mang lại sức sống mới cho câu chuyện lưu trữ đã im ắng từ lâu, và giờ đây Aptos cùng Jump Crypto đã ra mắt Shelby, nhằm nâng cao ứng dụng của lưu trữ Phi tập trung trong lĩnh vực dữ liệu nóng. Vậy, liệu lưu trữ Phi tập trung có thể trở lại, cung cấp các tình huống ứng dụng rộng rãi? Hay chỉ là một lần nữa là sự thổi phồng? Bài viết này sẽ phân tích quá trình biến chuyển của câu chuyện lưu trữ Phi tập trung thông qua sự phát triển của bốn dự án: Filecoin, Arweave, Walrus và Shelby, và khám phá xem lưu trữ Phi tập trung cần đi bao xa để trở nên phổ biến.
Filecoin: Lưu trữ bề mặt, thực chất là khai thác
Filecoin là một trong những dự án token nổi bật từ sớm, với định hướng phát triển tự nhiên xoay quanh Phi tập trung. Đây là đặc điểm chung của các đồng tiền ảo vào thời điểm đó - tìm kiếm ý nghĩa của Phi tập trung trong các lĩnh vực truyền thống khác nhau. Filecoin cũng không phải là ngoại lệ, nó liên kết lưu trữ với Phi tập trung, từ đó chỉ ra những bất lợi của lưu trữ dữ liệu tập trung: giả định về niềm tin đối với các nhà cung cấp dịch vụ lưu trữ tập trung. Do đó, Filecoin cố gắng chuyển đổi lưu trữ tập trung thành lưu trữ Phi tập trung. Tuy nhiên, một số khía cạnh bị hy sinh để đạt được Phi tập trung sau này trở thành nỗi đau mà các dự án như Arweave hoặc Walrus cố gắng giải quyết. Để hiểu tại sao Filecoin về bản chất chỉ là một đồng tiền khai thác, cần phải hiểu những hạn chế khách quan của công nghệ nền tảng IPFS của nó không phù hợp để xử lý dữ liệu nóng.
IPFS:Phi tập trung kiến trúc, bị hạn chế bởi nút thắt truyền tải
IPFS( Hệ thống tập tin liên ngân hà) đã ra mắt vào khoảng năm 2015, nhằm mục đích lật đổ giao thức HTTP truyền thống thông qua việc địa chỉ hóa nội dung. Nhược điểm lớn nhất của IPFS là tốc độ truy cập rất chậm. Trong thời đại mà các nhà cung cấp dịch vụ dữ liệu truyền thống có thể đạt được phản hồi trong mili giây, IPFS vẫn cần đến hàng chục giây để lấy một tệp, điều này khiến nó khó được áp dụng thực tế và cũng giải thích tại sao ngoài một số dự án blockchain, nó rất ít được các ngành công nghiệp truyền thống áp dụng.
Giao thức P2P cơ sở của IPFS chủ yếu phù hợp với "dữ liệu lạnh", tức là nội dung tĩnh không thường xuyên thay đổi, như video, hình ảnh và tài liệu. Tuy nhiên, trong việc xử lý dữ liệu nóng, như trang web động, trò chơi trực tuyến hoặc ứng dụng trí tuệ nhân tạo, giao thức P2P không có lợi thế rõ ràng so với CDN truyền thống.
Mặc dù IPFS bản thân nó không phải là blockchain, nhưng thiết kế dựa trên đồ thị có hướng không chu trình (DAG) mà nó áp dụng rất phù hợp với nhiều chuỗi công khai và giao thức Web3, khiến nó trở thành nền tảng xây dựng thích hợp cho blockchain. Do đó, ngay cả khi nó thiếu giá trị thực dụng, nhưng với tư cách là nền tảng chứa đựng câu chuyện blockchain đã đủ, các dự án tiền điện tử đầu tiên chỉ cần một khung có thể hoạt động để mở ra tầm nhìn vĩ đại, nhưng khi Filecoin phát triển đến một giai đoạn nhất định, những thiếu sót vốn có mà IPFS mang lại bắt đầu cản trở sự tiến bộ của nó.
Lógica khai thác dưới lớp lưu trữ
Thiết kế ban đầu của IPFS là để người dùng không chỉ lưu trữ dữ liệu mà còn trở thành một phần của mạng lưu trữ. Tuy nhiên, trong điều kiện không có động lực kinh tế, người dùng rất khó để tự nguyện sử dụng hệ thống này, chứ đừng nói đến việc trở thành các nút lưu trữ tích cực. Điều này có nghĩa là, phần lớn người dùng chỉ lưu trữ tệp trên IPFS mà không đóng góp không gian lưu trữ của riêng họ, cũng như không lưu trữ tệp của người khác. Chính trong bối cảnh như vậy, Filecoin ra đời.
Trong mô hình kinh tế token của Filecoin, chủ yếu có ba vai trò: Người dùng chịu trách nhiệm thanh toán phí để lưu trữ dữ liệu; Thợ mỏ lưu trữ nhận được phần thưởng token vì đã lưu trữ dữ liệu của người dùng; Thợ mỏ truy xuất cung cấp dữ liệu khi người dùng cần và nhận được phần thưởng.
Mô hình này tồn tại không gian tiềm ẩn cho hành vi xấu. Các thợ mỏ lưu trữ có thể thêm dữ liệu rác để nhận thưởng sau khi cung cấp không gian lưu trữ. Do những dữ liệu rác này không được truy xuất, ngay cả khi bị mất, cũng sẽ không kích hoạt cơ chế phạt đối với thợ mỏ lưu trữ. Điều này cho phép các thợ mỏ lưu trữ có thể xóa dữ liệu rác và lặp lại quá trình này. Đồng thuận chứng minh sao chép của Filecoin chỉ có thể đảm bảo rằng dữ liệu của người dùng không bị xóa một cách trái phép, nhưng không thể ngăn chặn các thợ mỏ thêm dữ liệu rác.
Việc vận hành của Filecoin phần lớn phụ thuộc vào sự đầu tư liên tục của các thợ mỏ vào nền kinh tế token, chứ không phải dựa trên nhu cầu thực sự của người dùng cuối đối với lưu trữ phân tán. Mặc dù dự án vẫn đang liên tục lặp lại, nhưng ở giai đoạn hiện tại, việc xây dựng hệ sinh thái của Filecoin phù hợp hơn với định nghĩa "logic khai thác" chứ không phải "dự án lưu trữ dựa trên ứng dụng".
Arweave: Thành bại của chủ nghĩa dài hạn
Nếu như mục tiêu thiết kế của Filecoin là xây dựng một "đám mây dữ liệu" phi tập trung có thể khuyến khích và chứng minh, thì Arweave lại đi theo một hướng cực đoan khác trong lưu trữ: cung cấp khả năng lưu trữ vĩnh viễn cho dữ liệu. Arweave không cố gắng xây dựng một nền tảng tính toán phân tán, mà toàn bộ hệ thống của nó xoay quanh một giả định cốt lõi - dữ liệu quan trọng nên được lưu trữ một lần và sẽ tồn tại mãi mãi trên mạng. Chủ nghĩa dài hạn cực đoan này khiến Arweave khác biệt hoàn toàn với Filecoin từ cơ chế đến mô hình khuyến khích, từ yêu cầu phần cứng đến quan điểm kể chuyện.
Arweave lấy Bitcoin làm đối tượng học hỏi, cố gắng tối ưu hóa mạng lưu trữ vĩnh viễn của mình trong một chu kỳ dài tính bằng năm. Arweave không quan tâm đến tiếp thị, cũng không quan tâm đến đối thủ cạnh tranh và xu hướng phát triển của thị trường. Nó chỉ đang tiếp tục tiến bước trên con đường lặp đi lặp lại kiến trúc mạng, ngay cả khi không có ai hỏi han cũng không để tâm, vì đây chính là bản chất của nhóm phát triển Arweave: chủ nghĩa dài hạn. Nhờ vào chủ nghĩa dài hạn, Arweave đã nhận được sự ủng hộ nồng nhiệt trong đợt tăng giá trước; cũng chính vì chủ nghĩa dài hạn, ngay cả khi rơi vào đáy, Arweave vẫn có thể vượt qua vài vòng thị trường bò và gấu. Chỉ có điều trong tương lai, liệu lưu trữ Phi tập trung có chỗ đứng cho Arweave hay không? Giá trị tồn tại của lưu trữ vĩnh viễn chỉ có thể được chứng minh qua thời gian.
Mạng chính Arweave từ phiên bản 1.5 đến phiên bản 2.9 gần đây, mặc dù đã mất đi sự thảo luận trên thị trường, nhưng vẫn luôn nỗ lực để cho nhiều thợ mỏ hơn tham gia vào mạng với chi phí thấp nhất, và khuyến khích thợ mỏ tối đa hóa việc lưu trữ dữ liệu, làm cho độ bền của toàn bộ mạng ngày càng tăng lên. Arweave nhận thức được rằng mình không phù hợp với sở thích của thị trường, do đó đã thực hiện một hướng đi bảo thủ, không ôm lấy cộng đồng thợ mỏ, hệ sinh thái hoàn toàn ngừng hoạt động, nâng cấp mạng chính với chi phí tối thiểu, trong khi không làm tổn hại đến an ninh mạng, liên tục giảm bớt ngưỡng phần cứng.
Tổng quan về con đường nâng cấp 1.5-2.9
Phiên bản Arweave 1.5 đã tiết lộ lỗ hổng cho phép thợ đào dựa vào GPU để tối ưu hóa xác suất tạo khối thay vì lưu trữ thực sự. Để ngăn chặn xu hướng này, phiên bản 1.7 đã giới thiệu thuật toán RandomX, hạn chế việc sử dụng sức mạnh tính toán chuyên dụng, thay vào đó yêu cầu CPU chung tham gia vào việc khai thác, từ đó làm suy yếu tính tập trung sức mạnh tính toán.
Trong phiên bản 2.0, Arweave áp dụng SPoA, chuyển đổi chứng minh dữ liệu thành cấu trúc đường dẫn Merkle gọn gàng, và giới thiệu giao dịch định dạng 2 để giảm bớt gánh nặng đồng bộ. Kiến trúc này đã làm giảm áp lực băng thông mạng, giúp khả năng hợp tác của các nút tăng lên đáng kể. Tuy nhiên, một số thợ mỏ vẫn có thể tránh trách nhiệm sở hữu dữ liệu thực thông qua chiến lược hồ chứa lưu trữ tốc độ cao tập trung.
Để khắc phục sự thiên lệch này, phiên bản 2.4 triển khai cơ chế SPoRA, đưa vào chỉ mục toàn cầu và truy cập ngẫu nhiên chậm với hàm băm, khiến cho thợ mỏ phải thực sự sở hữu khối dữ liệu để tham gia vào việc tạo khối hiệu quả, từ đó giảm thiểu hiệu ứng tích lũy sức mạnh tính toán. Kết quả là, các thợ mỏ bắt đầu chú trọng đến tốc độ truy cập lưu trữ, thúc đẩy việc ứng dụng SSD và các thiết bị đọc/ghi tốc độ cao. Phiên bản 2.6 đưa vào chuỗi băm để kiểm soát nhịp độ tạo khối, cân bằng lợi ích biên của thiết bị hiệu suất cao, cung cấp không gian tham gia công bằng cho các thợ mỏ nhỏ và vừa.
Các phiên bản tiếp theo tăng cường khả năng hợp tác mạng và đa dạng lưu trữ: 2.7 bổ sung khai thác hợp tác và cơ chế pool, nâng cao khả năng cạnh tranh của các thợ mỏ nhỏ; 2.8 ra mắt cơ chế gói phức hợp, cho phép thiết bị tốc độ thấp dung lượng lớn linh hoạt tham gia; 2.9 giới thiệu quy trình gói mới theo định dạng replica_2_9, nâng cao hiệu quả đáng kể và giảm phụ thuộc vào tính toán, hoàn thành mô hình khai thác dữ liệu định hướng.
Tổng thể, lộ trình nâng cấp của Arweave rõ ràng thể hiện chiến lược dài hạn hướng tới lưu trữ: đồng thời chống lại xu hướng tập trung sức mạnh tính toán, liên tục giảm bớt rào cản tham gia, đảm bảo khả năng vận hành lâu dài của giao thức.
Walrus: Ôm ấp dữ liệu nóng là sự thổi phồng hay có ý nghĩa khác?
Ý tưởng thiết kế của Walrus hoàn toàn khác với Filecoin và Arweave. Điểm khởi đầu của Filecoin là xây dựng một hệ thống lưu trữ có thể xác minh phi tập trung, với cái giá là lưu trữ dữ liệu lạnh; điểm khởi đầu của Arweave là tạo ra một thư viện Alexandria trên chuỗi có thể lưu trữ dữ liệu vĩnh viễn, với cái giá là quá ít trường hợp sử dụng; điểm khởi đầu của Walrus là tối ưu hóa giao thức lưu trữ dữ liệu nóng với chi phí lưu trữ.
Ma cải tiến mã sửa đổi: Đổi mới chi phí hay rượu cũ trong bình mới?
Về mặt thiết kế chi phí lưu trữ, Walrus cho rằng chi phí lưu trữ của Filecoin và Arweave là không hợp lý, cả hai đều sử dụng kiến trúc sao chép hoàn toàn, lợi thế chính của chúng là mỗi nút đều giữ bản sao đầy đủ, có khả năng chịu lỗi mạnh mẽ và độc lập giữa các nút. Kiến trúc này đảm bảo rằng ngay cả khi một phần nút ngoại tuyến, mạng vẫn có khả năng truy cập dữ liệu. Tuy nhiên, điều này cũng có nghĩa là hệ thống cần sự dư thừa nhiều bản sao để duy trì tính mạnh mẽ, từ đó làm tăng chi phí lưu trữ. Đặc biệt trong thiết kế của Arweave, cơ chế đồng thuận tự nó khuyến khích việc lưu trữ dư thừa của các nút để tăng cường an toàn dữ liệu. So với đó, Filecoin có tính linh hoạt hơn trong việc kiểm soát chi phí, nhưng điều đó đồng nghĩa với việc một số lưu trữ chi phí thấp có thể có rủi ro mất dữ liệu cao hơn. Walrus cố gắng tìm kiếm sự cân bằng giữa hai bên, cơ chế của nó kiểm soát chi phí sao chép trong khi tăng cường khả năng sử dụng thông qua phương thức dư thừa có cấu trúc, từ đó thiết lập một con đường thỏa hiệp mới giữa khả năng truy cập dữ liệu và hiệu quả chi phí.
Công nghệ Redstuff do Walrus tự phát triển là công nghệ then chốt để giảm thiểu sự dư thừa của nút, nó xuất phát từ mã Reed-Solomon(RS). Mã RS là một thuật toán mã sửa lỗi rất truyền thống, mã sửa lỗi là một kỹ thuật cho phép nhân đôi tập dữ liệu bằng cách thêm các đoạn dư thừa(erasure code), có thể được sử dụng để tái tạo dữ liệu gốc. Từ CD-ROM đến truyền thông vệ tinh cho đến mã QR, nó được sử dụng thường xuyên trong cuộc sống hàng ngày.
Mã sửa lỗi cho phép người dùng lấy một khối, ví dụ 1MB, sau đó "mở rộng" nó lên 2MB, trong đó 1MB bổ sung được gọi là dữ liệu sửa lỗi đặc biệt. Nếu bất kỳ byte nào trong khối bị mất, người dùng có thể dễ dàng khôi phục các byte này thông qua mã. Ngay cả khi mất đến 1MB khối, bạn vẫn có thể khôi phục toàn bộ khối. Công nghệ tương tự cũng cho phép máy tính đọc tất cả dữ liệu trên CD-ROM, ngay cả khi nó đã bị hư hại.
Hiện tại mã RS là mã thường được sử dụng nhất. Cách thực hiện là bắt đầu từ k khối thông tin, xây dựng đa thức liên quan và đánh giá nó tại các tọa độ x khác nhau để thu được các khối mã. Khi sử dụng mã sửa lỗi RS, khả năng mất một khối lượng lớn dữ liệu do lấy mẫu ngẫu nhiên là rất nhỏ.
Ví dụ: Chia một tệp thành 6 khối dữ liệu và 4 khối kiểm tra, tổng cộng 10 phần. Chỉ cần giữ lại bất kỳ 6 phần nào, bạn có thể khôi phục lại dữ liệu gốc hoàn chỉnh.
Ưu điểm: khả năng chịu lỗi tốt, được ứng dụng rộng rãi trong CD/DVD, hệ thống RAID( chống lỗi), cũng như trong các hệ thống lưu trữ đám mây( như Azure Storage, Facebook F4).
Nhược điểm: Tính toán giải mã phức tạp, chi phí cao; không phù hợp với các tình huống dữ liệu thay đổi thường xuyên. Do đó, thường được sử dụng cho việc phục hồi và điều phối dữ liệu trong môi trường tập trung bên ngoài chuỗi.
Trong kiến trúc Phi tập trung, Storj và Sia đã điều chỉnh mã hóa RS truyền thống để phù hợp với nhu cầu thực tế của mạng phân tán. Walrus cũng đã đề xuất biến thể của riêng mình - thuật toán mã hóa RedStuff, nhằm đạt được cơ chế lưu trữ dư thừa với chi phí thấp hơn và linh hoạt hơn.
Đặc điểm nổi bật nhất của Redstuff là gì? Bằng cách cải tiến thuật toán mã hóa xóa, Walrus có khả năng nhanh chóng và ổn định mã hóa các khối dữ liệu phi cấu trúc thành các phân đoạn nhỏ hơn, các phân đoạn này sẽ được lưu trữ phân tán trong một mạng lưới nút lưu trữ. Ngay cả khi mất tới hai phần ba các phân đoạn, vẫn có thể nhanh chóng tái cấu trúc lại khối dữ liệu gốc bằng cách sử dụng một phần các phân đoạn. Điều này trở thành khả thi trong khi giữ cho hệ số sao chép chỉ từ 4 đến 5 lần.
Do đó, việc định nghĩa Walrus là một giao thức phục hồi và dư thừa nhẹ được thiết kế lại xung quanh Phi tập trung là hợp lý. So với mã sửa lỗi truyền thống ( như Reed-Solomon ), RedSt
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
Phi tập trung lưu trữ phát triển lộ trình: từ FIL đến Shelby sự tiến hóa công nghệ và ứng dụng thực tiễn
Phi tập trung lưu trữ: từ sự thổi phồng khái niệm đến sự tiến triển thực tiễn
Lưu trữ từng là một trong những lĩnh vực nóng bỏng của ngành công nghiệp blockchain. Filecoin, với vai trò dẫn đầu trong đợt tăng giá trước đó, có giá trị vốn hóa thị trường từng vượt 10 tỷ USD. Arweave, với điểm nhấn lưu trữ vĩnh viễn, đạt giá trị vốn hóa tối đa 3,5 tỷ USD. Tuy nhiên, khi tính khả thi của lưu trữ dữ liệu lạnh bị nghi ngờ, sự cần thiết của lưu trữ vĩnh viễn cũng bị thách thức, liệu lưu trữ Phi tập trung có thực sự có thể phát triển hay không trở thành một câu hỏi lớn. Sự xuất hiện của Walrus đã mang lại sức sống mới cho câu chuyện lưu trữ đã im ắng từ lâu, và giờ đây Aptos cùng Jump Crypto đã ra mắt Shelby, nhằm nâng cao ứng dụng của lưu trữ Phi tập trung trong lĩnh vực dữ liệu nóng. Vậy, liệu lưu trữ Phi tập trung có thể trở lại, cung cấp các tình huống ứng dụng rộng rãi? Hay chỉ là một lần nữa là sự thổi phồng? Bài viết này sẽ phân tích quá trình biến chuyển của câu chuyện lưu trữ Phi tập trung thông qua sự phát triển của bốn dự án: Filecoin, Arweave, Walrus và Shelby, và khám phá xem lưu trữ Phi tập trung cần đi bao xa để trở nên phổ biến.
Filecoin: Lưu trữ bề mặt, thực chất là khai thác
Filecoin là một trong những dự án token nổi bật từ sớm, với định hướng phát triển tự nhiên xoay quanh Phi tập trung. Đây là đặc điểm chung của các đồng tiền ảo vào thời điểm đó - tìm kiếm ý nghĩa của Phi tập trung trong các lĩnh vực truyền thống khác nhau. Filecoin cũng không phải là ngoại lệ, nó liên kết lưu trữ với Phi tập trung, từ đó chỉ ra những bất lợi của lưu trữ dữ liệu tập trung: giả định về niềm tin đối với các nhà cung cấp dịch vụ lưu trữ tập trung. Do đó, Filecoin cố gắng chuyển đổi lưu trữ tập trung thành lưu trữ Phi tập trung. Tuy nhiên, một số khía cạnh bị hy sinh để đạt được Phi tập trung sau này trở thành nỗi đau mà các dự án như Arweave hoặc Walrus cố gắng giải quyết. Để hiểu tại sao Filecoin về bản chất chỉ là một đồng tiền khai thác, cần phải hiểu những hạn chế khách quan của công nghệ nền tảng IPFS của nó không phù hợp để xử lý dữ liệu nóng.
IPFS:Phi tập trung kiến trúc, bị hạn chế bởi nút thắt truyền tải
IPFS( Hệ thống tập tin liên ngân hà) đã ra mắt vào khoảng năm 2015, nhằm mục đích lật đổ giao thức HTTP truyền thống thông qua việc địa chỉ hóa nội dung. Nhược điểm lớn nhất của IPFS là tốc độ truy cập rất chậm. Trong thời đại mà các nhà cung cấp dịch vụ dữ liệu truyền thống có thể đạt được phản hồi trong mili giây, IPFS vẫn cần đến hàng chục giây để lấy một tệp, điều này khiến nó khó được áp dụng thực tế và cũng giải thích tại sao ngoài một số dự án blockchain, nó rất ít được các ngành công nghiệp truyền thống áp dụng.
Giao thức P2P cơ sở của IPFS chủ yếu phù hợp với "dữ liệu lạnh", tức là nội dung tĩnh không thường xuyên thay đổi, như video, hình ảnh và tài liệu. Tuy nhiên, trong việc xử lý dữ liệu nóng, như trang web động, trò chơi trực tuyến hoặc ứng dụng trí tuệ nhân tạo, giao thức P2P không có lợi thế rõ ràng so với CDN truyền thống.
Mặc dù IPFS bản thân nó không phải là blockchain, nhưng thiết kế dựa trên đồ thị có hướng không chu trình (DAG) mà nó áp dụng rất phù hợp với nhiều chuỗi công khai và giao thức Web3, khiến nó trở thành nền tảng xây dựng thích hợp cho blockchain. Do đó, ngay cả khi nó thiếu giá trị thực dụng, nhưng với tư cách là nền tảng chứa đựng câu chuyện blockchain đã đủ, các dự án tiền điện tử đầu tiên chỉ cần một khung có thể hoạt động để mở ra tầm nhìn vĩ đại, nhưng khi Filecoin phát triển đến một giai đoạn nhất định, những thiếu sót vốn có mà IPFS mang lại bắt đầu cản trở sự tiến bộ của nó.
Lógica khai thác dưới lớp lưu trữ
Thiết kế ban đầu của IPFS là để người dùng không chỉ lưu trữ dữ liệu mà còn trở thành một phần của mạng lưu trữ. Tuy nhiên, trong điều kiện không có động lực kinh tế, người dùng rất khó để tự nguyện sử dụng hệ thống này, chứ đừng nói đến việc trở thành các nút lưu trữ tích cực. Điều này có nghĩa là, phần lớn người dùng chỉ lưu trữ tệp trên IPFS mà không đóng góp không gian lưu trữ của riêng họ, cũng như không lưu trữ tệp của người khác. Chính trong bối cảnh như vậy, Filecoin ra đời.
Trong mô hình kinh tế token của Filecoin, chủ yếu có ba vai trò: Người dùng chịu trách nhiệm thanh toán phí để lưu trữ dữ liệu; Thợ mỏ lưu trữ nhận được phần thưởng token vì đã lưu trữ dữ liệu của người dùng; Thợ mỏ truy xuất cung cấp dữ liệu khi người dùng cần và nhận được phần thưởng.
Mô hình này tồn tại không gian tiềm ẩn cho hành vi xấu. Các thợ mỏ lưu trữ có thể thêm dữ liệu rác để nhận thưởng sau khi cung cấp không gian lưu trữ. Do những dữ liệu rác này không được truy xuất, ngay cả khi bị mất, cũng sẽ không kích hoạt cơ chế phạt đối với thợ mỏ lưu trữ. Điều này cho phép các thợ mỏ lưu trữ có thể xóa dữ liệu rác và lặp lại quá trình này. Đồng thuận chứng minh sao chép của Filecoin chỉ có thể đảm bảo rằng dữ liệu của người dùng không bị xóa một cách trái phép, nhưng không thể ngăn chặn các thợ mỏ thêm dữ liệu rác.
Việc vận hành của Filecoin phần lớn phụ thuộc vào sự đầu tư liên tục của các thợ mỏ vào nền kinh tế token, chứ không phải dựa trên nhu cầu thực sự của người dùng cuối đối với lưu trữ phân tán. Mặc dù dự án vẫn đang liên tục lặp lại, nhưng ở giai đoạn hiện tại, việc xây dựng hệ sinh thái của Filecoin phù hợp hơn với định nghĩa "logic khai thác" chứ không phải "dự án lưu trữ dựa trên ứng dụng".
Arweave: Thành bại của chủ nghĩa dài hạn
Nếu như mục tiêu thiết kế của Filecoin là xây dựng một "đám mây dữ liệu" phi tập trung có thể khuyến khích và chứng minh, thì Arweave lại đi theo một hướng cực đoan khác trong lưu trữ: cung cấp khả năng lưu trữ vĩnh viễn cho dữ liệu. Arweave không cố gắng xây dựng một nền tảng tính toán phân tán, mà toàn bộ hệ thống của nó xoay quanh một giả định cốt lõi - dữ liệu quan trọng nên được lưu trữ một lần và sẽ tồn tại mãi mãi trên mạng. Chủ nghĩa dài hạn cực đoan này khiến Arweave khác biệt hoàn toàn với Filecoin từ cơ chế đến mô hình khuyến khích, từ yêu cầu phần cứng đến quan điểm kể chuyện.
Arweave lấy Bitcoin làm đối tượng học hỏi, cố gắng tối ưu hóa mạng lưu trữ vĩnh viễn của mình trong một chu kỳ dài tính bằng năm. Arweave không quan tâm đến tiếp thị, cũng không quan tâm đến đối thủ cạnh tranh và xu hướng phát triển của thị trường. Nó chỉ đang tiếp tục tiến bước trên con đường lặp đi lặp lại kiến trúc mạng, ngay cả khi không có ai hỏi han cũng không để tâm, vì đây chính là bản chất của nhóm phát triển Arweave: chủ nghĩa dài hạn. Nhờ vào chủ nghĩa dài hạn, Arweave đã nhận được sự ủng hộ nồng nhiệt trong đợt tăng giá trước; cũng chính vì chủ nghĩa dài hạn, ngay cả khi rơi vào đáy, Arweave vẫn có thể vượt qua vài vòng thị trường bò và gấu. Chỉ có điều trong tương lai, liệu lưu trữ Phi tập trung có chỗ đứng cho Arweave hay không? Giá trị tồn tại của lưu trữ vĩnh viễn chỉ có thể được chứng minh qua thời gian.
Mạng chính Arweave từ phiên bản 1.5 đến phiên bản 2.9 gần đây, mặc dù đã mất đi sự thảo luận trên thị trường, nhưng vẫn luôn nỗ lực để cho nhiều thợ mỏ hơn tham gia vào mạng với chi phí thấp nhất, và khuyến khích thợ mỏ tối đa hóa việc lưu trữ dữ liệu, làm cho độ bền của toàn bộ mạng ngày càng tăng lên. Arweave nhận thức được rằng mình không phù hợp với sở thích của thị trường, do đó đã thực hiện một hướng đi bảo thủ, không ôm lấy cộng đồng thợ mỏ, hệ sinh thái hoàn toàn ngừng hoạt động, nâng cấp mạng chính với chi phí tối thiểu, trong khi không làm tổn hại đến an ninh mạng, liên tục giảm bớt ngưỡng phần cứng.
Tổng quan về con đường nâng cấp 1.5-2.9
Phiên bản Arweave 1.5 đã tiết lộ lỗ hổng cho phép thợ đào dựa vào GPU để tối ưu hóa xác suất tạo khối thay vì lưu trữ thực sự. Để ngăn chặn xu hướng này, phiên bản 1.7 đã giới thiệu thuật toán RandomX, hạn chế việc sử dụng sức mạnh tính toán chuyên dụng, thay vào đó yêu cầu CPU chung tham gia vào việc khai thác, từ đó làm suy yếu tính tập trung sức mạnh tính toán.
Trong phiên bản 2.0, Arweave áp dụng SPoA, chuyển đổi chứng minh dữ liệu thành cấu trúc đường dẫn Merkle gọn gàng, và giới thiệu giao dịch định dạng 2 để giảm bớt gánh nặng đồng bộ. Kiến trúc này đã làm giảm áp lực băng thông mạng, giúp khả năng hợp tác của các nút tăng lên đáng kể. Tuy nhiên, một số thợ mỏ vẫn có thể tránh trách nhiệm sở hữu dữ liệu thực thông qua chiến lược hồ chứa lưu trữ tốc độ cao tập trung.
Để khắc phục sự thiên lệch này, phiên bản 2.4 triển khai cơ chế SPoRA, đưa vào chỉ mục toàn cầu và truy cập ngẫu nhiên chậm với hàm băm, khiến cho thợ mỏ phải thực sự sở hữu khối dữ liệu để tham gia vào việc tạo khối hiệu quả, từ đó giảm thiểu hiệu ứng tích lũy sức mạnh tính toán. Kết quả là, các thợ mỏ bắt đầu chú trọng đến tốc độ truy cập lưu trữ, thúc đẩy việc ứng dụng SSD và các thiết bị đọc/ghi tốc độ cao. Phiên bản 2.6 đưa vào chuỗi băm để kiểm soát nhịp độ tạo khối, cân bằng lợi ích biên của thiết bị hiệu suất cao, cung cấp không gian tham gia công bằng cho các thợ mỏ nhỏ và vừa.
Các phiên bản tiếp theo tăng cường khả năng hợp tác mạng và đa dạng lưu trữ: 2.7 bổ sung khai thác hợp tác và cơ chế pool, nâng cao khả năng cạnh tranh của các thợ mỏ nhỏ; 2.8 ra mắt cơ chế gói phức hợp, cho phép thiết bị tốc độ thấp dung lượng lớn linh hoạt tham gia; 2.9 giới thiệu quy trình gói mới theo định dạng replica_2_9, nâng cao hiệu quả đáng kể và giảm phụ thuộc vào tính toán, hoàn thành mô hình khai thác dữ liệu định hướng.
Tổng thể, lộ trình nâng cấp của Arweave rõ ràng thể hiện chiến lược dài hạn hướng tới lưu trữ: đồng thời chống lại xu hướng tập trung sức mạnh tính toán, liên tục giảm bớt rào cản tham gia, đảm bảo khả năng vận hành lâu dài của giao thức.
Walrus: Ôm ấp dữ liệu nóng là sự thổi phồng hay có ý nghĩa khác?
Ý tưởng thiết kế của Walrus hoàn toàn khác với Filecoin và Arweave. Điểm khởi đầu của Filecoin là xây dựng một hệ thống lưu trữ có thể xác minh phi tập trung, với cái giá là lưu trữ dữ liệu lạnh; điểm khởi đầu của Arweave là tạo ra một thư viện Alexandria trên chuỗi có thể lưu trữ dữ liệu vĩnh viễn, với cái giá là quá ít trường hợp sử dụng; điểm khởi đầu của Walrus là tối ưu hóa giao thức lưu trữ dữ liệu nóng với chi phí lưu trữ.
Ma cải tiến mã sửa đổi: Đổi mới chi phí hay rượu cũ trong bình mới?
Về mặt thiết kế chi phí lưu trữ, Walrus cho rằng chi phí lưu trữ của Filecoin và Arweave là không hợp lý, cả hai đều sử dụng kiến trúc sao chép hoàn toàn, lợi thế chính của chúng là mỗi nút đều giữ bản sao đầy đủ, có khả năng chịu lỗi mạnh mẽ và độc lập giữa các nút. Kiến trúc này đảm bảo rằng ngay cả khi một phần nút ngoại tuyến, mạng vẫn có khả năng truy cập dữ liệu. Tuy nhiên, điều này cũng có nghĩa là hệ thống cần sự dư thừa nhiều bản sao để duy trì tính mạnh mẽ, từ đó làm tăng chi phí lưu trữ. Đặc biệt trong thiết kế của Arweave, cơ chế đồng thuận tự nó khuyến khích việc lưu trữ dư thừa của các nút để tăng cường an toàn dữ liệu. So với đó, Filecoin có tính linh hoạt hơn trong việc kiểm soát chi phí, nhưng điều đó đồng nghĩa với việc một số lưu trữ chi phí thấp có thể có rủi ro mất dữ liệu cao hơn. Walrus cố gắng tìm kiếm sự cân bằng giữa hai bên, cơ chế của nó kiểm soát chi phí sao chép trong khi tăng cường khả năng sử dụng thông qua phương thức dư thừa có cấu trúc, từ đó thiết lập một con đường thỏa hiệp mới giữa khả năng truy cập dữ liệu và hiệu quả chi phí.
Công nghệ Redstuff do Walrus tự phát triển là công nghệ then chốt để giảm thiểu sự dư thừa của nút, nó xuất phát từ mã Reed-Solomon(RS). Mã RS là một thuật toán mã sửa lỗi rất truyền thống, mã sửa lỗi là một kỹ thuật cho phép nhân đôi tập dữ liệu bằng cách thêm các đoạn dư thừa(erasure code), có thể được sử dụng để tái tạo dữ liệu gốc. Từ CD-ROM đến truyền thông vệ tinh cho đến mã QR, nó được sử dụng thường xuyên trong cuộc sống hàng ngày.
Mã sửa lỗi cho phép người dùng lấy một khối, ví dụ 1MB, sau đó "mở rộng" nó lên 2MB, trong đó 1MB bổ sung được gọi là dữ liệu sửa lỗi đặc biệt. Nếu bất kỳ byte nào trong khối bị mất, người dùng có thể dễ dàng khôi phục các byte này thông qua mã. Ngay cả khi mất đến 1MB khối, bạn vẫn có thể khôi phục toàn bộ khối. Công nghệ tương tự cũng cho phép máy tính đọc tất cả dữ liệu trên CD-ROM, ngay cả khi nó đã bị hư hại.
Hiện tại mã RS là mã thường được sử dụng nhất. Cách thực hiện là bắt đầu từ k khối thông tin, xây dựng đa thức liên quan và đánh giá nó tại các tọa độ x khác nhau để thu được các khối mã. Khi sử dụng mã sửa lỗi RS, khả năng mất một khối lượng lớn dữ liệu do lấy mẫu ngẫu nhiên là rất nhỏ.
Ví dụ: Chia một tệp thành 6 khối dữ liệu và 4 khối kiểm tra, tổng cộng 10 phần. Chỉ cần giữ lại bất kỳ 6 phần nào, bạn có thể khôi phục lại dữ liệu gốc hoàn chỉnh.
Ưu điểm: khả năng chịu lỗi tốt, được ứng dụng rộng rãi trong CD/DVD, hệ thống RAID( chống lỗi), cũng như trong các hệ thống lưu trữ đám mây( như Azure Storage, Facebook F4).
Nhược điểm: Tính toán giải mã phức tạp, chi phí cao; không phù hợp với các tình huống dữ liệu thay đổi thường xuyên. Do đó, thường được sử dụng cho việc phục hồi và điều phối dữ liệu trong môi trường tập trung bên ngoài chuỗi.
Trong kiến trúc Phi tập trung, Storj và Sia đã điều chỉnh mã hóa RS truyền thống để phù hợp với nhu cầu thực tế của mạng phân tán. Walrus cũng đã đề xuất biến thể của riêng mình - thuật toán mã hóa RedStuff, nhằm đạt được cơ chế lưu trữ dư thừa với chi phí thấp hơn và linh hoạt hơn.
Đặc điểm nổi bật nhất của Redstuff là gì? Bằng cách cải tiến thuật toán mã hóa xóa, Walrus có khả năng nhanh chóng và ổn định mã hóa các khối dữ liệu phi cấu trúc thành các phân đoạn nhỏ hơn, các phân đoạn này sẽ được lưu trữ phân tán trong một mạng lưới nút lưu trữ. Ngay cả khi mất tới hai phần ba các phân đoạn, vẫn có thể nhanh chóng tái cấu trúc lại khối dữ liệu gốc bằng cách sử dụng một phần các phân đoạn. Điều này trở thành khả thi trong khi giữ cho hệ số sao chép chỉ từ 4 đến 5 lần.
Do đó, việc định nghĩa Walrus là một giao thức phục hồi và dư thừa nhẹ được thiết kế lại xung quanh Phi tập trung là hợp lý. So với mã sửa lỗi truyền thống ( như Reed-Solomon ), RedSt