Sapien là một "xưởng dữ liệu" (data foundry) phi tập trung, ứng dụng công nghệ blockchain, sự tham gia của cộng đồng toàn cầu và cơ chế khuyến khích kinh tế để cung cấp dữ liệu huấn luyện chuyên biệt, chất lượng cao và quy mô lớn cho các mô hình AI. Khác với các công ty gán nhãn dữ liệu truyền thống, Sapien biến các nhiệm vụ dữ liệu thành trò chơi và phân bổ phần thưởng cho người tham gia trên toàn thế giới, hướng đến việc phá vỡ mô hình kiểm soát dữ liệu tập trung truyền thống.
Khi AI tạo sinh và các mô hình ngôn ngữ lớn (LLM) phát triển với tốc độ bùng nổ, nhu cầu về dữ liệu huấn luyện chất lượng cao cũng tăng theo cấp số nhân. Tuy nhiên, các hệ thống tạo dữ liệu truyền thống đang gặp phải những vấn đề mang tính cấu trúc nghiêm trọng: Dữ liệu chất lượng cao bị độc quyền bởi một số tập đoàn công nghệ lớn, khiến chi phí cao và khó tiếp cận. Các nền tảng crowdsourcing thường thiếu cơ chế tin cậy vững chắc, dẫn đến chất lượng dữ liệu không đồng đều và kết quả huấn luyện kém hiệu quả. Quan trọng hơn, phần lớn tập dữ liệu hiện nay bị chi phối bởi bối cảnh văn hoá Anh - Mỹ, tạo ra sự thiên lệch về địa lý và văn hoá, hạn chế khả năng ứng dụng toàn cầu của AI.
Trước bối cảnh đó, Sapien định vị mình là một "xưởng dữ liệu phi tập trung" với giải pháp tập trung vào ba hướng: Tính phi tập trung, cơ chế khuyến khích kinh tế và hệ thống danh tiếng. Thông qua việc kết hợp hạ tầng blockchain, sự cộng tác của cộng đồng toàn cầu và phần thưởng phân bổ theo đóng góp, Sapien đang xây dựng một mạng lưới tạo dữ liệu mở, minh bạch và chất lượng cao, nhằm phá vỡ mô hình kiểm soát tập trung và cung cấp nền tảng hạ tầng cốt lõi cho kỷ nguyên AI.
Sapien đã xây dựng được một cộng đồng thực sự toàn cầu, trải rộng tại hơn 110 quốc gia, hình thành nên một mạng lưới phân tán các "lao động AI" được gọi là Sapiens. Người tham gia sẽ nhận nhiệm vụ qua nền tảng, thực hiện gán nhãn dữ liệu và nhận phần thưởng dựa trên đóng góp của mình. Cộng đồng này hoàn thành hơn một triệu nhiệm vụ mỗi ngày, với tổng sản lượng đạt 80 triệu mục dữ liệu đã được gán nhãn - bao gồm văn bản, hình ảnh, âm thanh, video và cả các định dạng phức tạp như 3D/4D. Mạng lưới còn thể hiện hiệu ứng cộng hưởng rõ rệt: Cứ mỗi 10,000 người dùng mới, hiệu suất hoàn thành nhiệm vụ tăng thêm 8%, tạo nên một hệ sinh thái tự vận hành theo chu trình tạo dữ liệu → phản hồi chất lượng → tối ưu mô hình.
Hệ thống nhiệm vụ của Sapien được xây dựng dựa trên cơ chế trò chơi, biến quá trình gán nhãn dữ liệu thành một trải nghiệm lao động số hấp dẫn, cạnh tranh và có tính tích luỹ. Hệ thống này vận hành theo bốn yếu tố khuyến khích chính: Cấp độ (Levels), Điểm kinh nghiệm (Experience Points), Danh tiếng (Reputation) và Thử thách nhiệm vụ (Task Challenges).
Người dùng có thể tham gia thông qua các hình thức sau:
Mở khoá nhiệm vụ:Hoàn thành các nhiệm vụ cơ bản để tích luỹ điểm kinh nghiệm và mở khoá các gói nhiệm vụ có giá trị cao hơn (ví dụ như gán nhãn hình ảnh y tế).
Đánh giá đối kháng: Cạnh tranh trong "Labeling Arena", nơi người dùng thi đấu về độ chính xác. Những người đạt hiệu suất cao nhất sẽ nhận thêm phần thưởng token.
Hệ thống danh tính ảo: Trong tương lai, sẽ triển khai huy hiệu NFT và chứng chỉ thành tích trên chuỗi, tạo nên trải nghiệm metaverse tương tự như StepN.
Một thị trường nơi các lao động AI có thể tìm thấy các nhiệm vụ theo yêu cầu như làm sạch văn bản, gán nhãn hình ảnh hoặc phiên âm giọng nói. Phần thưởng và điểm sẽ thay đổi tùy theo độ khó của nhiệm vụ.
Hệ thống xác minh kép: Sau khi nhiệm vụ được hoàn thành, công việc sẽ được chuyển lại cho người dùng QA để kiểm tra, đảm bảo độ chính xác và đồng thời phản hồi vào điểm danh tiếng của người dùng.
Các doanh nghiệp có thể kết nối với nền tảng Sapien thông qua SDK hoặc API để triển khai các yêu cầu thu thập dữ liệu tùy chỉnh và nhận dữ liệu đã được xác minh, có cấu trúc - phục vụ cho các ứng dụng trong mô hình ngôn ngữ lớn (LLM), xe tự hành, y tế, tài chính và nhiều lĩnh vực khác.
Tên token: SAPIEN
Điểm thưởng: Được tích luỹ thông qua việc hoàn thành nhiệm vụ, có thể quy đổi thành token SAPIEN trong tương lai.
Staking: Người dùng có danh tiếng cao có thể stake SAPIEN để được ưu tiên truy cập nhiệm vụ và hưởng hệ số thưởng cao hơn.
Biểu quyết quản trị: Người nắm giữ SAPIEN có quyền bỏ phiếu điều chỉnh các tham số của nền tảng như tỷ lệ phần thưởng và loại nhiệm vụ.
Chia sẻ doanh thu: Một phần doanh thu từ khách hàng doanh nghiệp trong tương lai sẽ được phân bổ cho những người nắm giữ token lâu dài.
Sapien có kế hoạch phân bổ airdrop token cho những người tham gia sớm và các cá nhân đóng góp nhiệm vụ xuất sắc.
Theo tiêu chí chính thức, ưu tiên sẽ được dành cho: người dùng hoạt động tích cực, người gán nhãn có độ chính xác cao, người hoàn thành các nhiệm vụ thử thách đặc biệt, người dùng Web3 liên kết với các nhóm cộng đồng nổi tiếng, cũng như các ví hoạt động trên chuỗi hoặc người dùng kỳ cựu trên mạng lưới Base. Airdrop dự kiến sẽ được phân bổ dựa trên chụp nhanh trước khi token chính thức ra mắt.
Sapien không chỉ là một nền tảng gán nhãn dữ liệu. Dự án hướng đến việc xây dựng "Lớp dữ liệu" (Data Layer) lớn nhất thế giới, đóng vai trò là hạ tầng nền tảng cho kỷ nguyên AI - một hệ thống tạo dữ liệu vận hành dựa trên sự đồng thuận cộng đồng.
1) Ra mắt token SAPIEN và hệ thống staking
2) Mở rộng hỗ trợ đa chuỗi, không chỉ trên Base mà còn sang Solana, Polygon và các mạng khác 3) Triển khai quản trị DAO, cho phép cộng đồng cùng tham gia thiết kế nhiệm vụ và mô hình chia sẻ doanh thu
4) Tích hợp sâu với các dự án AI
Tuyên bố miễn trừ trách nhiệm: Thông tin này không cung cấp lời khuyên về đầu tư, thuế, pháp lý, tài chính, kế toán, tư vấn hoặc bất kỳ dịch vụ liên quan nào khác cũng như không cấu thành lời khuyên để mua, bán hoặc nắm giữ bất kỳ tài sản nào. MEXC Learn chỉ cung cấp thông tin cho mục đích tham khảo và không phải là lời khuyên đầu tư. Vui lòng hiểu rõ đầy đủ những rủi ro liên quan và thận trọng khi đầu tư. MEXC không chịu trách nhiệm về quyết định đầu tư của người dùng.