DataFi: البحر الأزرق الجديد لاقتصاد البيانات المدعوم بالذكاء الاصطناعي في مجال Web3

robot
إنشاء الملخص قيد التقدم

البيانات هي الأصول: DataFi تفتح بحرًا جديدًا

موضوع هذا الشهر في دائرة الذكاء الاصطناعي هو بلا شك تجنيد Meta للموظفين بكثافة، حيث شكلت فريقًا من علماء الأبحاث الذين يغلب عليهم الصينيون. يقود الفريق ألكسندر وانغ، الذي يبلغ من العمر 28 عامًا فقط، والذي أسس Scale AI. حاليًا، تبلغ قيمة Scale AI 29 مليار دولار، وتقدم خدمات البيانات للعديد من عمالقة الذكاء الاصطناعي بما في ذلك الجيش الأمريكي وOpenAI وAnthropic وMeta، حيث يتمثل نشاطها الأساسي في توفير كميات كبيرة من البيانات الموصوفة بدقة.

تتمثل ميزة Scale AI التي تجعلها تبرز بين العديد من الشركات الناشئة في أنها أدركت مبكرًا الوضع الحاسم للبيانات في صناعة الذكاء الاصطناعي. تعتبر قوة الحوسبة والنماذج والبيانات الركائز الثلاثة لنماذج الذكاء الاصطناعي. إذا تم اعتبار النموذج الكبير كشخص، فإن النموذج هو الجسم، وقوة الحوسبة هي الطعام، بينما البيانات هي المعرفة والمعلومات.

في عملية التطور السريع لنماذج اللغة الكبيرة، شهدت الصناعة انتقال التركيز من النماذج إلى قوة الحساب. اليوم، تستخدم معظم النماذج الـtransformer كإطار أساسي، وأحيانًا تتضمن ابتكارات مثل MoE أو MoRe؛ إما أن تقوم الشركات الكبرى ببناء تجمعات حوسبة فائقة خاصة بها، أو أن توقع اتفاقيات طويلة الأمد مع مقدمي خدمات السحابة لحل مشكلة قوة الحساب. على هذا الأساس، تزداد أهمية البيانات بشكل متزايد.

تتركز شركة Scale AI على بناء قاعدة بيانات قوية لنماذج الذكاء الاصطناعي، حيث تشمل أعمالها ليس فقط استخراج البيانات الحالية، ولكن أيضًا أعمال توليد البيانات. كما أن الشركة شكلت فريق تدريب للذكاء الاصطناعي يتكون من خبراء من مجالات مختلفة، لتوفير بيانات تدريب عالية الجودة لنماذج الذكاء الاصطناعي.

تنقسم عملية تدريب النموذج إلى مرحلتين: التدريب المسبق والتعديل الدقيق. التدريب المسبق مشابه لعملية تعلم الأطفال الكلام، ويتطلب كمية كبيرة من المعلومات المستخرجة من النصوص والكود المتاحة على الإنترنت. أما التعديل الدقيق فيشبه التعليم المدرسي، حيث يوجد هدف واضح واتجاه، ويتم تطوير القدرات المحددة للنموذج من خلال مجموعة بيانات مصممة بعناية.

لذلك، يتضمن مجال بيانات الذكاء الاصطناعي نوعين رئيسيين من مجموعات البيانات: النوع الأول هو كميات كبيرة من البيانات التي لا تتطلب الكثير من المعالجة، وعادة ما تأتي من منصات UGC مثل Reddit وTwitter وGithub، أو قواعد بيانات الأدبيات العامة أو قواعد البيانات الخاصة بالشركات؛ بينما النوع الثاني يحتاج إلى تصميم دقيق وانتقاء، لضمان تنمية قدرات معينة للنموذج، مما يتطلب تنظيف البيانات وانتقاؤها ووضع العلامات عليها وتقديم التعليقات اليدوية.

مع تعزيز قدرات النماذج، ستصبح أنواع البيانات التدريبية الأكثر دقة وتخصصًا هي العوامل الحاسمة في تحديد قدرات النموذج. على المدى الطويل، تعتبر بيانات الذكاء الاصطناعي أيضًا مسارًا طويل الأجل يمتلك تأثير كرة الثلج، حيث ستكتسب أصول البيانات القدرة على الفائدة المركبة مع تراكم الأعمال الأولية، مما يزيد من قيمتها باستمرار.

البيانات هي الأصول: DataFi تفتح بحارًا جديدة

Web3 DataFi: أرض البيانات المميزة للذكاء الاصطناعي

بالمقارنة مع فرق العلامة اليدوية عن بُعد التي تضم عشرات الآلاف من الأشخاص التي شكلتها بعض الشركات في عدة دول، فإن Web3 لديها ميزة طبيعية في مجال بيانات الذكاء الاصطناعي، ومن هنا وُلد مفهوم DataFi الجديد. في الوضع المثالي، تشمل مزايا Web3 DataFi ما يلي:

  1. ضمانات السيادة على البيانات والأمان والخصوصية للعقود الذكية
  2. الميزة الطبيعية للاختلاف الجغرافي: الهيكل اللامركزي الحر يجذب القوى العاملة الأكثر ملاءمة.
  3. المزايا الواضحة للتحفيز والتسوية في بلوكشين
  4. يساعد في بناء سوق بيانات "شاملة" أكثر كفاءة وفتحاً

بالنسبة للمستخدمين العاديين، فإن DataFi هو أيضًا أسهل مشروع للذكاء الاصطناعي اللامركزي يمكن المشاركة فيه. يمكن للمستخدمين المشاركة من خلال عمليات بسيطة، بما في ذلك توفير البيانات، وتقييم النماذج، واستخدام أدوات الذكاء الاصطناعي للقيام بإنشاءات بسيطة أو المشاركة في تداول البيانات.

البيانات هي الأصول: DataFi تفتح آفاق جديدة

مشاريع Web3 DataFi المحتملة

حالياً، حصلت العديد من مشاريع DataFi على تمويل ملحوظ. فيما يلي بعض المشاريع التمثيلية:

  1. Sahara AI: يهدف إلى إنشاء بنية تحتية فائقة لذكاء اصطناعي لامركزي وسوق تداول.

  2. يوب: منصة تغذية راجعة لنماذج الذكاء الاصطناعي، تجمع تعليقات المستخدمين حول مخرجات النموذج.

  3. فانا: تحويل البيانات الشخصية للمستخدمين إلى أصول رقمية قابلة للتداول.

  4. Chainbase: تركيز على البيانات على السلسلة، تغطي أكثر من 200 سلسلة كتلة.

  5. Sapien: يهدف إلى تحويل المعرفة البشرية على نطاق واسع إلى بيانات تدريب عالية الجودة للذكاء الاصطناعي.

  6. برايمسا إكس: تهدف إلى أن تكون طبقة التنسيق المفتوحة للروبوتات.

  7. ماسا: واحدة من المشاريع الفرعية الرائدة في نظام بتيتنور البيئي.

  8. Irys: تركز على تخزين البيانات القابل للبرمجة والحساب.

  9. ORO: تمكين الأشخاص العاديين من المشاركة في مساهمات الذكاء الاصطناعي.

  10. غاتا: تحديدها كطبقة بيانات لامركزية.

تعتبر الحواجز أمام هذه المشاريع عمومًا منخفضة حاليًا، ولكن بمجرد أن تتراكم المستخدمين والالتصاق بالنظام البيئي، ستتزايد مزايا المنصة بسرعة. لذلك، يجب على المشاريع المبكرة التركيز على الحوافز وتجربة المستخدم. في الوقت نفسه، تحتاج هذه المنصات أيضًا إلى التفكير في كيفية إدارة المشاركين وضمان جودة البيانات، وتجنب حدوث "تدهور العملة الجيدة".

علاوة على ذلك، فإن تحسين الشفافية يمثل تحديًا كبيرًا تواجهه المشاريع على السلسلة في الوقت الحالي. لا تزال العديد من المشاريع تفتقر إلى بيانات كافية يمكن الوصول إليها وتتبعها، مما يضر بالتطور الصحي طويل الأمد لـ Web3 DataFi.

يمكن تقسيم مسار التطبيق الواسع لـ DataFi إلى جزئين: الأول هو جذب عدد كافٍ من المستخدمين الأفراد للمشاركة، لتشكيل قوة جديدة لجمع/توليد البيانات ومستهلكي الاقتصاد الذكي؛ والثاني هو الحصول على اعتراف الشركات الرائدة، لأنها في المدى القصير المصدر الرئيسي للصفقات الكبيرة للبيانات.

DataFi تمثل تربية الذكاء البشري للذكاء الآلي على المدى الطويل، وفي الوقت نفسه تضمن عوائد العمل البشري من خلال العقود الذكية، مما يؤدي في النهاية إلى رد الذكاء الآلي الجميل للبشر. بالنسبة لأولئك الذين يشعرون بعدم اليقين تجاه عصر الذكاء الاصطناعي، أو لا يزال لديهم مثاليات حول blockchain، قد يكون الانخراط في DataFi خيارًا طبيعيًا.

البيانات هي الأصول: DataFi تفتح محيطًا جديدًا

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • 5
  • مشاركة
تعليق
0/400
NFTRegretfulvip
· منذ 1 س
ai还真卷上数据了哈 又一轮 يُستغل بغباء.
شاهد النسخة الأصليةرد0
AirdropNinjavip
· 08-01 05:45
مرة أخرى مشروع جيد لخداع الناس لتحقيق الربح، هيهي.
شاهد النسخة الأصليةرد0
LoneValidatorvip
· 08-01 05:42
ما أغنى! 290 مليار في سن 28.
شاهد النسخة الأصليةرد0
quiet_lurkervip
· 08-01 05:40
هل بيانات العلامة التجارية تستحق 29 مليار؟ هذه الأموال سهلة جدًا لكسبها.
شاهد النسخة الأصليةرد0
NotSatoshivip
· 08-01 05:22
لو كان لدى الناس نصف انتباه سيكون ذلك جيدًا~
شاهد النسخة الأصليةرد0
  • تثبيت