يكشف Cerebras عن شراكات جديدة لـ LLM وأدوات الذكاء الاصطناعي التوليدية

تحقق من الجلسات عند الطلب من قمة Low-Code / No-Code للتعرف على كيفية الابتكار وتحقيق الكفاءة بنجاح من خلال رفع المهارات وتوسيع نطاق المطورين المواطنين. شاهد الآن.


تعد نماذج اللغات الكبيرة (LLMs) كلها حديث عالم الذكاء الاصطناعي في الوقت الحالي ، ولكن تدريبها قد يكون صعبًا ومكلفًا ؛ تتطلب النماذج ذات المليارات من المعلمات شهورًا من العمل من قبل مهندسين ذوي خبرة للنهوض والتشغيل (بشكل موثوق ودقيق).

يهدف عرض مشترك جديد من Cerebras Techniques و Cirrascale Cloud Providers إلى إضفاء الطابع الديمقراطي على الذكاء الاصطناعي من خلال منح المستخدمين القدرة على تدريب نماذج فئة GPT بتكلفة أقل بكثير من مقدمي الخدمة الحاليين – وببضع أسطر من التعليمات البرمجية.

أندرو فيلدمان ، الرئيس التنفيذي والشريك المؤسس لشركة أنظمة Cerebras قال في إحاطة ما قبل. “خلال العام المقبل ، سنشهد ارتفاعًا كبيرًا في تأثير ماجستير إدارة الأعمال في أجزاء مختلفة من الاقتصاد.”

بصورة مماثلة، الذكاء الاصطناعي التوليدي قد يكون أحد أهم التطورات التكنولوجية في التاريخ الحديث ، حيث يتيح القدرة على كتابة المستندات وإنشاء الصور وبرامج الكود من مدخلات النص العادية.

حدث

قمة الأمن الذكي

تعرف على الدور الحاسم للذكاء الاصطناعي والتعلم الآلي في الأمن السيبراني ودراسات الحالة الخاصة بالصناعة في 8 ديسمبر. سجل للحصول على تصريح المرور المجاني اليوم.

سجل الان

للمساعدة في تسريع تبني وتحسين دقة الذكاء الاصطناعي التوليدي ، أعلنت Cerebras اليوم أيضًا عن شراكة جديدة مع منصة محتوى AI يشب منظمة العفو الدولية.

قال ديف روجموسر الرئيس التنفيذي لشركة Jasper: “نشعر حقًا أن الفصل التالي من الذكاء الاصطناعي التوليدي هو نماذج مخصصة تتحسن باستمرار”.

قال إن المرحلة الأولى من التكنولوجيا كانت “مثيرة حقًا” ، لكنها على وشك أن تصبح أكثر إثارة بكثير.

فتح فرص البحث

بالنسبة إلى LLMs ، يمكن أن يعاني مقدمو الخدمات السحابية التقليديون لأنهم غير قادرين على ضمان زمن الانتقال بين أعداد كبيرة من وحدات معالجة الرسومات. أوضح فيلدمان أن زمن الانتقال المتغير ينتج تحديات معقدة وتستغرق وقتًا طويلاً في توزيع نموذج ذكاء اصطناعي كبير بين وحدات معالجة الرسومات ، وهناك “تقلبات كبيرة في الوقت المناسب للتدريب”.

استوديو Cerebras AI Mannequin Studio الجديد ، والذي يتم استضافته في سحابة Cirrascale AI Innovation Cloud، يسمح للمستخدمين بتدريب نماذج فئة المحولات التوليدية (GPT) – بما في ذلك GPT-J و GPT-3 و GPT-NeoX – على مجموعات Cerebras Wafer-Scale Clusters. هذا يشمل المعلن عنه حديثا أندروميدا الذكاء الاصطناعي العملاق.

يمكن للمستخدمين الاختيار من بين أحدث طرازات فئة GPT ، والتي تتراوح من 1.3 مليار معلمة إلى 175 مليار معلمة ، والتدريب الكامل بثماني مرات أسرع في الدقة من A100 ، وبنصف سعر السحابة التقليدية قال فيلدمان.

على سبيل المثال ، يستغرق وقت التدريب على GPT-J باستخدام سحابة تقليدية ما يقرب من 64 يومًا من البداية ؛ يقلل Cerebras AI Mannequin Studio ذلك إلى ثمانية أيام من البداية. وبالمثل ، في السحب التقليدية ، تصل تكاليف الإنتاج لوحدات معالجة الرسومات وحدها إلى 61000 دولار ؛ بينما في Cerebras ، تبلغ 45000 دولار لكامل عملية الإنتاج.

الأداة الجديدة تلغي الحاجة إلى devops والبرمجة الموزعة ؛ يمكن أن يكون المسح الضوئي للنموذج بضغطة زر من واحد إلى 20 مليار معلمة. يمكن تدريب النماذج بأطوال تسلسل أطول ، مما يفتح فرصًا بحثية جديدة.

قال آندي هوك ، رئيس منتج سيريبراس: “نحن نطلق العنان لقدرة جديدة بشكل أساسي على البحث على هذا النطاق”.

كما أشار فيلدمان ، تتمثل مهمة Cerebras في “توسيع نطاق الوصول إلى التعلم العميق وتسريع أداء أعباء عمل الذكاء الاصطناعي.”

قال إن استوديو نموذج الذكاء الاصطناعي الجديد الخاص به “سهل وبسيط للغاية”. “لقد قمنا بتنظيم هذا بحيث يمكنك القفز فوق ، يمكنك الإشارة ، يمكنك النقر.”

تسريع إمكانات الذكاء الاصطناعي

وفي الوقت نفسه ، سيستخدم جاسبر الشاب (الذي تأسس في عام 2021) كمبيوتر Cerebras الفائق Andromeda AI لتدريب نماذجه الحاسوبية المكثفة في “جزء صغير من الوقت” ، كما قال Rogenmoser.

كما أشار ، تريد الشركات نماذج مخصصة ، “وهي تريدها بشدة”.

وقال: “إنهم يريدون أن تصبح هذه النماذج أفضل ، وأن تتحسن ذاتيًا استنادًا إلى بيانات الاستخدام السابقة ، بناءً على الأداء”.

في عملها الأولي على أعباء العمل الصغيرة مع أندروميدا – والذي تم الإعلان عنه هذا الشهر في SC22، المؤتمر الدولي للحوسبة عالية الأداء والشبكات والتخزين والتحليل – وجد Jasper أن الكمبيوتر العملاق أكمل العمل الذي كان الآلاف من وحدات معالجة الرسومات غير قادرة على القيام به.

تتوقع الشركة “تطوير عمل الذكاء الاصطناعي بشكل كبير” ، بما في ذلك تدريب شبكات GPT لتلائم مخرجات الذكاء الاصطناعي لجميع مستويات تعقيد المستخدم النهائي ودقة التفاصيل. قال Rogenmoser إن هذا سيمكن Jasper من تخصيص المحتوى عبر فئات متعددة من العملاء بسرعة وسهولة.

وقال إن الشراكة “تمكننا من ابتكار مستقبل الذكاء الاصطناعي التوليدي من خلال القيام بأشياء غير عملية أو مستحيلة ببساطة مع البنية التحتية التقليدية”.

يستخدم 100000 عميل منتجات Jasper لكتابة نسخ للتسويق والإعلانات والكتب والمواد الأخرى. وصف Rogenmoser الشركة بأنها تقضي على “استبداد الصفحة الفارغة” من خلال العمل “كطيار مساعد للذكاء الاصطناعي”.

على حد تعبيره ، فإن هذا يسمح لمنشئي المحتوى بالتركيز على العناصر الأساسية لقصتهم ، “وليس الدنيوية”.

مهمة VentureBeat هو أن تكون ساحة المدينة الرقمية لصناع القرار التقنيين لاكتساب المعرفة حول تكنولوجيا المؤسسات التحويلية والمعاملات. اكتشف إحاطاتنا.

The Information Weblog The place You Get The Information First
VentureBeat

brain2gain