مدل هوش مصنوعی مایکروسافت در بنچمارک SuperGLUE بهتر از انسان ظاهر شد

مایکروسافت در نسخه جدید مدل DeBERTa امکان انجام کارهای بیشتر و با سرعت بیشتر را فراهم کرده است که این کار از طریق یاددهی به 1.5 میلیارد پارامتر بوده است.

ژاله کرامتی مهر 26, 1401 3 مطالعه

مایکروسافت در نسخه جدید مدل DeBERTa امکان انجام کارهای بیشتر و با سرعت بیشتر را فراهم کرده است که این کار از طریق یاددهی به 1.5 میلیارد پارامتر بوده است.

هوش مصنوعی در طی سال های گذشته سبب پیشرفت در خیلی از حوزه ها شده است که این کار از طریق آموزش میلیاردها پارامتر اتفاق اتفاده است. مایکروسافت هم در مدل هوش مصنوعی خود DeBERTa، با یاددهی به یک نسخه بزرگتر با 48 لایه ترنسفورمر و 1.5 میلیارد پارامتر به روزرسانی شده است. همین بهبود عملکرد DeBERTa باعث شده است که سرعت پردازش آن در زبان SUPERGLUE از انسان بیشتر شود. بر این اساس DeBERTa در آزمایشی که انجام شد امتیاز 89.9 را به دست آورد در حالیکه انسان موفق شد امتیاز خود را 89.8 برساند. این در حالی است که با در نظر گرفتن امتیاز های پایه این تفاوت بیشتر هم می شود. (۹۰٫۳ در برابر ۸۹٫۸).

بنچمارک SUPERGLUE شامل وظایف متنوع مبتنی‌ بر پردازش زبان طبیعی (NLP) است که مواردی همچون پاسخ به سوال و نتیجه گیری را شامل می شود. در رتبه بندی بنچمارک های SUPERGLUE، DeBERTa متعلق به مایکروسافت موفق شد متوسط نمره کلان 90.8 را به دست آورد. براساس گزارش MSPoweruser، مدل DeBERTa که مایکروسافت توسعه داده است می‌تواند با استفاده از سه تکنیک نوین، PLMهای پیشین نظیر BERT،اRoBERTa و UniLM را بهبود ببخشد. یکی از این تکنیک ‌ها، مکانیسم دقت منظم‌ شده (Disentangled Attention) نام دارد و تکنیک دوم در حقیقت نسخه‌ی بهبود یافته‌ی ابزار Mask Decoder محسوب می‌شود. مایکروسافت همچنین در مدل DeBERTa به نوعی تعلیمِ رقابتی‌ مجازی برای بهینه‌سازی مدل اشاره می‌کند.

در مقایسه با مدل T5گوگل که از 11 میلیارد پارامتر تشکیل شده این مدل که 1.5 میلیارد پارامتر دارد، خیلی انرژی کمتری مصرف می کند و فشرده سازی اپلیکشین ها با تنظیمات مختلف انجام می شود. در هر صورت باید به این نکته باز هم اشاره کرد که موفقیت DeBERTa در بنچمارک SuperGLUE یک دستاورد بزرگ محسوب می شود.

با وجود عملکرد خوب مدل مایکروسافت باید به این نکته اذعان کرد که هوش انسان در درک زبان طبیعی خیلی بهتر از این مدل کار می کند و ذهن انسان در حوزه یادگیری از دانش از وظایف مختلف و برای حل کردن وظایف جدید خیلی از مدل های هوش مصنوعی ساخته بشر قوی تر عمل می کند.

تصمیم جدید مایکروسافت بر این است که این تکنولوژی جدید را با نسخه جدید مدل بازنمایی زبان طبیعی Microsoft Turing ترکیب نماید. یکی از شرکت هایی که از این مدل بهره می برد شرکت ردموندی است که از این مدل در Bing،اOffice،اDynamics و Azure Cognitive Services برای ایجاد امکان انواع کارها نظیر تعاملات انسان-انسان و تعاملات انسان-دستگاه بهره می گیرد. خبر دیگر اینکه مایکروسافت بنا دارد که پارامترهای 1.5 میلیاردی مدل DeBERTa را همراه با کدهای منبع آن در اختیار عموم قرار دهد.