کد خبر: 216076                      تاريخ انتشار: 1404/01/30 - 10:42
مایکروسافت با BitNet b۱.۵۸ ۲B۴T: انقلابی در هوش مصنوعی ۱ بیتی متن‌باز
 
مایکروسافت بزرگ‌ترین مدل هوش مصنوعی ۱ بیتی جهان، BitNet b۱.۵۸ ۲B۴T، را با ۲ میلیارد پارامتر و آموزش روی ۴ تریلیون توکن (معادل ۳۳ میلیون کتاب) معرفی کرد.
 
این مدل متن‌باز تحت مجوز MIT منتشر شده و به گزارش تک‌کرانچ، بهینه‌سازی آن به حدی است که روی پردازنده‌های معمولی مانند اپل M۲ اجرا می‌شود. این نوآوری، هوش مصنوعی را برای دستگاه‌های کم‌مصرف قابل دسترس‌تر می‌کند و گامی بزرگ در توسعه اقتصاد دیجیتال به شمار می‌رود.
BitNet b۱.۵۸: عملکرد برتر با مصرف حافظه کم در هوش مصنوعی
مدل BitNet b۱.۵۸ ۲B۴T با استفاده از وزن‌های سه‌مقداری (-۱، ۰، ۱) مصرف حافظه را به شدت کاهش داده و تا ۲ برابر سریع‌تر از مدل‌های هم‌رده مانند Llama ۳.۲ ۱B متا، Gemma ۳ ۱B گوگل و Qwen ۲.۵ ۱.۵B علی‌بابا عمل می‌کند. این مدل در بنچمارک‌هایی مانند GSM۸K (ریاضی) و PIQA (منطق فیزیکی) امتیازات برتری کسب کرده است. طراحی ۱.۵۸ بیتی این مدل، آن را برای کاربردهای دانش‌بنیان در دستگاه‌های سبک ایده‌آل می‌سازد، اما نیاز به فریمورک bitnet.cpp مایکروسافت، سازگاری با GPUها را محدود کرده است.
چالش‌ها و آینده هوش مصنوعی ۱ بیتی مایکروسافت
اگرچه BitNet b۱.۵۸ ۲B۴T با کاهش ۸ برابری حافظه و ۱۰ برابری مصرف انرژی، پتانسیل بالایی برای محیط‌های کم‌منبع نشان داده، اما وابستگی به فریمورک اختصاصی bitnet.cpp و عدم پشتیبانی از GPUها مانعی برای پذیرش گسترده آن است. مایکروسافت با انتشار این مدل روی Hugging Face و ارائه کد متن‌باز، توسعه‌دهندگان را به مشارکت دعوت کرده است. این مدل می‌تواند راه را برای اجرای هوش مصنوعی روی دستگاه‌های روزمره هموار کند و به رشد فناوری‌های پایدار کمک نماید.
خبرآنلاین
انتهای پیام/ن