|
مایکروسافت با BitNet b۱.۵۸ ۲B۴T: انقلابی در هوش مصنوعی ۱ بیتی متنباز |
|
مایکروسافت بزرگترین مدل هوش مصنوعی ۱ بیتی جهان، BitNet b۱.۵۸ ۲B۴T، را با ۲ میلیارد پارامتر و آموزش روی ۴ تریلیون توکن (معادل ۳۳ میلیون کتاب) معرفی کرد. |
|
این مدل متنباز تحت مجوز MIT منتشر شده و به گزارش تککرانچ، بهینهسازی آن به حدی است که روی پردازندههای معمولی مانند اپل M۲ اجرا میشود. این نوآوری، هوش مصنوعی را برای دستگاههای کممصرف قابل دسترستر میکند و گامی بزرگ در توسعه اقتصاد دیجیتال به شمار میرود.
BitNet b۱.۵۸: عملکرد برتر با مصرف حافظه کم در هوش مصنوعی
مدل BitNet b۱.۵۸ ۲B۴T با استفاده از وزنهای سهمقداری (-۱، ۰، ۱) مصرف حافظه را به شدت کاهش داده و تا ۲ برابر سریعتر از مدلهای همرده مانند Llama ۳.۲ ۱B متا، Gemma ۳ ۱B گوگل و Qwen ۲.۵ ۱.۵B علیبابا عمل میکند. این مدل در بنچمارکهایی مانند GSM۸K (ریاضی) و PIQA (منطق فیزیکی) امتیازات برتری کسب کرده است. طراحی ۱.۵۸ بیتی این مدل، آن را برای کاربردهای دانشبنیان در دستگاههای سبک ایدهآل میسازد، اما نیاز به فریمورک bitnet.cpp مایکروسافت، سازگاری با GPUها را محدود کرده است.
چالشها و آینده هوش مصنوعی ۱ بیتی مایکروسافت
اگرچه BitNet b۱.۵۸ ۲B۴T با کاهش ۸ برابری حافظه و ۱۰ برابری مصرف انرژی، پتانسیل بالایی برای محیطهای کممنبع نشان داده، اما وابستگی به فریمورک اختصاصی bitnet.cpp و عدم پشتیبانی از GPUها مانعی برای پذیرش گسترده آن است. مایکروسافت با انتشار این مدل روی Hugging Face و ارائه کد متنباز، توسعهدهندگان را به مشارکت دعوت کرده است. این مدل میتواند راه را برای اجرای هوش مصنوعی روی دستگاههای روزمره هموار کند و به رشد فناوریهای پایدار کمک نماید.
خبرآنلاین
انتهای پیام/ن |