پیشرفته‌ترین مدل هوش مصنوعی فقط ۶۹ درصد دقت دارد

آمار جدید محققان گوگل نشان می‌دهد که حتی پیشرفته‌ترین مدل هوش مصنوعی موجود دقت ۶۹ درصدی دارد.
پیشرفته‌ترین مدل هوش مصنوعی فقط ۶۹ درصد دقت دارد
1404/09/24 - 11:14
تاریخ و ساعت خبر:
150759
کد خبر:
به گزارش خبرگزاری زنان ایران - گوگل تصویری نگران‌کننده از میزان دقت هوش مصنوعی در بیان حقایق به دست آورد. گوگل دیپ‌مایند هفته‌ی گذشته از مجموعه‌ی بنچمارک FACTS رونمایی کرد؛ ابزاری برای سنجش اعتبار و درستی پاسخ‌های مدل‌های AI.
این بنچمارک مدل‌ها را در چهار حوزه‌ی کلیدی به چالش می‌کشد: پاسخ به پرسش‌های واقعی بر اساس دانش درونی، استفاده‌ی مؤثر از جست‌وجوی وب، استناد دقیق به اسناد طولانی و تفسیر تصاویر. در این آزمون، جمنای ۳ پرو گوگل با کسب امتیاز ۶۹ درصد، بهترین عملکرد را به ثبت رساند؛ درحالی‌که سایر مدل‌های پیشرو با اختلاف فاحشی پایین‌تر از این سطح قرار گرفتند.
آمار مذکور باید زنگ خطری جدی برای کسب‌وکارهایی باشد که روی هوش مصنوعی شرط بسته‌اند. اگرچه مدل‌ها در سرعت و شیوایی کلام بی‌نظیرند؛ اما قابلیت اطمینان آن‌ها در بیان حقایق همچنان فرسنگ‌ها با انتظارات انسانی فاصله دارد؛ به‌ویژه در وظایفی که نیازمند دانش تخصصی، استدلال پیچیده یا استناد دقیق به منابع هستند.
حتی خطاهای واقعی کوچک در صنایعی مانند امور مالی، بهداشت و درمان و حقوق می‌توانند پیامدهای ویرانگری به‌همراه داشته باشند. یکی از خبرنگاران روایت می‌کند که چگونه یک شرکت حقوقی، کارمندش را به دلیل استفاده از ChatGPT در تنظیم لایحه‌ای که مملو از پرونده‌های ساختگی بود، اخراج کرد.
بنچمارک FACTS هم هشدار است و هم نقشه‌ی راه؛ گوگل امید دارد با کاهش نقاط شکست و نحوه‌ی خطای مدل‌ها، پیشرفت در این حوزه را شتاب ببخشد. اما فعلاً پیام روشن است: هوش مصنوعی بهتر می‌شود؛ اما همچنان در حدود یک‌سوم موارد اشتباه می‌کند.
خبرآنلاین
انتهای پیام/ن

بازگشت به ابتدای صفحه بازگشت به ابتدای صفحه
برچسب ها:
اطلاعات، عامل‌ های هوش مصنوعی، گوگل
ارسال نظر
مخاطبان گرامی، برای انتشار نظرتان لطفا نکات زیر را رعایت فرمایید:
1- نظرات خود را با حروف فارسی تایپ کنید.
2- نظرات حاوی مطالب کذب، توهین یا بی‌احترامی به اشخاص، قومیت‌ها، عقاید دیگران، موارد مغایر با قوانین کشور و آموزه‌های اسلامی منتشر نمی‌شود.
3- نظرات بعد از بررسی و کنترل عدم مغایرت با موارد ذکر شده تایید و منتشر خواهد شد.
نام:
ایمیل:
* نظر:
فناوری اطلاعات
V
آرشیو