شبکه های اجتماعی

  • بله
  • اینستاگرام
  • تلگرام
خبر فوری

الگوی ‏DeepSeek-V3‎‏؛ چالشی مقرون‌به‌صرفه و متن باز برای غول‌های هوش‌مصنوعی – بخش اول

  • چین
  • اخبار برگزیده
  • اخبار
19 بهمن 1403
۰ دیدگاه

به‌تازگی الگوی زبانی قدرتمند جدید چین به نام‎ DeepSeek-V3 ‎ به دلیل ادعای مقرون‌به‌صرفه بودن و دردسترس‌بودن، توجهات ‏زیادی را جلب کرده است. این زبان، مستقیماً سلطه‌ی الگو‌های بسته‌ای؛ مانند خانواده GPT از‎ OpenAI ‎را به چالش کشیده است. بر اساس ‏آزمایشات داخلی شرکت، این الگو در زبان انگلیسی، چینی، برنامه‌نویسی و ریاضیات عملکرد چشمگیری دارد و حتی با الگو‌های ‏تجاری پیشرو مانند نسخه‎ GPT-4o ‎ازOpenAI ‎ رقابت می‌کند. اندازه این الگو با ۶۷۱ میلیارد عامل (پارامتر)، بسیار بزرگ‌تر از (نسخه 70B)‎ Llama 2 ‎از‎ ‎شرکت مِتا‎ ‎است و حتی از Llama 3.1 (نسخه 405B) ‎نیز فراتر می‌رود که ممکن است به عملکرد برتر ادعایی آن کمک کند‎.‎‏ ‏کاربران شخصی می‌توانند از طریق یک چت‌بات رایگان در وبگاه ‎ DeepSeek ‎به‌راحتی قابلیت‌های آن را بررسی کنند. این ابزار ‏تعاملی نه‌تنها به جستجو در وب می‌پردازد، بلکه با نمایش مراحل استدلال خود، بینش ارزشمندی از فرایند تصمیم‌گیری الگو ارائه ‏می‌دهد‎.‎‏ درحالی‌که‎ DeepSeek-V3 ‎ عملکردی مشابه با الگو‌های پیشرفته دارد، اما از نظر هزینه‌های توسعه و اجرا نیز برتری دارد. ‏شرکت DeepSeek ادعا می‌کند که با تنها ۵.۵ میلیون دلار این الگو را آموزش داده است، رقمی که در مقایسه با برآورد بیش از ‏‏۱۰۰ میلیون دلار هزینه‌ی توسعه‌ی‎ GPT-4 ‎بسیار ناچیز است‎.‎‏ این الگو همچنین قیمت‌گذاری بسیار پایین‌تری برای خدمات ‏برخط خود ارائه می‌دهد. یکی از ویژگی‌های کلیدی ‎ ،DeepSeek-V3امکان بارگیری (دانلود) رایگان و اجرای محلی آن است. این ‏قابلیت برای کاربران و سازمان‌هایی که بر حریم خصوصی داده‌ها تأکید دارند یا در مناطقی با دسترسی محدود به اینترنت فعالیت ‏می‌کنند یا این‌که به واپایش بیشتری بر ابزارهای هوش‌مصنوعی خود نیاز دارند، یک مزیت بزرگ محسوب می‌شود. این ویژگی، تفاوت ‏چشمگیری با الگو‌هایی مانند‎ Copilot ‎مایکروسافت،Gemini ‎‏ گوگل و ‏GPT‏ ازOpenAI ‎ دارد که نیاز به اتصال دائم به اینترنت ‏دارند‎.‎

دیدگاه کاربران

هیچ دیدگاهی وجود ندارد شما اولین نفر باشید

دیدگاه شما در مورد این مطلب