الگوی ‏DeepSeek-V3‎‏؛ چالشی مقرون‌به‌صرفه و متن باز برای غول‌های هوش‌مصنوعی – بخش اول

چین
اخبار برگزیده
اخبار

19 بهمن 1403

بازدید 29

۰ دیدگاه

به‌تازگی الگوی زبانی قدرتمند جدید چین به نام‎ DeepSeek-V3 ‎ به دلیل ادعای مقرون‌به‌صرفه بودن و دردسترس‌بودن، توجهات ‏زیادی را جلب کرده است. این زبان، مستقیماً سلطه‌ی الگو‌های بسته‌ای؛ مانند خانواده GPT از‎ OpenAI ‎را به چالش کشیده است. بر اساس ‏آزمایشات داخلی شرکت، این الگو در زبان انگلیسی، چینی، برنامه‌نویسی و ریاضیات عملکرد چشمگیری دارد و حتی با الگو‌های ‏تجاری پیشرو مانند نسخه‎ GPT-4o ‎ازOpenAI ‎ رقابت می‌کند. اندازه این الگو با ۶۷۱ میلیارد عامل (پارامتر)، بسیار بزرگ‌تر از (نسخه 70B)‎ Llama 2 ‎از‎ ‎شرکت مِتا‎ ‎است و حتی از Llama 3.1 (نسخه 405B) ‎نیز فراتر می‌رود که ممکن است به عملکرد برتر ادعایی آن کمک کند‎.‎‏ ‏کاربران شخصی می‌توانند از طریق یک چت‌بات رایگان در وبگاه ‎ DeepSeek ‎به‌راحتی قابلیت‌های آن را بررسی کنند. این ابزار ‏تعاملی نه‌تنها به جستجو در وب می‌پردازد، بلکه با نمایش مراحل استدلال خود، بینش ارزشمندی از فرایند تصمیم‌گیری الگو ارائه ‏می‌دهد‎.‎‏ درحالی‌که‎ DeepSeek-V3 ‎ عملکردی مشابه با الگو‌های پیشرفته دارد، اما از نظر هزینه‌های توسعه و اجرا نیز برتری دارد. ‏شرکت DeepSeek ادعا می‌کند که با تنها ۵.۵ میلیون دلار این الگو را آموزش داده است، رقمی که در مقایسه با برآورد بیش از ‏‏۱۰۰ میلیون دلار هزینه‌ی توسعه‌ی‎ GPT-4 ‎بسیار ناچیز است‎.‎‏ این الگو همچنین قیمت‌گذاری بسیار پایین‌تری برای خدمات ‏برخط خود ارائه می‌دهد. یکی از ویژگی‌های کلیدی ‎ ،DeepSeek-V3امکان بارگیری (دانلود) رایگان و اجرای محلی آن است. این ‏قابلیت برای کاربران و سازمان‌هایی که بر حریم خصوصی داده‌ها تأکید دارند یا در مناطقی با دسترسی محدود به اینترنت فعالیت ‏می‌کنند یا این‌که به واپایش بیشتری بر ابزارهای هوش‌مصنوعی خود نیاز دارند، یک مزیت بزرگ محسوب می‌شود. این ویژگی، تفاوت ‏چشمگیری با الگو‌هایی مانند‎ Copilot ‎مایکروسافت،Gemini ‎‏ گوگل و ‏GPT‏ ازOpenAI ‎ دارد که نیاز به اتصال دائم به اینترنت ‏دارند‎.‎

کد خبر 5689-20250207
منبع اصلی خبر

[print_posts post="POST_ID OR LEAVE EMPTY" pdf="yes" print="yes" word="yes"]

دیدگاه کاربران

هیچ دیدگاهی وجود ندارد شما اولین نفر باشید

دیده بان فناوری

الگوی ‏DeepSeek-V3‎‏؛ چالشی مقرون‌به‌صرفه و متن باز برای غول‌های هوش‌مصنوعی – بخش اول

دیدگاه کاربران

دیدگاه شما در مورد این مطلب

محل درج آگهی شما

خدمات دیده بان فناوری

تهیه گزارش های فنی، علمی و مطالعاتی توسط گروه دیده‌بان فناوری

ارتباط با نهادها و شرکت های دانش بنیان داخل و خارج از کشور

ارائه خدمات ترجمه چینی توسط متخصصان گروه دیده‌بان فناوری

خدمات تهیه تجهیزات توسط گروه دیده‌بان فناوری

دیده بان فناوری

دسترسی سریع

کشورها و مناطق

پیوندهای مرتبط

شبکه های اجتماعی

الگوی ‏DeepSeek-V3‎‏؛ چالشی مقرون‌به‌صرفه و متن باز برای غول‌های هوش‌مصنوعی – بخش اول

اخبار مشابه

دیدگاه کاربران

دیدگاه شما در مورد این مطلب

محل درج آگهی شما

خدمات دیده بان فناوری

دیده بان فناوری

دسترسی سریع

کشورها و مناطق

پیوندهای مرتبط