الگوی DeepSeek-V3؛ چالشی مقرونبهصرفه و متن باز برای غولهای هوشمصنوعی – بخش اول
- چین
- اخبار برگزیده
- اخبار
![](https://didebanefanavari.com/wp-content/uploads/2025/02/Untitled.jpeg)
بهتازگی الگوی زبانی قدرتمند جدید چین به نام DeepSeek-V3 به دلیل ادعای مقرونبهصرفه بودن و دردسترسبودن، توجهات زیادی را جلب کرده است. این زبان، مستقیماً سلطهی الگوهای بستهای؛ مانند خانواده GPT از OpenAI را به چالش کشیده است. بر اساس آزمایشات داخلی شرکت، این الگو در زبان انگلیسی، چینی، برنامهنویسی و ریاضیات عملکرد چشمگیری دارد و حتی با الگوهای تجاری پیشرو مانند نسخه GPT-4o ازOpenAI رقابت میکند. اندازه این الگو با ۶۷۱ میلیارد عامل (پارامتر)، بسیار بزرگتر از (نسخه 70B) Llama 2 از شرکت مِتا است و حتی از Llama 3.1 (نسخه 405B) نیز فراتر میرود که ممکن است به عملکرد برتر ادعایی آن کمک کند. کاربران شخصی میتوانند از طریق یک چتبات رایگان در وبگاه DeepSeek بهراحتی قابلیتهای آن را بررسی کنند. این ابزار تعاملی نهتنها به جستجو در وب میپردازد، بلکه با نمایش مراحل استدلال خود، بینش ارزشمندی از فرایند تصمیمگیری الگو ارائه میدهد. درحالیکه DeepSeek-V3 عملکردی مشابه با الگوهای پیشرفته دارد، اما از نظر هزینههای توسعه و اجرا نیز برتری دارد. شرکت DeepSeek ادعا میکند که با تنها ۵.۵ میلیون دلار این الگو را آموزش داده است، رقمی که در مقایسه با برآورد بیش از ۱۰۰ میلیون دلار هزینهی توسعهی GPT-4 بسیار ناچیز است. این الگو همچنین قیمتگذاری بسیار پایینتری برای خدمات برخط خود ارائه میدهد. یکی از ویژگیهای کلیدی ،DeepSeek-V3امکان بارگیری (دانلود) رایگان و اجرای محلی آن است. این قابلیت برای کاربران و سازمانهایی که بر حریم خصوصی دادهها تأکید دارند یا در مناطقی با دسترسی محدود به اینترنت فعالیت میکنند یا اینکه به واپایش بیشتری بر ابزارهای هوشمصنوعی خود نیاز دارند، یک مزیت بزرگ محسوب میشود. این ویژگی، تفاوت چشمگیری با الگوهایی مانند Copilot مایکروسافت،Gemini گوگل و GPT ازOpenAI دارد که نیاز به اتصال دائم به اینترنت دارند.
-
کد خبر 5689-20250207
دیدگاه کاربران