بازار هوش مصنوعی با سرعتی سرسامآور در حال تغییر است، اما برخلاف تصور رایج همیشه قویترین مدلها برنده رقابت نیستند. پلتفرم Poe به عنوان یکی از مراجع دسترسی به مدلهای AI گزارشی را از نحوه استفاده کاربران از این مدلها در سه ماهه اول سال ۲۰۲۵ منتشر کرده که حاوی نکات جالبی است. این گزارش تصویری روشن از روندهای کلیدی در حوزههای متن، استدلال، تصویر، ویدئو و صدا ارائه میدهد.
مدلهای متنی عمومی: رقابت تنگاتنگ در صدر
غولهای دنیای هوش مصنوعی با سرعت خیرهکننده سرگرم انتشار مدلهای جدید هستند. خانواده GPT-4.1 از OpenAI و Gemini 2.5 Pro از گوگل با عملکرد مناسب در کدنویسی در هفتههای ابتدایی عرضه به ترتیب به سهم ۱۰ درصد و ۵ درصدی دست یافتند.
در مقابل سری Claude از Anthropic (مانند Claude 3.5 Sonnet و Claude 3.7 Sonnet) با حدود ۱۰٪ کاهش سهم از صدر پایین کشیده شدند.
مدل DeepSeek که در ابتدای سال با سروصدای زیادی وارد بازار شد، حالا با کاهش سهمش از ۷ به ۳ درصد، نشان داد که «ترند شدن» به معنی «ماندگاری» نیست. در واقع ورود مدلهای ارزانتر و دقیقتر در زمینه استدلال و حل مسئله باعث فروکش کردن هیجان DeepSeek شد.
مقاله پیشنهادی: دیپ سیک چیست؟ چطور از هوش مصنوعی DeepSeek استفاده کنیم؟
دیگر نکته قابل توجه تمایل کاربران به جایگزینی سریع مدلهای قدیمی با نسخههای جدید است. برای مثال کاربران Poe به سرعت مدل Claude-3.7 را جایگزین Claude-3.5- کردند.
اوج گرفتن مدلهای استدلالی
مدلهای هوش مصنوعی که تمرکزشان بر «استدلال» (Reasoning) است، در این فصل سهم زیادی از تعاملات کاربران را به خود اختصاص دادند. در ابتدای سال ۲۰۲۵ تنها ۲ درصد پیامها به این مدلها اختصاص داشت؛ اما این عدد با افزایش ۵ برابری به حدود ۱۰ درصد رسیده است.
در این میان مدل Gemini 2.5 Pro تنها در شش هفته توانست ۳۰ درصد از سهم پیامهای استدلالی را به خود اختصاص دهد. از سوی دیگر OpenAI با عرضهی سریع مدلهایی مثل o1-pro، o3-mini، o3، و o4-mini عملاً استاندارد جدیدی در این حوزه تعریف کرده است. کاربران هم تمایل زیادی به استفاده از آخرین نسخهها دارند و تنها طی چند هفته شاهد مهاجرت سریع از o3-mini به o4-mini بودیم.
مدل Grok-3 که توسط xAI عرضه شده و در بنچمارکها نتایج خوبی ثبت کرده بود، بهدلیل محدودیت عملیاتی (فقط Grok-3-mini در API فعال است)، فعلاً کمتر از ۱ درصد از سهم مدلهای استدلالی را دارد.
رقابت داغ در تولید تصویر
تنور رقابت در حوزه تولید تصویر با بهبود کیفیت و دقت مدلها داغ شده. مدل GPT-Image-1 اوپنایآی که اواخر آپریل عرضه شد، تنها طی دو هفته ۱۷٪ از بازار را تصاحب کرد.
سهم خانواده Imagen3 گوگل که سال ۲۰۲۵ را با سهم ۱۰ درصدی شروع کرد، حالا با رشدی خیرهکننده به ۳۰٪ رسیده و با سری FLUX شرکت Black Forest رقابت تنگاتنگی دارد. FLUX که تا پیش از این صدرنشین بلامنازع بود، در بهار ۲۰۲۵ سهمش از ۴۵٪ به ۳۵٪ کاهش یافته ولی همچنان پرچمدار است.
تولید ویدیو: ظهور رقبای جدید
مدلهای Kling از لابراتوار چینی Kuaishou فقط در سه هفته ۳۰٪ از بازار تولید ویدیو با هوش مصنوعی را قبضه کردند؛ آن هم با قدرتنمایی Kling-2.0-Master که در پایان آپریل ۲۱٪ کل ویدیوهای تولیدی را به خود اختصاص داده است.
مدل Veo 2 گوگل هم با حفظ سهم ۲۰ درصدی در ماههای پس از عرضه جایگاه مستحکمی دارد. در مقابل Runway که پیشتاز این حوزه بود، به شدت افت کرده و حالا فقط ۲۰ درصد کاربران برای ساخت ویدیو سراغش میروند.
یکهتازی ElevenLabs در تولید صوت
در حوزه تبدیل متن به گفتار ElevenLabs یک تنه تاج و تخت را تصاحب کرده و با سهم ۸۰درصدی حاکم بلامنازع است. البته نشانههایی از ظهور رقبای جدی دیده میشود و Cartesia، Unreal Speech، PlayAI و Orpheus با ارائه قابلیتهای صوتی جدید، افکتهای متنوع و قیمت رقابتی در حال نزدیک شدن هستند؛ هرچند فعلاً سهمشان زیر ۲۰٪ است.
چشمانداز رقابتی در بازار AI
گزارش پلتفرم Poe نشان میدهد که با افزایش تنوع مدلها و ورود بازیگران جدید، رقابت در حوزههای متنی، تصویری، ویدیویی و صوتی داغتر خواهد شد. همانطور که عرضه مدل تصویرساز OpenAI موجی از هیجان ایجاد کرد، بعید نیست به زودی شاهد تحولات مشابهی در حوزه مدلهای ویدیویی نیز باشیم.
منبع