هوش مصنوعی Minghe Shen 11 Nov 2025 آریادنه: چارچوبی قابل کنترل برای بررسی و گسترش مرزهای استدلال مدلهای دیداری-زبا... بیشتر بخوانید
هوش مصنوعی Weihao Tan 12 Nov 2025 لومین: یک دستورالعمل باز برای ساخت عاملهای عمومی در دنیای باز سهبعدی بیشتر بخوانید
هوش مصنوعی Kangning Zhang 12 Nov 2025 LoopTool: بستن حلقه دادهآموزی برای فراخوانی ابزارهای LLM قوی بیشتر بخوانید
هوش مصنوعی Fangqi Zhu 12 Nov 2025 WMPO: بهینهسازی سیاست مبتنی بر مدل جهانی برای مدلهای بینایی-زبان-عمل بیشتر بخوانید
هوش مصنوعی Aleksandr Razin 13 Nov 2025 یک قدم کوچک در فضای نهفته، یک جهش بزرگ برای پیکسلها: آداپتور مقیاسگذاری سریع ن... بیشتر بخوانید
هوش مصنوعی Tianzhu Ye 13 Nov 2025 تقطیر مدلهای زبانی بزرگ به صورت جعبه سیاه و بر اساس سیاست بیشتر بخوانید
هوش مصنوعی Nikolay Blagoev 12 Nov 2025 سلام بر دزد: بررسی حملات و دفاعها در GRPO غیرمتمرکز بیشتر بخوانید
هوش مصنوعی Haotong Lin 13 Nov 2025 Depth Anything 3: فضای بصری را از هر نمایی بازیابی میکند بیشتر بخوانید
هوش مصنوعی Sreyan Ghosh 13 Nov 2025 موزیک فلامینگو: درک موسیقی را در مدلهای زبان صوتی گسترش میدهد بیشتر بخوانید
هوش مصنوعی Yun He 13 Nov 2025 ارزیابی مبتنی بر معیار و یادگیری تقویتی برای پیشرفت پیروی از دستورالعمل در LLM بیشتر بخوانید
هوش مصنوعی Isabela Albuquerque 13 Nov 2025 معیارسنجی تنوع در تولید تصویر از طریق ارزیابی انسانی شرطی بر اساس ویژگیها بیشتر بخوانید
هوش مصنوعی Xurui Li 13 Nov 2025 MuSc-V2: طبقهبندی و تقسیمبندی ناهنجاریهای صنعتی چندرسانهای بدون نمونهگذاری ... بیشتر بخوانید
هوش مصنوعی Xinyi Wang 13 Nov 2025 AffordBot: استدلال تجسمی دقیق سهبعدی از طریق مدلهای زبانی بزرگ چندرسانهای بیشتر بخوانید
هوش مصنوعی Arman Zarei 12 Nov 2025 SliderEdit: ویرایش مداوم تصویر با کنترل دقیق دستورالعملها بیشتر بخوانید
هوش مصنوعی Gailun Zeng 12 Nov 2025 MM-CRITIC: ارزیابی جامع مدلهای بزرگ چندرسانهای به عنوان نقد چندرسانهای بیشتر بخوانید
هوش مصنوعی Yunkai Zhang 13 Nov 2025 از آن هدر ندهید: راهنمایی توصیهگرهای مولد با استفاده از پیشفرضهای ساختاری انس... بیشتر بخوانید
هوش مصنوعی Isaac Robinson 12 Nov 2025 RF-DETR: جستجوی معماری عصبی برای ترنسفورمرهای تشخیص در زمان واقعی بیشتر بخوانید
هوش مصنوعی Konstantinos M. Dafnis 12 Nov 2025 راهنمایی نهان آگاه از طیف در زمان آزمایش برای تعمیم بدون نمونه در مدلهای بینایی... بیشتر بخوانید
هوش مصنوعی 19 Nov 2025 3 min یک سبک به اندازه یک کد ارزش دارد: باز کردن تولید تصویر از کد به سبک با فضای سبک گسسته بیشتر بخوانید
هوش مصنوعی 18 Nov 2025 3 min MMaDA-Parallel: مدلهای زبانی بزرگ چندرسانهای انتشار برای ویرایش و تولید آگاه به تفکر بیشتر بخوانید
هوش مصنوعی 18 Nov 2025 3 min MVI-Bench: یک معیار جامع برای ارزیابی استحکام در برابر ورودیهای بصری گمراهکننده در LVLMها بیشتر بخوانید