هوش مصنوعی Giorgos Nikolaou 23 Oct 2025 مدلهای زبانی تابع یک به یک هستند و بنابراین معکوسپذیرند بیشتر بخوانید
هوش مصنوعی Yanhong Li 23 Oct 2025 متن یا پیکسل؟ نیمه آن را میگیرد: در مورد کارایی توکن ورودیهای متنی بصری در LLM... بیشتر بخوانید
هوش مصنوعی Aritra Roy 23 Oct 2025 ComProScanner: یک چارچوب مبتنی بر چندعامل برای استخراج دادههای ساختاری با ویژگی... بیشتر بخوانید
هوش مصنوعی Xiaoxi Li 24 Oct 2025 DeepAgent: یک عامل استدلال عمومی با مجموعه ابزارهای مقیاسپذیر بیشتر بخوانید
هوش مصنوعی Yuxuan Bian 23 Oct 2025 Video-As-Prompt: کنترل معنایی یکپارچه برای تولید ویدیو بیشتر بخوانید
هوش مصنوعی Liangyu Chen 23 Oct 2025 UI-Ins: تقویت پایهگذاری رابط کاربری با استفاده از دستورالعمل چندجانبه به عنوان ... بیشتر بخوانید
هوش مصنوعی Yifu Luo 24 Oct 2025 نمونه به نمونه، بهینهسازی با بخش: GRPO سطح بخش برای تولید متن به تصویر بیشتر بخوانید
هوش مصنوعی Bowen Wang 23 Oct 2025 RECALL: کاهش فراموشی فاجعهای با همافزایی مدلهای سلسلهمراتبی متناسب با نمایش بیشتر بخوانید
هوش مصنوعی Kexuan Shi 24 Oct 2025 ادغام مدل با لنگرهای دوگانه عملکردی یک رویکرد نوآورانه است بیشتر بخوانید
هوش مصنوعی Bingjie Gao 23 Oct 2025 RAPO++: بهینهسازی پرامپت در مراحل مختلف برای تولید متن به ویدیو از طریق همراست... بیشتر بخوانید
هوش مصنوعی Runzhe Zhan 23 Oct 2025 مدلهای بزرگ استدلال به عنوان ارزیابهای خوب ترجمه عمل میکنند؟ تحلیل و افزایش ع... بیشتر بخوانید
هوش مصنوعی Hippolyte Pilchen 23 Oct 2025 ARC-Encoder: یادگیری نمایشهای متنی فشرده برای مدلهای زبانی بزرگ بیشتر بخوانید
هوش مصنوعی Samuel Soutullo 23 Oct 2025 ALICE-LRI: یک روش عمومی برای تولید تصویر برداری بدون افت کیفیت از LiDAR چرخشی بد... بیشتر بخوانید
هوش مصنوعی Enshu Liu 23 Oct 2025 رمزگشایی تقطیری ۲: نمونهبرداری یکمرحلهای از مدلهای خودرگرسیو تصویر با تقطیر ... بیشتر بخوانید
هوش مصنوعی Penghao Wang 23 Oct 2025 PartNeXt: یک مجموعه داده نسل بعد برای درک دقیق و سلسلهمراتبی اجزای سهبعدی بیشتر بخوانید
هوش مصنوعی Jiyu Cui 23 Oct 2025 L^2M^3OF: یک مدل چندرسانهای زبان بزرگ برای چارچوبهای فلزی-آلی بیشتر بخوانید
هوش مصنوعی 19 Nov 2025 3 min یک سبک به اندازه یک کد ارزش دارد: باز کردن تولید تصویر از کد به سبک با فضای سبک گسسته بیشتر بخوانید
هوش مصنوعی 18 Nov 2025 3 min MMaDA-Parallel: مدلهای زبانی بزرگ چندرسانهای انتشار برای ویرایش و تولید آگاه به تفکر بیشتر بخوانید
هوش مصنوعی 18 Nov 2025 3 min MVI-Bench: یک معیار جامع برای ارزیابی استحکام در برابر ورودیهای بصری گمراهکننده در LVLMها بیشتر بخوانید