AI-модели — 300+ нейросетей через единый API
Каталог нейросетей от OpenAI, Anthropic, Google, Meta, xAI и DeepSeek. Фильтруйте по провайдеру, категории и цене. Все модели доступны через единый API с оплатой в BYN.
332 моделей
Claude Opus 4.8 - самая способная общедоступная модель Anthropic в семействе Opus. Принимает text, image и file на вход с текстовым выводом, поддерживает reasoning и контекст до 1M токенов.
DeepSeek V4 Pro - large-scale MoE от DeepSeek с 1.6T общих и 49B активных параметров; контекст 1M. Advanced reasoning, coding и long-horizon agent workflows; та же архитектура что у V4 Flash с hybrid attention и множеством reasoning режимов.
Z.AI GLM-5.1 - major прирост в coding возможностях, особенно в long-horizon задачах. В отличие от прошлых моделей рассчитанных на минутные взаимодействия, GLM-5.1 работает независимо и непрерывно над одной задачей 8+ часов: автономно планирует, выполняет и refinines работу.
GPT-5.5 Pro - high-capability модель OpenAI оптимизирована под deep reasoning и точность на сложных high-stakes задачах. Контекст 1M+ (922K input, 128K output), text и image input; long-horizon problem solving, agentic coding, precise execution в multi-step workflows.
xAI Grok 4.3 - reasoning-модель xAI. Принимает text и image входы с text выходом; подходит для agentic workflows, instruction-following и приложений требующих factual точности.
Moonshot Kimi K2.6 - multimodal модель нового поколения для long-range coding workflows, code-centered UI/UX создания и multi-agent координации. End-to-end development в Python, Rust, Go; промпт и visual inputs → production interfaces; swarm-based архитектура до сотен parallel sub-agents.
Mistral Medium 3.5 - dense 128B instruction-following модель Mistral AI с text/image вход и text выход. Для agentic workflows, coding и сложных задач.
Qwen3.7-Max - флагман серии Alibaba Qwen3.7. Заточен под agent-centric workloads, coding, office и productivity задачи.
Command A - open-weights 111B параметровая модель Cohere с контекстом 256K. Заточена под agentic, multilingual и coding use cases; high-performance при низких hardware-расходах для business-критичных workflows с reasoning и tool use.
Llama 4 Maverick 17B Instruct (128E) - high-capacity multimodal LLM Meta на MoE архитектуре с 128 экспертами и 17B активных параметров за forward pass.
Amazon Nova Premier - наиболее способная multimodal модель Amazon для сложных reasoning-задач и distillation базы для кастомных моделей.
Fast-mode вариант Claude Opus 4.6 - идентичные возможности с увеличенной скоростью отдачи токенов. Премиум 6× от обычного pricing.
Claude Opus 4.7 - следующее поколение Opus от Anthropic, построенное под long-running асинхронные агенты. Развитие coding и agentic сильных сторон Opus 4.6 с приростом в долгих сессиях.
Fast-mode вариант Claude Opus 4.7 - идентичные возможности с увеличенной скоростью отдачи токенов. Премиум 6× от обычного pricing.
Claude Opus 4.8 Fast - fast-mode вариант Opus 4.8 с идентичными возможностями и повышенной скоростью вывода. Тарифицируется в 2× относительно обычной Opus 4.8.
DeepSeek V4 Flash - efficiency-focused MoE от DeepSeek с 284B общих и 13B активных параметров; контекст 1M. Hybrid attention для длинных контекстов; настраиваемые reasoning режимы. Для coding-ассистентов, chat, agent workflows.
Gemini 3.1 Flash Lite Preview - high-efficiency модель Google для high-throughput high-volume использования. Лучше Gemini 2.5 Flash Lite, близко к 2.5 Flash; audio input/ASR, RAG snippet ranking, translation, data extraction, code completion; configurable thinking levels.
Gemini 3.5 Flash - high-efficiency multimodal модель Google с near-Pro уровнем coding и reasoning по цене Flash. Заточена под coding и parallel agentic execution loops; text, image, video, audio, PDF на входе.
Gemma 4 26B A4B IT - instruction-tuned MoE модель Google DeepMind. 25.2B общих и 3.8B активных параметров за токен (производительность около 31B при заметно меньших вычислениях). Multimodal вход (text/image/video до 60 секунд при 1 fps), контекст 256K, native function calling, adjustable thinking mode, structured outputs; Apache 2.0.
Gemma 4 31B Instruct - dense 30.7B multimodal модель Google DeepMind с text/image входом и text выходом. Контекст 256K, configurable thinking режим, native function calling.
Z.AI GLM-5V-Turbo - первая native multimodal agent foundation модель Z.AI для vision-based кодирования и agent задач. Нативно принимает image, video, text входы; long-horizon планирование и сложный coding.
GPT-5.5 - frontier-модель OpenAI для сложных профессиональных задач, развитие GPT-5.4 с более сильным reasoning, надёжностью и token efficiency на hard задачах. Контекст 1M+ токенов (922K input, 128K output), text и image input; large-scale reasoning, coding, multimodal workflows в единой системе.
GPT Image 2 - SOTA image generation модель OpenAI для быстрой high-quality генерации и редактирования. Поддерживает гибкие размеры и high-fidelity image inputs.
GPT-5.4 Image 2 - сочетание GPT-5.4 с SOTA image generation от GPT Image 2. Multimodal workflows для перехода между reasoning, coding и созданием визуала.
IBM Granite 4.1 8B - dense decoder-only 8B LLM из семейства Granite 4.1. Контекст 131K, заточена под enterprise задачи.
xAI Grok 4.20 Beta - флагман-reasoning модель xAI с industry-leading скоростью и advanced agentic tool-calling. Одна из самых низких hallucination rates на рынке и сильное prompt adherence.
xAI Grok 4.20 Multi-Agent - вариант Grok 4.20 для collaborative agent-based workflows. Несколько агентов работают параллельно для deep research, координации tool use и синтеза информации.
xAI Grok Build 0.1 - быстрая coding-модель xAI тренированная специально под agentic software engineering. Text и image входы с text выходом; оптимизирована под interactive coding.
Tencent Hy3 preview - high-efficiency MoE модель от Tencent для agentic workflows и production. Configurable reasoning levels (disabled, low, high).
InclusionAI Ling-2.6-1T - instant (instruct) модель, trillion-параметровый флагман компании. Для real-world агентов требующих быстрого исполнения и эффективности на масштабе; «fast» подход.
InclusionAI Ling-2.6-flash - instant (instruct) модель с 104B общих и 7.4B активных параметров. Для real-world агентов с быстрыми ответами, сильным execution и высокой token efficiency.
MiMo-V2.5 - native omnimodal модель Xiaomi. Pro-уровень agentic производительности при ~половине inference cost; превосходит MiMo-V2-Omni в multimodal perception (image, video understanding).
MiMo-V2.5-Pro - флагман Xiaomi с сильной производительностью в general agentic возможностях, сложном software engineering и long-horizon задачах. Топ-результаты на ClawEval, GDPVal, SWE-bench Pro.
Perceptron Mk1 (Mark One) - высококачественная vision-language модель Perceptron для video и embodied reasoning. Принимает image/video с natural language запросами; детальное visual understanding.
Qwen3.5 Plus - large-scale multimodal LLM от Alibaba. Принимает text/image/video, выдаёт text; контекст 1M токенов.
Qwen3.6 27B - dense 27B LLM от Qwen Team Alibaba. Hybrid multimodal: text, image, video на входе.
Qwen3.6-35B-A3B - open-weight multimodal модель Alibaba Cloud с 35B общих и 3B активных параметров. Hybrid sparse MoE с Gated Attention.
Qwen3.6 Flash - быстрая модель серии Qwen 3.6 от Alibaba. Принимает text, image, video; контекст 1M токенов. Tiered pricing.
Qwen3.6-Max-Preview - proprietary frontier модель Alibaba Cloud на sparse MoE с ~1T общих параметров. Заточена под agentic coding, tool use.
Qwen 3.6 Plus - модель на гибридной архитектуре с linear attention + sparse MoE routing. Прирост относительно серии 3.5.
InclusionAI Ring-2.6-1T - thinking-модель масштаба 1T с 63B активных параметров. Для real-world agent workflows требующих сильных capability и operational efficiency; coding-агенты, tool use.
Arcee Trinity Large Thinking - open-source reasoning-модель. Сильна на PinchBench, agentic workloads и reasoning задачах.
Aion-1.0 - multi-model система AionLabs для high-performance reasoning и coding. Построена на базе DeepSeek-R1 с дополнительными моделями и техниками вроде Tree-of-Thoughts.
Aion-1.0-Mini - 32B-дистилляция DeepSeek-R1 от AionLabs. Заточена под reasoning в математике, кодировании и логике; модифицированный вариант базовой R1.
Aion-2.0 - вариант DeepSeek V3.2 оптимизированный AionLabs под immersive roleplay и storytelling. Особенно сильна в создании tension, кризисов и конфликтов в нарративе.
Aion-RP-Llama-3.1-8B - fine-tuned base модель AionLabs занявшая первое место в character evaluation на бенчмарке RPBench-Auto (roleplay-вариант Arena-Hard-Auto).
Claude 3 Haiku - самая быстрая и компактная модель Anthropic для near-instant отзывчивости. Точная targeted производительность.
Claude 3.5 Haiku - самая быстрая модель Anthropic с улучшенным coding, tool use и reasoning. Заточена под high-interactivity и low-latency: user-facing chatbots, on-the-fly code completions, data extraction, real-time content moderation. Не поддерживает image input.
Claude Haiku 4.5 - самая быстрая и эффективная модель Anthropic с near-frontier интеллектом по сниженной цене и latency. Сопоставима с Claude Sonnet 4 в reasoning, coding и computer-use; контролируемая reasoning depth, summarized/interleaved thinking; tool-assisted workflows. 73%+ на SWE-bench Verified.
Claude Opus 4 - модель Anthropic с устойчивой производительностью на сложных long-running задачах и agent workflows. На момент релиза - топ в кодировании.
Claude Opus 4.1 - обновлённая флагман-модель Anthropic с приростом в кодировании, reasoning и agentic задачах. 74.5% на SWE-bench Verified; multi-file refactoring, debugging precision, detail-oriented reasoning. Extended thinking до 64K.
Claude Opus 4.5 - reasoning-модель Anthropic для сложного software engineering, agent workflows и extended computer use. Multimodal, защита от prompt injection, регулируемая token efficiency через параметр effort.
Claude Opus 4.6 - наиболее продвинутая модель Anthropic для программирования и длинных профессиональных задач. Заточена под агентов работающих через целые workflows (большие codebases, сложный refactoring, multi-stage debugging); глубокая контекстная осведомлённость, надёжность в challenging engineering сценариях.
Claude Sonnet 4 - модель следующего поколения Anthropic с заметным приростом в coding и reasoning над Sonnet 3.7. SOTA на SWE-bench (72.7%), баланс capability и computational efficiency; улучшенная навигация по codebases, меньше ошибок, надёжнее follow-instruction.
Claude Sonnet 4.5 - наиболее продвинутая Sonnet от Anthropic для real-world агентов и coding workflows. SOTA на SWE-bench Verified; system design, code security, following specifications; extended autonomous operation с task continuity, fact-based progress tracking, tool orchestration и speculative parallel execution.
Claude Sonnet 4.6 - наиболее способная Sonnet-class модель Anthropic с frontier производительностью в coding, agentic задачах и профессиональной работе. Iterative development, navigation сложных codebases, end-to-end project management с памятью, создание polished документов, reliable computer use для web QA и workflow automation.
Code LLaMA Instruct 7B Solidity - 7B fine-tune Code LLaMA для генерации Solidity smart contracts через 4-bit QLoRA fine-tuning (PEFT library).
Arcee Coder-Large - 32B модель на основе Qwen 2.5-Instruct, дообученная на permissively-licensed GitHub, CodeSearchNet и synthetic bug-fix корпусах. Контекст 32K для multi-file работы.
Mistral Codestral - LLM Mistral для кода, специализируется на low-latency high-frequency задачах (fill-in-the-middle, code correction, test generation). Оптимизирована под productivity разработчика, поддержка широкого спектра языков программирования.
Deep Cogito v2.1 671B MoE - одна из сильнейших open моделей глобально, сопоставимая по производительности с frontier closed и open моделями. Тренирована через self-play с reinforcement learning.
Cohere Command R (08-2024) - обновление Command R с приростом в multilingual RAG и tool use. Лучше в математике, коде и reasoning.
Cohere Command R+ (08-2024) - обновление Command R+ с ~50% выше throughput и ~25% ниже latency при том же hardware footprint.
Cohere Command R7B (12-2024) - компактный быстрый апдейт Command R+. Заточен под RAG, tool use, агентов и задачи требующие сложного reasoning.
TheDrummer Cydonia 24B v4.1 - uncensored creative writing модель на базе Mistral Small 3.2 24B. Хорошее recall, prompt adherence и интеллект.
DeepSeek V3 - 685B MoE модель, последняя итерация флагман-серии чат-моделей DeepSeek. Последующая версия предыдущей V3, сильна на разнообразных задачах.
DeepSeek-V3.1 - 671B hybrid reasoning модель (37B активных) с поддержкой thinking/non-thinking режимов через prompt templates. Two-phase long-context training до 128K, FP8 microscaling для efficient inference. Tool use, code generation, reasoning; structured tool calling, code/search агенты.
DeepSeek V3 - 685B MoE модель, последняя итерация флагман-серии чат-моделей DeepSeek. Развитие предыдущих версий в instruction-following и coding; pre-trained на ~15T токенов.
DeepSeek V3.1 - модель серии V3.1 от DeepSeek (no source description; данные о hybrid reasoning см. в deepseek-chat-v3.1).
DeepSeek V3.1 Nex-N1 - флагман-релиз серии Nex-N1, post-trained модель с фокусом на agent autonomy, tool use и real-world productivity.
DeepSeek-V3.1 Terminus - обновление DeepSeek V3.1 сохраняющее оригинальные возможности и адресующее проблемы пользователей (language consistency, agent capabilities).
DeepSeek-V3.2 - LLM оптимизированная под высокую computational efficiency и сильный tool-use reasoning. DeepSeek Sparse Attention (DSA) снижает стоимость training и inference; scalable RL post-training; топ-результаты на 2025 IMO и IOI.
DeepSeek-V3.2-Exp - экспериментальная LLM DeepSeek как промежуточный шаг между V3.1 и будущими архитектурами. Использует DeepSeek Sparse Attention (DSA) для эффективности на длинных контекстах.
DeepSeek-V3.2-Speciale - high-compute вариант V3.2 оптимизированный под максимум reasoning и agentic производительности. Развивает DSA с масштабированным post-training RL.
Mistral Devstral 2 - open-source SOTA модель Mistral для agentic coding. 123B dense transformer с контекстом 256K, поддержка exploring.
Mistral Devstral Medium - high-performance code-generation и agentic reasoning модель Mistral AI совместно с All Hands AI. Шаг выше Devstral Small.
Mistral Devstral Small 1.1 - 24B open-weight LLM для software engineering агентов от Mistral AI и All Hands AI. Fine-tune Mistral Small 3.1.
Eleven-Multilingual-v1 - ранняя multilingual TTS модель ElevenLabs. Поддержка множества языков и надёжная natural-sounding voice generation.
Eleven-Multilingual-v2 - наиболее продвинутая multilingual TTS модель ElevenLabs. High-quality синтез голоса на разных языках с улучшенным реализмом и выразительностью.
Eleven-Turbo-v2 - English-optimized TTS модель ElevenLabs для быстрого high-quality синтеза с низкой latency. Для real-time приложений и интерактивных voice-систем.
Eleven v3 - самая выразительная text-to-speech модель ElevenLabs с поддержкой 70+ языков, multi-speaker диалогов и audio-тегов вроде [excited], [whispers], [laughs]. Даёт высокий реализм и тонкий контроль над речью.
ERNIE 4.5 21B - MoE-модель Baidu с 21B общих параметров и 3B активных за токен. Multimodal understanding и генерация через heterogeneous MoE и modality-isolated routing.
ERNIE-4.5-21B-A3B-Thinking - обновлённая lightweight MoE Baidu с углублённым reasoning. Для logical puzzles, math, science, coding, text generation и expert-level academic бенчмарков.
ERNIE-4.5-300B-A47B - 300B MoE LLM от Baidu (серия ERNIE 4.5). Активирует 47B параметров за токен, text generation.
ERNIE 4.5 VL 28B - multimodal MoE chat модель с 28B общих и 3B активных параметров. Text и vision понимание через heterogeneous MoE с modality-isolated routing.
ERNIE-4.5-VL-424B-A47B - multimodal MoE Baidu (серия ERNIE 4.5) с 424B общих и 47B активных параметров. Тренирована совместно на text и image data.
Flux-1-Kontext-Max - премиум text-based image editing модель Black Forest Labs. Максимальная производительность и advanced typography generation для трансформации изображений через natural language.
Flux-1-Kontext-Pro - text-based image editing модель Black Forest Labs с high-quality prompt-adherent выходом. Оптимизирована под consistent результаты и advanced editing.
Flux-1-Krea-Dev - 12B rectified flow transformer от Black Forest Labs и Krea. Фокус на aesthetic photography; guidance distillation для эффективного inference, открытые веса.
Flux-1-Pro - text-to-image модель Black Forest Labs для high-quality реалистичных изображений и чёткого текста. Для коммерческих и creative проектов.
Flux-1.1-Pro - улучшение Flux 1.0 Pro от Black Forest Labs с быстрой генерацией, улучшенным качеством и prompt adherence.
Flux-1.1-Pro-Ultra - high-resolution high-speed модель Black Forest Labs до 4MP (миллионов пикселей). Для professional printing, fine art и приложений требующих исключительной детализации.
Flux 2 Dev - open-weight image-модель Black Forest Labs серии Flux 2 (no source description).
FLUX.2 [flex] - рендеринг сложного текста, типографики и тонких деталей. Поддерживает multi-reference editing в единой архитектуре.
FLUX.2 [klein] 4B - самая быстрая и бюджетная модель семейства FLUX.2. Заточена под high-throughput workloads при сохранении хорошего качества изображения.
FLUX.2 [max] - SOTA image generation и advanced image editing с реализмом, точностью и consistency.
FLUX.2 [pro] - для high-quality манипуляции изображениями, style transfer и sequential editing workflows.
Flux Schnell Uncensored - uncensored fine-tune быстрой image-модели Flux Schnell (no source description).
Gemini Flash 2.0 - заметно быстрее времени до первого токена (TTFT) относительно предыдущих версий при сравнимом качестве с большими моделями. Улучшения в multimodal понимании, кодировании, сложных инструкциях и function calling для agentic workflows.
Gemini 2.0 Flash Lite - оптимизирована под крайне быстрые ответы и низкую цену при сохранении качества больших моделей. Для real-time и масштабных приложений.
Gemini 2.0 Flash Thinking - reasoning-вариант Gemini 2.0 Flash от Google (no source description).
Gemini 2.5 Flash - high-performance workhorse модель Google для advanced reasoning, coding, math и scientific задач. Встроенный «thinking»-режим настраивается через параметр max-tokens-for-reasoning.
Gemini 2.5 Flash Image (Nano Banana) - SOTA image generation модель с сильным контекстуальным пониманием. Image generation, editing и multi-turn conversational interaction.
Gemini 2.5 Flash-Lite - облегчённая reasoning-модель серии Gemini 2.5 для крайне низкой latency и cost efficiency. Выше throughput, быстрее token generation, прирост на бенчмарках относительно прошлых Flash.
Gemini 2.5 Pro - SOTA модель Google для advanced reasoning, coding, math и scientific задач. Использует «thinking»-возможности для nuanced контекста; первое место в LMArena leaderboard.
Gemini 3 Flash Preview - high-speed cost-effective reasoning-модель для agent-driven workflows, multi-turn диалога и coding поддержки. Near-Pro уровень reasoning и tool use при заметно меньшей latency; прирост в reasoning, multimodal понимании и надёжности относительно 2.5 Flash; контекст 1M.
Gemini 3 Pro Image Preview (Nano Banana Pro) - продвинутая image generation и editing модель Google на базе Gemini 3 Pro. Улучшения multimodal reasoning, real-world grounding и high-fidelity visual synthesis; sophisticated text rendering в картинках, multi-image blending, identity preservation; Search grounding для актуальной информации.
Gemini 3.1 Pro Preview - frontier reasoning модель Google с приростом software engineering, надёжного agent поведения и token efficiency. На фундаменте Gemini 3; reasoning по text/image/video/audio/code с контекстом 1M; улучшения в SWE-бенчмарках и autonomous task execution.
Gemma 2 27B от Google - open модель построенная на технологиях Gemini. Подходит для разных задач.
Gemma 3 - multimodal модель Google с поддержкой vision-language входа и text выхода. Контекст до 128K, 140+ языков; прирост в math, reasoning, chat, structured outputs и function calling.
Gemma 3 27B - open-source multimodal модель Google. Vision-language вход с text выходом, контекст 128K, 140+ языков. Прирост в math, reasoning, chat, structured outputs и function calling.
Gemma 3 4B - multimodal модель Google с поддержкой vision-language входа и text выхода. Контекст 128K, 140+ языков; прирост в math, reasoning и chat.
Gemma 3n E4B - оптимизирована под efficient execution на mobile и low-resource устройствах (телефоны, ноутбуки, планшеты). Multimodal вход: text, visual data, audio.
Zhipu GLM 4 32B - cost-effective foundation LLM. Эффективно выполняет сложные задачи; заметно улучшенные tool use, online search и code-related интеллектуальные задачи.
Z.AI GLM-4.5 - флагман foundation модель специально для agent-based приложений. MoE архитектура, контекст до 128K; прирост в reasoning, code generation, agent alignment. Hybrid inference: «thinking mode» для сложного reasoning и tool use, «non-thinking» для instant ответов.
Z.AI GLM-4.5-Air - lightweight вариант флагман-семейства для agent-focused приложений. Как GLM-4.5 использует MoE архитектуру, но меньше параметров; hybrid inference modes (thinking/non-thinking).
Z.AI GLM-4.5V - vision-language foundation модель для multimodal agent приложений. MoE с 106B общих и 12B активных параметров; SOTA в video understanding.
Z.AI GLM-4.6 - последняя версия серии GLM с контекстом 200K (выросло с 128K в GLM-4.5). Прирост в coding (бенчмарки + real-world результаты, front-end code generation), reasoning, tool use, agent frameworks и письме.
Z.AI GLM-4.6V - large multimodal модель для high-fidelity visual understanding и long-context reasoning по картинкам, документам и mixed media. До 128K токенов, сложные page layouts.
Z.AI GLM-4.7 - флагман с улучшениями в двух главных аспектах: улучшенные programming возможности и большая стабильность в multi-step reasoning и execution. Заметный прогресс в сложных agent задачах, более естественные разговоры, enhanced front-end design.
Z.AI GLM-4.7-Flash - SOTA 30B-класс модель с балансом эффективности и производительности. Оптимизирована под agentic coding: coding-навыки, long-term планирование задач, tool integration; leading результаты среди open-source моделей своего размера.
Z.AI GLM-5 - флагман open-source foundation модель для advanced systems engineering и handling long-term agent workflows. Production-уровень на extensive programming, сопоставима с топовыми proprietary; agent planning, backend reasoning, iterative self-improvement.
Z.AI GLM-5 Turbo - новая модель для быстрого inference и сильной производительности в agent окружениях вроде OpenClaw. Real-world agent workflows с длинными цепочками выполнения; декомпозиция сложных инструкций, tool use, scheduled и persistent execution.
GPT-5.1 - frontier-grade модель серии GPT-5 со более сильным general-purpose reasoning, лучшим instruction adherence и более естественным conversational style относительно GPT-5. Adaptive reasoning - быстрые ответы на простые запросы и глубокий анализ на сложных задачах.
GPT-5.1 Chat (Instant) - быстрый lightweight член семейства 5.1, оптимизирован под low-latency chat с сильным general intelligence. Adaptive reasoning селективно «думает» на сложных запросах; warmer и conversational по умолчанию; стабильнее short-form reasoning.
GPT-5.1-Codex - специализированная версия GPT-5.1 для software engineering и coding workflows. Интерактивные dev-сессии и long независимое выполнение; построение с нуля, feature development, debugging, large-scale refactoring, code review. Выше steerability и более чистый код.
GPT-5.1-Codex-Max - новейшая agentic coding модель OpenAI для extended high-context software development. Построена на обновлённой 5.1 reasoning stack, тренирована на agentic workflows (software engineering, math, research). Быстрее, лучше reasoning и token efficiency.
GPT-5.1-Codex-Mini - меньший и более быстрый вариант GPT-5.1-Codex.
GPT-5.2 Chat (Instant) - быстрый lightweight член семейства 5.2 для low-latency chat с сильным general intelligence. Adaptive reasoning селективно «думает» на сложных запросах; warmer и conversational.
GPT-5.2-Codex - улучшенная версия GPT-5.1-Codex для software engineering и coding workflows. Интерактивные сессии и long независимое выполнение; точнее следует инструкциям, более чистый и качественный код; интеграция с CLI, IDE, GitHub, cloud.
GPT-5.2 Pro - наиболее продвинутая модель OpenAI с major приростом в agentic coding и long-context производительности относительно GPT-5 Pro. Step-by-step reasoning, precise instruction-following, accuracy в критических сценариях; advanced test-time routing.
GPT-5.4 - frontier-модель OpenAI объединяющая семейства Codex и GPT в единую систему. Контекст 1M+ токенов (922K input, 128K output), text и image input; high-context reasoning, coding и multimodal анализ. Прирост в coding, document understanding, tool use и instruction-following.
GPT-5.4 mini - основные возможности GPT-5.4 в более быстрой и эффективной модели для high-throughput workloads. Text и image input, сильная производительность в reasoning, coding и tool use при сниженной latency и стоимости.
GPT-5.4 nano - самый лёгкий и cost-efficient вариант семейства GPT-5.4 для speed-sensitive high-volume задач. Text и image input; low-latency: классификация, data extraction, ranking, sub-agent execution.
GPT-5.4 Pro - наиболее способная модель OpenAI расширяющая unified архитектуру GPT-5.4 с более сильным reasoning для complex high-stakes задач. Контекст 1M+ (922K input, 128K output), text/image input; agentic coding, long-context workflows, multi-step problem solving.
GPT-audio - первая generally-available audio модель OpenAI. Upgraded decoder для более natural-sounding голосов, лучшая voice consistency.
GPT-audio Mini - cost-efficient версия GPT Audio. Upgraded decoder для natural голосов, лучшая voice consistency; цена $0.60 за миллион input.
GPT-image-1 - SOTA image generation модель OpenAI. Natively multimodal LLM принимающий text и image на входе с image выходом; powers ChatGPT image generation; исключительная prompt adherence, высокий уровень деталей.
GPT-Image-1.5 - флагман image generation и editing модели OpenAI для точного, естественного и быстрого создания. Надёжно следует инструкциям до тонких деталей (lighting, composition, facial likeness across edits); широкий спектр editing задач (addition, removal, stylization, combination, advanced text rendering). Генерация до 4× быстрее.
GPT-OSS-120B - open-weight 117B MoE LLM OpenAI для high-reasoning, agentic и general-purpose production. Активирует 5.1B параметров за forward pass, оптимизирована под deployment на single H100 GPU с native MXFP4 quantization; configurable reasoning depth, full chain-of-thought, native tool use (function calling, browsing, structured outputs).
GPT-OSS-20B - 21B open-weight MoE модель OpenAI под Apache 2.0. 3.6B активных параметров, оптимизирована под low-latency inference на consumer или single-GPU; тренирована в OpenAI Harmony response format, поддержка reasoning levels, fine-tuning, function calling, structured outputs.
GPT-OSS Safeguard 20B - safety reasoning модель OpenAI на базе gpt-oss-20b. Open-weight 21B MoE с низкой latency для safety задач (content classification, LLM filtering, trust).
GPT-3.5 Turbo - самая быстрая модель OpenAI. Понимает и генерирует natural language или код; оптимизирована под chat и traditional completion задачи. Training data до сентября 2021.
GPT-3.5 Turbo 16K - в четыре раза больше контекста gpt-3.5-turbo (~20 страниц текста за запрос) при более высокой цене. Training data до сентября 2021.
GPT-3.5 Turbo Instruct - вариант GPT-3.5 Turbo тюненный под instructional промпты без chat-related оптимизаций. Training data до сентября 2021.
OpenAI GPT-4 Turbo - последняя GPT-4 Turbo с vision-возможностями. JSON mode, function calling; training data до декабря 2023.
OpenAI GPT-4 - флагман-LLM, large-scale multimodal с решением сложных задач выше точности предыдущих моделей за счёт более широких знаний и продвинутого reasoning.
GPT-4.1 - флагман-LLM OpenAI оптимизирован под advanced instruction-following, real-world software engineering и long-context reasoning. Контекст 1M токенов; обходит GPT-4o и GPT-4.5 в coding (54.6% SWE-bench Verified), instruction compliance (87.4% IFEval), multimodal understanding. Точные code diffs, надёжность агентов, high recall.
GPT-4.1 Mini - средняя модель GPT-4.1 с производительностью конкурентной GPT-4o при заметно меньшей latency и стоимости. Контекст 1M, 45.1% на hard бенчмарках; сильна в coding и vision.
GPT-4.1 Nano - самая быстрая и cost-effective модель серии GPT-4.1 для low-latency задач (классификация, autocompletion). Контекст 1M токенов, исключительная производительность для размера.
GPT-4o («o» от «omni») - multimodal модель OpenAI с поддержкой text и image на входе и text выходом. Прирост в non-English языках и visual understanding; быстрее и дешевле предыдущих моделей.
GPT-4o-audio-preview - расширение GPT-4o с поддержкой audio на входе в качестве промпта. Различает нюансы аудиозаписей; добавляет глубину user experiences. Audio выходы.
GPT-4o mini - наиболее продвинутая small модель OpenAI с поддержкой text и image на входе и text выходом. Cost-effective, SOTA в своём размере, обходит более крупные модели на ключевых бенчмарках.
GPT-4o mini TTS - text-to-speech модель на базе GPT-4o mini. Преобразование текста в natural-sounding spoken audio.
GPT-4o Search Preview - специализированный вариант GPT-4o для web search в Chat Completions. Тренирован понимать и выполнять web search запросы.
GPT-4o mini Search Preview - специализированная модель для web search в Chat Completions. Тренирована понимать и выполнять web search запросы.
OpenAI GPT-5 - наиболее продвинутая модель OpenAI с major приростом в reasoning, качестве кода и user experience. Заточена под сложные задачи требующие step-by-step reasoning, instruction-following и точности.
GPT-5 Chat - тонко настроена под advanced natural multimodal и context-aware разговоры в enterprise приложениях. Расширенное удержание контекста и понимание user intent.
GPT-5-Codex - специализированная версия GPT-5 для software engineering и coding. Для интерактивных dev-сессий и long независимого выполнения сложных engineering задач; построение проектов с нуля, новые фичи, debugging, large-scale refactoring, code review. Выше steerability, точнее следует инструкциям разработчика.
GPT-5 Image - GPT-5 в комбинации с SOTA image generation возможностями. Major прирост в reasoning, качестве кода и UX; включает superior instruction-following от GPT Image 1.
GPT-5 Image Mini - сочетает language возможности GPT-5 Mini с GPT Image 1 Mini для эффективной image generation. Native multimodal с superior instruction-following.
GPT-5 Mini - компактный вариант GPT-5 для lightweight reasoning и chat задач. Сохраняет instruction-following и safety features при сниженной latency и стоимости; преемник o4-mini.
GPT-5-Nano - самый маленький и быстрый член семейства GPT-5 для dev-инструментов, быстрых user interactions и ultra-low latency окружений. Ограничен в reasoning depth относительно крупных, сохраняет instruction-following и safety; преемник GPT-4.1-nano.
GPT-5 Pro - наиболее продвинутая модель OpenAI с major приростом в reasoning, качестве кода и UX. Заточена под сложные задачи требующие step-by-step reasoning, instruction-following и точности.
GPT-5.2 - frontier-grade модель серии GPT-5 с более сильными agentic возможностями и long-context производительностью относительно GPT-5.1. Adaptive reasoning динамически распределяет ресурсы для быстрых ответов и глубокого анализа; прирост в math, programming, science, tool use.
GPT-5.3 Chat - обновление наиболее используемой модели ChatGPT для плавных, useful и directly helpful повседневных разговоров. Точнее ответы с лучшей contextualization, заметно меньше ненужных отказов и излишних caveats.
GPT-5.3-Codex - наиболее продвинутая agentic coding модель OpenAI, сочетающая frontier software engineering производительность GPT-5.2-Codex с более широким reasoning и professional knowledge GPT-5.2. SOTA на SWE-Bench Pro, сильна на Terminal-Bench 2.0 и OSWorld-Verified; multi-language coding, terminal fluency, real-world computer-use.
IBM Granite-4.0-H-Micro - 3B модель из семейства Granite 4. Fine-tuned под длинные задачи; серия enterprise моделей IBM.
Nous Hermes 3 - generalist LLM с улучшениями над Hermes 2: advanced agentic capabilities, лучше roleplay, reasoning, multi-turn разговор, long-context coherence.
Nous Hermes 3 на Llama 3.1 70B - generalist LLM с улучшениями над Hermes 2: advanced agentic capabilities, лучше roleplay, reasoning, multi-turn разговор, long-context coherence.
Nous Hermes 4 - large-scale reasoning модель на Meta-Llama-3.1-405B от Nous Research. Hybrid reasoning режим: модель может deliberate internally.
Nous Hermes 4 70B - hybrid reasoning модель Nous Research на базе Meta-Llama-3.1-70B. Тот же hybrid режим что у 405B релиза.
Tencent Hunyuan-A13B - 13B активных параметров MoE LLM от Tencent (80B общих) с поддержкой reasoning через Chain-of-Thought. Конкурентные бенчмарки.
Tencent Hunyuan Image 3.0 - native multimodal модель Tencent для unified multimodal понимания и генерации в autoregressive фреймворке. Крупнейшая open-source image MoE - 80B параметров и 64 эксперта; SOTA photorealistic imagery, prompt fidelity; intelligent world knowledge reasoning обогащает sparse промпты.
Imagen-4 - text-to-image модель Google для photorealistic качества, улучшенных fine деталей, advanced spelling и typography, высокой точности по разным художественным стилям. Включает SynthID watermarking для AI-generated content идентификации.
Inflection 3 Pi - модель чат-приложения Pi (backstory, emotional intelligence, productivity, safety). Доступ к свежим новостям; для customer support и roleplay.
Inflection 3 Productivity - оптимизирована под следование инструкциям. Лучше для задач требующих JSON-вывода или точного следования предоставленным guidelines; доступ к свежим новостям.
INTELLECT-3 - 106B MoE модель (12B активных) post-trained из GLM-4.5-Air-Base через SFT + large-scale RL. SOTA для размера в math и других задачах.
Jamba Large 1.7 - последняя модель в open-семействе Jamba от AI21 с приростом в grounding, instruction-following и эффективности. Построена на гибридной SSM-Transformer архитектуре с контекстом 256K.
KAT-Coder-Pro V2 - high-performance модель серии KwaiKAT KAT-Coder от Kuaishou. Заточена под complex enterprise-grade software engineering и SaaS интеграцию; развитие agentic coding сильных сторон предыдущих версий.
Moonshot Kimi K2 Instruct - large-scale MoE LLM от Moonshot AI с 1T общих и 32B активных параметров за forward pass. Заточена под agentic capabilities: tool use, reasoning, code synthesis. Бенчмарки: LiveCodeBench, SWE-bench, ZebraLogic, GPQA, Tau2, AceBench; long-context до 128K; MuonClip optimizer.
Moonshot Kimi K2 Thinking - open reasoning-модель серии K2 для agentic long-horizon reasoning. Trillion-параметровая MoE с 32B активных, контекст 256K; persistent step-by-step thought, dynamic tool use, multi-agent поведение через 200-300 tool calls. Рекорды на HLE, BrowseComp, SWE-Multilingual, LiveCodeBench.
Moonshot Kimi K2.5 - proprietary multimodal модель Moonshot AI с SOTA visual coding и self-directed agent swarm подходом. Развита из Kimi K2 + ~15T смешанных visual/text токенов; general reasoning, visual coding, autonomous tool invocation.
Liquid LFM2-24B-A2B - крупнейшая модель семейства LFM2 на гибридной архитектуре для efficient on-device deployment. 24B MoE с 2B активных параметров.
Meta Llama 3 70B Instruct - модель Meta оптимизированная под high-quality диалог. Сильная производительность на human evaluations; для conversational AI задач.
Meta Llama 3 8B Instruct - модель Meta оптимизированная под high-quality диалог. Эффективная для conversational AI задач.
Sao10K Lunaris 8B - универсальная generalist и roleplay модель на базе Llama 3. Strategic merge нескольких моделей для баланса креативности с улучшенной логикой и knowledge.
L3.1 70B Hanami X1 - эксперимент Sao10K над Euryale v2.2 (на базе Llama 3.1 70B).
Meta Llama 3.1 70B Instruct - модель Meta оптимизированная под high-quality диалог. Сильная производительность на human evaluations.
Meta Llama 3.1 8B - 8B base модель Meta серии Llama 3.1 (no source description).
Meta Llama 3.1 8B Instruct - быстрая и эффективная модель Meta серии Llama 3.1 для диалога. Сильная производительность на human evaluations при балансе скорости и качества.
Euryale L3.1 70B v2.2 - модель Sao10K с фокусом на creative roleplay (на базе Llama 3.1 70B). Последователь Euryale L3 70B v2.1.
Llama 3.2 11B Vision - multimodal модель Meta с 11B параметров для задач сочетающих visual и текстовые данные. Image captioning, visual QA; pre-trained на массивном датасете image-text пар.
Llama 3.2 1B - 1B модель для эффективных NLP задач: summarization, диалог, multilingual анализ. Малый размер для low-resource deployment с поддержкой 8 core языков.
Llama 3.2 3B - 3B multilingual модель для NLP задач (диалог, reasoning, summarization). Поддерживает 8 языков, тренирована на 9T токенов; сильна в instruction-following, сложном reasoning и tool use.
Meta Llama 3.3 - 70B pretrained и instruction-tuned multilingual LLM. Оптимизирована под multilingual диалог; обходит многие open-source и closed чат-модели на индустриальных бенчмарках. Английский, немецкий, французский, итальянский, португальский, хинди, испанский, тайский.
Euryale L3.3 70B - модель Sao10K с фокусом на creative roleplay (на базе Llama 3.3 70B). Последователь Euryale L3 70B v2.2.
Llama-3.3-Nemotron-Super-49B-v1.5 - 49B English-centric reasoning/chat модель на базе Llama-3.3-70B-Instruct с контекстом 128K. Post-trained под agentic workflows (RAG, tool calling) через SFT на math, code, science.
Llama 4 Scout 17B Instruct (16E) - MoE LLM Meta активирующая 17B параметров из 109B. Native multimodal вход.
Llama Guard 3 - Llama-3.1-8B pretrained модель fine-tuned под content safety classification. Классификация контента в LLM input (prompt classification) и других сценариях.
Llama Guard 4 - multimodal content safety classifier на основе Llama 4 Scout, fine-tuned под классификацию prompts и responses. Поддержка модерации на английском и других языках, mixed text+image prompts; согласована с MLCommons hazards taxonomy.
Maestro Reasoning - флагман-analysis модель Arcee на 32B параметров (derivative Qwen 2.5-32B) с DPO-тюнингом и chain-of-thought RL для step-by-step логики.
Mistral Magistral Small - 24B efficient reasoning модель на базе Mistral Small 3.2 (2506) с добавленными reasoning возможностями. SFT из Magistral Medium traces + RL.
TheDrummer Magnum v4 72B - серия моделей повторяющих prose-качество Claude 3 (Sonnet и Opus). Fine-tune на базе Qwen 2.5 72B.
Inception Mercury 2 - крайне быстрая reasoning LLM, первая reasoning diffusion LLM (dLLM). Вместо последовательной генерации токенов производит и уточняет несколько токенов параллельно.
MiMo-V2-Flash - open-source foundation LLM от Xiaomi. MoE с 309B общих и 15B активных параметров, hybrid attention; hybrid-thinking, контекст 256K; reasoning, coding, agent-задачи. №1 среди open-source на SWE-bench Verified и Multilingual бенчмарках.
MiniMax-M1 - large-scale open-weight reasoning модель с 456B общих и 45.9B активных параметров. Hybrid MoE + кастомная «lightning attention»; контекст до 1M, long-context understanding, software engineering, agentic tool use, math reasoning. RL pipeline CISPO; результаты на FullStackBench, SWE-bench, MATH, GPQA, TAU-Bench.
MiniMax-M2 - компактная efficient LLM с 10B активных (230B общих) параметров, оптимизирована под coding и agentic workflows. Near-frontier reasoning и tool use при низкой latency; code generation, multi-file editing, compile-run-fix циклы, automated test repair. SWE-Bench, Terminal-Bench; agentic BrowseComp, GAIA.
MiniMax M2-her - dialogue-first LLM для immersive roleplay, character-driven chat и выразительных multi-turn разговоров. Сохраняет consistent tone и personality, rich message support.
MiniMax-M2.1 - lightweight SOTA LLM для coding, agentic workflows и modern application development. 10B активных параметров; более concise/чистый вывод, более быстрые ответы относительно M2; 49.4% на Multi-SWE-Bench, 72.5% на SWE-Bench Multilingual.
MiniMax-M2.5 - SOTA LLM для реальной productivity. Тренирована в разных complex real-world digital working средах; расширяет coding-сильные стороны M2.1 на офисные задачи (Word, Excel, PowerPoint), переключение контекста между tools, коллаборация с mixed agent и human командами. 80.2% SWE-Bench Verified, 51.3% Multi-SWE-Bench, 76.3% BrowseComp.
MiniMax-M2.7 - LLM для autonomous реальной productivity и continuous improvement. Активная роль в собственной эволюции через advanced agentic capabilities (multi-agent collaboration); live debugging, root cause analysis, financial modeling, full document creation (Word, Excel, PowerPoint).
MiniMax-01 - комбинация MiniMax-Text-01 (генерация текста) и MiniMax-VL-01 (понимание изображений). 456B параметров, 45.9B активных за inference; большой контекст.
Mistral Ministral 3 14B - крупнейшая модель в Ministral 3 семействе с производительностью сопоставимой с Mistral Small 3.2 24B. Powerful efficient LLM.
Mistral Ministral 3 3B - самая маленькая модель в Ministral 3 семействе. Powerful efficient tiny LLM с vision возможностями.
Mistral Ministral 8B - 8B модель с interleaved sliding-window attention для быстрого memory-efficient inference. Контекст до 128K, edge use cases; превосходит модели sub-10B категории в knowledge и reasoning.
Mistral Embed - embedding-модель Mistral (no source description).
Mistral Large 3 - наиболее способная модель Mistral на sparse MoE с 41B активных и 675B общих параметров. Apache 2.0.
Mistral Medium 3 - high-performance enterprise-grade LLM с балансом SOTA reasoning и multimodal возможностей при заметно сниженной операционной стоимости. Coding, STEM reasoning, enterprise adaptation; для hybrid и on-prem окружений.
Mistral Medium 3 - high-performance enterprise-grade LLM с frontier-уровнем возможностей при заметно меньшей стоимости. SOTA reasoning и multimodal производительность при 8× меньшей цене.
Mistral Medium 3.1 - обновлённая версия Medium 3, high-performance enterprise модель с frontier capabilities при сниженной стоимости. SOTA reasoning и multimodal баланс.
Mistral Nemo - 12B модель с контекстом 128K от Mistral в сотрудничестве с NVIDIA. Multilingual: English, French, German, Spanish, Italian, Portuguese, Chinese, Japanese, и др.
Mistral Saba - 24B LLM для Middle East и South Asia. Точные contextually релевантные ответы на индийских языках (Tamil, Malayalam) и арабском; тренирована на curated regional датасетах.
Mistral Small 4 - следующий major релиз Small семейства, объединяющий возможности нескольких флагманов в одной системе. Reasoning от Magistral, multimodal от Pixtral, agentic coding от Devstral.
Mistral Small 3 - 24B LLM оптимизирована под low-latency. Apache 2.0; pre-trained и instruction-tuned версии для общих AI задач.
Mistral Small 3.1 24B Instruct - обновлённый Mistral Small 3 (2501) с 24B параметрами и advanced multimodal возможностями. SOTA в text-based reasoning.
Mistral-Small-3.2-24B-Instruct-2506 - обновлённая 24B модель оптимизированная под instruction-following, снижение повторов и улучшенный function calling относительно 3.1.
Mistral Mixtral 8x22B Instruct - официальный instruct fine-tune Mixtral 8x22B. 39B активных параметров из 141B; сильна в math, coding.
Morph V3 Fast - apply-модель Morph для code edits. ~10500 tokens/sec при 96% точности; формат промпта <instruction>{}</instruction> <code>{}</code> <update>{}</update>.
Morph V3 Large - high-accuracy apply-модель Morph для сложных code edits. ~4500 tokens/sec при 98% точности; тот же промпт-формат что и Fast.
MythoMax L2 13B - один из самых популярных и производительных fine-tune Llama 2 13B. Богатые описания и хорошая производительность в roleplay; merge нескольких моделей.
Gemini 3.1 Flash Image (Nano Banana 2) - флагман-Flash image модель Google DeepMind для high-fidelity генерации и быстрого advanced редактирования. Configurable thinking levels (Minimal vs High/Dynamic), улучшенный in-image text rendering, in-image localization (генерация/перевод текста в изображении), native aspect ratios.
NVIDIA Nemotron 3 Nano 30B A3B - малая MoE LLM с высокой compute efficiency и accuracy для разработчиков специализированных agentic AI систем. Open модель.
NVIDIA Nemotron 3 Super - 120B open hybrid MoE с 12B активных параметров для максимума compute efficiency и accuracy в сложных multi-agent сценариях. Hybrid Mamba-Transformer MoE с multi-token prediction; контекст 1M, генерация >50% быстрее ведущих open моделей.
NVIDIA Nemotron-Nano-9B-v2 - LLM тренированная NVIDIA с нуля как unified модель для reasoning и non-reasoning задач.
Amazon Nova 2 Lite - быстрая cost-effective reasoning-модель для everyday workloads. Принимает text, image, video для генерации текста.
Amazon Nova Lite 1.0 - дешёвая multimodal модель Amazon для быстрой обработки image/video/text входа с text выходом. Real-time customer interactions, document analysis, visual QA; 300K контекст, video до 30 минут.
Amazon Nova Micro 1.0 - text-only модель серии Nova с ультра-низкой latency и стоимостью. Контекст 128K; text summarization, translation, content classification, chat, brainstorming, базовый math/coding.
Amazon Nova Pro 1.0 - универсальная multimodal модель Amazon с балансом точности, скорости и стоимости. SOTA на visual question answering (TextVQA) и financial document analysis; video input не поддерживается.
OpenAI o1 - семейство моделей разработанных тратить больше времени на «думание» перед ответом. Тренировано large-scale reinforcement learning для chain-of-thought reasoning; оптимизировано под math, science, programming и STEM. PhD-level точность на индустриальных бенчмарках.
OpenAI o1-pro - модель серии o1 тренированная reinforcement learning для думания перед ответом и complex reasoning. Использует больше compute для более глубокого мышления и стабильных ответов.
OpenAI o3 - well-rounded мощная модель устанавливающая новый стандарт в math, science, coding и visual reasoning. Сильна в техническом письме и instruction-following; для multi-step problem solving по text/code/images. BYOK для доступа.
OpenAI o3-deep-research - advanced модель OpenAI для глубоких исследований, complex multi-step research задач. Всегда использует «web_search» tool (доп. стоимость).
OpenAI o3-mini - cost-efficient LLM оптимизирована под STEM reasoning (science, math, coding). Параметр reasoning_effort для настраиваемого thinking time; прирост над предшественником на сложных вопросах при меньшей latency и стоимости.
OpenAI o3-mini-high - та же модель что o3-mini с reasoning_effort=high. Cost-efficient LLM оптимизирована под STEM reasoning.
OpenAI o3-pro - o-серия моделей тренированных reinforcement learning для думания перед ответом и complex reasoning. Использует больше compute для более глубокого мышления и стабильных ответов.
OpenAI o4-mini - компактная reasoning-модель o-серии, оптимизирована под быструю cost-efficient производительность при сохранении multimodal и agentic возможностей. Tool use, конкурентный reasoning и coding; обходит o3-mini и приближается к o3 в некоторых доменах.
OpenAI o4-mini-deep-research - более быстрая и доступная deep-research модель для сложных multi-step research задач. Всегда использует «web_search» tool (доп. стоимость).
OpenAI o4-mini-high - та же модель что o4-mini с reasoning_effort=high. Компактная reasoning-модель o-серии для multimodal и agentic задач.
Olmo 3 32B Think - 32B-параметровая модель AI2 для deep reasoning, сложных logic chains и advanced instruction-following.
Mistral Large 2 (mistral-large-2407) - флагман Mistral AI с поддержкой множества языков (French, German, Spanish, Italian, Portuguese, Arabic, Hindi, Russian, Chinese, Japanese, Korean) и 80+ языков программирования. Длинный контекст для precise information recall; reasoning, code, JSON, chat.
Writer Palmyra X5 - наиболее продвинутая модель Writer для построения и масштабирования AI агентов в enterprise. Industry-leading скорость и эффективность на контекстных окнах до 1M.
Phi-4-mini-instruct - lightweight open модель серии Phi-4 построенная на synthetic data и filtered websites. Фокус на high-quality reasoning-dense данных.
Microsoft Phi-4 - 14B модель Microsoft Research для сложных reasoning задач, эффективная в low-memory или high-throughput сценариях. Тренирована на mix высококачественной synthetic и curated data; оптимизирована под English, сильна в instruction following.
Mistral Pixtral Large - 124B open-weight multimodal модель на базе Mistral Large 2. Понимание документов, чартов и натуральных изображений; research и commercial лицензии.
Qwen 2.5 72B - очередная серия Qwen LLM с приростом в знаниях, кодировании и математике относительно Qwen 2. Специализированные expert-модели, генерация длинных текстов от 8K токенов, structured outputs и поддержка 29+ языков.
Qwen-Image - foundation image-модель от Qwen с фокусом на high-fidelity text rendering и сложную интеграцию текста (English и Chinese). Поддерживает разные художественные стили, style transfer, object manipulation и human pose editing.
Qwen-Max - MoE-модель Qwen на базе Qwen 2.5 с лучшим inference в линейке для сложных multi-step задач. Pretrained на 20T+ токенов с SFT и RLHF; точное число параметров не раскрыто.
Qwen-Plus на базе Qwen 2.5 - модель с контекстом 131K, сбалансированная между производительностью, скоростью и стоимостью.
Qwen-Turbo - модель на базе Qwen 2.5 с контекстом 1M, заточенная под скорость и низкую стоимость. Для простых задач где эффективность и доступная цена важнее глубокого reasoning.
Qwen 2.5 7B - компактная модель серии с приростом в знаниях, кодировании и математике над Qwen 2. Те же улучшения что и у 72B-варианта, но в более доступном 7B формате.
Qwen 2.5 Coder 32B - последняя серия code-specific Qwen LLM (бывший CodeQwen). Заметные улучшения в code generation и code reasoning относительно CodeQwen 1.5.
Qwen 2.5 VL 72B - vision-модель умеющая распознавать обычные объекты (цветы, птицы, рыбы, насекомые) и анализировать текст, чарты, иконки, графику и layout картинок.
Qwen3-14B - dense 14.8B causal LLM серии Qwen3, для reasoning и эффективного диалога. Переключение между «thinking» mode (math, programming, логика) и «non-thinking» (general chat). Поддержка 100+ языков, agent tool use, multilingual задач.
Qwen3-235B-A22B - 235B MoE модель Qwen, активирующая 22B параметров за forward pass. Переключение thinking/non-thinking режимов; reasoning, 100+ языков, instruction-following и agent tool calling.
Qwen3-235B-A22B-Thinking-2507 - open-weights MoE для сложного reasoning. Активирует 22B из 235B параметров, нативно поддерживает 262144 токена контекста. Thinking-only вариант для логики, математики, science и long-form генерации.
Qwen3-30B-A3B-Instruct-2507 - 30.5B MoE модель с 3.3B активных параметров. Non-thinking режим, заточена под качественное instruction-following и multilingual задачи.
Qwen3-30B-A3B-Thinking-2507 - 30B MoE reasoning-модель для сложных задач с extended multi-step мышлением. Разделяет внутренние reasoning-следы от ответа.
Qwen3-32B - dense 32.8B causal LLM серии Qwen3. Переключение thinking/non-thinking режимов; instruction-following, agent tool use, creative writing, 100+ языков.
Qwen3-8B - dense 8.2B causal LLM серии Qwen3 для reasoning и эффективного диалога. Переключение thinking/non-thinking режимов для math, code, логики vs general chat.
Qwen3-Coder-480B-A35B-Instruct - MoE code-generation модель Qwen. 480B общих параметров, 35B активных (8 из 160 экспертов). Заточена под agentic coding: function calling, tool use, long-context reasoning по репозиториям. Variable pricing зависит от длины контекста.
Qwen3-Coder-30B-A3B-Instruct - 30.5B MoE модель с 128 экспертами (8 активных). Для code generation, repository-scale понимания и agentic tool use.
Qwen3 Coder Flash - быстрый cost-efficient вариант proprietary Qwen3 Coder Plus от Alibaba. Coding-агент для autonomous programming через tool calling.
Qwen3-Coder-Next - open-weight causal LLM для coding-агентов и локальных dev workflows. Sparse MoE на 80B общих параметров и 3B активных.
Qwen3 Coder Plus - proprietary версия open-source Qwen3 Coder 480B A35B от Alibaba. Coding-агент для autonomous programming через tool use и environment interaction; сочетает coding-навыки с general-purpose возможностями.
Qwen3-Max - обновлённая модель Qwen3 с приростом в reasoning, instruction-following, multilingual support и long-tail knowledge относительно январской 2025 версии. Лучше в math, coding, logic, science; меньше hallucinations.
Qwen3-Max-Thinking - флагман-reasoning серии Qwen3 для сложных cognitive задач с deep multi-step мышлением. Масштабированный capacity и RL-compute.
Qwen3-Next-80B-A3B-Instruct - instruction-tuned chat модель Qwen3-Next для быстрых стабильных ответов без «thinking»-следов. Reasoning, code generation, knowledge Q&A, multilingual; выше throughput и стабильность на длинных входах.
Qwen3-Next-80B-A3B-Thinking - reasoning-focused модель генерирующая структурированные thinking-traces по умолчанию. Multi-step задачи, math proofs, code synthesis, agentic planning; работает только в thinking режиме.
Qwen3-VL-235B-A22B Instruct - open-weight multimodal модель сочетающая text generation с visual understanding (картинки, видео). VQA, document parsing, chart/table extraction, multilingual OCR; 2D/3D spatial understanding.
Qwen3-VL-235B-A22B Thinking - multimodal модель оптимизированная под reasoning в STEM и math. Robust perception, 2D/3D spatial understanding, long-form visual comprehension; agent interaction и tool use.
Qwen3-VL-30B-A3B-Instruct - multimodal модель сочетающая text generation с visual understanding для картинок и видео. Instruct-вариант для general multimodal задач.
Qwen3-VL-30B-A3B-Thinking - multimodal Thinking-вариант с усиленным reasoning в STEM, math и сложных задачах.
Qwen3-VL-32B-Instruct - large-scale multimodal vision-language модель для high-precision понимания и reasoning text/image/video. Dense 32B параметров, deep visual perception, advanced text reasoning.
Qwen3-VL-8B-Instruct - multimodal модель серии Qwen3-VL для high-fidelity понимания и reasoning text/image/video. Улучшенный multimodal fusion с Interleaved-MRoPE для long-horizon visual reasoning.
Qwen3-VL-8B-Thinking - reasoning-вариант 8B multimodal модели для visual и textual reasoning по сложным сценам, документам и temporal sequences.
Qwen3.5 397B-A17B - native vision-language модель на гибридной архитектуре с linear attention + sparse MoE. SOTA-уровень в language understanding, logical reasoning, code generation, agent-задачах, image и video understanding, GUI interaction.
Qwen3.5 122B-A10B - native vision-language модель на гибридной архитектуре с linear attention + sparse MoE. Выше inference efficiency относительно обычных Transformer.
Qwen3.5 27B - dense native vision-language модель с linear attention. Быстрые ответы при балансе скорости inference и качества.
Qwen3.5 35B-A3B - native vision-language модель на гибридной архитектуре с linear attention + sparse MoE. Выше inference efficiency при сохранении качества.
Qwen3.5 9B - multimodal foundation модель серии Qwen3.5 для reasoning, coding и visual understanding в эффективной 9B архитектуре. Unified vision-language design.
Qwen3.5 Flash - native vision-language модель на гибридной архитектуре с linear attention + sparse MoE. Заточена под высокий inference efficiency.
DeepSeek R1 - open-source модель с производительностью сопоставимой с OpenAI o1, с полностью открытыми reasoning токенами. 671B параметров, 37B активных за inference pass.
DeepSeek R1 Distill Llama 70B - дистилляция на базе Llama-3.3-70B-Instruct с использованием выходов DeepSeek R1. Сочетает advanced distillation техники для высокой производительности.
DeepSeek R1 Distill Qwen 32B - дистилляция на базе Qwen 2.5 32B с использованием выходов DeepSeek R1. Превосходит OpenAI o1-mini на разных бенчмарках.
Reka Edge - крайне эффективная 7B multimodal vision-language модель принимающая image/video+text входы и генерирующая текст. Заточена под image understanding.
Reka Flash 3 - general-purpose instruction-tuned LLM на 21B параметров от Reka. Сильна в chat, coding, instruction-following и function calling.
Relace Apply 3 - специализированная code-patching LLM, мерджит AI-suggested edits в исходные файлы. Применяет обновления от GPT-4o, Claude и других в файлы.
Relace Search - использует 4-12 view_file и grep tools параллельно для исследования codebase и возврата релевантных файлов. В отличие от RAG, выполняет agentic search.
Gryphe ReMM-SLERP-L2-13B - попытка пересоздать оригинальный MythoMax-L2-13B с обновлёнными моделями. Merge.
Rnj-1 - 8B dense open-weight модель Essential AI тренированная с нуля с фокусом на programming, math и scientific reasoning.
TheDrummer Rocinante 12B - модель для engaging storytelling и rich prose. Расширенный vocabulary с уникальными выразительными выборами слов, vivid narrative.
ByteDance Seed 1.6 - general-purpose модель ByteDance Seed team. Multimodal с adaptive deep thinking; контекст 256K.
ByteDance Seed 1.6 Flash - ультра-быстрая multimodal deep thinking модель ByteDance Seed. Text и visual понимание; контекст 256K.
ByteDance Seed-2.0-Lite - универсальный cost-efficient enterprise workhorse с сильными multimodal и agent возможностями при низкой latency. Практичный default для большинства production задач.
ByteDance Seed-2.0-mini - заточена под latency-sensitive, high-concurrency и cost-sensitive сценарии. Производительность сопоставима с ByteDance-Seed-1.6; контекст 256K, 4 уровня reasoning effort, multimodal understanding.
ByteDance Seedream 4.0 - text-to-image и image editing модель. Высокоскоростная high-resolution генерация с контекстуальным пониманием; объединяет генерацию и редактирование в единой архитектуре. Multi-reference batches, разнообразные style transfers.
ByteDance Seedream 4.5 - proprietary image модель с приростом в editing consistency (preservation объектов, light и color tone), portrait clarity и small-text rendering. Улучшенная композиция нескольких изображений.
ByteDance Seedream 5.0 lite - proprietary image-модель с multi-step логическим reasoning, example-based editing и domain-knowledge интеграцией. Пользователь может задать before/after reference пару вместо текстового описания изменения.
TheDrummer Skyfall 36B v2 - улучшенная итерация Mistral Small 2501, fine-tuned под креативность, nuanced письмо, roleplay и coherent storytelling.
Upstage Solar Mini - компактная модель Upstage (no source description).
Upstage Solar Pro 2 - модель Upstage (no source description).
Upstage Solar Pro 3 - MoE LLM Upstage с 102B общих и 12B активных параметров за forward pass. Исключительная производительность при сохранении computational efficiency.
Perplexity Sonar - lightweight доступная быстрая question-answering модель с цитированиями и настраиваемыми источниками. Для компаний интегрирующих быстрые citation-enabled Q&A фичи.
Perplexity Sonar Deep Research - research-focused модель для multi-step retrieval, синтеза и reasoning по сложным темам. Автономно ищет, читает и оценивает источники; для финансов, технологий, здоровья, текущих событий. Pricing по prompt токенам, citation токенам, числу поисков и reasoning токенам.
Perplexity Sonar Pro - enterprise-grade API для advanced multi-step запросов с расширяемостью. Длинные nuanced поиски, follow-up вопросы; вдвое больше цитирований на поиск относительно базового Sonar; большие контекстные окна.
Perplexity Sonar Pro Search - доступен эксклюзивно через OpenRouter API. Наиболее advanced agentic search система Perplexity для глубокого reasoning и анализа.
Perplexity Sonar Reasoning Pro - premier reasoning модель на DeepSeek R1 с Chain-of-Thought (CoT). Advanced multi-step запросы с большим контекстом и большим числом цитирований за поиск; pricing включает Perplexity search costs.
Arcee Spotlight - 7B vision-language модель на базе Qwen 2.5-VL, fine-tuned под tight image-text grounding. Контекст 32K для multimodal задач.
StepFun Step 3.5 Flash - наиболее способная open-source foundation модель StepFun. Sparse MoE архитектура, селективно активирует 11B из 196B параметров за токен.
OpenAI Text-Embedding-3-Large - наиболее способная embedding модель с поддержкой English и не-English текстов. High-dimensional embeddings (до 3072 dim) для semantic similarity, search, clustering; гибкие trade-offs между производительностью и ресурсами.
OpenAI Text-Embedding-3-Small - efficient compact embedding модель для конвертации текста в numerical representations (semantic search, clustering, recommendations). Прирост производительности и cost-efficiency над предыдущими моделями; низкая latency и storage.
Text Embedding Ada - embedding-модель OpenAI (no source description).
Arcee Trinity Mini - 26B sparse MoE модель (3B активных) со 128 экспертами (8 активных). Заточена под efficient reasoning на длинных контекстах (131K) с надёжным function-calling.
ByteDance UI-TARS-1.5 - multimodal vision-language агент для GUI-окружений (desktop, web browsers, mobile, игры). Развитие UI-TARS с reinforcement learning.
TheDrummer UnslopNemo v4.1 - последнее дополнение от автора Rocinante, заточено под adventure writing и role-play сценарии.
Arcee Virtuoso-Large - топ-tier general-purpose LLM на 72B параметров для cross-domain reasoning, creative writing и enterprise QA. Сохраняет контекст 128K в отличие от многих 70B-аналогов.
Mistral Voxtral Small - расширение Mistral Small 3 с SOTA audio-input возможностями при сохранении best-in-class text производительности. Speech transcription, translation и audio understanding.
Mancer Weaver - попытка пересоздать Claude-style verbosity (без аналогичного уровня coherence и memory). Для roleplay/нарративных сценариев.
OpenAI Whisper Large v3 - SOTA модель для automatic speech recognition (ASR) и speech translation. Тренирована на 5M+ часов labeled data; сильная generalization по датасетам и доменам, zero-shot transcription и translation.
OpenAI Whisper Large-v3-Turbo - fine-tuned версия pruned Whisper large-v3. Та же модель но число decoding layers снижено с 32 до 4; заметно быстрее ценой минимальной потери качества.
WizardLM-2 8x22B - продвинутая Wizard модель Microsoft AI, конкурентная с ведущими proprietary моделями и обходящая SOTA open-source. Instruct fine-tune Mixtral 8x22B; оптимизирована под complex reasoning и instruction-following.
Z-Image Turbo - image-модель Alibaba (no source description).
Цены указаны в белорусских рублях за 1 миллион токенов
Готовы начать?
Получите API-ключ и начните использовать AI модели уже сегодня
Получить API-ключ бесплатно →Каталог нейросетей AIAI.BY
В каталоге представлены 300+ моделей искусственного интеллекта от ведущих мировых провайдеров — OpenAI, Anthropic, Google, Meta, xAI и DeepSeek. Каждая модель доступна через единый API, совместимый с форматом OpenAI: текстовые модели (GPT-5, Claude, Gemini), модели генерации изображений (DALL-E, Flux), reasoning-модели и бюджетные варианты для массовых задач.
Все цены указаны в белорусских рублях за 1 миллион токенов. Фильтруйте по провайдеру, категории или стоимости, чтобы подобрать оптимальную модель. Для детального сравнения моделей между собой используйте раздел Сравнение.
Не знаете, какую модель выбрать? Наши специалисты помогут подобрать модель под вашу задачу — от обработки клиентских обращений до анализа финансовой отчётности. Подключение занимает 5 минут, первые 100K токенов — бесплатно.
