AI-модели — 300+ нейросетей через единый API

Каталог нейросетей от OpenAI, Anthropic, Google, Meta, xAI и DeepSeek. Фильтруйте по провайдеру, категории и цене. Все модели доступны через единый API с оплатой в BYN.

Сравнить

332 моделей

Anthropic: Claude Opus 4.8NEWTOP

Claude Opus 4.8 - самая способная общедоступная модель Anthropic в семействе Opus. Принимает text, image и file на вход с текстовым выводом, поддерживает reasoning и контекст до 1M токенов.

Anthropic|Текстовая|23.85BYN/1M запрос|119.25BYN/1M ответ

DeepSeek: Deepseek V4 ProNEWTOP

DeepSeek V4 Pro - large-scale MoE от DeepSeek с 1.6T общих и 49B активных параметров; контекст 1M. Advanced reasoning, coding и long-horizon agent workflows; та же архитектура что у V4 Flash с hybrid attention и множеством reasoning режимов.

DeepSeek|Текстовая|1.39BYN/1M запрос|2.77BYN/1M ответ

Z.ai: GLM 5.1NEWTOP

Z.AI GLM-5.1 - major прирост в coding возможностях, особенно в long-horizon задачах. В отличие от прошлых моделей рассчитанных на минутные взаимодействия, GLM-5.1 работает независимо и непрерывно над одной задачей 8+ часов: автономно планирует, выполняет и refinines работу.

Z.ai|Текстовая|3.12BYN/1M запрос|9.80BYN/1M ответ

OpenAI: GPT 5.5 ProNEWTOP

GPT-5.5 Pro - high-capability модель OpenAI оптимизирована под deep reasoning и точность на сложных high-stakes задачах. Контекст 1M+ (922K input, 128K output), text и image input; long-horizon problem solving, agentic coding, precise execution в multi-step workflows.

OpenAI|Текстовая|95.40BYN/1M запрос|572.40BYN/1M ответ

xAI: Grok 4.3NEWTOP

xAI Grok 4.3 - reasoning-модель xAI. Принимает text и image входы с text выходом; подходит для agentic workflows, instruction-following и приложений требующих factual точности.

xAI|Текстовая|5.97BYN/1M запрос|11.93BYN/1M ответ

Moonshot: Kimi K2.6NEWTOP

Moonshot Kimi K2.6 - multimodal модель нового поколения для long-range coding workflows, code-centered UI/UX создания и multi-agent координации. End-to-end development в Python, Rust, Go; промпт и visual inputs → production interfaces; swarm-based архитектура до сотен parallel sub-agents.

Moonshot|Текстовая|2.33BYN/1M запрос|11.10BYN/1M ответ

Mistral: Mistral Medium 3.5NEWTOP

Mistral Medium 3.5 - dense 128B instruction-following модель Mistral AI с text/image вход и text выход. Для agentic workflows, coding и сложных задач.

Mistral|Текстовая|7.16BYN/1M запрос|35.78BYN/1M ответ

Qwen: Qwen3.7 MaxNEWTOP

Qwen3.7-Max - флагман серии Alibaba Qwen3.7. Заточен под agent-centric workloads, coding, office и productivity задачи.

Qwen|Текстовая|5.97BYN/1M запрос|17.89BYN/1M ответ

Cohere: Command ATOP

Command A - open-weights 111B параметровая модель Cohere с контекстом 256K. Заточена под agentic, multilingual и coding use cases; high-performance при низких hardware-расходах для business-критичных workflows с reasoning и tool use.

Cohere|Текстовая|7.95BYN/1M запрос|31.80BYN/1M ответ

Meta: Llama 4 Maverick 17B 128E InstructTOP

Llama 4 Maverick 17B Instruct (128E) - high-capacity multimodal LLM Meta на MoE архитектуре с 128 экспертами и 17B активных параметров за forward pass.

Meta|Текстовая|0.72BYN/1M запрос|2.87BYN/1M ответ

Amazon: Nova Premier 1.0TOP

Amazon Nova Premier - наиболее способная multimodal модель Amazon для сложных reasoning-задач и distillation базы для кастомных моделей.

Amazon|Текстовая|11.93BYN/1M запрос|59.63BYN/1M ответ

Anthropic: Claude Opus 4.6 (Fast)NEW

Fast-mode вариант Claude Opus 4.6 - идентичные возможности с увеличенной скоростью отдачи токенов. Премиум 6× от обычного pricing.

Anthropic|Текстовая|143.10BYN/1M запрос|715.50BYN/1M ответ

Anthropic: Claude Opus 4.7NEW

Claude Opus 4.7 - следующее поколение Opus от Anthropic, построенное под long-running асинхронные агенты. Развитие coding и agentic сильных сторон Opus 4.6 с приростом в долгих сессиях.

Anthropic|Текстовая|23.85BYN/1M запрос|119.25BYN/1M ответ

Anthropic: Claude Opus 4.7 (Fast)NEW

Fast-mode вариант Claude Opus 4.7 - идентичные возможности с увеличенной скоростью отдачи токенов. Премиум 6× от обычного pricing.

Anthropic|Текстовая|143.10BYN/1M запрос|715.50BYN/1M ответ

Anthropic: Claude Opus 4.8 (Fast)NEW

Claude Opus 4.8 Fast - fast-mode вариант Opus 4.8 с идентичными возможностями и повышенной скоростью вывода. Тарифицируется в 2× относительно обычной Opus 4.8.

Anthropic|Текстовая|47.70BYN/1M запрос|238.50BYN/1M ответ

DeepSeek: Deepseek V4 FlashNEW

DeepSeek V4 Flash - efficiency-focused MoE от DeepSeek с 284B общих и 13B активных параметров; контекст 1M. Hybrid attention для длинных контекстов; настраиваемые reasoning режимы. Для coding-ассистентов, chat, agent workflows.

DeepSeek|Текстовая|0.34BYN/1M запрос|0.67BYN/1M ответ

Google: Gemini 3.1 Flash Lite PreviewNEW

Gemini 3.1 Flash Lite Preview - high-efficiency модель Google для high-throughput high-volume использования. Лучше Gemini 2.5 Flash Lite, близко к 2.5 Flash; audio input/ASR, RAG snippet ranking, translation, data extraction, code completion; configurable thinking levels.

Google|Текстовая|0.80BYN/1M запрос|4.78BYN/1M ответ

Google: Gemini 3.5 FlashNEW

Gemini 3.5 Flash - high-efficiency multimodal модель Google с near-Pro уровнем coding и reasoning по цене Flash. Заточена под coding и parallel agentic execution loops; text, image, video, audio, PDF на входе.

Google|Текстовая|4.78BYN/1M запрос|28.62BYN/1M ответ

Google: Gemma 4 26B A4BNEW

Gemma 4 26B A4B IT - instruction-tuned MoE модель Google DeepMind. 25.2B общих и 3.8B активных параметров за токен (производительность около 31B при заметно меньших вычислениях). Multimodal вход (text/image/video до 60 секунд при 1 fps), контекст 256K, native function calling, adjustable thinking mode, structured outputs; Apache 2.0.

Google|Текстовая|0.29BYN/1M запрос|1.05BYN/1M ответ

Google: Gemma 4 31BNEW

Gemma 4 31B Instruct - dense 30.7B multimodal модель Google DeepMind с text/image входом и text выходом. Контекст 256K, configurable thinking режим, native function calling.

Google|Текстовая|0.39BYN/1M запрос|1.18BYN/1M ответ

Z.ai: GLM 5V TurboNEW

Z.AI GLM-5V-Turbo - первая native multimodal agent foundation модель Z.AI для vision-based кодирования и agent задач. Нативно принимает image, video, text входы; long-horizon планирование и сложный coding.

Z.ai|Текстовая|5.73BYN/1M запрос|19.09BYN/1M ответ

OpenAI: GPT 5.5NEW

GPT-5.5 - frontier-модель OpenAI для сложных профессиональных задач, развитие GPT-5.4 с более сильным reasoning, надёжностью и token efficiency на hard задачах. Контекст 1M+ токенов (922K input, 128K output), text и image input; large-scale reasoning, coding, multimodal workflows в единой системе.

OpenAI|Текстовая|15.90BYN/1M запрос|95.40BYN/1M ответ

OpenAI: GPT Image 2NEW

GPT Image 2 - SOTA image generation модель OpenAI для быстрой high-quality генерации и редактирования. Поддерживает гибкие размеры и high-fidelity image inputs.

OpenAI|Изображения|0.15BYNза изображение

OpenAI: GPT-5.4 Image 2NEW

GPT-5.4 Image 2 - сочетание GPT-5.4 с SOTA image generation от GPT Image 2. Multimodal workflows для перехода между reasoning, coding и созданием визуала.

OpenAI|Изображения|38.17BYN/1M запрос|143.10BYN/1M ответ

IBM: Granite 4.1 8BNEW

IBM Granite 4.1 8B - dense decoder-only 8B LLM из семейства Granite 4.1. Контекст 131K, заточена под enterprise задачи.

IBM|Текстовая|0.24BYN/1M запрос|0.48BYN/1M ответ

xAI: Grok 4.20 BetaNEW

xAI Grok 4.20 Beta - флагман-reasoning модель xAI с industry-leading скоростью и advanced agentic tool-calling. Одна из самых низких hallucination rates на рынке и сильное prompt adherence.

xAI|Текстовая|5.97BYN/1M запрос|11.93BYN/1M ответ

xAI: Grok 4.20 Multi-AgentNEW

xAI Grok 4.20 Multi-Agent - вариант Grok 4.20 для collaborative agent-based workflows. Несколько агентов работают параллельно для deep research, координации tool use и синтеза информации.

xAI|Текстовая|9.55BYN/1M запрос|28.62BYN/1M ответ

xAI: Grok Build 0.1NEW

xAI Grok Build 0.1 - быстрая coding-модель xAI тренированная специально под agentic software engineering. Text и image входы с text выходом; оптимизирована под interactive coding.

xAI|Текстовая|4.78BYN/1M запрос|9.55BYN/1M ответ

Tencent: Hy3 previewNEW

Tencent Hy3 preview - high-efficiency MoE модель от Tencent для agentic workflows и production. Configurable reasoning levels (disabled, low, high).

Tencent|Текстовая|0.31BYN/1M запрос|1.01BYN/1M ответ

Inclusion AI: Ling-2.6-1TNEW

InclusionAI Ling-2.6-1T - instant (instruct) модель, trillion-параметровый флагман компании. Для real-world агентов требующих быстрого исполнения и эффективности на масштабе; «fast» подход.

Inclusion AI|Текстовая|0.36BYN/1M запрос|2.99BYN/1M ответ

Inclusion AI: Ling-2.6-flashNEW

InclusionAI Ling-2.6-flash - instant (instruct) модель с 104B общих и 7.4B активных параметров. Для real-world агентов с быстрыми ответами, сильным execution и высокой token efficiency.

Inclusion AI|Текстовая|0.05BYN/1M запрос|0.15BYN/1M ответ

MiniMax: MiMo-V2.5NEW

MiMo-V2.5 - native omnimodal модель Xiaomi. Pro-уровень agentic производительности при ~половине inference cost; превосходит MiMo-V2-Omni в multimodal perception (image, video understanding).

MiniMax|Текстовая|0.67BYN/1M запрос|1.34BYN/1M ответ

MiniMax: MiMo-V2.5-ProNEW

MiMo-V2.5-Pro - флагман Xiaomi с сильной производительностью в general agentic возможностях, сложном software engineering и long-horizon задачах. Топ-результаты на ClawEval, GDPVal, SWE-bench Pro.

MiniMax|Текстовая|2.08BYN/1M запрос|4.15BYN/1M ответ

Perceptron: Perceptron Mk1NEW

Perceptron Mk1 (Mark One) - высококачественная vision-language модель Perceptron для video и embodied reasoning. Принимает image/video с natural language запросами; детальное visual understanding.

Perceptron|Текстовая|0.72BYN/1M запрос|7.16BYN/1M ответ

Qwen: Qwen3.5 Plus 2026-04-20NEW

Qwen3.5 Plus - large-scale multimodal LLM от Alibaba. Принимает text/image/video, выдаёт text; контекст 1M токенов.

Qwen|Текстовая|1.25BYN/1M запрос|7.45BYN/1M ответ

Qwen: Qwen3.6 27BNEW

Qwen3.6 27B - dense 27B LLM от Qwen Team Alibaba. Hybrid multimodal: text, image, video на входе.

Qwen|Текстовая|1.39BYN/1M запрос|15.27BYN/1M ответ

Qwen: Qwen3.6 35B A3BNEW

Qwen3.6-35B-A3B - open-weight multimodal модель Alibaba Cloud с 35B общих и 3B активных параметров. Hybrid sparse MoE с Gated Attention.

Qwen|Текстовая|0.67BYN/1M запрос|4.78BYN/1M ответ

Qwen: Qwen3.6 FlashNEW

Qwen3.6 Flash - быстрая модель серии Qwen 3.6 от Alibaba. Принимает text, image, video; контекст 1M токенов. Tiered pricing.

Qwen|Текстовая|0.90BYN/1M запрос|5.37BYN/1M ответ

Qwen: Qwen3.6 Max PreviewNEW

Qwen3.6-Max-Preview - proprietary frontier модель Alibaba Cloud на sparse MoE с ~1T общих параметров. Заточена под agentic coding, tool use.

Qwen|Текстовая|4.97BYN/1M запрос|29.77BYN/1M ответ

Qwen: Qwen3.6 PlusNEW

Qwen 3.6 Plus - модель на гибридной архитектуре с linear attention + sparse MoE routing. Прирост относительно серии 3.5.

Qwen|Текстовая|1.56BYN/1M запрос|9.31BYN/1M ответ

Inclusion AI: Ring-2.6-1TNEW

InclusionAI Ring-2.6-1T - thinking-модель масштаба 1T с 63B активных параметров. Для real-world agent workflows требующих сильных capability и operational efficiency; coding-агенты, tool use.

Inclusion AI|Текстовая|0.36BYN/1M запрос|2.99BYN/1M ответ

Arcee: Trinity Large ThinkingNEW

Arcee Trinity Large Thinking - open-source reasoning-модель. Сильна на PinchBench, agentic workloads и reasoning задачах.

Arcee|Текстовая|1.05BYN/1M запрос|4.06BYN/1M ответ

AionLabs: Aion-1.0

Aion-1.0 - multi-model система AionLabs для high-performance reasoning и coding. Построена на базе DeepSeek-R1 с дополнительными моделями и техниками вроде Tree-of-Thoughts.

AionLabs|Текстовая|19.09BYN/1M запрос|38.17BYN/1M ответ

AionLabs: Aion-1.0-Mini

Aion-1.0-Mini - 32B-дистилляция DeepSeek-R1 от AionLabs. Заточена под reasoning в математике, кодировании и логике; модифицированный вариант базовой R1.

AionLabs|Текстовая|3.34BYN/1M запрос|6.68BYN/1M ответ

AionLabs: Aion-2.0

Aion-2.0 - вариант DeepSeek V3.2 оптимизированный AionLabs под immersive roleplay и storytelling. Особенно сильна в создании tension, кризисов и конфликтов в нарративе.

AionLabs|Текстовая|3.82BYN/1M запрос|7.64BYN/1M ответ

AionLabs: Aion-RP 1.0 (8B)

Aion-RP-Llama-3.1-8B - fine-tuned base модель AionLabs занявшая первое место в character evaluation на бенчмарке RPBench-Auto (roleplay-вариант Arena-Hard-Auto).

AionLabs|Текстовая|3.82BYN/1M запрос|7.64BYN/1M ответ

Anthropic: Claude 3 Haiku

Claude 3 Haiku - самая быстрая и компактная модель Anthropic для near-instant отзывчивости. Точная targeted производительность.

Anthropic|Текстовая|0.80BYN/1M запрос|3.98BYN/1M ответ

Anthropic: Claude 3.5 Haiku

Claude 3.5 Haiku - самая быстрая модель Anthropic с улучшенным coding, tool use и reasoning. Заточена под high-interactivity и low-latency: user-facing chatbots, on-the-fly code completions, data extraction, real-time content moderation. Не поддерживает image input.

Anthropic|Текстовая|2.55BYN/1M запрос|12.72BYN/1M ответ

Anthropic: Claude Haiku 4.5

Claude Haiku 4.5 - самая быстрая и эффективная модель Anthropic с near-frontier интеллектом по сниженной цене и latency. Сопоставима с Claude Sonnet 4 в reasoning, coding и computer-use; контролируемая reasoning depth, summarized/interleaved thinking; tool-assisted workflows. 73%+ на SWE-bench Verified.

Anthropic|Текстовая|3.18BYN/1M запрос|15.90BYN/1M ответ

Anthropic: Claude Opus 4

Claude Opus 4 - модель Anthropic с устойчивой производительностью на сложных long-running задачах и agent workflows. На момент релиза - топ в кодировании.

Anthropic|Текстовая|47.70BYN/1M запрос|238.50BYN/1M ответ

Anthropic: Claude Opus 4.1

Claude Opus 4.1 - обновлённая флагман-модель Anthropic с приростом в кодировании, reasoning и agentic задачах. 74.5% на SWE-bench Verified; multi-file refactoring, debugging precision, detail-oriented reasoning. Extended thinking до 64K.

Anthropic|Текстовая|47.70BYN/1M запрос|238.50BYN/1M ответ

Anthropic: Claude Opus 4.5

Claude Opus 4.5 - reasoning-модель Anthropic для сложного software engineering, agent workflows и extended computer use. Multimodal, защита от prompt injection, регулируемая token efficiency через параметр effort.

Anthropic|Текстовая|15.90BYN/1M запрос|79.50BYN/1M ответ

Anthropic: Claude Opus 4.6

Claude Opus 4.6 - наиболее продвинутая модель Anthropic для программирования и длинных профессиональных задач. Заточена под агентов работающих через целые workflows (большие codebases, сложный refactoring, multi-stage debugging); глубокая контекстная осведомлённость, надёжность в challenging engineering сценариях.

Anthropic|Текстовая|15.90BYN/1M запрос|79.50BYN/1M ответ

Anthropic: Claude Sonnet 4

Claude Sonnet 4 - модель следующего поколения Anthropic с заметным приростом в coding и reasoning над Sonnet 3.7. SOTA на SWE-bench (72.7%), баланс capability и computational efficiency; улучшенная навигация по codebases, меньше ошибок, надёжнее follow-instruction.

Anthropic|Текстовая|9.55BYN/1M запрос|47.70BYN/1M ответ

Anthropic: Claude Sonnet 4.5

Claude Sonnet 4.5 - наиболее продвинутая Sonnet от Anthropic для real-world агентов и coding workflows. SOTA на SWE-bench Verified; system design, code security, following specifications; extended autonomous operation с task continuity, fact-based progress tracking, tool orchestration и speculative parallel execution.

Anthropic|Текстовая|9.55BYN/1M запрос|47.70BYN/1M ответ

Anthropic: Claude Sonnet 4.6

Claude Sonnet 4.6 - наиболее способная Sonnet-class модель Anthropic с frontier производительностью в coding, agentic задачах и профессиональной работе. Iterative development, navigation сложных codebases, end-to-end project management с памятью, создание polished документов, reliable computer use для web QA и workflow automation.

Anthropic|Текстовая|9.55BYN/1M запрос|47.70BYN/1M ответ

Meta: CodeLLaMa 7B Instruct Solidity

Code LLaMA Instruct 7B Solidity - 7B fine-tune Code LLaMA для генерации Solidity smart contracts через 4-bit QLoRA fine-tuning (PEFT library).

Meta|Текстовая|3.82BYN/1M запрос|5.73BYN/1M ответ

Arcee: Coder Large

Arcee Coder-Large - 32B модель на основе Qwen 2.5-Instruct, дообученная на permissively-licensed GitHub, CodeSearchNet и synthetic bug-fix корпусах. Контекст 32K для multi-file работы.

Arcee|Текстовая|2.39BYN/1M запрос|3.82BYN/1M ответ

Mistral: Codestral 2501

Mistral Codestral - LLM Mistral для кода, специализируется на low-latency high-frequency задачах (fill-in-the-middle, code correction, test generation). Оптимизирована под productivity разработчика, поддержка широкого спектра языков программирования.

Mistral|Текстовая|0.96BYN/1M запрос|2.87BYN/1M ответ

DeepCogito: Cogito v2.1 671B

Deep Cogito v2.1 671B MoE - одна из сильнейших open моделей глобально, сопоставимая по производительности с frontier closed и open моделями. Тренирована через self-play с reinforcement learning.

DeepCogito|Текстовая|5.97BYN/1M запрос|5.97BYN/1M ответ

Cohere: Command R (08-2024)

Cohere Command R (08-2024) - обновление Command R с приростом в multilingual RAG и tool use. Лучше в математике, коде и reasoning.

Cohere|Текстовая|0.72BYN/1M запрос|2.87BYN/1M ответ

Cohere: Command R+ (08-2024)

Cohere Command R+ (08-2024) - обновление Command R+ с ~50% выше throughput и ~25% ниже latency при том же hardware footprint.

Cohere|Текстовая|11.93BYN/1M запрос|47.70BYN/1M ответ

Cohere: Command R7B (12-2024)

Cohere Command R7B (12-2024) - компактный быстрый апдейт Command R+. Заточен под RAG, tool use, агентов и задачи требующие сложного reasoning.

Cohere|Текстовая|0.18BYN/1M запрос|0.72BYN/1M ответ

TheDrummer: Cydonia 24B V4.1

TheDrummer Cydonia 24B v4.1 - uncensored creative writing модель на базе Mistral Small 3.2 24B. Хорошее recall, prompt adherence и интеллект.

TheDrummer|Текстовая|1.44BYN/1M запрос|2.39BYN/1M ответ

DeepSeek: DeepSeek Chat

DeepSeek V3 - 685B MoE модель, последняя итерация флагман-серии чат-моделей DeepSeek. Последующая версия предыдущей V3, сильна на разнообразных задачах.

DeepSeek|Текстовая|0.73BYN/1M запрос|2.91BYN/1M ответ

DeepSeek: DeepSeek Chat v3.1

DeepSeek-V3.1 - 671B hybrid reasoning модель (37B активных) с поддержкой thinking/non-thinking режимов через prompt templates. Two-phase long-context training до 128K, FP8 microscaling для efficient inference. Tool use, code generation, reasoning; structured tool calling, code/search агенты.

DeepSeek|Текстовая|0.67BYN/1M запрос|2.52BYN/1M ответ

DeepSeek: DeepSeek V3 0324

DeepSeek V3 - 685B MoE модель, последняя итерация флагман-серии чат-моделей DeepSeek. Развитие предыдущих версий в instruction-following и coding; pre-trained на ~15T токенов.

DeepSeek|Текстовая|0.96BYN/1M запрос|3.68BYN/1M ответ

DeepSeek: DeepSeek V3.1

DeepSeek V3.1 - модель серии V3.1 от DeepSeek (no source description; данные о hybrid reasoning см. в deepseek-chat-v3.1).

DeepSeek|Текстовая|0.86BYN/1M запрос|3.50BYN/1M ответ

DeepSeek: DeepSeek V3.1 Nex N1

DeepSeek V3.1 Nex-N1 - флагман-релиз серии Nex-N1, post-trained модель с фокусом на agent autonomy, tool use и real-world productivity.

DeepSeek|Текстовая|0.65BYN/1M запрос|2.39BYN/1M ответ

DeepSeek: DeepSeek V3.1 Terminus

DeepSeek-V3.1 Terminus - обновление DeepSeek V3.1 сохраняющее оригинальные возможности и адресующее проблемы пользователей (language consistency, agent capabilities).

DeepSeek|Текстовая|1.29BYN/1M запрос|4.54BYN/1M ответ

DeepSeek: Deepseek v3.2

DeepSeek-V3.2 - LLM оптимизированная под высокую computational efficiency и сильный tool-use reasoning. DeepSeek Sparse Attention (DSA) снижает стоимость training и inference; scalable RL post-training; топ-результаты на 2025 IMO и IOI.

DeepSeek|Текстовая|0.81BYN/1M запрос|1.21BYN/1M ответ

DeepSeek: DeepSeek v3.2 Exp

DeepSeek-V3.2-Exp - экспериментальная LLM DeepSeek как промежуточный шаг между V3.1 и будущими архитектурами. Использует DeepSeek Sparse Attention (DSA) для эффективности на длинных контекстах.

DeepSeek|Текстовая|0.86BYN/1M запрос|1.31BYN/1M ответ

DeepSeek: DeepSeek V3.2 Speciale

DeepSeek-V3.2-Speciale - high-compute вариант V3.2 оптимизированный под максимум reasoning и agentic производительности. Развивает DSA с масштабированным post-training RL.

DeepSeek|Текстовая|1.37BYN/1M запрос|2.06BYN/1M ответ

Mistral: Devstral 2 2512

Mistral Devstral 2 - open-source SOTA модель Mistral для agentic coding. 123B dense transformer с контекстом 256K, поддержка exploring.

Mistral|Текстовая|1.91BYN/1M запрос|9.55BYN/1M ответ

Mistral: Devstral Medium

Mistral Devstral Medium - high-performance code-generation и agentic reasoning модель Mistral AI совместно с All Hands AI. Шаг выше Devstral Small.

Mistral|Текстовая|1.91BYN/1M запрос|9.55BYN/1M ответ

Mistral: Devstral Small 1.1

Mistral Devstral Small 1.1 - 24B open-weight LLM для software engineering агентов от Mistral AI и All Hands AI. Fine-tune Mistral Small 3.1.

Mistral|Текстовая|0.48BYN/1M запрос|1.44BYN/1M ответ

ElevenLabs: Eleven Multilingual v1

Eleven-Multilingual-v1 - ранняя multilingual TTS модель ElevenLabs. Поддержка множества языков и надёжная natural-sounding voice generation.

ElevenLabs|Синтез речи|429.30BYN/1M запрос

ElevenLabs: Eleven Multilingual v2

Eleven-Multilingual-v2 - наиболее продвинутая multilingual TTS модель ElevenLabs. High-quality синтез голоса на разных языках с улучшенным реализмом и выразительностью.

ElevenLabs|Синтез речи|429.30BYN/1M запрос

ElevenLabs: Eleven Turbo v2

Eleven-Turbo-v2 - English-optimized TTS модель ElevenLabs для быстрого high-quality синтеза с низкой latency. Для real-time приложений и интерактивных voice-систем.

ElevenLabs|Синтез речи|429.30BYN/1M запрос

ElevenLabs: Eleven v3

Eleven v3 - самая выразительная text-to-speech модель ElevenLabs с поддержкой 70+ языков, multi-speaker диалогов и audio-тегов вроде [excited], [whispers], [laughs]. Даёт высокий реализм и тонкий контроль над речью.

ElevenLabs|Синтез речи|429.30BYN/1M запрос

Baidu: ERNIE 4.5 21B A3B

ERNIE 4.5 21B - MoE-модель Baidu с 21B общих параметров и 3B активных за токен. Multimodal understanding и генерация через heterogeneous MoE и modality-isolated routing.

Baidu|Текстовая|0.34BYN/1M запрос|1.34BYN/1M ответ

Baidu: ERNIE 4.5 21B A3B Thinking

ERNIE-4.5-21B-A3B-Thinking - обновлённая lightweight MoE Baidu с углублённым reasoning. Для logical puzzles, math, science, coding, text generation и expert-level academic бенчмарков.

Baidu|Текстовая|0.34BYN/1M запрос|1.34BYN/1M ответ

Baidu: ERNIE 4.5 300B A47B

ERNIE-4.5-300B-A47B - 300B MoE LLM от Baidu (серия ERNIE 4.5). Активирует 47B параметров за токен, text generation.

Baidu|Текстовая|1.34BYN/1M запрос|5.25BYN/1M ответ

Baidu: ERNIE 4.5 VL 28B A3B

ERNIE 4.5 VL 28B - multimodal MoE chat модель с 28B общих и 3B активных параметров. Text и vision понимание через heterogeneous MoE с modality-isolated routing.

Baidu|Текстовая|0.67BYN/1M запрос|2.68BYN/1M ответ

Baidu: ERNIE 4.5 VL 424B A47B

ERNIE-4.5-VL-424B-A47B - multimodal MoE Baidu (серия ERNIE 4.5) с 424B общих и 47B активных параметров. Тренирована совместно на text и image data.

Baidu|Текстовая|2.01BYN/1M запрос|5.97BYN/1M ответ

Black Forest Labs: Flux 1 Kontext Max

Flux-1-Kontext-Max - премиум text-based image editing модель Black Forest Labs. Максимальная производительность и advanced typography generation для трансформации изображений через natural language.

Black Forest Labs|Изображения|0.26BYNза изображение

Black Forest Labs: Flux 1 Kontext Pro

Flux-1-Kontext-Pro - text-based image editing модель Black Forest Labs с high-quality prompt-adherent выходом. Оптимизирована под consistent результаты и advanced editing.

Black Forest Labs|Изображения|0.13BYNза изображение

Black Forest Labs: Flux 1 Krea Dev

Flux-1-Krea-Dev - 12B rectified flow transformer от Black Forest Labs и Krea. Фокус на aesthetic photography; guidance distillation для эффективного inference, открытые веса.

Black Forest Labs|Изображения|0.09BYNза изображение

Black Forest Labs: Flux 1 Pro

Flux-1-Pro - text-to-image модель Black Forest Labs для high-quality реалистичных изображений и чёткого текста. Для коммерческих и creative проектов.

Black Forest Labs|Изображения|0.13BYNза изображение

Black Forest Labs: Flux 1.1 Pro

Flux-1.1-Pro - улучшение Flux 1.0 Pro от Black Forest Labs с быстрой генерацией, улучшенным качеством и prompt adherence.

Black Forest Labs|Изображения|0.20BYNза изображение

Black Forest Labs: Flux 1.1 Pro Ultra

Flux-1.1-Pro-Ultra - high-resolution high-speed модель Black Forest Labs до 4MP (миллионов пикселей). Для professional printing, fine art и приложений требующих исключительной детализации.

Black Forest Labs|Изображения|0.20BYNза изображение

Black Forest Labs: Flux 2 Dev

Flux 2 Dev - open-weight image-модель Black Forest Labs серии Flux 2 (no source description).

Black Forest Labs|Изображения|0.06BYNза изображение

Black Forest Labs: Flux 2 Flex

FLUX.2 [flex] - рендеринг сложного текста, типографики и тонких деталей. Поддерживает multi-reference editing в единой архитектуре.

Black Forest Labs|Изображения|0.20BYNза изображение

Black Forest Labs: Flux 2 Klein 4B

FLUX.2 [klein] 4B - самая быстрая и бюджетная модель семейства FLUX.2. Заточена под high-throughput workloads при сохранении хорошего качества изображения.

Black Forest Labs|Изображения|0.05BYNза изображение

Black Forest Labs: Flux 2 Max

FLUX.2 [max] - SOTA image generation и advanced image editing с реализмом, точностью и consistency.

Black Forest Labs|Изображения|0.23BYNза изображение

Black Forest Labs: Flux 2 Pro

FLUX.2 [pro] - для high-quality манипуляции изображениями, style transfer и sequential editing workflows.

Black Forest Labs|Изображения|0.11BYNза изображение

Black Forest Labs: Flux Schnell Uncensored

Flux Schnell Uncensored - uncensored fine-tune быстрой image-модели Flux Schnell (no source description).

Black Forest Labs|Изображения|0.02BYNза изображение

Google: Gemini 2.0 Flash

Gemini Flash 2.0 - заметно быстрее времени до первого токена (TTFT) относительно предыдущих версий при сравнимом качестве с большими моделями. Улучшения в multimodal понимании, кодировании, сложных инструкциях и function calling для agentic workflows.

Google|Текстовая|0.32BYN/1M запрос|1.28BYN/1M ответ

Google: Gemini 2.0 Flash Lite

Gemini 2.0 Flash Lite - оптимизирована под крайне быстрые ответы и низкую цену при сохранении качества больших моделей. Для real-time и масштабных приложений.

Google|Текстовая|0.24BYN/1M запрос|0.96BYN/1M ответ

Google: Gemini 2.0 Flash Thinking

Gemini 2.0 Flash Thinking - reasoning-вариант Gemini 2.0 Flash от Google (no source description).

Google|Текстовая|0.39BYN/1M запрос|1.56BYN/1M ответ

Google: Gemini 2.5 Flash

Gemini 2.5 Flash - high-performance workhorse модель Google для advanced reasoning, coding, math и scientific задач. Встроенный «thinking»-режим настраивается через параметр max-tokens-for-reasoning.

Google|Текстовая|0.96BYN/1M запрос|7.95BYN/1M ответ

Google: Gemini 2.5 Flash Image Preview

Gemini 2.5 Flash Image (Nano Banana) - SOTA image generation модель с сильным контекстуальным пониманием. Image generation, editing и multi-turn conversational interaction.

Google|Изображения|0.96BYN/1M запрос|95.40BYN/1M ответ

Google: Gemini 2.5 Flash Lite

Gemini 2.5 Flash-Lite - облегчённая reasoning-модель серии Gemini 2.5 для крайне низкой latency и cost efficiency. Выше throughput, быстрее token generation, прирост на бенчмарках относительно прошлых Flash.

Google|Текстовая|0.32BYN/1M запрос|1.28BYN/1M ответ

Google: Gemini 2.5 Pro

Gemini 2.5 Pro - SOTA модель Google для advanced reasoning, coding, math и scientific задач. Использует «thinking»-возможности для nuanced контекста; первое место в LMArena leaderboard.

Google|Текстовая|3.98BYN/1M запрос|31.80BYN/1M ответ

Google: Gemini 3 Flash Preview

Gemini 3 Flash Preview - high-speed cost-effective reasoning-модель для agent-driven workflows, multi-turn диалога и coding поддержки. Near-Pro уровень reasoning и tool use при заметно меньшей latency; прирост в reasoning, multimodal понимании и надёжности относительно 2.5 Flash; контекст 1M.

Google|Текстовая|1.59BYN/1M запрос|9.55BYN/1M ответ

Google: Gemini 3 Pro Image Preview (Nano Banana Pro)

Gemini 3 Pro Image Preview (Nano Banana Pro) - продвинутая image generation и editing модель Google на базе Gemini 3 Pro. Улучшения multimodal reasoning, real-world grounding и high-fidelity visual synthesis; sophisticated text rendering в картинках, multi-image blending, identity preservation; Search grounding для актуальной информации.

Google|Изображения|6.36BYN/1M запрос|381.60BYN/1M ответ

Google: Gemini 3.1 Pro Preview

Gemini 3.1 Pro Preview - frontier reasoning модель Google с приростом software engineering, надёжного agent поведения и token efficiency. На фундаменте Gemini 3; reasoning по text/image/video/audio/code с контекстом 1M; улучшения в SWE-бенчмарках и autonomous task execution.

Google|Текстовая|6.36BYN/1M запрос|38.17BYN/1M ответ

Google: Gemma 2 27B

Gemma 2 27B от Google - open модель построенная на технологиях Gemini. Подходит для разных задач.

Google|Текстовая|3.11BYN/1M запрос|3.11BYN/1M ответ

Google: Gemma 3 12B

Gemma 3 - multimodal модель Google с поддержкой vision-language входа и text выхода. Контекст до 128K, 140+ языков; прирост в math, reasoning, chat, structured outputs и function calling.

Google|Текстовая|0.20BYN/1M запрос|0.60BYN/1M ответ

Google: Gemma 3 27B IT

Gemma 3 27B - open-source multimodal модель Google. Vision-language вход с text выходом, контекст 128K, 140+ языков. Прирост в math, reasoning, chat, structured outputs и function calling.

Google|Текстовая|0.39BYN/1M запрос|0.77BYN/1M ответ

Google: Gemma 3 4B

Gemma 3 4B - multimodal модель Google с поддержкой vision-language входа и text выхода. Контекст 128K, 140+ языков; прирост в math, reasoning и chat.

Google|Текстовая|0.20BYN/1M запрос|0.39BYN/1M ответ

Google: Gemma 3n 4B

Gemma 3n E4B - оптимизирована под efficient execution на mobile и low-resource устройствах (телефоны, ноутбуки, планшеты). Multimodal вход: text, visual data, audio.

Google|Текстовая|0.29BYN/1M запрос|0.58BYN/1M ответ

Z.ai: GLM 4 32B

Zhipu GLM 4 32B - cost-effective foundation LLM. Эффективно выполняет сложные задачи; заметно улучшенные tool use, online search и code-related интеллектуальные задачи.

Z.ai|Текстовая|0.48BYN/1M запрос|0.48BYN/1M ответ

Z.ai: GLM 4.5

Z.AI GLM-4.5 - флагман foundation модель специально для agent-based приложений. MoE архитектура, контекст до 128K; прирост в reasoning, code generation, agent alignment. Hybrid inference: «thinking mode» для сложного reasoning и tool use, «non-thinking» для instant ответов.

Z.ai|Текстовая|1.91BYN/1M запрос|7.00BYN/1M ответ

Z.ai: GLM 4.5 Air (free)

Z.AI GLM-4.5-Air - lightweight вариант флагман-семейства для agent-focused приложений. Как GLM-4.5 использует MoE архитектуру, но меньше параметров; hybrid inference modes (thinking/non-thinking).

Z.ai|Текстовая|0.40BYN/1M запрос|2.71BYN/1M ответ

Z.ai: GLM 4.5V

Z.AI GLM-4.5V - vision-language foundation модель для multimodal agent приложений. MoE с 106B общих и 12B активных параметров; SOTA в video understanding.

Z.ai|Текстовая|2.87BYN/1M запрос|8.59BYN/1M ответ

Z.ai: GLM 4.6

Z.AI GLM-4.6 - последняя версия серии GLM с контекстом 200K (выросло с 128K в GLM-4.5). Прирост в coding (бенчмарки + real-world результаты, front-end code generation), reasoning, tool use, agent frameworks и письме.

Z.ai|Текстовая|1.37BYN/1M запрос|5.54BYN/1M ответ

Z.ai: GLM 4.6V

Z.AI GLM-4.6V - large multimodal модель для high-fidelity visual understanding и long-context reasoning по картинкам, документам и mixed media. До 128K токенов, сложные page layouts.

Z.ai|Текстовая|1.44BYN/1M запрос|4.30BYN/1M ответ

Z.ai: GLM 4.7

Z.AI GLM-4.7 - флагман с улучшениями в двух главных аспектах: улучшенные programming возможности и большая стабильность в multi-step reasoning и execution. Заметный прогресс в сложных agent задачах, более естественные разговоры, enhanced front-end design.

Z.ai|Текстовая|1.28BYN/1M запрос|5.57BYN/1M ответ

Z.ai: GLM 4.7 Flash

Z.AI GLM-4.7-Flash - SOTA 30B-класс модель с балансом эффективности и производительности. Оптимизирована под agentic coding: coding-навыки, long-term планирование задач, tool integration; leading результаты среди open-source моделей своего размера.

Z.ai|Текстовая|0.29BYN/1M запрос|1.91BYN/1M ответ

Z.ai: GLM 5

Z.AI GLM-5 - флагман open-source foundation модель для advanced systems engineering и handling long-term agent workflows. Production-уровень на extensive programming, сопоставима с топовыми proprietary; agent planning, backend reasoning, iterative self-improvement.

Z.ai|Текстовая|1.91BYN/1M запрос|6.11BYN/1M ответ

Z.ai: GLM 5 Turbo

Z.AI GLM-5 Turbo - новая модель для быстрого inference и сильной производительности в agent окружениях вроде OpenClaw. Real-world agent workflows с длинными цепочками выполнения; декомпозиция сложных инструкций, tool use, scheduled и persistent execution.

Z.ai|Текстовая|3.82BYN/1M запрос|12.72BYN/1M ответ

OpenAI: GPT 5.1

GPT-5.1 - frontier-grade модель серии GPT-5 со более сильным general-purpose reasoning, лучшим instruction adherence и более естественным conversational style относительно GPT-5. Adaptive reasoning - быстрые ответы на простые запросы и глубокий анализ на сложных задачах.

OpenAI|Текстовая|3.98BYN/1M запрос|31.80BYN/1M ответ

OpenAI: GPT 5.1 Chat

GPT-5.1 Chat (Instant) - быстрый lightweight член семейства 5.1, оптимизирован под low-latency chat с сильным general intelligence. Adaptive reasoning селективно «думает» на сложных запросах; warmer и conversational по умолчанию; стабильнее short-form reasoning.

OpenAI|Текстовая|3.98BYN/1M запрос|31.80BYN/1M ответ

OpenAI: GPT 5.1 Codex

GPT-5.1-Codex - специализированная версия GPT-5.1 для software engineering и coding workflows. Интерактивные dev-сессии и long независимое выполнение; построение с нуля, feature development, debugging, large-scale refactoring, code review. Выше steerability и более чистый код.

OpenAI|Текстовая|3.98BYN/1M запрос|31.80BYN/1M ответ

OpenAI: GPT 5.1 Codex Max

GPT-5.1-Codex-Max - новейшая agentic coding модель OpenAI для extended high-context software development. Построена на обновлённой 5.1 reasoning stack, тренирована на agentic workflows (software engineering, math, research). Быстрее, лучше reasoning и token efficiency.

OpenAI|Текстовая|3.98BYN/1M запрос|31.80BYN/1M ответ

OpenAI: GPT 5.1 Codex Mini

GPT-5.1-Codex-Mini - меньший и более быстрый вариант GPT-5.1-Codex.

OpenAI|Текстовая|0.80BYN/1M запрос|6.36BYN/1M ответ

OpenAI: GPT 5.2 Chat

GPT-5.2 Chat (Instant) - быстрый lightweight член семейства 5.2 для low-latency chat с сильным general intelligence. Adaptive reasoning селективно «думает» на сложных запросах; warmer и conversational.

OpenAI|Текстовая|5.57BYN/1M запрос|44.52BYN/1M ответ

OpenAI: GPT 5.2 Codex

GPT-5.2-Codex - улучшенная версия GPT-5.1-Codex для software engineering и coding workflows. Интерактивные сессии и long независимое выполнение; точнее следует инструкциям, более чистый и качественный код; интеграция с CLI, IDE, GitHub, cloud.

OpenAI|Текстовая|5.57BYN/1M запрос|44.52BYN/1M ответ

OpenAI: GPT 5.2 Pro

GPT-5.2 Pro - наиболее продвинутая модель OpenAI с major приростом в agentic coding и long-context производительности относительно GPT-5 Pro. Step-by-step reasoning, precise instruction-following, accuracy в критических сценариях; advanced test-time routing.

OpenAI|Текстовая|66.78BYN/1M запрос|534.24BYN/1M ответ

OpenAI: GPT 5.4

GPT-5.4 - frontier-модель OpenAI объединяющая семейства Codex и GPT в единую систему. Контекст 1M+ токенов (922K input, 128K output), text и image input; high-context reasoning, coding и multimodal анализ. Прирост в coding, document understanding, tool use и instruction-following.

OpenAI|Текстовая|7.95BYN/1M запрос|47.70BYN/1M ответ

OpenAI: GPT 5.4 Mini

GPT-5.4 mini - основные возможности GPT-5.4 в более быстрой и эффективной модели для high-throughput workloads. Text и image input, сильная производительность в reasoning, coding и tool use при сниженной latency и стоимости.

OpenAI|Текстовая|2.39BYN/1M запрос|14.31BYN/1M ответ

OpenAI: GPT 5.4 Nano

GPT-5.4 nano - самый лёгкий и cost-efficient вариант семейства GPT-5.4 для speed-sensitive high-volume задач. Text и image input; low-latency: классификация, data extraction, ranking, sub-agent execution.

OpenAI|Текстовая|0.64BYN/1M запрос|3.98BYN/1M ответ

OpenAI: GPT 5.4 Pro

GPT-5.4 Pro - наиболее способная модель OpenAI расширяющая unified архитектуру GPT-5.4 с более сильным reasoning для complex high-stakes задач. Контекст 1M+ (922K input, 128K output), text/image input; agentic coding, long-context workflows, multi-step problem solving.

OpenAI|Текстовая|95.40BYN/1M запрос|572.40BYN/1M ответ

OpenAI: GPT Audio

GPT-audio - первая generally-available audio модель OpenAI. Upgraded decoder для более natural-sounding голосов, лучшая voice consistency.

OpenAI|Realtime аудио|11.93BYN/1M запрос|47.70BYN/1M ответ

OpenAI: GPT Audio Mini

GPT-audio Mini - cost-efficient версия GPT Audio. Upgraded decoder для natural голосов, лучшая voice consistency; цена $0.60 за миллион input.

OpenAI|Realtime аудио|2.87BYN/1M запрос|11.45BYN/1M ответ

OpenAI: GPT Image 1

GPT-image-1 - SOTA image generation модель OpenAI. Natively multimodal LLM принимающий text и image на входе с image выходом; powers ChatGPT image generation; исключительная prompt adherence, высокий уровень деталей.

OpenAI|Изображения|0.20BYNза изображение

OpenAI: GPT Image 1.5

GPT-Image-1.5 - флагман image generation и editing модели OpenAI для точного, естественного и быстрого создания. Надёжно следует инструкциям до тонких деталей (lighting, composition, facial likeness across edits); широкий спектр editing задач (addition, removal, stylization, combination, advanced text rendering). Генерация до 4× быстрее.

OpenAI|Изображения|0.16BYNза изображение

OpenAI: GPT OSS 120B

GPT-OSS-120B - open-weight 117B MoE LLM OpenAI для high-reasoning, agentic и general-purpose production. Активирует 5.1B параметров за forward pass, оптимизирована под deployment на single H100 GPU с native MXFP4 quantization; configurable reasoning depth, full chain-of-thought, native tool use (function calling, browsing, structured outputs).

OpenAI|Текстовая|0.19BYN/1M запрос|0.86BYN/1M ответ

OpenAI: GPT OSS 20B

GPT-OSS-20B - 21B open-weight MoE модель OpenAI под Apache 2.0. 3.6B активных параметров, оптимизирована под low-latency inference на consumer или single-GPU; тренирована в OpenAI Harmony response format, поддержка reasoning levels, fine-tuning, function calling, structured outputs.

OpenAI|Текстовая|0.12BYN/1M запрос|0.48BYN/1M ответ

OpenAI: GPT OSS Safeguard 20B

GPT-OSS Safeguard 20B - safety reasoning модель OpenAI на базе gpt-oss-20b. Open-weight 21B MoE с низкой latency для safety задач (content classification, LLM filtering, trust).

OpenAI|Текстовая|0.36BYN/1M запрос|1.44BYN/1M ответ

OpenAI: GPT-3.5 Turbo (older v0613)

GPT-3.5 Turbo - самая быстрая модель OpenAI. Понимает и генерирует natural language или код; оптимизирована под chat и traditional completion задачи. Training data до сентября 2021.

OpenAI|Текстовая|2.39BYN/1M запрос|7.16BYN/1M ответ

OpenAI: GPT-3.5 Turbo 16k

GPT-3.5 Turbo 16K - в четыре раза больше контекста gpt-3.5-turbo (~20 страниц текста за запрос) при более высокой цене. Training data до сентября 2021.

OpenAI|Текстовая|14.31BYN/1M запрос|19.09BYN/1M ответ

OpenAI: GPT-3.5 Turbo Instruct

GPT-3.5 Turbo Instruct - вариант GPT-3.5 Turbo тюненный под instructional промпты без chat-related оптимизаций. Training data до сентября 2021.

OpenAI|Текстовая|7.16BYN/1M запрос|9.55BYN/1M ответ

OpenAI: GPT-4 Turbo

OpenAI GPT-4 Turbo - последняя GPT-4 Turbo с vision-возможностями. JSON mode, function calling; training data до декабря 2023.

OpenAI|Текстовая|31.80BYN/1M запрос|95.40BYN/1M ответ

OpenAI: GPT-4 Turbo Preview

OpenAI GPT-4 - флагман-LLM, large-scale multimodal с решением сложных задач выше точности предыдущих моделей за счёт более широких знаний и продвинутого reasoning.

OpenAI|Текстовая|47.70BYN/1M запрос|143.10BYN/1M ответ

OpenAI: GPT-4.1

GPT-4.1 - флагман-LLM OpenAI оптимизирован под advanced instruction-following, real-world software engineering и long-context reasoning. Контекст 1M токенов; обходит GPT-4o и GPT-4.5 в coding (54.6% SWE-bench Verified), instruction compliance (87.4% IFEval), multimodal understanding. Точные code diffs, надёжность агентов, high recall.

OpenAI|Текстовая|6.36BYN/1M запрос|25.44BYN/1M ответ

OpenAI: GPT-4.1 Mini

GPT-4.1 Mini - средняя модель GPT-4.1 с производительностью конкурентной GPT-4o при заметно меньшей latency и стоимости. Контекст 1M, 45.1% на hard бенчмарках; сильна в coding и vision.

OpenAI|Текстовая|1.28BYN/1M запрос|5.09BYN/1M ответ

OpenAI: GPT-4.1 Nano

GPT-4.1 Nano - самая быстрая и cost-effective модель серии GPT-4.1 для low-latency задач (классификация, autocompletion). Контекст 1M токенов, исключительная производительность для размера.

OpenAI|Текстовая|0.32BYN/1M запрос|1.28BYN/1M ответ

OpenAI: GPT-4o

GPT-4o («o» от «omni») - multimodal модель OpenAI с поддержкой text и image на входе и text выходом. Прирост в non-English языках и visual understanding; быстрее и дешевле предыдущих моделей.

OpenAI|Текстовая|7.95BYN/1M запрос|31.80BYN/1M ответ

OpenAI: GPT-4o Audio

GPT-4o-audio-preview - расширение GPT-4o с поддержкой audio на входе в качестве промпта. Различает нюансы аудиозаписей; добавляет глубину user experiences. Audio выходы.

OpenAI|Текстовая|11.93BYN/1M запрос|47.70BYN/1M ответ

OpenAI: GPT-4o Mini

GPT-4o mini - наиболее продвинутая small модель OpenAI с поддержкой text и image на входе и text выходом. Cost-effective, SOTA в своём размере, обходит более крупные модели на ключевых бенчмарках.

OpenAI|Текстовая|0.48BYN/1M запрос|1.91BYN/1M ответ

OpenAI: GPT-4o Mini TTS

GPT-4o mini TTS - text-to-speech модель на базе GPT-4o mini. Преобразование текста в natural-sounding spoken audio.

OpenAI|Синтез речи|1.91BYN/1M запрос|38.17BYN/1M ответ

OpenAI: GPT-4o Search Preview

GPT-4o Search Preview - специализированный вариант GPT-4o для web search в Chat Completions. Тренирован понимать и выполнять web search запросы.

OpenAI|Текстовая|11.93BYN/1M запрос|47.70BYN/1M ответ

OpenAI: GPT-4o-mini Search Preview

GPT-4o mini Search Preview - специализированная модель для web search в Chat Completions. Тренирована понимать и выполнять web search запросы.

OpenAI|Текстовая|0.72BYN/1M запрос|2.87BYN/1M ответ

OpenAI: GPT-5

OpenAI GPT-5 - наиболее продвинутая модель OpenAI с major приростом в reasoning, качестве кода и user experience. Заточена под сложные задачи требующие step-by-step reasoning, instruction-following и точности.

OpenAI|Текстовая|3.98BYN/1M запрос|31.80BYN/1M ответ

OpenAI: GPT-5 Chat Latest

GPT-5 Chat - тонко настроена под advanced natural multimodal и context-aware разговоры в enterprise приложениях. Расширенное удержание контекста и понимание user intent.

OpenAI|Текстовая|5.97BYN/1M запрос|47.70BYN/1M ответ

OpenAI: GPT-5 Codex

GPT-5-Codex - специализированная версия GPT-5 для software engineering и coding. Для интерактивных dev-сессий и long независимого выполнения сложных engineering задач; построение проектов с нуля, новые фичи, debugging, large-scale refactoring, code review. Выше steerability, точнее следует инструкциям разработчика.

OpenAI|Текстовая|3.98BYN/1M запрос|31.80BYN/1M ответ

OpenAI: GPT-5 Image

GPT-5 Image - GPT-5 в комбинации с SOTA image generation возможностями. Major прирост в reasoning, качестве кода и UX; включает superior instruction-following от GPT Image 1.

OpenAI|Изображения|47.70BYN/1M запрос|190.80BYN/1M ответ

OpenAI: GPT-5 Image Mini

GPT-5 Image Mini - сочетает language возможности GPT-5 Mini с GPT Image 1 Mini для эффективной image generation. Native multimodal с superior instruction-following.

OpenAI|Изображения|11.93BYN/1M запрос|38.17BYN/1M ответ

OpenAI: GPT-5 Mini

GPT-5 Mini - компактный вариант GPT-5 для lightweight reasoning и chat задач. Сохраняет instruction-following и safety features при сниженной latency и стоимости; преемник o4-mini.

OpenAI|Текстовая|0.80BYN/1M запрос|6.36BYN/1M ответ

OpenAI: GPT-5 Nano

GPT-5-Nano - самый маленький и быстрый член семейства GPT-5 для dev-инструментов, быстрых user interactions и ultra-low latency окружений. Ограничен в reasoning depth относительно крупных, сохраняет instruction-following и safety; преемник GPT-4.1-nano.

OpenAI|Текстовая|0.16BYN/1M запрос|1.28BYN/1M ответ

OpenAI: GPT-5 Pro

GPT-5 Pro - наиболее продвинутая модель OpenAI с major приростом в reasoning, качестве кода и UX. Заточена под сложные задачи требующие step-by-step reasoning, instruction-following и точности.

OpenAI|Текстовая|71.55BYN/1M запрос|572.40BYN/1M ответ

OpenAI: GPT-5.2

GPT-5.2 - frontier-grade модель серии GPT-5 с более сильными agentic возможностями и long-context производительностью относительно GPT-5.1. Adaptive reasoning динамически распределяет ресурсы для быстрых ответов и глубокого анализа; прирост в math, programming, science, tool use.

OpenAI|Текстовая|5.57BYN/1M запрос|44.52BYN/1M ответ

OpenAI: GPT-5.3 Chat

GPT-5.3 Chat - обновление наиболее используемой модели ChatGPT для плавных, useful и directly helpful повседневных разговоров. Точнее ответы с лучшей contextualization, заметно меньше ненужных отказов и излишних caveats.

OpenAI|Текстовая|5.57BYN/1M запрос|44.52BYN/1M ответ

OpenAI: GPT-5.3-Codex

GPT-5.3-Codex - наиболее продвинутая agentic coding модель OpenAI, сочетающая frontier software engineering производительность GPT-5.2-Codex с более широким reasoning и professional knowledge GPT-5.2. SOTA на SWE-Bench Pro, сильна на Terminal-Bench 2.0 и OSWorld-Verified; multi-language coding, terminal fluency, real-world computer-use.

OpenAI|Текстовая|5.57BYN/1M запрос|44.52BYN/1M ответ

IBM: Granite 4.0 Micro

IBM Granite-4.0-H-Micro - 3B модель из семейства Granite 4. Fine-tuned под длинные задачи; серия enterprise моделей IBM.

IBM|Текстовая|0.09BYN/1M запрос|0.54BYN/1M ответ

Nous Research: Hermes 3 405B Instruct (free)

Nous Hermes 3 - generalist LLM с улучшениями над Hermes 2: advanced agentic capabilities, лучше roleplay, reasoning, multi-turn разговор, long-context coherence.

Nous Research|Текстовая|4.78BYN/1M запрос|4.78BYN/1M ответ

Nous Research: Hermes 3 70B Instruct

Nous Hermes 3 на Llama 3.1 70B - generalist LLM с улучшениями над Hermes 2: advanced agentic capabilities, лучше roleplay, reasoning, multi-turn разговор, long-context coherence.

Nous Research|Текстовая|1.44BYN/1M запрос|1.44BYN/1M ответ

Nous Research: Hermes 4 405B

Nous Hermes 4 - large-scale reasoning модель на Meta-Llama-3.1-405B от Nous Research. Hybrid reasoning режим: модель может deliberate internally.

Nous Research|Текстовая|4.78BYN/1M запрос|14.31BYN/1M ответ

Nous Research: Hermes 4 70B

Nous Hermes 4 70B - hybrid reasoning модель Nous Research на базе Meta-Llama-3.1-70B. Тот же hybrid режим что у 405B релиза.

Nous Research|Текстовая|0.63BYN/1M запрос|1.91BYN/1M ответ

Tencent: Hunyuan A13B Instruct

Tencent Hunyuan-A13B - 13B активных параметров MoE LLM от Tencent (80B общих) с поддержкой reasoning через Chain-of-Thought. Конкурентные бенчмарки.

Tencent|Текстовая|0.67BYN/1M запрос|2.72BYN/1M ответ

Tencent: Hunyuan Image 3

Tencent Hunyuan Image 3.0 - native multimodal модель Tencent для unified multimodal понимания и генерации в autoregressive фреймворке. Крупнейшая open-source image MoE - 80B параметров и 64 эксперта; SOTA photorealistic imagery, prompt fidelity; intelligent world knowledge reasoning обогащает sparse промпты.

Tencent|Изображения|0.20BYNза изображение

Google: Imagen 4

Imagen-4 - text-to-image модель Google для photorealistic качества, улучшенных fine деталей, advanced spelling и typography, высокой точности по разным художественным стилям. Включает SynthID watermarking для AI-generated content идентификации.

Google|Изображения|0.13BYNза изображение

Inflection: Inflection 3 Pi

Inflection 3 Pi - модель чат-приложения Pi (backstory, emotional intelligence, productivity, safety). Доступ к свежим новостям; для customer support и roleplay.

Inflection|Текстовая|11.93BYN/1M запрос|47.70BYN/1M ответ

Inflection: Inflection 3 Productivity

Inflection 3 Productivity - оптимизирована под следование инструкциям. Лучше для задач требующих JSON-вывода или точного следования предоставленным guidelines; доступ к свежим новостям.

Inflection|Текстовая|11.93BYN/1M запрос|47.70BYN/1M ответ

Prime Intellect: INTELLECT-3

INTELLECT-3 - 106B MoE модель (12B активных) post-trained из GLM-4.5-Air-Base через SFT + large-scale RL. SOTA для размера в math и других задачах.

Prime Intellect|Текстовая|0.96BYN/1M запрос|5.25BYN/1M ответ

AI21: Jamba Large 1.7

Jamba Large 1.7 - последняя модель в open-семействе Jamba от AI21 с приростом в grounding, instruction-following и эффективности. Построена на гибридной SSM-Transformer архитектуре с контекстом 256K.

AI21|Текстовая|9.55BYN/1M запрос|38.17BYN/1M ответ

Kuaishou: KAT-Coder-Pro V2

KAT-Coder-Pro V2 - high-performance модель серии KwaiKAT KAT-Coder от Kuaishou. Заточена под complex enterprise-grade software engineering и SaaS интеграцию; развитие agentic coding сильных сторон предыдущих версий.

Kuaishou|Текстовая|1.44BYN/1M запрос|5.73BYN/1M ответ

Moonshot: Kimi K2

Moonshot Kimi K2 Instruct - large-scale MoE LLM от Moonshot AI с 1T общих и 32B активных параметров за forward pass. Заточена под agentic capabilities: tool use, reasoning, code synthesis. Бенчмарки: LiveCodeBench, SWE-bench, ZebraLogic, GPQA, Tau2, AceBench; long-context до 128K; MuonClip optimizer.

Moonshot|Текстовая|2.72BYN/1M запрос|10.98BYN/1M ответ

Moonshot: Kimi K2 Thinking

Moonshot Kimi K2 Thinking - open reasoning-модель серии K2 для agentic long-horizon reasoning. Trillion-параметровая MoE с 32B активных, контекст 256K; persistent step-by-step thought, dynamic tool use, multi-agent поведение через 200-300 tool calls. Рекорды на HLE, BrowseComp, SWE-Multilingual, LiveCodeBench.

Moonshot|Текстовая|1.91BYN/1M запрос|7.95BYN/1M ответ

Moonshot: Kimi K2.5

Moonshot Kimi K2.5 - proprietary multimodal модель Moonshot AI с SOTA visual coding и self-directed agent swarm подходом. Развита из Kimi K2 + ~15T смешанных visual/text токенов; general reasoning, visual coding, autonomous tool invocation.

Moonshot|Текстовая|1.44BYN/1M запрос|7.16BYN/1M ответ

Liquid: LFM2-24B-A2B

Liquid LFM2-24B-A2B - крупнейшая модель семейства LFM2 на гибридной архитектуре для efficient on-device deployment. 24B MoE с 2B активных параметров.

Liquid|Текстовая|0.15BYN/1M запрос|0.58BYN/1M ответ

Meta: Llama 3 70B Instruct

Meta Llama 3 70B Instruct - модель Meta оптимизированная под high-quality диалог. Сильная производительность на human evaluations; для conversational AI задач.

Meta|Текстовая|2.44BYN/1M запрос|3.53BYN/1M ответ

Meta: Llama 3 8B Instruct

Meta Llama 3 8B Instruct - модель Meta оптимизированная под high-quality диалог. Эффективная для conversational AI задач.

Meta|Текстовая|0.20BYN/1M запрос|0.20BYN/1M ответ

Sao10K: Llama 3 8B Lunaris

Sao10K Lunaris 8B - универсальная generalist и roleplay модель на базе Llama 3. Strategic merge нескольких моделей для баланса креативности с улучшенной логикой и knowledge.

Sao10K|Текстовая|0.20BYN/1M запрос|0.24BYN/1M ответ

Meta: Llama 3.1 70B Hanami x1

L3.1 70B Hanami X1 - эксперимент Sao10K над Euryale v2.2 (на базе Llama 3.1 70B).

Meta|Текстовая|14.31BYN/1M запрос|14.31BYN/1M ответ

Meta: Llama 3.1 70B Instruct

Meta Llama 3.1 70B Instruct - модель Meta оптимизированная под high-quality диалог. Сильная производительность на human evaluations.

Meta|Текстовая|1.91BYN/1M запрос|1.91BYN/1M ответ

Meta: Llama 3.1 8B

Meta Llama 3.1 8B - 8B base модель Meta серии Llama 3.1 (no source description).

Meta|Текстовая|0.16BYN/1M запрос|0.16BYN/1M ответ

Meta: Llama 3.1 8B Instruct

Meta Llama 3.1 8B Instruct - быстрая и эффективная модель Meta серии Llama 3.1 для диалога. Сильная производительность на human evaluations при балансе скорости и качества.

Meta|Текстовая|0.10BYN/1M запрос|0.24BYN/1M ответ

Meta: Llama 3.1 Euryale 70B v2.2

Euryale L3.1 70B v2.2 - модель Sao10K с фокусом на creative roleplay (на базе Llama 3.1 70B). Последователь Euryale L3 70B v2.1.

Meta|Текстовая|4.06BYN/1M запрос|4.06BYN/1M ответ

Meta: Llama 3.2 11B Vision Instruct

Llama 3.2 11B Vision - multimodal модель Meta с 11B параметров для задач сочетающих visual и текстовые данные. Image captioning, visual QA; pre-trained на массивном датасете image-text пар.

Meta|Текстовая|1.17BYN/1M запрос|1.17BYN/1M ответ

Meta: Llama 3.2 1B Instruct

Llama 3.2 1B - 1B модель для эффективных NLP задач: summarization, диалог, multilingual анализ. Малый размер для low-resource deployment с поддержкой 8 core языков.

Meta|Текстовая|0.10BYN/1M запрос|0.64BYN/1M ответ

Meta: Llama 3.2 3B Instruct

Llama 3.2 3B - 3B multilingual модель для NLP задач (диалог, reasoning, summarization). Поддерживает 8 языков, тренирована на 9T токенов; сильна в instruction-following, сложном reasoning и tool use.

Meta|Текстовая|0.17BYN/1M запрос|1.07BYN/1M ответ

Meta: Llama 3.3 70B Instruct

Meta Llama 3.3 - 70B pretrained и instruction-tuned multilingual LLM. Оптимизирована под multilingual диалог; обходит многие open-source и closed чат-модели на индустриальных бенчмарках. Английский, немецкий, французский, итальянский, португальский, хинди, испанский, тайский.

Meta|Текстовая|0.48BYN/1M запрос|1.53BYN/1M ответ

Meta: Llama 3.3 Euryale 70B

Euryale L3.3 70B - модель Sao10K с фокусом на creative roleplay (на базе Llama 3.3 70B). Последователь Euryale L3 70B v2.2.

Meta|Текстовая|3.11BYN/1M запрос|3.58BYN/1M ответ

Meta: Llama 3.3 Nemotron Super 49B V1.5

Llama-3.3-Nemotron-Super-49B-v1.5 - 49B English-centric reasoning/chat модель на базе Llama-3.3-70B-Instruct с контекстом 128K. Post-trained под agentic workflows (RAG, tool calling) через SFT на math, code, science.

Meta|Текстовая|0.48BYN/1M запрос|1.91BYN/1M ответ

Meta: Llama 4 Scout 17B 16E Instruct (Free)

Llama 4 Scout 17B Instruct (16E) - MoE LLM Meta активирующая 17B параметров из 109B. Native multimodal вход.

Meta|Текстовая|0.39BYN/1M запрос|1.44BYN/1M ответ

Meta: Llama Guard 3 8B

Llama Guard 3 - Llama-3.1-8B pretrained модель fine-tuned под content safety classification. Классификация контента в LLM input (prompt classification) и других сценариях.

Meta|Текстовая|2.31BYN/1M запрос|0.15BYN/1M ответ

Meta: Llama Guard 4 12B

Llama Guard 4 - multimodal content safety classifier на основе Llama 4 Scout, fine-tuned под классификацию prompts и responses. Поддержка модерации на английском и других языках, mixed text+image prompts; согласована с MLCommons hazards taxonomy.

Meta|Текстовая|0.86BYN/1M запрос|0.86BYN/1M ответ

Anthropic: Maestro Reasoning

Maestro Reasoning - флагман-analysis модель Arcee на 32B параметров (derivative Qwen 2.5-32B) с DPO-тюнингом и chain-of-thought RL для step-by-step логики.

Anthropic|Текстовая|4.30BYN/1M запрос|15.75BYN/1M ответ

Mistral: Magistral Small 2509

Mistral Magistral Small - 24B efficient reasoning модель на базе Mistral Small 3.2 (2506) с добавленными reasoning возможностями. SFT из Magistral Medium traces + RL.

Mistral|Текстовая|1.20BYN/1M запрос|3.58BYN/1M ответ

TheDrummer: Magnum v4 72B

TheDrummer Magnum v4 72B - серия моделей повторяющих prose-качество Claude 3 (Sonnet и Opus). Fine-tune на базе Qwen 2.5 72B.

TheDrummer|Текстовая|14.31BYN/1M запрос|23.85BYN/1M ответ

Inception: Mercury 2

Inception Mercury 2 - крайне быстрая reasoning LLM, первая reasoning diffusion LLM (dLLM). Вместо последовательной генерации токенов производит и уточняет несколько токенов параллельно.

Inception|Текстовая|1.20BYN/1M запрос|3.58BYN/1M ответ

MiniMax: Mimo V2 Flash

MiMo-V2-Flash - open-source foundation LLM от Xiaomi. MoE с 309B общих и 15B активных параметров, hybrid attention; hybrid-thinking, контекст 256K; reasoning, coding, agent-задачи. №1 среди open-source на SWE-bench Verified и Multilingual бенчмарках.

MiniMax|Текстовая|0.32BYN/1M запрос|0.96BYN/1M ответ

MiniMax: MiniMax M1

MiniMax-M1 - large-scale open-weight reasoning модель с 456B общих и 45.9B активных параметров. Hybrid MoE + кастомная «lightning attention»; контекст до 1M, long-context understanding, software engineering, agentic tool use, math reasoning. RL pipeline CISPO; результаты на FullStackBench, SWE-bench, MATH, GPQA, TAU-Bench.

MiniMax|Текстовая|1.91BYN/1M запрос|7.00BYN/1M ответ

MiniMax: MiniMax M2

MiniMax-M2 - компактная efficient LLM с 10B активных (230B общих) параметров, оптимизирована под coding и agentic workflows. Near-frontier reasoning и tool use при низкой latency; code generation, multi-file editing, compile-run-fix циклы, automated test repair. SWE-Bench, Terminal-Bench; agentic BrowseComp, GAIA.

MiniMax|Текстовая|0.82BYN/1M запрос|3.18BYN/1M ответ

MiniMax: MiniMax M2-her

MiniMax M2-her - dialogue-first LLM для immersive roleplay, character-driven chat и выразительных multi-turn разговоров. Сохраняет consistent tone и personality, rich message support.

MiniMax|Текстовая|1.44BYN/1M запрос|5.73BYN/1M ответ

MiniMax: MiniMax M2.1

MiniMax-M2.1 - lightweight SOTA LLM для coding, agentic workflows и modern application development. 10B активных параметров; более concise/чистый вывод, более быстрые ответы относительно M2; 49.4% на Multi-SWE-Bench, 72.5% на SWE-Bench Multilingual.

MiniMax|Текстовая|0.93BYN/1M запрос|3.03BYN/1M ответ

MiniMax: MiniMax M2.5

MiniMax-M2.5 - SOTA LLM для реальной productivity. Тренирована в разных complex real-world digital working средах; расширяет coding-сильные стороны M2.1 на офисные задачи (Word, Excel, PowerPoint), переключение контекста между tools, коллаборация с mixed agent и human командами. 80.2% SWE-Bench Verified, 51.3% Multi-SWE-Bench, 76.3% BrowseComp.

MiniMax|Текстовая|0.72BYN/1M запрос|3.66BYN/1M ответ

MiniMax: MiniMax M2.7

MiniMax-M2.7 - LLM для autonomous реальной productivity и continuous improvement. Активная роль в собственной эволюции через advanced agentic capabilities (multi-agent collaboration); live debugging, root cause analysis, financial modeling, full document creation (Word, Excel, PowerPoint).

MiniMax|Текстовая|0.89BYN/1M запрос|3.82BYN/1M ответ

MiniMax: MiniMax-01

MiniMax-01 - комбинация MiniMax-Text-01 (генерация текста) и MiniMax-VL-01 (понимание изображений). 456B параметров, 45.9B активных за inference; большой контекст.

MiniMax|Текстовая|0.96BYN/1M запрос|5.25BYN/1M ответ

Mistral: Ministral 3 14B 2512

Mistral Ministral 3 14B - крупнейшая модель в Ministral 3 семействе с производительностью сопоставимой с Mistral Small 3.2 24B. Powerful efficient LLM.

Mistral|Текстовая|0.96BYN/1M запрос|0.96BYN/1M ответ

Mistral: Ministral 3 3B 2512

Mistral Ministral 3 3B - самая маленькая модель в Ministral 3 семействе. Powerful efficient tiny LLM с vision возможностями.

Mistral|Текстовая|0.48BYN/1M запрос|0.48BYN/1M ответ

Mistral: Ministral 8B 2410

Mistral Ministral 8B - 8B модель с interleaved sliding-window attention для быстрого memory-efficient inference. Контекст до 128K, edge use cases; превосходит модели sub-10B категории в knowledge и reasoning.

Mistral|Текстовая|0.48BYN/1M запрос|0.48BYN/1M ответ

Mistral: Mistral Embed

Mistral Embed - embedding-модель Mistral (no source description).

Mistral|Embedding|0.32BYN/1M запрос

Mistral: Mistral Large 2411

Mistral Large 3 - наиболее способная модель Mistral на sparse MoE с 41B активных и 675B общих параметров. Apache 2.0.

Mistral|Текстовая|1.59BYN/1M запрос|4.78BYN/1M ответ

Mistral: Mistral Medium 2505

Mistral Medium 3 - high-performance enterprise-grade LLM с балансом SOTA reasoning и multimodal возможностей при заметно сниженной операционной стоимости. Coding, STEM reasoning, enterprise adaptation; для hybrid и on-prem окружений.

Mistral|Текстовая|1.28BYN/1M запрос|6.36BYN/1M ответ

Mistral: Mistral Medium 3

Mistral Medium 3 - high-performance enterprise-grade LLM с frontier-уровнем возможностей при заметно меньшей стоимости. SOTA reasoning и multimodal производительность при 8× меньшей цене.

Mistral|Текстовая|1.91BYN/1M запрос|9.55BYN/1M ответ

Mistral: Mistral Medium 3.1

Mistral Medium 3.1 - обновлённая версия Medium 3, high-performance enterprise модель с frontier capabilities при сниженной стоимости. SOTA reasoning и multimodal баланс.

Mistral|Текстовая|1.91BYN/1M запрос|9.55BYN/1M ответ

Mistral: Mistral Nemo

Mistral Nemo - 12B модель с контекстом 128K от Mistral в сотрудничестве с NVIDIA. Multilingual: English, French, German, Spanish, Italian, Portuguese, Chinese, Japanese, и др.

Mistral|Текстовая|0.10BYN/1M запрос|0.15BYN/1M ответ

Mistral: Mistral Saba 2502

Mistral Saba - 24B LLM для Middle East и South Asia. Точные contextually релевантные ответы на индийских языках (Tamil, Malayalam) и арабском; тренирована на curated regional датасетах.

Mistral|Текстовая|0.64BYN/1M запрос|1.91BYN/1M ответ

Mistral: Mistral Small 2503

Mistral Small 4 - следующий major релиз Small семейства, объединяющий возможности нескольких флагманов в одной системе. Reasoning от Magistral, multimodal от Pixtral, agentic coding от Devstral.

Mistral|Текстовая|0.48BYN/1M запрос|1.91BYN/1M ответ

Mistral: Mistral Small 3

Mistral Small 3 - 24B LLM оптимизирована под low-latency. Apache 2.0; pre-trained и instruction-tuned версии для общих AI задач.

Mistral|Текстовая|0.24BYN/1M запрос|0.39BYN/1M ответ

Mistral: Mistral Small 3.1 24B

Mistral Small 3.1 24B Instruct - обновлённый Mistral Small 3 (2501) с 24B параметрами и advanced multimodal возможностями. SOTA в text-based reasoning.

Mistral|Текстовая|1.68BYN/1M запрос|2.65BYN/1M ответ

Mistral: Mistral Small 3.2 24B

Mistral-Small-3.2-24B-Instruct-2506 - обновлённая 24B модель оптимизированная под instruction-following, снижение повторов и улучшенный function calling относительно 3.1.

Mistral|Текстовая|0.36BYN/1M запрос|0.96BYN/1M ответ

Mistral: Mixtral 8x22B Instruct

Mistral Mixtral 8x22B Instruct - официальный instruct fine-tune Mixtral 8x22B. 39B активных параметров из 141B; сильна в math, coding.

Mistral|Текстовая|9.55BYN/1M запрос|28.62BYN/1M ответ

Morph: Morph V3 Fast

Morph V3 Fast - apply-модель Morph для code edits. ~10500 tokens/sec при 96% точности; формат промпта <instruction>{}</instruction> <code>{}</code> <update>{}</update>.

Morph|Текстовая|3.82BYN/1M запрос|5.73BYN/1M ответ

Morph: Morph V3 Large

Morph V3 Large - high-accuracy apply-модель Morph для сложных code edits. ~4500 tokens/sec при 98% точности; тот же промпт-формат что и Fast.

Morph|Текстовая|4.30BYN/1M запрос|9.07BYN/1M ответ

Gryphe: Mythomax L2 13B

MythoMax L2 13B - один из самых популярных и производительных fine-tune Llama 2 13B. Богатые описания и хорошая производительность в roleplay; merge нескольких моделей.

Gryphe|Текстовая|0.29BYN/1M запрос|0.29BYN/1M ответ

Google: Nano Banana 2 (Gemini 3.1 Flash Image Preview)

Gemini 3.1 Flash Image (Nano Banana 2) - флагман-Flash image модель Google DeepMind для high-fidelity генерации и быстрого advanced редактирования. Configurable thinking levels (Minimal vs High/Dynamic), улучшенный in-image text rendering, in-image localization (генерация/перевод текста в изображении), native aspect ratios.

Google|Изображения|1.59BYN/1M запрос|190.80BYN/1M ответ

NVIDIA: Nemotron 3 Nano 30B A3B (free)

NVIDIA Nemotron 3 Nano 30B A3B - малая MoE LLM с высокой compute efficiency и accuracy для разработчиков специализированных agentic AI систем. Open модель.

NVIDIA|Текстовая|0.24BYN/1M запрос|0.96BYN/1M ответ

NVIDIA: Nemotron 3 Super (free)

NVIDIA Nemotron 3 Super - 120B open hybrid MoE с 12B активных параметров для максимума compute efficiency и accuracy в сложных multi-agent сценариях. Hybrid Mamba-Transformer MoE с multi-token prediction; контекст 1M, генерация >50% быстрее ведущих open моделей.

NVIDIA|Текстовая|0.43BYN/1M запрос|2.15BYN/1M ответ

NVIDIA: Nemotron Nano 9B V2 (free)

NVIDIA Nemotron-Nano-9B-v2 - LLM тренированная NVIDIA с нуля как unified модель для reasoning и non-reasoning задач.

NVIDIA|Текстовая|0.20BYN/1M запрос|0.77BYN/1M ответ

Amazon: Nova 2 Lite

Amazon Nova 2 Lite - быстрая cost-effective reasoning-модель для everyday workloads. Принимает text, image, video для генерации текста.

Amazon|Текстовая|1.44BYN/1M запрос|11.93BYN/1M ответ

Amazon: Nova Lite v1

Amazon Nova Lite 1.0 - дешёвая multimodal модель Amazon для быстрой обработки image/video/text входа с text выходом. Real-time customer interactions, document analysis, visual QA; 300K контекст, video до 30 минут.

Amazon|Текстовая|0.20BYN/1M запрос|0.77BYN/1M ответ

Amazon: Nova Micro v1

Amazon Nova Micro 1.0 - text-only модель серии Nova с ультра-низкой latency и стоимостью. Контекст 128K; text summarization, translation, content classification, chat, brainstorming, базовый math/coding.

Amazon|Текстовая|0.12BYN/1M запрос|0.45BYN/1M ответ

Amazon: Nova Pro v1

Amazon Nova Pro 1.0 - универсальная multimodal модель Amazon с балансом точности, скорости и стоимости. SOTA на visual question answering (TextVQA) и financial document analysis; video input не поддерживается.

Amazon|Текстовая|2.55BYN/1M запрос|10.18BYN/1M ответ

OpenAI: O1

OpenAI o1 - семейство моделей разработанных тратить больше времени на «думание» перед ответом. Тренировано large-scale reinforcement learning для chain-of-thought reasoning; оптимизировано под math, science, programming и STEM. PhD-level точность на индустриальных бенчмарках.

OpenAI|Текстовая|71.55BYN/1M запрос|286.20BYN/1M ответ

OpenAI: O1 Pro

OpenAI o1-pro - модель серии o1 тренированная reinforcement learning для думания перед ответом и complex reasoning. Использует больше compute для более глубокого мышления и стабильных ответов.

OpenAI|Текстовая|715.50BYN/1M запрос|2862.00BYN/1M ответ

OpenAI: O3

OpenAI o3 - well-rounded мощная модель устанавливающая новый стандарт в math, science, coding и visual reasoning. Сильна в техническом письме и instruction-following; для multi-step problem solving по text/code/images. BYOK для доступа.

OpenAI|Текстовая|6.36BYN/1M запрос|25.44BYN/1M ответ

OpenAI: o3 Deep Research

OpenAI o3-deep-research - advanced модель OpenAI для глубоких исследований, complex multi-step research задач. Всегда использует «web_search» tool (доп. стоимость).

OpenAI|Текстовая|47.70BYN/1M запрос|190.80BYN/1M ответ

OpenAI: O3 Mini

OpenAI o3-mini - cost-efficient LLM оптимизирована под STEM reasoning (science, math, coding). Параметр reasoning_effort для настраиваемого thinking time; прирост над предшественником на сложных вопросах при меньшей latency и стоимости.

OpenAI|Текстовая|5.25BYN/1M запрос|20.99BYN/1M ответ

OpenAI: o3 Mini High

OpenAI o3-mini-high - та же модель что o3-mini с reasoning_effort=high. Cost-efficient LLM оптимизирована под STEM reasoning.

OpenAI|Текстовая|5.25BYN/1M запрос|20.99BYN/1M ответ

OpenAI: o3 Pro

OpenAI o3-pro - o-серия моделей тренированных reinforcement learning для думания перед ответом и complex reasoning. Использует больше compute для более глубокого мышления и стабильных ответов.

OpenAI|Текстовая|95.40BYN/1M запрос|381.60BYN/1M ответ

OpenAI: O4 Mini

OpenAI o4-mini - компактная reasoning-модель o-серии, оптимизирована под быструю cost-efficient производительность при сохранении multimodal и agentic возможностей. Tool use, конкурентный reasoning и coding; обходит o3-mini и приближается к o3 в некоторых доменах.

OpenAI|Текстовая|3.50BYN/1M запрос|14.00BYN/1M ответ

OpenAI: o4 Mini Deep Research

OpenAI o4-mini-deep-research - более быстрая и доступная deep-research модель для сложных multi-step research задач. Всегда использует «web_search» tool (доп. стоимость).

OpenAI|Текстовая|9.55BYN/1M запрос|38.17BYN/1M ответ

OpenAI: o4 Mini High

OpenAI o4-mini-high - та же модель что o4-mini с reasoning_effort=high. Компактная reasoning-модель o-серии для multimodal и agentic задач.

OpenAI|Текстовая|5.25BYN/1M запрос|20.99BYN/1M ответ

AllenAI: Olmo 3 32B Think

Olmo 3 32B Think - 32B-параметровая модель AI2 для deep reasoning, сложных logic chains и advanced instruction-following.

AllenAI|Текстовая|0.72BYN/1M запрос|2.39BYN/1M ответ

Mistral: Open Mistral Nemo 2407

Mistral Large 2 (mistral-large-2407) - флагман Mistral AI с поддержкой множества языков (French, German, Spanish, Italian, Portuguese, Arabic, Hindi, Russian, Chinese, Japanese, Korean) и 80+ языков программирования. Длинный контекст для precise information recall; reasoning, code, JSON, chat.

Mistral|Текстовая|0.09BYN/1M запрос|0.20BYN/1M ответ

Writer: Palmyra X5

Writer Palmyra X5 - наиболее продвинутая модель Writer для построения и масштабирования AI агентов в enterprise. Industry-leading скорость и эффективность на контекстных окнах до 1M.

Writer|Текстовая|2.87BYN/1M запрос|28.62BYN/1M ответ

Microsoft: Phi 4 Mini Instruct

Phi-4-mini-instruct - lightweight open модель серии Phi-4 построенная на synthetic data и filtered websites. Фокус на high-quality reasoning-dense данных.

Microsoft|Текстовая|0.39BYN/1M запрос|1.67BYN/1M ответ

Microsoft: Phi-4

Microsoft Phi-4 - 14B модель Microsoft Research для сложных reasoning задач, эффективная в low-memory или high-throughput сценариях. Тренирована на mix высококачественной synthetic и curated data; оптимизирована под English, сильна в instruction following.

Microsoft|Текстовая|0.32BYN/1M запрос|0.67BYN/1M ответ

Mistral: Pixtral Large 2411

Mistral Pixtral Large - 124B open-weight multimodal модель на базе Mistral Large 2. Понимание документов, чартов и натуральных изображений; research и commercial лицензии.

Mistral|Текстовая|6.36BYN/1M запрос|19.09BYN/1M ответ

Qwen: Qwen 2.5 72B Instruct

Qwen 2.5 72B - очередная серия Qwen LLM с приростом в знаниях, кодировании и математике относительно Qwen 2. Специализированные expert-модели, генерация длинных текстов от 8K токенов, structured outputs и поддержка 29+ языков.

Qwen|Текстовая|1.72BYN/1M запрос|1.91BYN/1M ответ

Qwen: Qwen Image

Qwen-Image - foundation image-модель от Qwen с фокусом на high-fidelity text rendering и сложную интеграцию текста (English и Chinese). Поддерживает разные художественные стили, style transfer, object manipulation и human pose editing.

Qwen|Изображения|0.12BYNза изображение

Qwen: Qwen Max

Qwen-Max - MoE-модель Qwen на базе Qwen 2.5 с лучшим inference в линейке для сложных multi-step задач. Pretrained на 20T+ токенов с SFT и RLHF; точное число параметров не раскрыто.

Qwen|Текстовая|5.09BYN/1M запрос|20.36BYN/1M ответ

Qwen: Qwen Plus 0728 (thinking)

Qwen-Plus на базе Qwen 2.5 - модель с контекстом 131K, сбалансированная между производительностью, скоростью и стоимостью.

Qwen|Текстовая|1.25BYN/1M запрос|3.73BYN/1M ответ

Qwen: Qwen Turbo

Qwen-Turbo - модель на базе Qwen 2.5 с контекстом 1M, заточенная под скорость и низкую стоимость. Для простых задач где эффективность и доступная цена важнее глубокого reasoning.

Qwen|Текстовая|0.16BYN/1M запрос|0.64BYN/1M ответ

Qwen: Qwen2.5 7B Instruct

Qwen 2.5 7B - компактная модель серии с приростом в знаниях, кодировании и математике над Qwen 2. Те же улучшения что и у 72B-варианта, но в более доступном 7B формате.

Qwen|Текстовая|0.20BYN/1M запрос|0.48BYN/1M ответ

Qwen: Qwen2.5 Coder 32B Instruct

Qwen 2.5 Coder 32B - последняя серия code-specific Qwen LLM (бывший CodeQwen). Заметные улучшения в code generation и code reasoning относительно CodeQwen 1.5.

Qwen|Текстовая|3.15BYN/1M запрос|4.78BYN/1M ответ

Qwen: Qwen2.5 VL 72B Instruct

Qwen 2.5 VL 72B - vision-модель умеющая распознавать обычные объекты (цветы, птицы, рыбы, насекомые) и анализировать текст, чарты, иконки, графику и layout картинок.

Qwen|Текстовая|1.20BYN/1M запрос|3.58BYN/1M ответ

Qwen: Qwen3 14B

Qwen3-14B - dense 14.8B causal LLM серии Qwen3, для reasoning и эффективного диалога. Переключение между «thinking» mode (math, programming, логика) и «non-thinking» (general chat). Поддержка 100+ языков, agent tool use, multilingual задач.

Qwen|Текстовая|0.48BYN/1M запрос|1.15BYN/1M ответ

Qwen: Qwen3 235B A22B

Qwen3-235B-A22B - 235B MoE модель Qwen, активирующая 22B параметров за forward pass. Переключение thinking/non-thinking режимов; reasoning, 100+ языков, instruction-following и agent tool calling.

Qwen|Текстовая|0.34BYN/1M запрос|0.48BYN/1M ответ

Qwen: Qwen3 235B A22B Thinking 2507

Qwen3-235B-A22B-Thinking-2507 - open-weights MoE для сложного reasoning. Активирует 22B из 235B параметров, нативно поддерживает 262144 токена контекста. Thinking-only вариант для логики, математики, science и long-form генерации.

Qwen|Текстовая|0.72BYN/1M запрос|7.14BYN/1M ответ

Qwen: Qwen3 30B A3B Instruct 2507

Qwen3-30B-A3B-Instruct-2507 - 30.5B MoE модель с 3.3B активных параметров. Non-thinking режим, заточена под качественное instruction-following и multilingual задачи.

Qwen|Текстовая|0.43BYN/1M запрос|1.44BYN/1M ответ

Qwen: Qwen3 30B A3B Thinking 2507

Qwen3-30B-A3B-Thinking-2507 - 30B MoE reasoning-модель для сложных задач с extended multi-step мышлением. Разделяет внутренние reasoning-следы от ответа.

Qwen|Текстовая|0.39BYN/1M запрос|1.91BYN/1M ответ

Qwen: Qwen3 32B

Qwen3-32B - dense 32.8B causal LLM серии Qwen3. Переключение thinking/non-thinking режимов; instruction-following, agent tool use, creative writing, 100+ языков.

Qwen|Текстовая|0.26BYN/1M запрос|0.90BYN/1M ответ

Qwen: Qwen3 8B

Qwen3-8B - dense 8.2B causal LLM серии Qwen3 для reasoning и эффективного диалога. Переключение thinking/non-thinking режимов для math, code, логики vs general chat.

Qwen|Текстовая|0.24BYN/1M запрос|1.91BYN/1M ответ

Qwen: Qwen3 Coder

Qwen3-Coder-480B-A35B-Instruct - MoE code-generation модель Qwen. 480B общих параметров, 35B активных (8 из 160 экспертов). Заточена под agentic coding: function calling, tool use, long-context reasoning по репозиториям. Variable pricing зависит от длины контекста.

Qwen|Текстовая|1.05BYN/1M запрос|8.59BYN/1M ответ

Qwen: Qwen3 Coder 30B A3B Instruct

Qwen3-Coder-30B-A3B-Instruct - 30.5B MoE модель с 128 экспертами (8 активных). Для code generation, repository-scale понимания и agentic tool use.

Qwen|Текстовая|0.34BYN/1M запрос|1.29BYN/1M ответ

Qwen: Qwen3 Coder Flash

Qwen3 Coder Flash - быстрый cost-efficient вариант proprietary Qwen3 Coder Plus от Alibaba. Coding-агент для autonomous programming через tool calling.

Qwen|Текстовая|0.94BYN/1M запрос|4.66BYN/1M ответ

Qwen: Qwen3 Coder Next

Qwen3-Coder-Next - open-weight causal LLM для coding-агентов и локальных dev workflows. Sparse MoE на 80B общих параметров и 3B активных.

Qwen|Текстовая|0.53BYN/1M запрос|3.82BYN/1M ответ

Qwen: Qwen3 Coder Plus

Qwen3 Coder Plus - proprietary версия open-source Qwen3 Coder 480B A35B от Alibaba. Coding-агент для autonomous programming через tool use и environment interaction; сочетает coding-навыки с general-purpose возможностями.

Qwen|Текстовая|2.39BYN/1M запрос|10.34BYN/1M ответ

Qwen: Qwen3 Max

Qwen3-Max - обновлённая модель Qwen3 с приростом в reasoning, instruction-following, multilingual support и long-tail knowledge относительно январской 2025 версии. Лучше в math, coding, logic, science; меньше hallucinations.

Qwen|Текстовая|2.87BYN/1M запрос|14.31BYN/1M ответ

Qwen: Qwen3 Max Thinking

Qwen3-Max-Thinking - флагман-reasoning серии Qwen3 для сложных cognitive задач с deep multi-step мышлением. Масштабированный capacity и RL-compute.

Qwen|Текстовая|3.73BYN/1M запрос|18.61BYN/1M ответ

Qwen: Qwen3 Next 80B A3B Instruct

Qwen3-Next-80B-A3B-Instruct - instruction-tuned chat модель Qwen3-Next для быстрых стабильных ответов без «thinking»-следов. Reasoning, code generation, knowledge Q&A, multilingual; выше throughput и стабильность на длинных входах.

Qwen|Текстовая|0.34BYN/1M запрос|3.50BYN/1M ответ

Qwen: Qwen3 Next 80B A3B Thinking

Qwen3-Next-80B-A3B-Thinking - reasoning-focused модель генерирующая структурированные thinking-traces по умолчанию. Multi-step задачи, math proofs, code synthesis, agentic planning; работает только в thinking режиме.

Qwen|Текстовая|0.34BYN/1M запрос|3.34BYN/1M ответ

Qwen: Qwen3 VL 235B A22B Instruct

Qwen3-VL-235B-A22B Instruct - open-weight multimodal модель сочетающая text generation с visual understanding (картинки, видео). VQA, document parsing, chart/table extraction, multilingual OCR; 2D/3D spatial understanding.

Qwen|Текстовая|0.96BYN/1M запрос|4.20BYN/1M ответ

Qwen: Qwen3 VL 235B A22B Thinking

Qwen3-VL-235B-A22B Thinking - multimodal модель оптимизированная под reasoning в STEM и math. Robust perception, 2D/3D spatial understanding, long-form visual comprehension; agent interaction и tool use.

Qwen|Текстовая|1.25BYN/1M запрос|12.41BYN/1M ответ

Qwen: Qwen3 VL 30B A3B Instruct

Qwen3-VL-30B-A3B-Instruct - multimodal модель сочетающая text generation с visual understanding для картинок и видео. Instruct-вариант для general multimodal задач.

Qwen|Текстовая|0.63BYN/1M запрос|2.49BYN/1M ответ

Qwen: Qwen3 VL 30B A3B Thinking

Qwen3-VL-30B-A3B-Thinking - multimodal Thinking-вариант с усиленным reasoning в STEM, math и сложных задачах.

Qwen|Текстовая|0.63BYN/1M запрос|7.45BYN/1M ответ

Qwen: Qwen3 VL 32B Instruct

Qwen3-VL-32B-Instruct - large-scale multimodal vision-language модель для high-precision понимания и reasoning text/image/video. Dense 32B параметров, deep visual perception, advanced text reasoning.

Qwen|Текстовая|0.50BYN/1M запрос|1.99BYN/1M ответ

Qwen: Qwen3 VL 8B Instruct

Qwen3-VL-8B-Instruct - multimodal модель серии Qwen3-VL для high-fidelity понимания и reasoning text/image/video. Улучшенный multimodal fusion с Interleaved-MRoPE для long-horizon visual reasoning.

Qwen|Текстовая|0.39BYN/1M запрос|2.39BYN/1M ответ

Qwen: Qwen3 VL 8B Thinking

Qwen3-VL-8B-Thinking - reasoning-вариант 8B multimodal модели для visual и textual reasoning по сложным сценам, документам и temporal sequences.

Qwen|Текстовая|0.56BYN/1M запрос|6.52BYN/1M ответ

Qwen: Qwen3.5 397B A17B

Qwen3.5 397B-A17B - native vision-language модель на гибридной архитектуре с linear attention + sparse MoE. SOTA-уровень в language understanding, logical reasoning, code generation, agent-задачах, image и video understanding, GUI interaction.

Qwen|Текстовая|1.44BYN/1M запрос|7.45BYN/1M ответ

Qwen: Qwen3.5-122B-A10B

Qwen3.5 122B-A10B - native vision-language модель на гибридной архитектуре с linear attention + sparse MoE. Выше inference efficiency относительно обычных Transformer.

Qwen|Текстовая|1.25BYN/1M запрос|9.93BYN/1M ответ

Qwen: Qwen3.5-27B

Qwen3.5 27B - dense native vision-language модель с linear attention. Быстрые ответы при балансе скорости inference и качества.

Qwen|Текстовая|0.94BYN/1M запрос|7.45BYN/1M ответ

Qwen: Qwen3.5-35B-A3B

Qwen3.5 35B-A3B - native vision-language модель на гибридной архитектуре с linear attention + sparse MoE. Выше inference efficiency при сохранении качества.

Qwen|Текстовая|0.67BYN/1M запрос|4.78BYN/1M ответ

Qwen: Qwen3.5-9B

Qwen3.5 9B - multimodal foundation модель серии Qwen3.5 для reasoning, coding и visual understanding в эффективной 9B архитектуре. Unified vision-language design.

Qwen|Текстовая|0.20BYN/1M запрос|0.72BYN/1M ответ

Qwen: Qwen3.5-Flash

Qwen3.5 Flash - native vision-language модель на гибридной архитектуре с linear attention + sparse MoE. Заточена под высокий inference efficiency.

Qwen|Текстовая|0.32BYN/1M запрос|1.25BYN/1M ответ

DeepSeek: R1 0528

DeepSeek R1 - open-source модель с производительностью сопоставимой с OpenAI o1, с полностью открытыми reasoning токенами. 671B параметров, 37B активных за inference pass.

DeepSeek|Текстовая|2.39BYN/1M запрос|10.26BYN/1M ответ

DeepSeek: R1 Distill Llama 70B

DeepSeek R1 Distill Llama 70B - дистилляция на базе Llama-3.3-70B-Instruct с использованием выходов DeepSeek R1. Сочетает advanced distillation техники для высокой производительности.

DeepSeek|Текстовая|3.34BYN/1M запрос|3.82BYN/1M ответ

DeepSeek: R1 Distill Qwen 32B

DeepSeek R1 Distill Qwen 32B - дистилляция на базе Qwen 2.5 32B с использованием выходов DeepSeek R1. Превосходит OpenAI o1-mini на разных бенчмарках.

DeepSeek|Текстовая|1.39BYN/1M запрос|1.39BYN/1M ответ

Reka: Reka Edge

Reka Edge - крайне эффективная 7B multimodal vision-language модель принимающая image/video+text входы и генерирующая текст. Заточена под image understanding.

Reka|Текстовая|0.48BYN/1M запрос|0.48BYN/1M ответ

Reka: Reka Flash 3

Reka Flash 3 - general-purpose instruction-tuned LLM на 21B параметров от Reka. Сильна в chat, coding, instruction-following и function calling.

Reka|Текстовая|0.48BYN/1M запрос|0.96BYN/1M ответ

Relace: Relace Apply 3

Relace Apply 3 - специализированная code-patching LLM, мерджит AI-suggested edits в исходные файлы. Применяет обновления от GPT-4o, Claude и других в файлы.

Relace|Текстовая|4.06BYN/1M запрос|5.97BYN/1M ответ

Relace: Relace Search

Relace Search - использует 4-12 view_file и grep tools параллельно для исследования codebase и возврата релевантных файлов. В отличие от RAG, выполняет agentic search.

Relace|Текстовая|4.78BYN/1M запрос|14.31BYN/1M ответ

Gryphe: ReMM SLERP 13B

Gryphe ReMM-SLERP-L2-13B - попытка пересоздать оригинальный MythoMax-L2-13B с обновлёнными моделями. Merge.

Gryphe|Текстовая|2.15BYN/1M запрос|3.11BYN/1M ответ

Essential AI: Rnj 1 Instruct

Rnj-1 - 8B dense open-weight модель Essential AI тренированная с нуля с фокусом на programming, math и scientific reasoning.

Essential AI|Текстовая|0.72BYN/1M запрос|0.72BYN/1M ответ

TheDrummer: Rocinante 12B

TheDrummer Rocinante 12B - модель для engaging storytelling и rich prose. Расширенный vocabulary с уникальными выразительными выборами слов, vivid narrative.

TheDrummer|Текстовая|0.82BYN/1M запрос|2.06BYN/1M ответ

ByteDance: Seed 1.6

ByteDance Seed 1.6 - general-purpose модель ByteDance Seed team. Multimodal с adaptive deep thinking; контекст 256K.

ByteDance|Текстовая|1.20BYN/1M запрос|9.55BYN/1M ответ

ByteDance: Seed 1.6 Flash

ByteDance Seed 1.6 Flash - ультра-быстрая multimodal deep thinking модель ByteDance Seed. Text и visual понимание; контекст 256K.

ByteDance|Текстовая|0.36BYN/1M запрос|1.44BYN/1M ответ

ByteDance: Seed-2.0-Lite

ByteDance Seed-2.0-Lite - универсальный cost-efficient enterprise workhorse с сильными multimodal и agent возможностями при низкой latency. Практичный default для большинства production задач.

ByteDance|Текстовая|1.20BYN/1M запрос|9.55BYN/1M ответ

ByteDance: Seed-2.0-Mini

ByteDance Seed-2.0-mini - заточена под latency-sensitive, high-concurrency и cost-sensitive сценарии. Производительность сопоставима с ByteDance-Seed-1.6; контекст 256K, 4 уровня reasoning effort, multimodal understanding.

ByteDance|Текстовая|0.48BYN/1M запрос|1.91BYN/1M ответ

ByteDance: Seedream 4

ByteDance Seedream 4.0 - text-to-image и image editing модель. Высокоскоростная high-resolution генерация с контекстуальным пониманием; объединяет генерацию и редактирование в единой архитектуре. Multi-reference batches, разнообразные style transfers.

ByteDance|Изображения|0.10BYNза изображение

ByteDance: Seedream 4.5

ByteDance Seedream 4.5 - proprietary image модель с приростом в editing consistency (preservation объектов, light и color tone), portrait clarity и small-text rendering. Улучшенная композиция нескольких изображений.

ByteDance|Изображения|0.13BYNза изображение

ByteDance: Seedream 5 Lite

ByteDance Seedream 5.0 lite - proprietary image-модель с multi-step логическим reasoning, example-based editing и domain-knowledge интеграцией. Пользователь может задать before/after reference пару вместо текстового описания изменения.

ByteDance|Изображения|0.09BYNза изображение

TheDrummer: Skyfall 36B V2

TheDrummer Skyfall 36B v2 - улучшенная итерация Mistral Small 2501, fine-tuned под креативность, nuanced письмо, roleplay и coherent storytelling.

TheDrummer|Текстовая|2.63BYN/1M запрос|3.82BYN/1M ответ

Upstage: Solar Mini

Upstage Solar Mini - компактная модель Upstage (no source description).

Upstage|Текстовая|0.32BYN/1M запрос|0.64BYN/1M ответ

Upstage: Solar Pro 2

Upstage Solar Pro 2 - модель Upstage (no source description).

Upstage|Текстовая|0.60BYN/1M запрос|1.91BYN/1M ответ

Upstage: Solar Pro 3

Upstage Solar Pro 3 - MoE LLM Upstage с 102B общих и 12B активных параметров за forward pass. Исключительная производительность при сохранении computational efficiency.

Upstage|Текстовая|0.60BYN/1M запрос|1.91BYN/1M ответ

Perplexity: Sonar

Perplexity Sonar - lightweight доступная быстрая question-answering модель с цитированиями и настраиваемыми источниками. Для компаний интегрирующих быстрые citation-enabled Q&A фичи.

Perplexity|Текстовая|3.18BYN/1M запрос|3.18BYN/1M ответ

Perplexity: Sonar Deep Research

Perplexity Sonar Deep Research - research-focused модель для multi-step retrieval, синтеза и reasoning по сложным темам. Автономно ищет, читает и оценивает источники; для финансов, технологий, здоровья, текущих событий. Pricing по prompt токенам, citation токенам, числу поисков и reasoning токенам.

Perplexity|Текстовая|9.55BYN/1M запрос|38.17BYN/1M ответ

Perplexity: Sonar Pro

Perplexity Sonar Pro - enterprise-grade API для advanced multi-step запросов с расширяемостью. Длинные nuanced поиски, follow-up вопросы; вдвое больше цитирований на поиск относительно базового Sonar; большие контекстные окна.

Perplexity|Текстовая|9.55BYN/1M запрос|47.70BYN/1M ответ

Perplexity: Sonar Pro Search

Perplexity Sonar Pro Search - доступен эксклюзивно через OpenRouter API. Наиболее advanced agentic search система Perplexity для глубокого reasoning и анализа.

Perplexity|Текстовая|14.31BYN/1M запрос|71.55BYN/1M ответ

Perplexity: Sonar Reasoning Pro

Perplexity Sonar Reasoning Pro - premier reasoning модель на DeepSeek R1 с Chain-of-Thought (CoT). Advanced multi-step запросы с большим контекстом и большим числом цитирований за поиск; pricing включает Perplexity search costs.

Perplexity|Текстовая|9.55BYN/1M запрос|38.17BYN/1M ответ

Arcee: Spotlight

Arcee Spotlight - 7B vision-language модель на базе Qwen 2.5-VL, fine-tuned под tight image-text grounding. Контекст 32K для multimodal задач.

Arcee|Текстовая|0.86BYN/1M запрос|0.86BYN/1M ответ

StepFun: Step 3.5 Flash

StepFun Step 3.5 Flash - наиболее способная open-source foundation модель StepFun. Sparse MoE архитектура, селективно активирует 11B из 196B параметров за токен.

StepFun|Текстовая|0.43BYN/1M запрос|1.44BYN/1M ответ

OpenAI: Text Embedding 3 Large

OpenAI Text-Embedding-3-Large - наиболее способная embedding модель с поддержкой English и не-English текстов. High-dimensional embeddings (до 3072 dim) для semantic similarity, search, clustering; гибкие trade-offs между производительностью и ресурсами.

OpenAI|Embedding|0.42BYN/1M запрос

OpenAI: Text Embedding 3 Small

OpenAI Text-Embedding-3-Small - efficient compact embedding модель для конвертации текста в numerical representations (semantic search, clustering, recommendations). Прирост производительности и cost-efficiency над предыдущими моделями; низкая latency и storage.

OpenAI|Embedding|0.07BYN/1M запрос

OpenAI: Text Embedding Ada

Text Embedding Ada - embedding-модель OpenAI (no source description).

OpenAI|Embedding|0.32BYN/1M запрос

Arcee: Trinity Mini

Arcee Trinity Mini - 26B sparse MoE модель (3B активных) со 128 экспертами (8 активных). Заточена под efficient reasoning на длинных контекстах (131K) с надёжным function-calling.

Arcee|Текстовая|0.22BYN/1M запрос|0.72BYN/1M ответ

ByteDance: UI-TARS 7B

ByteDance UI-TARS-1.5 - multimodal vision-language агент для GUI-окружений (desktop, web browsers, mobile, игры). Развитие UI-TARS с reinforcement learning.

ByteDance|Текстовая|0.48BYN/1M запрос|0.96BYN/1M ответ

TheDrummer: UnslopNemo 12B

TheDrummer UnslopNemo v4.1 - последнее дополнение от автора Rocinante, заточено под adventure writing и role-play сценарии.

TheDrummer|Текстовая|1.91BYN/1M запрос|1.91BYN/1M ответ

Arcee: Virtuoso Large

Arcee Virtuoso-Large - топ-tier general-purpose LLM на 72B параметров для cross-domain reasoning, creative writing и enterprise QA. Сохраняет контекст 128K в отличие от многих 70B-аналогов.

Arcee|Текстовая|3.58BYN/1M запрос|5.73BYN/1M ответ

Mistral: Voxtral Small 24B 2507

Mistral Voxtral Small - расширение Mistral Small 3 с SOTA audio-input возможностями при сохранении best-in-class text производительности. Speech transcription, translation и audio understanding.

Mistral|Текстовая|0.48BYN/1M запрос|1.44BYN/1M ответ

Mancer: Weaver (alpha)

Mancer Weaver - попытка пересоздать Claude-style verbosity (без аналогичного уровня coherence и memory). Для roleplay/нарративных сценариев.

Mancer|Текстовая|3.58BYN/1M запрос|4.78BYN/1M ответ

OpenAI: Whisper Large v3

OpenAI Whisper Large v3 - SOTA модель для automatic speech recognition (ASR) и speech translation. Тренирована на 5M+ часов labeled data; сильная generalization по датасетам и доменам, zero-shot transcription и translation.

OpenAI|Распознавание речи|19.09BYN/1M запрос

OpenAI: Whisper Large v3 Turbo

OpenAI Whisper Large-v3-Turbo - fine-tuned версия pruned Whisper large-v3. Та же модель но число decoding layers снижено с 32 до 4; заметно быстрее ценой минимальной потери качества.

OpenAI|Распознавание речи|19.09BYN/1M запрос

Microsoft: WizardLM 2 8x22B

WizardLM-2 8x22B - продвинутая Wizard модель Microsoft AI, конкурентная с ведущими proprietary моделями и обходящая SOTA open-source. Instruct fine-tune Mixtral 8x22B; оптимизирована под complex reasoning и instruction-following.

Microsoft|Текстовая|1.98BYN/1M запрос|1.98BYN/1M ответ

Qwen: Z Image Turbo

Z-Image Turbo - image-модель Alibaba (no source description).

Qwen|Изображения|0.03BYNза изображение

Цены указаны в белорусских рублях за 1 миллион токенов

Подключение через API Цены и тарификация Документация

Готовы начать?

Получите API-ключ и начните использовать AI модели уже сегодня

Получить API-ключ бесплатно →

Каталог нейросетей AIAI.BY

В каталоге представлены 300+ моделей искусственного интеллекта от ведущих мировых провайдеров — OpenAI, Anthropic, Google, Meta, xAI и DeepSeek. Каждая модель доступна через единый API, совместимый с форматом OpenAI: текстовые модели (GPT-5, Claude, Gemini), модели генерации изображений (DALL-E, Flux), reasoning-модели и бюджетные варианты для массовых задач.

Все цены указаны в белорусских рублях за 1 миллион токенов. Фильтруйте по провайдеру, категории или стоимости, чтобы подобрать оптимальную модель. Для детального сравнения моделей между собой используйте раздел Сравнение.

Не знаете, какую модель выбрать? Наши специалисты помогут подобрать модель под вашу задачу — от обработки клиентских обращений до анализа финансовой отчётности. Подключение занимает 5 минут, первые 100K токенов — бесплатно.