сравнение ИИ

Claude 5 vs GPT-6: тест на реальных задачах из редакции

Мы скормили двум моделям 30 задач, с которыми сталкивались в работе за последний квартал — от расшифровки интервью до отладки sql. Без cherry-pick.

Юрий Берёзкин · 17 мая 2026 г. · 15 мин чтения

В декабре 2025-го Anthropic выпустила Claude 5, в январе 2026-го OpenAI ответила GPT-6. С тех пор мы используем обе модели ежедневно в редакции и накопили достаточно опыта, чтобы написать не маркетинговое сравнение, а реальное.

Методика простая: 30 задач, с которыми мы сталкивались за последний квартал. Каждая задача давалась обеим моделям с одинаковым промптом, ответы оценивали трое: один редактор, один разработчик и один человек, далёкий от технологий (он оценивал «читабельность» и «полезность как обычному человеку»).

Категории задач

  • Расшифровка интервью (8 задач): аудио → текст → структурированный конспект.
  • Отладка кода (7 задач): SQL, Python, TypeScript — реальные баги из наших проектов.
  • Длинный анализ (6 задач): «прочти этот PDF на 80 страниц и ответь на 5 вопросов».
  • Креативное письмо (5 задач): редакторские правки текстов под другую аудиторию.
  • Многошаговое планирование (4 задачи): «спланируй переезд офиса с 5 сотрудниками».

Сухие результаты

По общему счёту: Claude 5 — 18 побед, GPT-6 — 9, ничья — 3. По категориям:

  • Расшифровка интервью: Claude 5 — 6, GPT-6 — 2. Claude существенно лучше понимает контекст в русскоязычной речи с переключениями на английский.
  • Отладка кода: GPT-6 — 5, Claude 5 — 1, ничья — 1. GPT заметно сильнее в коде — особенно когда нужно держать в голове большую кодовую базу.
  • Длинный анализ: Claude 5 — 5, GPT-6 — 0, ничья — 1. Контекстное окно Claude (1М токенов в новой ревизии) играет роль; в GPT нужно резать PDF на куски.
  • Креативное письмо: Claude 5 — 4, GPT-6 — 1. Claude чувствует тон редакционных текстов лучше; GPT часто скатывается в усреднённый «нейтральный» стиль.
  • Многошаговое планирование: Claude 5 — 2, GPT-6 — 1, ничья — 1.

Что важно за пределами цифр

Скорость и стоимость. GPT-6 заметно быстрее: типичный ответ за 6-8 секунд против 12-15 у Claude. По стоимости — Claude 5 дороже примерно на 30% за миллион токенов вывода. Для интерактивной работы (чат-интерфейс) GPT-6 субъективно приятнее именно из-за скорости.

Tone и «вежливость». Claude по-прежнему более склонен к развёрнутым ответам с оговорками и попыткой быть «полезным». GPT — короче и резче, но иногда полезнее именно из-за этого. Если задача — «дай быстрый ответ», GPT часто лучше.

Кодинг-агенты. Если вы используете AI-агентов в IDE (Cursor, Zed, Claude Code), Claude 5 пока заметно стабильнее в роли «помощник, который не сломает кодовую базу». GPT-6 быстрее, но чаще «переписывает то, что не просили».

Что мы стали использовать ежедневно

В редакции теперь так: Claude 5 — для расшифровок, факт-чека, редактуры, длинных анализов. GPT-6 — для всего, что связано с кодом, и для быстрых ответов в чате. Caching у Anthropic экономит нам ~$200 в месяц на повторных длинных контекстах.

Рекомендация

Если бы мы могли иметь только одну подписку — это был бы Claude 5, потому что он сильнее на задачах, где «качество > скорость». Но если вы много кодите — берите обе, разница в кодинг-категории слишком большая, чтобы её игнорировать.

Сырые данные тестирования (вопросы, оба ответа на каждый, оценки) выложены отдельным репозиторием на GitHub — там же протокол оценивания.

Читайте также