Для чего нужны мобильные бенчмарки?

Мобильные бенчмарки нужны для объективного измерения производительности смартфонов и планшетов. Они выполняют стандартизированные сценарии, нагружая процессор, графику, память и другие компоненты, чтобы получить числовую оценку. Это позволяет сравнивать разные модели, проверять заявленные характеристики и выявлять случаи нечестной оптимизации.

Что измеряет AnTuTu и как интерпретировать его результаты?

AnTuTu — это комплексный бенчмарк, оценивающий процессор (CPU), графику (GPU), память (MEM) и пользовательский опыт (UX). Он выдаёт единую итоговую оценку, но важно смотреть на детализированные суб-показатели: два телефона с одинаковой суммой могут иметь разный баланс, например один лучше в играх, другой — в скорости работы с приложениями.

Какие возможности есть у современных версий AnTuTu?

Современные версии AnTuTu включают тесты, приближенные к реальному использованию, например обработку документов Word и Excel или конвертацию видео. Добавлены тесты искусственного интеллекта (CPU AI) и скорости чтения данных для нейросетей. Графическая подсистема тестируется с помощью сцен на движке Unreal Engine 5.5 для оценки запаса производительности в будущих играх.

Что такое Geekbench AI и для чего он нужен?

Geekbench AI — специализированная версия бенчмарка для измерения производительности устройств в задачах машинного обучения. Он использует реальные сценарии компьютерного зрения и обработки естественного языка, нагружая CPU, GPU и нейронные модули (NPU). Результаты помогают понять, насколько хорошо смартфон справится с распознаванием объектов или работой с голосовыми помощниками нового поколения.

Для чего используется бенчмарк 3DMark на мобильных устройствах?

3DMark — это «золотой стандарт» для тестирования графической производительности. Он создаёт нагрузку, приближенную к современным 3D-играм, рендерит сложные сцены с высоким разрешением и измеряет результат в баллах и кадрах в секунду (FPS). Это напрямую отражает способность устройства запускать требовательные игры на комфортных настройках.

Что показывает стресс-тест в 3DMark (Wild Life Stress Test)?

Стресс-тест в 3DMark прогоняет сцену многократно для оценки стабильности работы чипа под длительной нагрузкой. Падение производительности в этом тесте указывает на перегрев и троттлинг — снижение тактовых частот для охлаждения. Это критически важно для понимания, как устройство поведёт себя в долгих игровых сессиях.

Чем Burnout Benchmark отличается от других тестов производительности?

Burnout Benchmark специализируется на измерении стабильности под экстремальной длительной нагрузкой. В отличие от краткосрочных тестов, он нагружает процессор и графику в течение продолжительного времени, чтобы выявить предрасположенность к троттлингу. Результат представляется в виде графика, показывающего, как меняется частота и нагрев с течением времени.

Что такое троттлинг и почему важно его измерять?

Троттлинг — это снижение тактовых частот процессора или графического чипа из-за перегрева для защиты компонентов. Измерять его важно, потому что он напрямую влияет на производительность в реальных сценариях. Устройство с мощным чипом, но плохой системой охлаждения может проигрывать по стабильности более слабому конкуренту в длительных играх или тяжёлых приложениях.

Какой бенчмарк лучше всего подходит для оценки игровых возможностей смартфона?

Для оценки игровых возможностей лучше всего подходит 3DMark, так как он специализируется на графике. Однако для полной картины стоит смотреть и на результаты Burnout Benchmark, который покажет стабильность производительности в длительных игровых сессиях, и на суб-показатели AnTuTu, которые могут выявить узкие места в памяти или процессоре.

Почему для оценки производительности важно смотреть не только на общий балл бенчмарка?

Общий балл даёт лишь общее представление о классе устройства, но два телефона с одинаковой суммой могут иметь разный баланс. Один может быть лучше в играх за счёт мощной графики, другой — быстрее в многозадачности благодаря скоростному накопителю и оперативной памяти. Только детализированные отчёты по каждому компоненту позволяют сделать правильный выбор под конкретные задачи.

Мобильные бенчмарки: что это и зачем они нужны

Q: На чём фокусируется бенчмарк Geekbench?

Geekbench в первую очередь измеряет производительность центрального процессора (CPU) в реалистичных сценариях. Он разделяет нагрузку на однопоточные и многопоточные задачи, что позволяет оценить скорость работы как в повседневных приложениях, так и в требовательных расчётах. Результат представляется в виде двух чисел, что делает его стандартом для сравнения процессорной мощи.

Нажмите, чтобы оценить наш труд:

[Всего: 1 Средняя: 5]

Мобильные бенчмарки представляют собой специализированное программное обеспечение, предназначенное для измерения производительности смартфонов и планшетов в контролируемых условиях. Эти инструменты выполняют заранее прописанные сценарии, нагружая ключевые компоненты устройства — центральный процессор, графический ускоритель, оперативную память и накопитель — для получения числовой оценки их возможностей.

Результаты тестов позволяют сравнить разные модели устройств, оценить заявленные производителем характеристики и понять, насколько та или иная новинка соответствует ожиданиям от её использования в реальных задачах, хотя и не являются единственным критерием выбора.

Содержание скрыть

1 Назначение мобильных бенчмарков

1.1 AnTuTu и его возможности

1.2 Geekbench

1.3 3DMark

1.4 Burnout Benchmark

2 Учет бенчмарков при выборе гаджета

Назначение мобильных бенчмарков

Основное назначение бенчмарков заключается в создании объективной метрики для сравнения огромного количества устройств на рынке.

Поскольку субъективные ощущения от работы могут сильно различаться, единая шкала оценок помогает отделить реальную производительность от маркетинговых заявлений. Тесты выявляют не только мощь процессора, но и эффективность оптимизации программного обеспечения: например, обновление версии Android может дать значительно больший прирост скорости работы в интернете, чем увеличение частоты процессора. Кроме того, бенчмарки служат инструментом проверки честности производителей, раскрывая случаи, когда устройства работают на пределе возможностей исключительно во время прохождения тестов, но не в повседневных сценариях.

Современные бенчмарки также играют важную роль в отслеживании технологического прогресса. По мере того как мобильные чипы становятся сложнее, а их архитектура разнообразнее, тесты помогают разработчикам и инженерам оценивать эффективность новых решений. Они позволяют понять, насколько хорошо устройство справляется не только с текущими задачами, но и с перспективными нагрузками, такими как алгоритмы искусственного интеллекта или сложная 3D-графика. При этом важно понимать, что высокий балл в синтетическом тесте не всегда гарантирует идеальную плавность интерфейса или длительное время автономной работы, которые зависят от комплексной оптимизации аппаратного и программного обеспечения.

Разберем основные примеры, а прочие опустим, чтобы не затягивать статью.

Таблица поможет читателю быстро сопоставить ключевые тесты, понять, что именно они измеряют и как эти результаты соотносятся с реальным использованием устройства:

Бенчмарк	Что измеряет	Формат результата	Сильные стороны (по первому тексту)	Ограничения / что не учитывает (по второму тексту)
AnTuTu	Комплексный тест: CPU, GPU, память (MEM), пользовательский опыт (UX), AI	Единый общий балл + детальные субпоказатели	Позволяет оценить общую производительность и сбалансированность системы. Включает современные сценарии (Unreal Engine 5.5, AI).	Не показывает стабильность под длительной нагрузкой (троттлинг). Высокий балл не гарантирует плавность в играх через час.
Geekbench	Производительность CPU (одно- и многопоточная), а также AI (Geekbench AI)	Два числа (одно-/многопоточный балл)	«Золотой стандарт» для сравнения процессоров. Позволяет оценить как повседневную, так и пиковую вычислительную мощность.	Тестирует CPU в изоляции, без учёта графики и общей системы. Не отражает реальную игровую производительность.
3DMark	Графическая производительность (GPU) в сценах, приближенных к играм	Баллы + FPS (кадры в секунду), стресс-тесты	Наглядно показывает, как устройство справится с требовательными играми. Стресс-тест выявляет троттлинг.	Высокий балл может быть получен за счёт кратковременного разгона, который не сохраняется в реальных игровых сессиях.
Burnout Benchmark	Стабильность производительности под длительной экстремальной нагрузкой	График изменения частот и температуры (профиль троттлинга)	Единственный тест, специализирующийся на устойчивости к перегреву. Позволяет сравнить эффективность систем охлаждения.	Не даёт комплексной оценки производительности, фокусируется только на одном аспекте.

Тестовое устройство для этого обзора: Samsung Galaxy Tab S11 Ultra 5G с 12 ГБ RAM и 256 ГБ хранилища, обзор которого уже был у нас на сайте (правда, другого, на 16 ГБ / 512 ГБ).

AnTuTu и его возможности

Скачать можно тут: https://www.antutu.com/web/download

AnTuTu является одним из самых популярных и комплексных бенчмарков, оценивающих устройство по целому ряду параметров и выдающих единую итоговую оценку. Его методология включает тестирование центрального процессора (CPU), графического процессора (GPU), оперативной и постоянной памяти (MEM), а также пользовательского опыта (UX). Такой подход позволяет получить общее представление о сбалансированности системы и её готовности к разным типам нагрузок — от игр до многозадачности. Именно общие рейтинги AnTuTu часто фигурируют в презентациях производителей и новостных сводках о самых мощных смартфонах месяца.

Возможности AnTuTu постоянно расширяются, чтобы идти в ногу с развитием технологий:

Новейшие версии теста включают специализированные нагрузки, приближенные к реальному использованию, например, обработку документов Word и Excel или конвертацию видеоформатов.
Для оценки перспективных задач добавлены тесты вычислительных способностей искусственного интеллекта (CPU AI) и скорости чтения больших данных, необходимых для работы нейросетей.
Графическая подсистема тестируется с помощью сцен, созданных на движке Unreal Engine 5.5, что позволяет оценить запас производительности для будущих игр с фотореалистичной графикой.

Анализируя результаты AnTuTu, можно получить детальную информацию о сильных и слабых сторонах устройства. Суммарный балл даёт общее представление о классе производительности, но более ценными являются суб-показатели по каждой категории. Например, два телефона с одинаковой итоговой суммой могут иметь совершенно разный баланс: один будет лучше в играх, а другой — быстрее работать с приложениями благодаря скоростному накопителю. Именно поэтому важно смотреть на детализированные отчёты, а не только на громкий заголовок о новом рекорде.

Geekbench

Скачать можно тут: https://play.google.com/store/search?q=geekbench

Geekbench фокусируется в первую очередь на измерении производительности центрального процессора (CPU), используя для этого реалистичные вычислительные сценарии. Тест разделяет нагрузку на однопоточные и многопоточные задачи, что позволяет оценить скорость работы как в повседневных приложениях (открытие сайтов, работа с почтой), так и в более требовательных, таких как обработка видео или сложные расчёты. Результат представляется в виде двух понятных чисел, что делает Geekbench стандартом для сравнения процессорной мощи устройств на разных платформах.

С развитием технологий роль Geekbench вышла за рамки простого тестирования CPU:

Сегодня существует специализированная версия Geekbench AI, которая измеряет производительность устройства в задачах машинного обучения.
Этот бенчмарк использует реальные сценарии компьютерного зрения и обработки естественного языка, нагружая не только центральный процессор, но и графический чип (GPU), и специализированные нейронные модули (NPU).
Результаты Geekbench AI помогают понять, насколько хорошо смартфон справится с задачами будущего, такими как распознавание объектов на фото или работа с голосовыми помощниками нового поколения.

Возможность сравнения результатов между разными версиями Geekbench требует осторожности, так как каждое крупное обновление методологии может приводить к изменению итоговых баллов. Например, Geekbench AI 1.1 и 1.2 используют обновлённые фреймворки и модели, что повышает точность и производительность, но делает результаты несовместимыми с предыдущими версиями. Тем не менее, это наиболее авторитетный инструмент для профессиональной оценки вычислительной мощности и эффективности работы с новыми типами данных.

3DMark

Скачать можно тут: https://play.google.com/store/search?q=3damrk

3DMark от UL Solutions является безусловным лидером в области тестирования графической производительности мобильных устройств. В отличие от комплексных пакетов, 3DMark фокусируется исключительно на игровых возможностях, создавая нагрузку, максимально приближенную к современным трёхмерным играм. Тесты включают рендеринг сложных сцен с высоким разрешением и использованием передовых графических эффектов, а результат измеряется не только в итоговых баллах, но и в количестве кадров в секунду (FPS), что напрямую говорит о плавности геймплея.

Пакет 3DMark включает несколько тестов для разных классов устройств.

Например, тест Wild Life используется для сравнения производительности современных смартфонов, а его стресс-версия (Wild Life Stress Test) прогоняет сцену многократно для оценки стабильности работы чипа под длительной нагрузкой. Падение производительности в стресс-тесте может указывать на перегрев и троттлинг, когда устройство вынуждено снижать частоты для охлаждения. Более старые тесты, такие как Sling Shot, используются для оценки менее мощных устройств.

Результаты 3DMark критически важны для геймеров, так как они напрямую отражают способность телефона запускать требовательные игры на комфортных настройках. Высокий балл в этом тесте гарантирует, что устройство справится с современными хитами, обеспечивая высокую и стабильную частоту кадров. Кроме того, результаты 3DMark часто используются аналитиками и обозревателями для сравнения графической мощи флагманских чипсетов, таких как новейшие процессоры Qualcomm или MediaTek.

Вернемся к сценам. 3DMark — это не просто абстрактный «тест производительности», а набор графических сцен, каждая из которых создана для оценки GPU в определенных условиях. Эти сцены рендерятся в реальном времени, имитируя игровую графику, а результат (баллы) напрямую зависит от того, насколько быстро устройство может их отрисовать.

Например, некоторые из сцен:

Wild Life: Кроссплатформенный тест для сравнения производительности смартфонов, планшетов и ноутбуков. Использует Vulkan на Android и Windows, Metal на iOS. Сцена представляет собой фэнтезийный мир с парящими кристаллами и сложными эффектами постобработки.
Wild Life Stress Test: Многократный прогон сцены Wild Life для оценки стабильности и троттлинга. Результат показывает график производительности с течением времени, а не просто средний балл. Позволяет выявить, насколько хорошо устройство охлаждается под длительной нагрузкой.
Wild Life Extreme: Усиленная версия теста Wild Life с рендерингом в 4K (3840×2160). Создаёт в три раза большую нагрузку на GPU по сравнению с обычной версией. Предназначен для самых мощных устройств и чипов Apple M-серии.
Sling Shot: Тест для оценки OpenGL ES 3.0/3.1 на смартфонах и планшетах среднего и высокого уровня. Сцена напоминает Cloud Gate из ПК-версии и включает сложное освещение. Используется в двух вариантах: для 1080p и для 1440p (2K).
Night Raid: Бенчмарк для устройств со встроенной графикой и поддержкой DirectX 12, включая ARM-процессоры. Сцена выполнена в стиле аниме/киберпанк с динамическими отражениями и тесселяцией. Процессорный тест моделирует физику и процедурную генерацию объектов.
Solar Bay: Тест для проверки производительности трассировки лучей в реальном времени на мобильных устройствах. Рендерит футуристический техногенный мир со сложными отражениями. Доступен в обычной и Extreme-версии для самых передовых GPU.
Steel Nomad Light: Новейший не кроссплатформенный тест для iOS, Android и Windows, использующий Metal, Vulkan и DirectX 12. Представляет постапокалиптический пейзаж с высокой детализацией геометрии. Это самый тяжёлый тест для мобильных GPU без использования трассировки лучей.

Burnout Benchmark

Скачать можно тут: https://play.google.com/store/search?q=Burnout%20Benchmark

Burnout Benchmark — это специализированный инструмент, который фокусируется на измерении стабильности и производительности устройства под длительной экстремальной нагрузкой. В отличие от краткосрочных тестов, которые могут показать пиковую производительность, Burnout Benchmark нагружает процессор и графический чип в течение продолжительного времени, чтобы выявить предрасположенность к троттлингу — снижению тактовых частот из-за перегрева. Это особенно важно для понимания того, как устройство поведёт себя в ресурсоёмких играх или при работе с профессиональными приложениями в течение часа и более.

Методология Burnout Benchmark основана на циклическом прогоне сложных вычислительных алгоритмов и отслеживании падения производительности.
Тест предоставляет пользователю график, наглядно демонстрирующий, как меняется частота работы чипов и уровень их нагрева с течением времени. Это позволяет сравнить эффективность систем охлаждения разных смартфонов в одинаковых условиях.
Производители, которые уделяют внимание не только пиковой, но и устойчивой производительности, получают в этом бенчмарке высокие оценки.

Результаты Burnout Benchmark являются важным дополнением к данным других тестов, таких как 3DMark. В то время как 3DMark показывает, насколько мощная у телефона графика, Burnout Benchmark отвечает на вопрос, как долго он сможет демонстрировать эту мощь без потери производительности.

Для тех, кто планирует активно использовать смартфон для мобильного гейминга или работы с дополненной реальностью, показатели устойчивости к троттлингу являются не менее важными, чем пиковые баллы в синтетических тестах.

Если обратиться к нашим результатам на фото выше, то можно сделать такие выводы:

По результату Burnout Benchmark видно выраженное троттлинг-поведение: при Compute Score 87.5 стабильность всего 44.1%, что означает почти двукратное падение производительности под нагрузкой — график сверху показывает резкий спад и дальнейшую работу на заниженной частоте.
Это типичная картина перегрева или агрессивного thermal-лимита: система быстро сбрасывает частоты, чтобы удержать температуру и энергопотребление.
При этом 118 Perf/Watt говорит о неплохой энергоэффективности в урезанном режиме, но именно устойчивость под длительной нагрузкой слабая — для игр или рендеринга это означает заметное снижение FPS спустя несколько минут.

Но как объяснить тот факт, что при многочасовой игре в такие игры, как Undecember, Diablo Immortal, Genshin Impact и прочие, нет никакого дискомфорта и падений FPS ?

Наше объяснение такое. Отсутствие дискомфорта в играх, данном случае на MediaTek Dimensity 9400+, при ультра-настройках объясняется тем, что приложение Burnout Benchmark создаёт экстремальную, синтетическую и полностью CPU/GPU-загруженную нагрузку, тогда как реальные игры редко держат 100% одновременную загрузку всех ядер и графики длительное время; кроме того, игровые движки динамически распределяют нагрузку, используют кэширование, масштабирование разрешения и ограничение FPS, поэтому даже при снижении частот из-за троттлинга производительность остаётся выше порога комфортного фреймрейта (например, стабильные 60 FPS), а падение с условных 100% до 70–75% в реальном сценарии субъективно почти не ощущается.

Учет бенчмарков при выборе гаджета

Бенчмарки — это полезный, но не единственный инструмент в арсенале технократа.

Представьте, что вы покупаете автомобиль: тест-драйв и цифры разгона до сотни важны, но они не расскажут вам о расходе топлива через три года, надежности подвески или удобстве посадки для пассажиров сзади.

С гаджетами та же история. AnTuTu или Geekbench отлично показывают пиковую производительность «здесь и сейчас», но они не моделируют ситуацию, когда телефон проведет два часа в требовательной игре на солнце, или как быстро начнет деградировать аккумулятор после года активных циклов зарядки. Ориентироваться только на них — значит выбирать спринтера для марафонского забега.

Если вы берете устройство с прицелом на несколько лет, особенно для игр, ключевым становится не столько сырой балл в тесте, сколько совокупность факторов.

Решающее значение имеет эффективность системы охлаждения (наличие испарительной камеры), качество программной оптимизации (как часто производитель выпускает обновления и не режут ли они производительность со временем), а также тип и скорость памяти UFS (для игр важна не только графика, но и скорость загрузки уровней).
Бенчмарки часто показывают производительность процессора в отрыве от реальной работы, где включаются троттлинг, фоновые процессы и нагрев корпуса.
Телефон с результатом 1.5 миллиона в AnTuTu, но слабой системой охлаждения, через полгода будет проигрывать в реальных играх модели с результатом 1.2 миллиона, но с отличной системой отвода тепла и вдумчивым софтом.

Мой подход как технократа — использовать бенчмарки для «отбраковки» заведомо слабых вариантов и для сравнения однопоколенных чипов. Но окончательное решение всегда базируется на анализе обзоров с реальными тестами в играх (с замерами FPS и стабильности кадров), изучении опыта владельцев спустя полгода-год использования и оценке «сухих» технических спецификаций вроде версии Bluetooth, стандарта Wi-Fi и типа дисплея.

Бенчмарк говорит, насколько быстро чип может считать, но он не скажет, насколько комфортно вам будет пользоваться устройством все эти годы. Цифры — это лишь отправная точка для анализа, а не его финал.

Нажмите, чтобы оценить наш труд:

[Всего: 1 Средняя: 5]

Ирина Петрова-Левин

Я, Ирина Петрова-Левин, выпускница Московского Технического Университета Связи и Информатики, где получила образование в области информационных технологий. Мой профессиональный путь связан с языком Python, а также с глубоким интересом к тому, как современные технологии влияют на повседневную жизнь. Я стараюсь объяснять сложные процессы так, чтобы они становились понятными каждому, без потери точности и сути.

С 2019 года живу в Далласе, что позволяет мне сочетать опыт российской инженерной школы с американским технологическим подходом. В своих материалах я стремлюсь показывать реальные механизмы работы технологий и предметов вокруг нас, делая информацию одновременно доступной, практичной и структурированной.