Использование VTune™ Performance Analyzer на системах с процессором Intel® Atom™ под управлением Windows* XP

Использование VTune™ Performance Analyzer на системах с процессором Intel® Atom™ под управлением Windows* XP

31.03.2009

Автор: Robert MuellerAlbrecht (Intel)
Источник: Intel Software Network

Введение

Типичная модель использования Intel® VTune™ Performance Analyzer на
мобильных Интернет устройствах (MID), работающих под управлением
Linux*, состоит в запуске модуля сбора данных (RDC, Remote Data
Collector) на MID устройстве, с дальнейшим анализом результатов на
основном компьютере. Нетбуки на базе процессора Intel® Atom™ под
управлением Windows XP позволяют проанализировать производительность
непосредственно на нетбуке, что в ряде случаев значительно удобнее.

Для этой цели подойдет версия Intel® VTune™ Performance Analyzer для Windows* (http://www3.intel.com/cd/software/products/emea/rus/vtune/343445.htm). Вы можете воспользоваться некоторыми функциями VTune, недоступными через модуль удаленного сбора данных, в том числе:

  • Профилирование выборок с низкими накладными расходами (Low Overhead
    Sampling Profiling): сбор и контроль данных о исполняемых командах
    позволяет выявить «узкие места» с непроизводительными затратами
    ресурсов, что пригодится при оптимизации библиотек, драйверов и
    приложений.
  • Профилирование дерева вызовов (Call Graph): определение
    последовательности вызовов функций и графическое отображение
    критического пути, что позволяет определить, какие функции занимают
    наибольшее процессорное время или дольше всего остаются
    заблокированными.
  • Монитор производительности (Counter Monitor): позволяет быстро
    выявить проблемы производительности на системном уровне, отслеживая
    активность системы и использование ресурсов в процессе выполнения.
  • Помощник (Tuning Assistant): поможет вам улучшить
    производительность, предлагая рекомендации, основанные на типичных
    приемах и трюках.

Использование

Запустить версию Intel® VTune™ Performance Analyzer с графическим
пользовательским интерфейсом вы можете через соответствующий ярлык на
рабочем столе, или непосредственно открыв исполняемый файл
\Shared\Bin\VTuneEnv.exe.

Выборка данных - sampling

Имеет смысл начать анализ производительности со сбора данных об исполняемых инструкциях (Sampling).

Для сбора, анализа и отображения данных о производительности
программного обеспечения на уровне системы вы можете использовать
неинтрузивный модуль сбора данных об адресах и исполняемых инструкциях.
Полученные с его помощью данные могут применяться для идентификации
критических процессов, потоков, модулей, вплоть до функций и строк кода.

Во время сбора данных об инструкциях, VTune™ Performance Analyzer
осуществляет мониторинг всего программного обеспечения, выполняющегося
на компьютере, включая операционную систему, компилируемые в процессе
исполнения (JIT-compiled) приложения Java*, приложения .NET* и драйверы
устройств. При мониторинге производительности вашего приложения
модификации бинарных или исполняемых файлов не происходит. VTune
обрабатывает полученные данные и графически отображает «горячие точки»
и «узкие места» на вкладке Hotspot. Данные по «узким местам» можно
детализировать вплоть до исходного или ассемблерного кода. Вы можете
просматривать исходный код, вызывающий появление «горячих точек», и
получать рекомендации по его изменению, чтобы оптимизировать
производительность вашего приложения.

Существует два метода выборки:

  • Выборка данных по времени (Time-based sampling, TBS): считывание
    информации об адресах активных команд через равные промежутки времени
    (по умолчанию 1 мс).
  • Выборка данных по событиям (Event-based sampling, EBS): считывание
    информации об адресах активных команд по достижении определенного числа
    процессорных событий. События могут различаться в зависимости от
    процессора, на котором производится выборка данных.

Для начала работы вам потребуется создать новый проект (activity) и
настроить параметры выборки данных. При установке параметров проекта
необходимо указать символьный файл PDB Microsoft Codeview, в котором
находится отладочная информация, а также выбрать исполняемый файл,
который будет анализироваться. При наличии исходного кода VTune сможет
соотнести данные о производительности со строками исходного кода,
которые впоследствии можно доработать.

Для удаленного сбора данных при помощи модуля удаленного агента
(remote sampling agent) требуется настроить параметры удаленного
анализа и/или приложение для удаленного сбора данных в диалоговом окне
Advanced Sampling Configuration.

Анализ

После завершения процесса сбора данных сэмплинга вы можете
просмотреть полученные данные на вкладке Sampling Views. Данные можно
сортировать по процессам или модулям, а также повышать уровень
детализации вплоть до потоков, функций, исходного и даже ассемблерного
кода. Частота наступления предварительно заданных системных событий или
время, затраченное на выполнение операции или строки кода, отображается
справа от основного поля просмотра и привязывается к модулю или
исходному файлу, либо к определенной строке в исходном коде приложения.

Таким образом, вы получаете в свое распоряжение мощный инструмент
для глубокого анализа приложений, позволяющий понять, где в первую
очередь требуется оптимизация программного кода и с чем могут быть
связаны проблемы производительности.

Однако функциональность Intel® VTune™ Performance Analyzer этим не
ограничивается – помощники по оптимизации предоставят вам советы и
рекомендации по решению возможных проблем, а профилирование дерева
вызовов позволит установить последовательности вызовов и зависимости,
благодаря чему вы можете отслеживать различные аспекты
производительность по всему списку вызовов, вплоть до исходного кода.

Заключение

Intel® VTune™ Performance Analyzer для Windows* версии 9.1 и выше –
это мощный инструмент для анализа производительности, который поможет
вам быстро определить «узкие места» в вашем приложении, и
оптимизировать его для систем с процессором Intel® Atom™. Учитывая, что
процессоры Intel® Atom™ имеют планировщик инструкций, разработчикам
важно избежать задержек в выполнении программного кода, вызванных
задержками, связанными с взаимными зависимостями инструкций (dependency
stalls). С помощью такого гибкого инструмента, как Intel® VTune™
Performance Analyzer, вы можете добиться эффективной и быстрой работы
ваших приложений на ультра-мобильных устройствах или нетбуках,
работающих под управлением Microsoft Windows* XP.

Ссылки

Дополнительная информация о VTune™ Performance Analyzer 9.1 для Windows