Рефераты

Современные методы позиционирования и сжатия звука

той же комнате, что и слушатель, при этом, звук не проходит сквозь колонну.

EAX

Модель распространения света, основанная на геометрии пространства,

повсеместно используется в графическом мире и известна под названием "ray

tracing" (распространение лучей), имеет акустический эквивалент. Для

реализации геометрической акустики требуется компьютерная модель

физического пространства: четкое определение того, какой объект и где

расположен и какие звукоотражающие или звукопроводящие свойства имеет

каждый объект. Затем рассчитывается количество слышимых пользователем

звуков, отраженных от этих объектов для каждого источника акустики. Также,

в расчет могут приниматься ослабление звукового сигнала во время

прохождения сквозь стены или преграды на пути прямого распространения

звуковых волн и каждого из отраженного звука. Ray tracing и другие модели

распространения звуков на основе геометрии пространства - такие, как метод

зеркальных источников звука - являются техниками, зависимыми от времени и

широко применяются в качестве поддержки при вычислении акустики помещений в

архитектурном дизайне. Подобная техника допускает, что звуковые волны

отражаются в "зеркальной" форме, которая является аппроксимацией

игнорируемых дифракции и диффузии звука. Совсем недавно, этот метод

геометрического моделирования был адаптирован для воспроизведения 3D звука

в некоторых экспериментальных интерактивных системах виртуальной

реальности.

Модель распространения звука, основанная на геометрии пространства,

такая, как ray tracing, может быть очень привлекательна для использования в

API трехмерного звука. Разработчик просто определяет модель 3D звукового

мира, располагает источники звука и слушателя в этом мире, а затем механизм

ray tracing определяет пути распространения звуковых волн для завершения

работы по созданию реалистичной акустической окружающей среды. На практике,

тем не менее, такое применение геометрической модели в мире интерактивного

компьютерного звука имеет несколько серьезных недостатков.

Полный расчет отражений от множества объектов для нескольких источников

звука является сложной задачей. Не смотря на то, что физические принципы

лежащие в основе геометрической модели просты (и обеспечивают лишь

аппроксимацию реальных отражений звука) для ее расчета требуется серьезные

вычислительные ресурсы. Главное следствие, в 3D играх, это то, что техника

расчета распространения акустических волн (ray tracing) может оперировать

лишь ограниченным числом отраженных звуков и не может быть использована для

воспроизведения затухания запаздывающей реверберации. Чтобы понять, почему

это так, рассмотрим источники звука в реальном мире.

Источники звука испускают звуковые волны, которые отражаются от первого

объекта, которого достигнут, затем от второго объекта, затем от третьего, и

т.д. В обычном помещении существует бесконечное число непрямых путей

распространения звуковых волн от источника звука через отражение к

слушателю. Когда эти отраженные звуковые волны достигают слушателя,

запаздывающие отражения все больше и больше ослабляются, и следуют друг за

другом все ближе и ближе по времени. Эти запаздывающие отраженные звуки

быстро формируют континуум (сплошную среду), известный как "реверберация".

Так как сложность полной модели увеличивается экспоненциально с течением

времени, на практике моделирование геометрической акустики в реальном

времени должно быть ограничено одним "отскоком" от препятствия

("первоочередные" ранние отраженные звуки) с целью экономии ресурсов CPU.

Следовательно, механизм расчета распространения акустических волн в

реальном времени не может использоваться для расчета затухания

запаздывающей реверберации, которая является составной частью отраженных

звуков в типичной акустической среде. В результате 3D звуковой окружающей

среде не хватает живости и ощущения реалистичности. Это также приводит к

несовместимости, так как первоочередной отраженный звук может стать явным,

а затем исчезнуть, согласно физической модели - появляется чувство

разочарования, потому что ожидаемого эффекта нет, так как нет запаздывающей

реверберации для заполнения свободного акустического пространства, когда

первоочередные отраженные звуки исчезают. Для избавления от этой проблемы,

в интерфейсе EAX от Creative используется статичная модель распространение

звуков, которая оперирует ранними отражениями и затуханием запаздывающей

реверберации, и, следовательно, обеспечивает более полное и сильное

ощущение звуковой окружающей среды.

Другая серьезная проблема с моделью распространения на основе геометрии

пространства, применительно к звуку, состоит в том, что разработчик должен

создать и манипулировать сложной моделью акустической окружающей среды для

создания отраженных звуков. Поэтому, акустика, базирующаяся на геометрии

пространства, может применяться для очень впечатляющих демонстрационных

программ, но очень сложна для эффективного использования в реальных

приложениях.

Создание эффективной акустической модели это не простая задача, как об

этом могут говорить дизайнеры акустики в реальном мире. Дизайнер может

потратить месяцы, и даже годы для создания холла с приемлемой акустикой, но

даже тогда он может не добиться успеха. Разработчики игр оказались перед

этой проблемой дизайна в виртуальном мире при использовании геометрической

модели: правильно ли они определили коэффициент поглощения звука для этой

стены? Достаточно ли прозрачен для звука этот объект? Им приходится

произвести массу настроек, чтобы все было правильным, даже если

геометрический API обеспечивает их списком материалов, из которых

программист может выбирать. Кроме того, в дополнение к необходимости

определения свойств материалов, обычно существует необходимость

преобразования графической геометрической информации в форму, которую может

использовать звуковой механизм (движок). И то и другое не является простой

рутинной задачей.

Последнее и возможно самое важное замечание для игроков и разработчиков

заключается в том, что геометрическое моделирование может создавать только

конечный результат, который по своей природе является ограниченным, даже с

точки зрения производящего сильное впечатление качества звука. Даже если

геометрическая модель акустики сможет создать безупречную копию реальной

звуковой сцены, эта форма реализма не всегда будет подходящей или

эффективной для озвучивания, о чем хорошо осведомлены звукоинженеры

киностудий. Слух является в большей степени чувством внутренних ощущений,

чем зрение. Для создания наилучшего ощущения от звука, часто требуется

использование звуковых эффектов, которые очень далеки от тех, которые могут

существовать в физической реальности. Вот почему многие звуки в фильмах -

от шуршания одежды до оружейных выстрелов - часто заменяются звуками,

которые были "подправлены". Также на звуковых дорожках к фильмам часто

записывают имитацию реверберации, подобно той, которую воспроизводится с

помощью EAX.

Использование EAX реверберации позволяет создавать в играх виртуальную

акустическую окружающую среду, которая отличается от среды, изображаемой на

мониторе. В этой виртуальной акустической среде персонажи или объекты

звучат так, будто они находятся ближе или дальше от слушателя, чем это

выглядит на экране, т.е. плоскому изображению сообщается объем. API EAX

создан с целью обеспечить именно такую форму звучания, в тоже время, все

задачи по внедрению интерактивности в игру перекладываются на процесс

звукового дизайна, т.е. это дело разработчика, как, и в каких объемах

использовать и добиваться интерактивности звучания.

Разработчики игр, как и режиссеры фильмов, хотят управлять степенью

выразительности и качеством своих 3D звуковых сред окружения, а значит,

хотят найти соответствующий инструментарий в EAX. Их потребности не так

просто удовлетворить в геометрических моделях, подобных ray tracing.

Например, если вы решили увеличить время затухания реверберации для

обеспечения более сильного ощущения благоговения при имитации кафедрального

собора, в модели типа ray tracing не существует простой кнопки управления

длительностью времени затухания reverb. Вместо этого вы можете увеличить

размеры звуковой геометрической модели, отодвинув стены дальше от

слушателя, чтобы добиться требуемого эффекта. Это сложно сделать и, что еще

хуже, в результате получается модель акустики, отличная от графической

модели, вследствие чего могут возникнуть проблемы, например, если вы

начнете двигать источники звука и графические объекты внутри созданной

модели. И даже если вы справитесь с этими проблемами, вы получите модель

акустики, которая не будет соответствовать законам физики. Вы не можете

добиться одновременно и психологического реализма и эмоциональности, чего

разработчики игр, как и режиссеры фильмов, хотят от создаваемого звучания.

В двух словах, EAX обеспечивает разработчиков лучшими параметрами для

звукового дизайна, чем для архитектурного дизайна. И EAX реалистично

моделирует ранние отраженные звуки и затухание запаздывающей реверберации,

которые создают виртуальные объекты или стены.

Мы думаем, что первый фактор, определяет труднообъяснимо быстрое

принятие EAX разработчиками приложений. Как отмечалось выше, параметры для

звукового дизайна дают возможность разработчикам игр легко (по сравнению с

геометрическим моделированием) создавать убедительное и эмоционально

красивое ощущение от окружающей слушателя акустики. В EAX, первый набор

параметров управляет тем, как слушатель ощущает окружающую среду

(помещение, в котором находится слушатель), а второй набор параметров

позволяет регулировать эффекты акустической окружающей среды для каждого

звука в отдельности. Эти параметры интуитивно понятны разработчику, он

может легко манипулировать ими, изменять или усложнять эффекты акустики

окружающей среды в любой модели игры или сценария. EAX не требуется наличия

перспективы от первого лица (читай слушателя) или привязки источников звука

к графическому представлению виртуального мира. С другой стороны, дизайнер

звука, который хочет создать звуковую сцену, которая наиболее близко и

реалистично совпадает с графической сценой, может легко сделать это,

используя громадные возможности EAX по управлению ранними отраженными

звуками, эффектами окклюзии и обструкции.

При создании этих эффектов, EAX использует метод статистического

моделирования вместо метода геометрического моделирования. Статистическая

модель EAX автоматически вычисляет параметры реверберации и отраженных

звуков, в зависимости от расположения слушателя относительно источников

звука, размеров помещения, направленности источников звука и в зависимости

от дополнительного набора параметров, которые может изменять программист.

EAX более прост и более гибок в использовании для программистов, потому

что статистическое моделирование не требует полного геометрического

описания акустического мира вокруг слушателя. Вместо этого он работает,

используя макроскопические параметры, начиная от таких как размер помещения

и времени реверберации и заканчивая динамическим вычислением параметров

важнейших отраженных звуков и реверберации. Статистическое моделирование

также более эффективно использует CPU, чем геометрическое моделирование, но

при этом все равно более эффективно моделирует ранние отраженные звуки и

реверберацию с запаздыванием, обеспечивая реалистичное воспроизведение

глубины акустической сцены. В игре в любой момент могут изменяться заранее

сделанные установки окружающей звуковой среды и настраиваться отдельные

параметры простым нажатием кнопок управления для создания убедительного

ощущения реалистичности акустики, при перемещении слушателя и источников

звука из одной части виртуального мира в другую, в зависимости от любого

события по сценарию игры.

Среди будущих возможностей EAX будет набор для интуитивного управления,

с помощью которого можно будет полностью и эффективно манипулировать

ранними отраженными звуками, а также запаздывающей реверберацией. Этот

набор также позволит устанавливать параметры окклюзии, обструкции и

эффектов перспективы для создания очень четкого впечатления окружающего

звучания, если это потребуется. EAX позволяет программистам настраивать или

модифицировать полностью или частично автоматическое управление отраженными

звуками и реверберацией с целью создать в точности такую акустическую среду

окружения, как он или она хочет, или, чтобы наложить требуемый эффект на

один конкретный звук. Если необходимо, этот метод позволяет программистам

использовать их собственную геометрическую модель с целью контролировать не

только эффекты окклюзии и обструкции, но также и ранние отраженные звуки, в

зависимости от геометрии стен и препятствий.

Creative наряду с другими компаниями работает в IASIG (Interactive

Audio Special Interest Group), разрабатывая новый стандарт 3D звука. Какова

роль Creative в этих разработках?

IASIG пригласила Creative внести EAX в качестве вклада в IASIG "Level

Two Guidelines" ("Принципы управления второго уровня"). Цель этих принципов

установить промышленный стандарт на интерфейс звуковой окружающей среды для

разработчиков мультимедиа и игр для PC. Creative согласилась сделать EAX

1.0 открытым для промышленного использования и принять во внимание

предложения членов IASIG по расширению нашей первоначальной задачи.

Creative легко реализует поддержку стандарта от IASIG, когда он будет

закончен (так как он полностью основана на механизме EAX) и будет

поддерживать совместимость с EAX 1.0 в своих драйверах. В действительности,

такой стандарт может рассматриваться в качестве некоторого представления

"EAX 2.0". Более того, мы продолжаем расширять EAX, с целью получить

дополнительные преимущества от использования возможностей продуктов

семейства SoundBlaster Live! не только при использовании EAX 1.0 или

стандарта IASIG. Будущая версия EAX будет работать без проблем в качестве

расширенного набора стандартов EAX 1.0 и IASIG. Для разработчиков игр это

означает, что EAX будет больше чем когда-либо, тем API, выбор которого

будет гарантировать оптимальную производительность на наиболее

распространенном оборудовании.

В видении компании Qsound

3D звук, что это?

Обычная печатная пресса, к сожалению, изрядно невежественна во многих

вещах, в частности в вопросе 3D звука. Как результат, если речь заходит об

играх, то вам ужасно повезет, если в обзоре игры упоминается звук как

таковой, и уж гораздо реже можно встретить упоминание о 3D звуке. Если 3D

звук все же упоминается, проверьте обзор на предмет комментариев от

компаний, занимающихся трехмерным звуком, для оценки некоторых перспектив

технологии, используемой в продукте и сделанных в обзоре выводах.

Терминология 3D звука

Половина всех дискуссий в ньюсгруппах посвящены вопросу что такое "3D"

и что нет, вплоть до бессмысленной семантики. Для протокола, термин

"stereophonic" означает трехмерный звук! (От Греческого "stereos",

означающего "пространственный, трехмерный, непрерывный, сплошной, цельный",

а если вы не представляете себе, что означает "phonic" (акустический,

звуковой), то дальше не читайте).

На протяжении лет, рынок наводнялся различными видами технологий,

которые расширяли возможности аппаратуры убедительно воспроизводить

позиционируемый звук в пространстве на ограниченном количестве реальных

акустических колонок, и каждый называл все это "3D".

Допустим, что существует нечто, называемое "3D графикой", причем

повсеместно под этим термином понимается "визуализация в 2D пространстве 3D

модели". Теперь представим, что существует технология, которая позволяет

создать подлинное ощущение глубины изображения, и некоторые люди убеждены,

что термин "3D", применительно к графике, должен быть зарезервирован для

этой технологии. Я полагаю, что пока мы не имеем изображения,

протяженностью 360 градусов с воспринимаемой глубиной, его нельзя по

настоящему считать "трехмерным" ("3D.

Типы "3D audio" процессов

Очень важно видеть различия между типами технологий 3D звука, прежде

всего по функциям (игнорируя в этот момент то, какого успеха достигли

поставщики этих технологий на рынке).

В результате получаем следующее:

Stereo Expansion (Расширение стерео): технология, которая оперирует с

имеющейся избыточной стерео информацией, надлежащим образом расширяя

кажущуюся ширину звукового поля (т.е. главным образом удобная для не-3D

стерео произведений, таких как записанная музыка).

Positional 3D Audio (Позиционируемый 3D звук): технология, которая

оперирует с множеством индивидуальных звуковых потоков и пытается

определить местоположение каждого из них индивидуально в 3D пространстве.

Virtual Surround (Виртуальный окружающий звук): технология, которая

оперирует с декодированными данными в формате surround с целью

воспроизведения разнообразных каналов в их истинной перспективе с

использованием ограниченного числа источников звука, например

воспроизведение пятиканального звука на двух акустических колонках.

Stereo expansion и virtual surround главным образом удобны для

применения в бытовой электронике, такой, как стерео системы, домашние

кинотеатры и т.д. Однако так как некоторые из этих технологий пересекаются

с рынком персональных компьютеров (прослушивание музыки с помощью CD-ROM

проигрывателей или прямо из сети Интернет, просмотр фильмов DVD), их

применение также допустимо.

Тем не менее, визитная карточка для компьютеров - это позиционируемый

3D звук.

Все эти технологии покрывают львиную долю потребительского рынка,

каждая в своей соответствующей области применения. Следовательно, 3D звук

это не шутка, это полезная и быстро развивающаяся технология для создания

музыки, применения в бытовой электроники,в видеоиграх, и т.д. и т.д.

Что действительно смешно, так это количество дезинформации и слепо

верящих в характеристики чего-то -- при этом большая часть информации

почерпнута из рекламных проспектов различных продуктов, но сами верующие

при этом в массе своей не имеют знаний о звуке, в особенности о 3D звуке.

В чем разница между 3D звуком и панорамированием?

В течение многих лет добавить звук в видео игру можно было только при

условии использования панорамирования стерео (stereo panning). Это

накладывало ограничение в том, что звук можно было поместить только где-то

между акустическими колонками, неважно, где бы они ни находились, перед

вами в вашей комнате или на вашей голове в виде головных телефонов.

В первом случае, все звуки слышаться где-то между колонками спереди от

вас, а в последнем случае, звуки воспроизводятся внутри вашей головы -- что

не имеет никаких аналогов с ощущениями в реальном мире.

Панорамирование стерео это просто управление уровнями левого/правого

звуковых каналов, которое никогда не зависит от частоты звука и напрямую не

влияет на его фазу или синхронизацию. Панорамирование на нескольких

акустических колонках (Multi-speaker panning) обычно является развитием

этой идеи, но при этом может содержать больше манипуляций с

преобразованиями.

Преобразование звука в "3D" (т.е. трехмерный) -- не имеет значения,

какой метод при этом используется -- включает дополнительную информацию в

звуковой поток в форме амплитуды и разности фаз/задержек между выходными

каналами. В этом случае часто присутствует зависимость от частоты звука,

хотя некоторые простые эффекты создаются с использованием простых задержек

по времени на всем протяжении спектра шумов.

3D звук совершенен?

Сегодня существуют несколько технологий, которые расширяют возможности

разработчиков по размещению звука в уникальных местах относительно

слушателя. Есть ли какое-то решение действительно совершенное? По-моему,

такого решения нет. Означает ли это, что "3D звук" это бесполезная вещь? По-

моему, это не так. Истина находится где-то между двумя крайностями.

Почему люди не могут прийти к какому-то общему мнению относительно

действенности 3D звука?

Тот факт, что человеческий слух несовершенен, является корнем проблем.

Два уха, расположенных по сторонам головы, для определения местоположения

источника звука воспринимают большую часть из доступной информации в

горизонтальной плоскости (т.е. по азимуту или "по углу компаса"), при этом

мы плохо различаем звуки исходящие спереди и сзади, при отсутствии

дополнительных данных.

Так как все мы являемся существами, живущими на поверхности земли, то

мы определяем местоположение источника звука по смещению относительно

азимута, так как наши жертвы и наши враги, все являются тоже наземными

существами. Выходит, что наша возможность оценки положения звука в

вертикальной плоскости и его удаленности от нас очень слаба и сильно

зависит от ушных каналов, которые зачастую очень плохо развиты.

Таким образом, когда разработчик технологии говорит о "точном"

расположении источников звука, относитесь к этому с осторожностью. Простая

математика может создать целый набор хороших цифр, но реальные результаты

это совершенно другой вопрос -- после всего, мы вновь начинаем с

недостатков, парни.

Нравится это или нет, но для нормально видящих людей, зрение является

основным чувством определения местоположения чего-либо, причем до такой

степени, что нас легко одурачить без особых трудов, предоставив

противоречивую звуковую информацию. Сколько раз мы смотрели телевизор со

звуковым сопровождением, исходящим из паршивого маленького динамика,

который мог быть вмонтирован даже не в переднюю панель телика? Волновало ли

это нас? Ощущали ли мы большое несоответствие между происходящими на экране

событиями и звуком сопровождавшим их? По-видимому, не сильно. Долгое время

мы не имели стерео телевизоров и домашних кинотеатров, а популярность они

приобрели лишь из-за существенно упавшей на них цены.

Действенность любой технологии позиционируемого звука полностью

находится под влиянием таких факторов, связанных с областью применения:

использование в качестве дополнительной поддержки, облегчающей визуальное

восприятие

сопровождение действия (скажем фильм, футбольный матч, игра)

усиление интерактивности (например, звуковые эффекты при работе с меню)

уместность применения

Интересно, что видео игры (или другие симуляторы окружающей среды) это

единственные приложения с 3D звуком, в которых все эти факторы играют

важную роль.

Если вы поместите кого-нибудь в затемненную комнату и проиграете ему

незнакомые звуки, воспроизводя их из колонок, расположенных в произвольно

выбранных местах помещения, вы увидите, что ни одна из существующих

технологий не обеспечивает 100% эффективность -- даже близкую!

Теперь, скажем, у нас есть безэховая камера (т.е. помещение, в котором

нет реверберации), поместим в нее слушателя, зафиксируем его голову в

нужном (правильном) положении и повторим эксперимент. Есть все шансы, что

результат будет лучше. Однако все это не относится к делу до тех пор, пока

вы не начали всерьез планировать построить безэховую камеру у себя дома,

тогда к чему все это?

Точно такая же технология, обеспечившая посредственные результаты в

первом тесте на эффективность, при использовании в хорошо сделанном

приложении, например, видео игре, заставит большинство людей поклясться

всем святым в том, что она (технология) обеспечивает абсолютную возможность

размещения источника звука в любом месте пространства, потому что они

слышат звук исходящим именно из этих мест!

Это вторая самая большая проблема и одновременно обоснование того, что

заявления типа "делайте так!" "так не делайте!" никогда не прекратятся до

тех пор, пока участники тестов в слепую не подтвердят и не удостоверятся в

том, что они одновременно и правы и не правы.

Нет ничего странного в том факте, что иллюзия или обман чувств

используется в большинстве создаваемых приложениях. Это как раз то место,

где на сцену выходит искусство. Тем не менее, очень важно отдать должное

тому, что этого заслуживает. Если в игре нет эффективного использования 3D

звука, это не означает, что виновата в этом технология и если звук звучит

правдоподобно как в жизни, технология, сама по себе, лишь часть

головоломки! Это должно быть так же очевидно, как в случае, если вам

попался паршивый текстовый процессор, в этом нет вины компьютера, на

котором он запущен, почему же в случае с 3D звуком люди все время строят

свои выводы, не представляя точно, на чем основывается их мнение.

Далее, будем считать, что разные методы реализации имеют сильные и

слабые стороны.

Получается, что наушники, в связке с соответствующим бинауральным

процессом обработки звука (слишком часто называемым просто HRTF)

относительно хорошо справляются с созданием ощущения, что звук расположен

сзади нас или над нами. Тем не менее, я еще ни разу не слышал такого

звучания (а слышал я все), где бы убедительно осуществлялось расположение

источника звука справа и впереди слушателя. (Флойд Тул /Floyd Toole/,

занимающийся 3D звуком в компании Harman International и в течение долгого

времени проводящий исследованиями по этой теме, один из немногих людей,

который обобщил и изложил эту проблему в печатном виде.)

Кстати, HRTF, конечно же, звучит по-особому для каждого слушающего,

поэтому любая звуковая технология для массового рынка должна создавать

усредненное звучание, воспроизводя потенциально компромиссный результат и

тем самым, продолжая вносить все больше разногласий между слушателями.

При использовании двух акустических колонок, основная зона эффективного

размещения источников звука (т.н. sweet spot) находится спереди от

слушателя и покрывает пространство в 180 градусов по азимуту, т.е. в

горизонтальной плоскости. Ощущения, что звук расположен сзади и над

слушателем, очень слабые, если нет поддержки в виде дополнительных

сигналов. Особо отметим то, что использование алгоритмов HRTF,

обеспечивающих воспроизведение звука для бинаурального прослушивания (т.е.

в наушниках) и алгоритмов cross-talk cancelation (или для краткости CC;

технология позволяющая воспроизводить звук, например из левой колонки так,

что бы слышно этот звук было только левым ухом) не является успешным

решением проблемы, неважно как хорошо цифры выглядят на бумаге или как

крута рекламная компания.

Применение множества акустических колонок это уже другой вид зверей, но

они действительно являются частью доступного выбора возможностей, особенно

для компьютерных игр. Панорамирование звука обеспечивает явные выгоды при

расположении акустических колонок сзади слушателя. Это облегчает проблему

выбора места с наилучшим звучанием для прослушивания, так называемый sweet

spot. Однако само по себе панорамирование звука никогда не может обеспечить

значительных результатов, с точки зрения позиционирования источников звука

в вертикальной плоскости. Конечно, до тех пор, пока мы не перестанем

размещать колонки только на полу, а не начнем их подвешивать под потолком.

API и Rendering Engine - это две разные вещи!

Играя в игры, вы используете API и rendering engine (рендерин энджин).

API (application programming interface или, для краткости, интерфейс) это,

по сути, просто набор команд, используемых разработчиком при написании игры

-- это не технология 3D звука или чего-то другого.

Rendering engine или механизм воспроизведения звука (далее просто

звуковой движок) представляет собой процесс взаимодействия алгоритмов 3D

звука со звуковыми потоками с целью расположения источников акустики в

пространстве. Если API (например, DS3D или наш QMDX) поддерживает множество

звуковых движков, тогда в одном и том же приложении будет воспроизводиться

звук немного отличающийся при использовании разных звуковых движков, почти

так же, как и звуковая дорожка MIDI (другой набор команд) будет звучать

немного иначе на разных аппаратных синтезаторах от различных

производителей.

Так как различные звуковые движки и схемы реализации имеют разную

степень эффективности соответствующий интерфейс позиционирования не должен

ограничиваться возможностями какого-то одного звукового движка. В

действительности, API говорит: "поместите этот звук здесь" и звуковой

движок делает эту работу наилучшим способом, помещая звук в нужное место.

При этом звуковой движок использует свои алгоритмы и имеющуюся конфигурацию

воспроизведения звука (наушники, две колонки, 15 колонок, что угодно).

Люди, которые делаю заявления типа "эта игра поддерживает только DS3D"

совершенно не понимают сути вещей. Если игра написана под интерфейс DS3D -

это отлично! Она будет работать со всеми 3D звуковыми картами в любой

последовательности. На каждой звуковой карте, игра будет использовать

имеющийся звуковой движок, неважно, кем он сделан QSound, EMU, Aureal или

кем-то еще.

Существует масса звуковых интерфейсов, таких, как DS3D, QMDX, QMixer,

A3D 1.x и 2.0 и звуковые API третьих фирм, таких как HMI, EAR, Diamondware

и другие. Если программист выбрал для использования интерфейс "Фирмы Х"

(при этом он может также использовать более чем один API для конкретного

приложения) это совсем не означает, что вы должны обязательно использовать

аппаратное обеспечение "Фирмы Х" что бы все работало.

Что сбивает с толку, так это знание того, какой звуковой движок

поддерживает данный API.

Лишь немногие API созданы для поддержки специфичных аппаратных

возможностей, которые могут быть недоступны при использовании звуковых карт

других производителей или они могут быть неспособными поддерживать основные

функциональные возможности конкурирующих продуктов.

Хороший API должен поддерживать как можно больше аппаратного

обеспечения и так много функциональных особенностей, насколько это

возможно, так, чтобы разработчик игры мог использовать один интерфейс и

получить хороший результат на всех звуковых платах.

Например, если кто-то купит игру, которая была написана в расчете на

новейшую версию интерфейса QMixer, эта игра будет иметь отличные 3D

звуковые эффекты даже на звуковой карте с поддержкой только обычного стерео

звука. Если та же игра будет запущена на системе оснащенной 3D картой на

чипсете от Aureal, игра все равно будет использовать чипсет Aureal для

воспроизведения 3D звука, в итоге пользователь услышит то, за что он

заплатил.

Большинство разработчиков убедились в очевидном преимуществе

использования таких API, как DS3D, QMixer и QMDX, которые не являются

зависимыми от производителя аппаратного обеспечения и, следовательно, будут

прекрасно работать с любой 3D звуковой картой.

Что такое "Panning"?

Panning (панорамирование) -- этот термин происходит от простого

устройства, изобретенного Лесом Полом (Les Paul) в далеких 50-х годах,

которое использовалось для расположения моно фонических звуковых дорожек в

явно определенное положение слева/справа в стерео звуковом поле.

"Panoramic Potentiometer" (или для краткости "Pan Pot", панорамный

потенциометр) это нечто вроде регулятора баланса в стерео системе. В то

время как регулятор баланса управляет всем входящим стерео сигналом и

выдает отрегулированный стерео сигнал на выходе, pan pot управляет моно

сигналом на входе, а на выходе выдает его разделенным на части, передавая

их в выходные каналы, левый и правый.

Любой микшерский пульт стерео звука (использующийся в студии

звукозаписи) имеет pan pot для каждого канала. Повернем ручку управления

pan pot полностью влево и 100% сигнала (скажем в честь Леса, что это звук

гитары) будет направлено в левую колонку. В результате, звук гитары будет

явственно исходить из левой колонки. Повернем ручку управления pan pot

полностью вправо и 100% сигнала будет исходить из правой колонки.

В любом месте между этими двумя крайними положениями, pan pot будет

направлять порции моно сигнала в каждый канал, создавая иллюзию того, что

источник звука находится где-то между двумя колонками.

Такая же концепция панорамирования использовалась на протяжении лет в

видео играх, с целью динамического расположения источников звука

слева/справа в звуковом стерео поле. (Ясно, что физически pan pot не

использовался, а применялся его программные эквиваленты). Такой же принцип

может быть распространен на любое количество колонок. Панорамирование,

использующееся в обработке 3D звука, не изменяет звуковой сигнал (например,

его фазу, частоту и т.д.) осуществляя лишь простое управление пропорциями

передаваемого сигнала индивидуально в каждое физическое устройство

воспроизведения.

Что такое "Voice Manager"?

Термином Voice Manager (менеджер голоса) называют стандартизованный

механизм для управления на аппаратном уровне каналами в 3D звуковой карте.

Раньше аппаратное обеспечение оперировало всего лишь 5 каналами 3D звука,

сейчас стандартным является число в 8 каналов. Основной интерфейс 3D звука

DirectSound3D перекладывает работу по распределению этих ограниченных

ресурсов между самыми важными звуками (те, что должны звучать в данный

конкретный момент) полностью на программиста. Это очень большой объем

работы. Программисты обычно предпочитают задать много (20, 30 или больше)

звуковых каналов, а затем просто манипулировать ими по своему усмотрению.

Voice manager работает на уровне драйвера аппаратной части. По существу

он позволяет программе работать так, как если бы было больше звуковых

каналов, чем в действительности поддерживается на аппаратном уровне. В

соответствии с некоторыми схемами приоритета, определяемыми программистом,

voice manager берет на себя управление процессом динамического

распределения самых важных звуков между реально доступными на аппаратном

уровне каналами.

Компании QSound и Aureal в свое время предусмотрели возможность

управления распределением ресурсов в своих драйверах для звуковых карт, но

это привело к ситуации, когда каждая игра должна была знать о каждом типе

управления распределением ресурсов. Каждый производитель, который

окончательно убедился, что это проблема, должен был создавать свою

собственную систему управления распределением ресурсов со своими

собственными вызовами команд API и т.д.

Поэтому, QSound предложила Microsoft, чтобы наша схема управления

распределением ресурсов была адаптирована и распространялась в качестве

стандартной с тем, чтобы любой производитель мог ее использовать (также как

Страницы: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14


© 2010 БИБЛИОТЕКА РЕФЕРАТЫ