Опорные изображения
Краткое введение
Внутренний дизайн Game Boy Advance довольно впечатляющий для портативной консоли, которая работает от двух АА батареек.
В этой консоли по-прежнему будет использоваться фирменный графический процессор Nintendo. Дополнительно, в ней будет представлен относительно новый процессор от британской компании, который будет набирать популярность в ближайшие годы.
Процессор
Большинство компонентов объединены в единый модульпод названием CPU AGB. Модуль содержит два совершенно разных процессора:
- Sharp SM83, работающий на частоте 8,4 или 4,2 МГц: Да это же тот самый процессор, что использовался в Game Boy! Он позволяет запускать игры для Game Boy (DMG) и Game Boy Color (CGB). Вот моя предыдущая статья, если вы хотите узнать больше об этих консолях.
- ARM7TDMI работает на частоте 16,78 МГц: Это новый процессор, на котором мы сосредоточимся. Именно он запускает игры Game Boy Advance.
Надо отметить, что оба процессора никогда не работают одновременно и никаким сопроцессингом не занимаются. Единственная причина включать очень старый Sharp это обратная совместимость.
Тем не менее, прежде чем мы рассмотрим чип ARM, я считаю, что целесообразно начать с истории за этим брендом CPU.
Кембриджское чудо
История о происхождении процессора ARM и его последующем пути к славе захватывает дух. Здесь мы увидим сочетание государственных инвестиций, экспоненциального роста, злополучных решений и партнерств на большом расстоянии.
Расцвет Acorn Computers
В конце 70-х годов для Соединенного Королевства был начат жесткий переход от интервенционистской экономики к свободному рынку. Посреди этого шторма, венчурный бизнес из Кембриджа, такой как Acorn Computers, вместе с Sinclair и подобными, продавал компьютерные наборы для лабораторий и энтузиастов. Подобно американским и японским предприятиям, компьютеры Acorn опирались на процессор 6502 и проприетарный диалект BASIC.
Входя в 80-е годы, интересы министерств в рамках нового британского правительства привели к созданию проекта по повышению компьютерной грамотности в школах [2]. Благодаря предстоящему домашнему компьютеру ‘Atom’ от Acorn компания получила контракт на создание доступного компьютера, который соответствует видению правительства. Результатом стал BBC Micro (по прозвищу ‘Beep’), которым удалось добиться значительных успехов среди школ, учителей и студентов. Внутрь Micro Acorn добавила авангардный интерфейс ‘Tube’, который позволяет расширить компьютер с помощью второго процессора. Это проложит путь к следующей большой инвестиции Acorn.
В ходе разработки своего следующего продукта, на этот раз нацеленного на компании, Acorn не нашла подходящего процессора на замену 6502. Давление на создание инноваций против японской и американской конкуренции, в сочетании с неудачным планированием, привели Acorn к плачевному финансовому состоянию. Таким образом, перед новым подразделением в Acorn была поставлена задача создать хороший центральный процессор. Чтобы обойти недавние ограничения, Acorn команда, отвечавшая за центральный процессор, основала свою архитектуру на учениях исследовательской работы под названием Дело о компьютере с сокращённым набором инструкций (англ. Reduced Instruction Set Computer) и его прототипе, процессоре RISC [3]. Наконец, в 1985 году Acorn начали поставку процессора ARM1 в качестве модуля Tube для BBC Micro, но его позиционировали только для научно-исследовательских и опытно-конструкторских работ. Так было до тех пор, пока в 1987 не представили свой первый компьютер Acorn Archimedes, после этого чипы ARM (на тот момент уже ARM2) заняли главную роль.
Новая авантюра с процессором
Во время коммерциализации Acorn Archimedes, Apple была поражена энергоэффективными процессорами Acorn, но американская компания до сих пор не была убеждена в том, что последний ARM3 Acorn подходит для нового небольшого проекта Apple: Newton. Однако, вместо того, чтобы уйти (в конце концов, Акорн был конкурентом), оба обсудили возможность эволюции ARM3 для соответствия требованиям Apple [4], а именно гибкая тактовая частота, интегрированный MMU и полная 32-битная адресация.
Это сотрудничество в скором времени превратилось в партнерство, где Acorn, Apple и VLSI (производитель микросхем ARM) создали новую компанию, ориентированную исключительно на разработку процессоров ARM. Apple предоставила инвестиции (приобретая 43% продукта), Acorn поделился своим персоналом, а VLSI позаботился о производстве. В 1990 году появилась на свет Advanced RISC Machines (ARM) Ltd с Robin Saxby в качестве исполнительного председателя.
Годы спустя Apple наконец-то начала продажу Newton MessagePad на базе ARM610, одного из следующих поколений чипов ARM, выполнявшего требования Apple. Между тем, Acorn также выпустил RiscPC с использованием новых процессоров.
Теперь, когда Acorn и Apple удерживались на компьютерном/портативном рынке, ARM разработала радикальную бизнес-модель. Избегая производство, видение Saxby заключалось в лицензировании интеллектуальной собственности ARM в форме схем центрального процессора и его набора инструкций [5]. Это дало ARM клиентов за пределами компьютерной сферы, такие как Texas Instruments [6], которые позднее свяжут компанию с формирующимся мобильным рынком (кульминацией станет Nokia 6110) и телевизионными приставками. В последующие годы технологии ARM будут поставляться в миллиардах мобильных устройств [7].
Партнёрство с Nintendo
Тем временем в Японии, благодаря анализу Game Boy, мы узнали, что стратегия Nintendo в области аппаратного обеспечения портативных систем поощряет модель Систем на кристалле (СНК, англ. SoC). Это позволило компании спрятать доступную готовую технологию и объединить ее с собственными разработками. При этом новая консоль может быть уникальной и конкурентоспособной.
К счастью, лицензионная модель ARM подходила именно для этих нужд. К тому же хорошая репутация в мобильном секторе замолвила за ARM словечко, особенно во время их продукта, ориентированного на мобильные устройства, под названием ARM7TDMI - процессор, созданный под руководством Nokia, чтобы выжать максимум мощности с ограниченным питанием и памятью. Вот так удачно сложилось, что Nintento и ARM в конце концов стали партнёрами, и выбор процессора для Game Boy Advance пал на ARM7TDMI.
Давай погрузимся в то, что предлагает этот чип разработчикам.
Набор инструкций
Для начала, ARM7TDMI реализует набор инструкций ARMv4, наследника ARMv3. Это значит:
- Строение на основе RISC: Как было сказано выше, процессоры ARM создавались под влиянием работы из университета Беркли под названием “Дело о компьютере с сокращённым набором инструкций”. Её исследования очерчивали набор требований для масштабируемой конструкции процессора и защищает использование архитектуры load-store, фиксированного размера инструкций и большого регистрового файла. Многие из них не были реализованы на рынке центральных процессоров того времени (т.е. Intel 8086, MOS 6502, Zilog Z80 и Motorola 68000), но при этом они повлияли на конструкцию новых линеек процессоров в 80-е и 90-х годах.
- Условное исполнение (англ. Conditional execution): Характерная черта архитектуры набора инструкций ARM. По сути, почти каждая инструкция включает в себя условие, которое определяет, должна ли она выполниться. Как правило, другие процессоры следуют процессу ‘сравнить и прыгнуть’ (также называемому ‘ветвлением’) каждый раз, когда процессор достигает перекрестка. В отличие от этого, инструкции ARM обусловлены результатом предыдущего сравнения. Это возможно из-за первых четырех бит кодов операций ARM, зарезервированных для условия (например, равенство, неравенство). В общем и целом это уменьшает сложность кода ARM, поскольку условное исполнение обеспечивает более чистое строение процедур, в отличие от ветвления и разделения на подпрограммы.
- Инструкции для 32-битного и 64-битного умножения: Дополнение из ARM v4. Кроме того, 64-битные операции выводят результат в два регистра.
Ядро
Пришло время осмотреть чип. ARM7TDMI является урезанной версией ARM710 с интересными дополнениями. Ядро включает в себя [8] [9]:
- Шестнадцать 32-разрядных регистров общего назначения: Хотя это большой скачок по сравнению с семью 8-битными регистрами SM83/Game Boy, это нарушение принципов RISC, требующих тридцать два регистра размером в 32 бита. Так сделано потому, что ARM предпочитает поддерживать маленький размер кремниевого чипа [10].
- 32-битная шина данных и АЛУ: Позволяет перемещать и управлять 32-разрядными значениями без траты дополнительных циклов.
- Чистая 32-битная адресация: Эта часть была одним из требований Apple. Первые три процессора ARM использовали 26-разрядные адреса памяти для повышения производительности (счётчик команд и регистр статуса вместе могли поместиться в одном 32-битном слове) взамен адресуемости памяти (можно получить доступ только к 64 МБ памяти). В последующей серии ARM6 (с архитектурой набора инструкций ARMv3) реализована 32-битная логика адресации, но сохранён режим обратной совместимости для старого кода. А затем ARM7TDMI (ориентированны на мобильные устройства) избавился от 26-битного режима и оставил логику только для 32-битных адресов (тем самым уменьшил требуемое количество кремния).
- Трёхэтапный конвейер: выполнение инструкций разбито на три шага или этапа. Процессор выбирает, декодирует и выполняет до трех инструкций параллельно. Это позоволяет использовать ресурсы процессора по максимуму (что снижает простой процессора), при этом так же увеличивает количество выполняемых за еденицу времени инструкций.
- Благодаря этому решению, условное исполнение более эффективное, чем разделение кода на ветви.
- Отсутствие Блока управления памятью (англ. MMU): Начиная с ARM1, ARM предоставляла готовый MMU. Сначала как сопроцессор ‘MEMC’, а затем встроенный в ARM610. А сейчас, похоже, ARM7TDMI остаётся единственным в своей серии без такого блока, потенциально из-за отсутствия интереса (ранние мобильные устройства не требовали сложной виртуальной памяти).
- Отсутствие кеша: Очередное сокращение затрат на этот чип, так как предыдущие чипы ARM имели небольшой кеш.
Наконец, всё это может работать от 3-вольтового блока питания [11]. Это очевидный шаг в сторону мобильных вычислений, так как предыдущие ядра требовали блока питания на 5 Вольт.
Выжимание производительности
Один из недостатков архитектуры load-store привёл к разрежённости кода для ARM. Такие конкуренты, как x86, могут выполнять те же задачи, используя меньшее количество кода, требующего меньше пространства. Следовательно, когда ARM начал продаваться в телекоммуникационные компании, Nokia этим была недовольна [12]. Размер инструкций ARM означал, что железо Nokia, заточенное на 16-битные шины и ограниченную постоянную и оперативную память - всё ради экономии стоимости и энергии - станет для процессора бутылочным горлышком и ограничит его эффективность. Таким образом, ARM пришла к решению: Набор инструкций Thumb.
Thumb — это подмножество набора инструкций ARM, инструкции которых кодируются в 16-битные слова (в отличие от 32-бит) [13]. Будучи 16-битными, инструкции Thumb требуют половину от ширины шины и занимают вдвое меньше памяти.
Главный компромисс заключается в том, что Thumb не предлагает условное исполнение, полагаясь на использование ветвей. К тому же, его коды операций с данными использовали только формат с двумя адресами, а не с тремя, и он имел доступ только к нижней половине регистрового файла (то есть, доступно только восемь регистров общего назначения). В общем, так как инструкции Thumb предлагают только функциональное подмножество инструкций ARM, разработчикам может потребоваться больше инструкций для достижения схожего результата.
На практике Thumb занимает 70% места ARM кода. На 16-битной памяти Thumb работает быстрее, чем ARM. При нужде ARM и Thumb инструкции можно смешивать в одной программе (т. н. interworking), так что разработчик может выбирать когда и где использовать каждый режим.
Расширения
ARM7TDMI является, по своей сути, ARMv3-совместимым ядром с расширениями. Это отражено в его имени (TDMI), которое значит:
- T → Thumb: Включение набора инструкций Thumb.
- D → Debug Extensions: обеспечивает отладку через JTAG.
- M → Улучшенный множитель (Enhanced Multiplier): Предыдущим ядрам ARM требовалось несколько тактов для вычисления полного 32-битного умножения, а данное усовершенствование сокращает этот процесс до нескольких тактов.
- I → EmbeddedICE macrocell: Включает аппаратные точки останова, точки наблюдения и позволяет останавливать систему во время отладки. Это облегчает разработку программ для данного процессора.
Всё это сделало ARM7TDMI привлекательным решением для мобильных и встроенных устройств.
Расположение памяти
В частности, включение Thumb оказало сильное влияние на окончательный дизайн этой консоли. Nintendo смешивала 16-битные и 32-битные шины между различными модулями, чтобы снизить затраты, и в то же время предоставляла программистам необходимые ресурсы для оптимизации кода.
Память, используемая в Game Boy Advance, распределена по следующим местам (в порядке от самой быстрой к самой медленной) [14]:
- IWRAM (Internal WRAM) → 32-бит с 32 КБ: Используется для хранения инструкций ARM.
- VRAM (Video RAM) → 16-битный с 96 КБ: Хотя этот блок предназначен для графических данных (об этом в следующем разделе этой статьи), он все равно находится в карте памяти процессора, поэтому программисты могут хранить другие данные, если IWRAM недостаточно.
- EWRAM (External WRAM) → 16-бит с 256 КБ: отдельный чип рядом с CPU AGB. Оптимален для хранения Thumb-only инструкций и данных небольшими фрагментами. С другой стороны доступ к этому чипу может быть до шести раз медленнее, чем к IWRAM.
- Game PAK ROM → 16-бит переменного размера: отсюда читается ROM картриджа. Хотя он может обеспечивать одну из самых медленных скоростей, он также зеркалируется в карте памяти для управления различными скоростями доступа. Кроме этого, Nintendo добавили Prefetch Buffer (буфер предварительной выборки), который взаимодействует с картриджем для уменьшения чрезмерных задержек. Этот компонент независимо кэширует непрерывные адреса, когда CPU не обращается к картриджу, он может вмещать до восьми 16-битных слов.
- Однако на практике процессор редко позволяет буферу выполнять свою работу. Поскольку по умолчанию он будет продолжать получать инструкции из картриджа для продолжения выполнения [15] (вот почему IWRAM и EWRAM так важны).
- Game PAK RAM → 8-бит переменного размера: здесь происходит доступ к оперативной памяти картриджа (SRAM или Flash Memory).
- Это строго 8-битная шина (процессор видит ‘мусор’ в незадействованных битах), по этой причине Nintendo заявляют, что с ней можно работать только через их библиотеки.
Хотя эту консоль позиционировали как 32-битную систему, с большей частью памяти можно общаться только через 16-битную шину, а значит игры в основном используют набор инструкций Thumb, чтобы не тратить два цикла на один запрос инструкций. Только в очень исключительных обстоятельствах (например, при необходимости использовать инструкции, отсутствующие в Thumb, храня их в IWRAM) программисты смогут воспользоваться набором инструкций ARM.
Становление Game Boy Color
Кроме включения компонентов GBC (Sharp SM83, оригинальный BIOS, режимы аудио и видео, совместимый слот для картриджей и так далее), для обеспечения обратной совместимости нужны еще две функции.
Со стороны оборудования консоль полагается на переключатели для определения, какой картридж вставлен: Game Boy или Game Boy Color. Детектор формы в слоте для картриджей по сути определяет тип картриджа и позволяет процессору читать его состояние. Предполагается, что некий компонент CPU AGB читает это значение и автоматически выключает ненужное в режиме GBC оборудование.
Со стороны программного обеспечения существует специальный 16-битный регистр REG_DISPCNT
, который может изменять многие свойства дисплея, но один из его битов устанавливает консоль в ‘GBC режим’ [16]. Сначала мне было очень трудно понять, когда именно GBA пытается обновить это регистр. К счастью, нашлись разработчики прояснить ситуацию:
Думаю, вот что происходит во время загрузки GBC: она проверяет переключатель (считывается по адресу REG_WAITCNT 0x4000204), делает переход (очень быстрый, сложно заметить), потом окончательно переключатеся в режим GBC (BIOS пишет в REG_DISPCNT 0x4000000), останавливая ARM7.
Остается недостающий кусочек пазла: что если убрать часть корпуса на картридже GBC, чтобы переключатель больше не нажимался, а потом сделать программное переключение в режим GBC? Может помочь режим мультизагрузки. Не уверен, требуется ли нажатие переключателя, чтобы шина картриджа GBC работала корректно, или она работает само собой. Я склонен считать, что переключатель все таки необходим, но это всего лишь догадка.
– Dan Weiss (он же Dwedit, текущий разработчик PocketNES и Goomba Color)
Графика
Прежде чем мы начнем, вы узнаете, что система представляет собой смесь между SNES и Game Boy, графическим ядром по-прежнему является хорошо известный 2D движок под названием PPU. Поэтому, я рекомендую прочитать эти статьи, прежде чем продолжить, так как я буду рассматривать множество ранее разъясненных понятий.
В сравнении с прошлыми приставками Game Boys, теперь у нас есть цветной LCD дисплей, который может показывать до 32 768 цветов (15-бит). Его разрешение 240 x 160 пикселей, а частота обновления примерно 60Гц.
Организация контента
Графика распределяется по следующим областям памяти:
- 96 КБ 16-битной VRAM (Video RAM): 64 КБ для хранения фонов и 32 КБ для хранения спрайтов.
- 1 КБ 32-битной OAM (Object Attribute Memory): хранит до 128 спрайтовых записей (не изображения, только индексы и атрибуты). Шина оптимизирована для быстрой отрисовки.
- 1 КБ 16-битной PAL RAM (Palette RAM): хранит две палитры, одна для фонов, а другая для спрайтов. В каждой палитре 256 записей 15-битных цветов, цвет
0
значит прозрачность.
Построение кадра
Если вы читали прошлые статьи, GBA будет казаться вам знакомой, хотя дополнительная функциональность может вас удивить, и не надо забывать, что консоль работает от двух пальчиковых батареек.
Я одолжу графику из Sonic Advance 3 от Sega, чтобы проиллюстрировать, как составляется кадр.
Тайлы
Тайлы GBA - это растровые изображения размером строго 8x8 пикселей, они могут использовать 16 цветов (4 bpp) или 256 цветов (8 bpp). Плитки размером 4 bpp занимают 32 байта, а 8 bpp - 64 байта.
Тайлы можно хранить где угодно в VRAM, однако, для PPU их нужно группировать в charblocks: блоки по 16 КБ. Каждый блок резервирует определенный тип слоев (фон или спрайты). Это может привести к перекрытиям, что, как следствие, позволяет блоками иметь общие тайлы.
Из-за размера блока символов в одном блоке можно хранить до 256 плиток 8 bpp или 512 плиток 4 bpp. Допускается до шести таких блоков, что в сумме требует 96 КБ памяти: точное количество VRAM этой консоли.
Для фонов можно использовать только четыре, а два можно применить для спрайтов.
Фоны
Этот конкретный слой сдвигается по горизонтали на определенных сканлайнах для имитации эффектов воды.
Фоновый слой в этой системе значительно улучшился со времен Game Boy Color. Она наконец-то включает в себя некоторые функции, найденные в Super Nintendo (помните аффинное преобразование?)
PPU теперь умеет рисовать до четырех фоновых слоев. Возможности каждого из них зависят от выбранного режима работы [17]:
- Режим 0: четыре статических слоя.
- Режим 1: доступно всего три слоя, но один из них аффинный (может вращаться и масштабироваться).
- Режим 2: два аффинных слоя.
Размеры каждого слоя могут быть до 512x512 пикселей. Если слой аффинный, он может быть размером до 1024x1024 пикселей.
Совокупность данных, которая задает фоновый слой, называют Tile Map. Чтобы реализовать ее в понятном для PPU виде, программисты используют screenblocks, структуру, задающую части фонового слоя (32x32 тайлов). Screenblock занимает всего 2 КБ, но для построения всего слоя их требуется несколько штук. Программисты вольны размещать их где угодно внутри фонового блока, а значит не все тайлы хранят графику!
Спрайты
Спрайт может быть размером до 64x64 пикселей, но из-за маленького экрана, он будет занимать большую его часть.
Если этого недостаточно, PPU теперь умеет применять к спрайтам аффинные преобразования!
Спрайтовые записи занимают 32 бита, их значения можно разделить на две группы:
- Атрибуты: x/y - положение, h/v - отражение, размер, форма (квадрат или прямоугольник), тип спрайта (аффинный или простой) и положение первого тайла.
- Аффинные данные: используются только если спрайт аффинный, задают масштаб и вращение.
Результат
Как обычно, PPU объеденяет все слои автоматически, но это еще не все! Система может наложить на эти слои несколько эффектов:
- Mosaic: делает тайлы более пиксельными.
- Alpha blending: комбинирует цвета двух наложенных слоев, что дает эффекты прозрачности.
- Windowing: разделяет экран на два разных окна, в каждом может быть своя собственная графика и эффекты, внешнюю зону обоих окон также можно отрисовывать тайлами.
С другой стороны, для обновления кадра есть несколько опций на выбор:
- Распоряжатся ЦП: у процессора теперь полный доступ к VRAM в любое вермя. Однако изменение некоторых данных посреди када может привести к нежелательным артефактам, так что ждать VBlank/HBlank промежутков (традиционный подход) остаестя самой безопасной тактикой в больинстве случаев.
- Использовать DMA контроллер: DMA обеспечивает в ~10 раз более быструю передачу данных, его можно отправить в обработку во время VBlank и HBlank. Консоль предоставляет 4 канала DMA (два зарезервированы под звук, один для критических операций, другой - общего назначения). При этом контроллер остановит процессор на время операции (хотя он едва заметит это!).
Кроме тайлов
Мы можем захотеть составить фон с которым тайловый движок не справится. Современные консоли решили это, внедрив архитектуру с буфером кадра, но это невозможно при очень маленькой емкости памяти… Что же, у GBA как раз есть 96 КБ видеопамяти, чего достаточно для растрового изображения размером с наш LCD экран.
Хорошей новостью является то, что PPU фактически реализовал эту функциональность, включив три дополнительных режима, которые называются bitmap modes [18]:
- Режим 3: Выделяет один полноцветный (16 bpp, 32 768 цветов) кадр.
- Режим 4: Предоставляет два кадра с половиной цветов (8 bpp, 256 цветов) каждый.
- Режим 5: Два полностью цветных кадра с половиной размера каждого (160x128 пикселей).
Причина наличия двух растровых изображений заключается в возможности перелистывания страниц: Рисование поверх отображаемого растрового изображения может привести к появлению некоторых странных артефактов во время процесса. Если вместо этого манипулировать другим, то ни один из глюков не будет показан пользователю. Как только вторая растровая карта будет готова, PPU можно обновить, чтобы указать на вторую, эффективно поменяв отображаемый кадр местами.
Растровый режим позволил процессору рисовать рудиментарную 3D графику.
Объекты переднего плана это спрайты (отдельный слой).
Растровая картинка с примитивами.
Обратите внимание, экран не показывает существенных узоры тайловых движков.
О целом звучит как суперсовременная фишка, однако, большинство игр продолжили пользоваться тайловым движком. Почему? Потому, что на практике, растры сьедают очень много ресурсов ЦП.
Видите ли, когда применяется тайловый движок, процессор делегирует большинство вычислений графическому чипу. А вот система фреймбуфферов от PPU ограничена только отображением сегмента памяти на единственном фоновом слое, что значит больше нет индивидуальных аффинных транформаций, наложений или эффектов если процессор сам их не просчитает. Фреймбуффер также занимает 80 КБ памяти, так что только 16 КБ (половина) доступны для хранения спрайтовых тайлов.
Вот почему эти режимы применяются в исключетельных случаях, таких как проигрывание видео (Game Boy Advance Video полностью на это полагалось) или отрисовка 3D геометрии через ЦП. В любом случае результаты были мягко говоря впечатляющими.
Звук
В GBA используется двухканальный проигрыватель сэмплов, который работает в связке со звуковай системой Game Boy.
Функционал
Вот разбор каждого звукового компонента на примере Sonic Advance 2:
PCM
Новая звуковая система теперь умеет проигрывать PCM сэмплы, она предоставляет два канала под названием Direct Sound, куда приходят сэмплы через очередь FIFO (реализована в виде 16-битного буфера).
Семплы 8-битрые и со знаком (кодируются в значениях от -128 до 127). Частота выборки по умолчанию 32 кГц, хотя это зависит от игры: так как большая частота значит больше размер и больше циклов процессора, не каждая игра выделяет отдинаковое количество ресурсов аудиочипу.
DMA необходим во избежание лишней траты циклов ЦП. Таймеры также доступны для синхронизации с очередью.
PSG
Хотя подсистема от Game Boy не делится ресурсами ЦП, доступ к своему PSG она дает. В целях обратной совместимости это тот-же дизайн, что и в оригинальном Game Boy. Ранее я уже писал эту статью, в которой подробно рассказывается о каждом канале в отдельности.
Большинство игры GBA используют его для аккопониманта или эффектов. Более поздние оптимизировали музыку под PCM, а PSG оставили незадействованным.
Комбинирование
Наконец, все автоматически микшируется вместе и выводится через динамик/разъем наушников.
Несмотря на то, что в GBA только два канала PCM, некоторые игры волшебным образом проигрывают более двух сэмплов одновременно. Как такое возможно? Хотя на бумаге наличие только двух каналов может показаться немного слабым, основной процессор может использовать часть своих циклов для обеспечения секвенирования и микширования звука [19] (это должно дать вам представление о мощности ARM7!). Более того, в разделе “Операционная система” вы узнаете, что в ROM BIOS-а входит аудиосиквенсер!
Лучшее из обоих миров
Некоторые игры понесли дуальнось PCM-PSG еще дальше и “сменяют” ведущий чип в зависимости от контекста.
В этой игре (Mother 3) игрок может входить в две разные комнаты, одна относительно нормальная, а другая в ностальгическом сеттинге. В вазисимости от того, в какой комнате находится персонаж, та же самая музыка звучит современно или восьмибитно.
Операционная система
Вектор сброса ARM7 находится по адресу 0x000000
, который указывает на 16 KB BIOS ROM. Это означает, что Game Boy Advance сначала загружается из BIOS, который, в свою очередь, показывает знакомую заставку, а затем решает, загружать игру или нет.
В этом ПЗУ также хранятся программные процедуры, которые игры могут вызывать для упрощения определенных операций и уменьшения размера картриджа [20]. К ним относятся:
- Арифметические функции: Маршруты для выполнения деления, квадратного корня и тангенса дуги.
- Вычисление аффинной матрицы: Учитывая значение ‘zoom’ и угол, вычисляет аффинную матрицу, которая будет введена в PPU для масштабирования/поворота фона или спрайта.
- Есть две функции, одна для спрайтов, другая для фонов. Их параметры немного отличаются, но идея одна и та же.
- Функции декомпрессии: Реализует алгоритмы декомпрессии, включая Run-Length, LZ77 и Huffman. Он также обеспечивает распаковку битов и последовательное различие.
- Копирование памяти: Две функции, которые перемещают память. Первая копирует 32-байтовые блоки, используя специализированный опкод для этого типа передачи (
LDMIA
для загрузки иSDMIA
для хранения) только один раз. Вторая копирует 2-байтовые или 4-байтовые блоки, используя повторяющиеся опкодыLDRH/STRH
илиLDMIA/STMIA
, соответственно. Таким образом, вторая функция является более гибкой, но не такой быстрой. - Звук: Реализует полный MIDI-секвенсор! Он включает в себя множество функций для управления им.
- ** Интерфейс питания**: ярлыки для сброса, очистки большей части оперативной памяти, остановки процессора до наступления определенного события (V-blank или пользовательского) или перехода в “режим низкого энергопотребления”.
- Мультизагрузка: Загружает программу на другой GBA и запускает ее. Более подробную информацию можно найти в разделе “Игра”.
BIOS подключен через 32-битную шину и реализован с использованием комбинации инструкций Arm и Thumb, хотя последняя является наиболее заметной.
Также помните, что все это будет работать только на ARM7. Другими словами, нет никакого аппаратного ускорения для ускорения этих операций. Таким образом, Nintendo обеспечила всю эту функциональность с помощью программного обеспечения.
Игры
Программирование для GBA имело много общих методологий с Super Nintendo, но также унаследовало все преимущества разработки игр в начале 2000-х годов: стандартизированные языки высокого уровня, надёжные компиляторы, более быстрые RISC-процессоры, не проприетарные решения для разработки, сравнительно лучшая документация и… Интернет доступ!
Программы для GBA чаще всего написаны на языке C с критичными по времени выполнения секциями на языке ассемблера (ARM и Thumb), чтобы сэкономить циклы. Nintendo предоставила SDK с библиотеками и компиляторами.
Игры распространяются на новом проприетарном формате картриджей, он также называется Game Pak, но имеет меньший размер.
Доступ к данным картриджа
Хотя ARM7 имеет 32-битную адресную шину, к картриджу подключено только 24 адресных линии. Это значит, что в теории можно адресовать только 16 МБ данных с картриджа без использования маппера. Однако карта памяти гласит, что можно адресовать до 32 МБ данных картриджа. Как такое возможно? Дело в том, что Gamepak использует 25-битные адреса (что объясняет 32 мегабайтный блок), но младший бит адреса всегда равен нулю. Таким образом, только 24 бита имеют значение. Вот как работает адресация Game Pak.
Означает ли это, что данные, расположенные по нечетным адресам (с младшим значащим битом ‘1’), будут недоступны? Нет, потому что шина данных 16-битная: При каждой передаче CPU/DMA получает расположенный байт плюс следующий, что позволяет читать как четные, так и нечетные адреса. Как видите, это еще одно произведение инженерной мысли, в котором полностью используются возможности аппаратного обеспечения при одновременном снижении затрат.
Пространство оперативной памяти картриджа
Для хранения сохранений Game Paks может включать [21]:
- SRAM: Нуждается в батарейке для сохранения своего содержимого и может иметь размер до 64 КБ (хотя коммерческие игры не превышали 32 КБ). Доступ к нему осуществляется через GBA memory map.
- Flash ROM: аналогично SRAM без необходимости использования батареи, размер может достигать 128 КБ.
- EEPROM: Они требуют последовательного подключения и теоретически могут иметь любой размер (часто встречается до 8 КБ).
Аксессуары
Тот самый разъём Game Boy Link обеспечивал возможность многопользовательской игры. Хотя, по какой-то причине они убрали ИК датчик (наверное, он был недостаточно надёжным для передачи больших объёмов).
Кроме того, BIOS GBA имеет специальную функцию, известную как Multi-boot: Другая консоль (GBA или GameCube) может послать рабочую игру в EWRAM получателя, после чего последний загрузится оттуда (вместо того, чтобы загружаться с картриджа).
Борьба с пиратством и хоумбрю
В целом, использование проприетарных картриджей было большим препятствием по сравнению с постоянной игрой в кошки-мышки, с которой приходилось бороться другим производителям консолей при использовании CD-ROM.
Для борьбы с подделками картриджей (несанкционированными копиями) в BIOS GBA были встроены те же проверки загрузки, что и в оригинальном Game Boy.
Флеш-картриджи
По мере того как твердотельные накопители становились все более доступными, на рынке появился новый тип картриджей. Flashcarts выглядели как обычные Game Pak-и, но имели дополнительную перезаписываемую память или слот для карт памяти. Это позволяет пользователям играть с ROM-файлов в консоли. Концепция на самом деле не нова, разработчики издревле использовали подобные инструменты для тестирования своих игр на реальной консоли (а производители предоставляли аппаратное обеспечение для этого).
Более ранние решения включали прошиваемую NOR Flash память (до 32 МБ) и некоторые SRAM с питанием от батареи. Для загрузки двоичных файлов на картридж в комплекте поставлялся кабель Link-to-USB, который использовался с GBA и ПК под управлением Windows XP. С помощью фирменной программы для прошивки и драйверов компьютер загружал в GBA программу multi-boot, которая, в свою очередь, использовалась для передачи бинарного файла игры с ПК на Flashcart (вставленный в GBA). В целом, весь процесс загрузки игры считался слишком медленным. Более поздние флэш-карты (например, ‘EZ-Flash’) предлагали больший объем памяти и возможность прошивки картриджа без использования GBA в качестве промежуточного устройства [22]. Последние полагались на съемные накопители (SD, MiniSD, MicroSD или любые другие).
Коммерческая доступность этих карт оказалась серой правовой зоной: Nintendo осуждала их использование из-за возможности пиратства, в то время как некоторые пользователи защищали, что это единственный способ запуска Homebrew (программ, созданных вне игровых студий и, следовательно, без одобрения Nintendo). Аргумент Nintendo был подкреплен тем, что такие прошивальщики, как EZ-Writer, помогали пользователям патчить игровые ПЗУ, чтобы они могли без проблем запускаться в картриджах EZ-Flash. После юридических попыток Nintendo эти картриджи были запрещены в некоторых странах (например, в Великобритании). Тем не менее, они сохранялись повсеместно.
Вот и всё, ребята
Жаль, что у нее нет подсветки!