RU2367001C1 - System for access to memory with adaptively adjustable speed of operation - Google Patents
System for access to memory with adaptively adjustable speed of operation Download PDFInfo
- Publication number
- RU2367001C1 RU2367001C1 RU2007145032/02A RU2007145032A RU2367001C1 RU 2367001 C1 RU2367001 C1 RU 2367001C1 RU 2007145032/02 A RU2007145032/02 A RU 2007145032/02A RU 2007145032 A RU2007145032 A RU 2007145032A RU 2367001 C1 RU2367001 C1 RU 2367001C1
- Authority
- RU
- Russia
- Prior art keywords
- bus
- access
- busbar
- memory
- external memory
- Prior art date
Links
Images
Landscapes
- Bus Control (AREA)
- Multi Processors (AREA)
Abstract
Description
Изобретение относится к вычислительной технике, а именно к области обработки потоковых данных в многопроцессорной системе на кристалле.The invention relates to computing, and in particular to the field of processing streaming data in a multiprocessor system on a chip.
Область обработки потоковых данных (компрессия, декомпрессия видео) является быстроразвивающимся направлением. Возрастают разрешающие способности оборудования (камеры и экраны высокой четкости) и качество обработки изображения. При этом устройства становятся компактнее, возрастают требования к энергопотреблению изделия, а средства их удовлетворения все еще недостаточны в полной мере.The field of processing streaming data (compression, decompression of video) is a rapidly developing area. The resolution of equipment (cameras and high-definition screens) and the quality of image processing are increasing. At the same time, the devices become more compact, the requirements for the energy consumption of the product increase, and the means of satisfying them are still insufficient in full.
Известны технические решения [1, 2], выполняющие доступ к общей внешней памяти без регулировки скорости обращения, что является существенным недостатком данного решения систем, т.к. они обладают высокой потребляемой мощностью, что ухудшает потребительские свойства системы.Known technical solutions [1, 2] that access the shared external memory without adjusting the speed of rotation, which is a significant drawback of this solution of systems, because they have high power consumption, which affects the consumer properties of the system.
Наиболее близким техническим решением является система, использующая шинный арбитр для выключения [3], включающая:The closest technical solution is a system that uses a bus arbiter to turn off [3], including:
- шину общего доступа,- shared bus
- внешнюю память, подключенную к шине общего доступа,- external memory connected to the shared bus,
- модуль управления сигналом синхронизирующей тактовой частоты,- a clock control signal module,
- основной мастер-модуль, сохраняющий исключительный доступ к памяти при работе системы в режиме сохранения энергии,- the main master module that retains exclusive access to memory when the system is in energy conservation mode,
- мастер-модули, подключенные к шине и генерирующие запросы на доступ к ней,- master modules connected to the bus and generating requests for access to it,
- выключающий мастер-модуль,- turning off the master module,
- шинный арбитр.- tire arbiter.
Функциональная схема прототипа [3] представлена на фигуре 1.Functional diagram of the prototype [3] is presented in figure 1.
На представленной схеме сделаны обозначения, где: 1 - шина общего доступа, 2 - внешняя память, 3 - модуль управления сигналом синхронизирующей тактовой частоты, 4 - основной мастер-модуль, сохраняющий исключительный доступ к памяти при работе системы в режиме сохранения энергии, 5 - мастер-модули, подключенные к шине и генерирующие запросы на доступ к ней, 6 - выключающий мастер-модуль, 7 - шинный арбитр.The notation is made in the presented diagram, where: 1 is the shared bus, 2 is the external memory, 3 is the clock synchronization signal control module, 4 is the main master module that maintains exclusive access to the memory when the system is operating in energy conservation mode, 5 - master modules connected to the bus and generating requests for access to it, 6 - turning off the master module, 7 - bus arbiter.
Как следует из описания системы прототипа [3] и из функциональной схемы, представленной на фиг.1, система имеет недостатки:As follows from the description of the prototype system [3] and from the functional diagram presented in figure 1, the system has disadvantages:
1. Активность на шине и определения условий входа системы в режим сохранения энергии наблюдаются программно внешними средствами. Внешнее управление скоростью существенно снижает быстродействие и скорость реагирования системы на изменения.1. Activity on the bus and determining the conditions for the system to enter the energy conservation mode are observed programmatically by external means. External speed control significantly reduces the speed and responsiveness of the system to changes.
2. В режиме сохранения энергии право доступа на шину принадлежит исключительно одному мастер-модулю 4, шина не используется, что существенно снижает функциональные возможности системы.2. In the energy conservation mode, the right to access the bus belongs exclusively to one
Задачей изобретения является нахождение технического решения, заключающегося в автоматическом выборе скорости работы системы с внешней памятью, повышающем скорость настройки системы под общий уровень нагрузки, и обеспечении доступа на шину всех мастер-модулей во всех режимах работы в результате добавления в систему счетного устройства полезных тактов шины, счетного устройства полных тактов шины и устройства сравнения и управления.The objective of the invention is to find a technical solution, which consists in the automatic selection of the speed of the system with external memory, increasing the speed of tuning the system to the general load level, and providing access to the bus of all master modules in all operating modes as a result of adding useful bus clocks to the system of the calculating device , a full bus clock counting device, and a comparison and control device.
Для достижения названного технического результата в систему, использующую шинный арбитр для выключения [3], содержащую:To achieve the named technical result in a system using a bus arbiter to turn off [3], containing:
- шину общего доступа,- shared bus
- внешнюю память, подключенную к шине общего доступа,- external memory connected to the shared bus,
- модуль управления сигналом синхронизирующей тактовой частоты,- a clock control signal module,
- основной мастер-модуль, сохраняющий исключительный доступ к памяти при работе системы в режиме сохранения энергии,- the main master module that retains exclusive access to memory when the system is in energy conservation mode,
- мастер-модули, подключенные к шине и генерирующие запросы на доступ к ней,- master modules connected to the bus and generating requests for access to it,
- шинный арбитр- tire arbiter
включают блоки, являющиеся отличительными признаками изобретения:include blocks that are the hallmarks of the invention:
- счетное устройство полезных тактов шины,- calculator of useful bus ticks,
- счетное устройство полных тактов шины,- total bus clock counter,
- устройство сравнения и управления тактовой частотой шинного арбитра и внешней памяти.- a device for comparing and controlling the clock frequency of the bus arbiter and external memory.
Проведенные патентные исследования показали, что совокупность признаков предлагаемого изобретения является новой, что доказывает новизну заявляемого прибора.Patent studies have shown that the combination of features of the invention is new, which proves the novelty of the claimed device.
Кроме того, патентные исследования показали, что в литературе отсутствуют данные, показывающие влияние отличительных признаков заявляемого изобретения на достижение технического результата, что подтверждает изобретательский уровень предлагаемой конструкции прибора.In addition, patent studies have shown that in the literature there are no data showing the influence of the distinguishing features of the claimed invention on the achievement of a technical result, which confirms the inventive step of the proposed device design.
Данная совокупность отличительных признаков позволяет достичь названный технический результат.This set of distinctive features allows to achieve the named technical result.
Функциональная схема устройства согласно предполагаемому изобретению иллюстрируется на фиг.2.The functional diagram of the device according to the alleged invention is illustrated in figure 2.
Устройство, представленное на фиг.2, содержит: 1 - шину, 2 - внешнюю память, 3 - модуль управления, 4 - основной мастер-модуль, 5 - мастер-модули, 7 - шинный арбитр, 8 - счетное устройство полезных тактов шины, 9 - счетное устройство полных тактов шины, 10 - устройство сравнения и управления тактовой частотой шинного арбитра и внешней памяти.The device shown in figure 2, contains: 1 - bus, 2 - external memory, 3 - control module, 4 - main master module, 5 - master modules, 7 - bus arbiter, 8 - calculating device useful bus ticks, 9 - calculating device for full bus clocks, 10 - device for comparing and controlling the clock frequency of the bus arbiter and external memory.
В предлагаемой нами системе, где нагрузка на общий массив памяти меняется в зависимости от режима, можно значительно сэкономить энергию, уменьшив скорость работы с общей внешней памятью до минимально необходимого для данного режима. Также возможны устойчивые продолжительные изменения в уровне нагрузки на общую внешнюю память при работе в выбранном режиме.In our system, where the load on the shared memory array varies depending on the mode, you can significantly save energy by reducing the speed of working with shared external memory to the minimum necessary for this mode. Sustainable long-term changes in the load level on the shared external memory are also possible when working in the selected mode.
Логика работы шины доступа к общей внешней памяти с адаптивной подстраиваемой скоростью работы рассмотрена ниже.The logic of the access bus to the shared external memory with adaptive adjustable speed of operation is discussed below.
Начальные условия: устанавливается максимальная тактовая частота внешней памяти и шинного арбитра. Система обработки потоковых данных (многопроцессорная системе на кристалле) работает согласно своему алгоритму. Каждый мастер-модуль запрашивает доступ к внешней памяти и осуществляет доступ к ней через шинный арбитр. Во время доступа каждого мастер-модуля счетным устройством полезных тактов шины (8) суммируется общая активность всех устройств «K». В то же время осуществляется подсчет «k» полных тактов шины (полной возможной пропускной способности шины и внешней памяти) счетным устройством полных тактов шины (9).Initial conditions: the maximum clock frequency of the external memory and the bus arbiter is set. The streaming data processing system (multiprocessor system on a chip) works according to its own algorithm. Each master module requests access to external memory and accesses it through a bus arbiter. During the access of each master module, the counting device of useful bus clocks (8) summarizes the total activity of all K devices. At the same time, the “k” of the full bus clocks (the full possible bandwidth of the bus and external memory) is counted by the total bus clock counter (9).
Устройство сравнения (10) находит отношение полезной скорости обменов «K» на шине к полной возможной скорости «k» на данной (максимальной) тактовой частоте. Отношение будет меньше (или равно) единицы.The comparison device (10) finds the ratio of the useful exchange rate “K” on the bus to the total possible speed “k” at a given (maximum) clock frequency. The ratio will be less than (or equal to) one.
При меньшем отношении (неполной загрузке шины) сравнивающий модуль устанавливает другое (меньшее) значение тактовой частоты шинного арбитра и внешней памяти.With a smaller ratio (incomplete loading of the bus), the comparing module sets another (lower) value of the clock frequency of the bus arbiter and external memory.
Сетка значений «N» тактовых частот «F(N)» определяется как пошаговое увеличение минимальной базовой тактовой частоты системы. Так, например, для системы обработки видео, использующей стандартную внешнюю SDRAM память с максимальной тактовой частотой работы до 200 МГц, предлагается использовать шаг сетки частот, равный 27 МГц (кратное частоте вывода и приема входных данных значение).The grid of values “N” of the clock frequencies “F (N)” is defined as a incremental increase in the minimum base clock frequency of the system. So, for example, for a video processing system using a standard external SDRAM memory with a maximum clock frequency of up to 200 MHz, it is proposed to use a frequency grid step equal to 27 MHz (a multiple of the frequency of output and reception of input data).
В данной системе шаг сетки частот будет следующий:In this system, the frequency grid step will be as follows:
В устройстве сравнения и управления тактовой частотой шинного арбитра и внешней памяти (10) сравниваются значения и отношения K(N) и k(N) и, если K(N)/k(N)<Mmin(N), то выбирается следующее меньшее согласно сетке значение тактовой частоты, иначе, при K(N)/k(N)=1 выбирается следующее большее значение тактовой частоты. Если же Mmin(N)=<K(N)/k(N)<1, то значение сетки тактовой частоты не меняется.In the device for comparing and controlling the clock frequency of the bus arbiter and external memory (10), the values and ratios K (N) and k (N) are compared and, if K (N) / k (N) <Mmin (N), then the next smaller according to the grid, the value of the clock frequency; otherwise, for K (N) / k (N) = 1, the next higher value of the clock frequency is selected. If Mmin (N) = <K (N) / k (N) <1, then the value of the clock frequency grid does not change.
Таким образом, скорость работы с внешней памятью адаптивно регулируется под уровень загрузки шины, минимизируется потребляемая мощность при работе внешней памяти на меньших скоростях.Thus, the speed of working with external memory is adaptively adjusted to the bus load level, power consumption is minimized when the external memory is operating at lower speeds.
Пример реализации, описанный выше, является частным случаем. Предполагаемая система может использоваться для задач любого другого типа не выходя за пределы патентных притязаний.The implementation example described above is a special case. The proposed system can be used for any other type of tasks without going beyond the scope of patent claims.
ЛитератураLiterature
1. Philips semiconductors, Integrated MPEG AVGD decoders SAA7215; SAA7216; SAA7221, Preliminary specification, 2001 Mar 28, page 2. www.platan.ru/pdf/1dist/philips/SAA7215_7216_7221_1. Philips semiconductors, Integrated MPEG AVGD decoders SAA7215; SAA7216; SAA7221, Preliminary specification, 2001 Mar 28,
2. Robert Cravotta, 2002 DSP directory, www.ednmag.com, paper edn040402, April 2002 N4, page 56, TEXAS INSTRUMENTS' TMS320DSCX FAMILY.2. Robert Cravotta, 2002 DSP directory, www.ednmag.com, paper edn040402, April 2002 N4, page 56, TEXAS INSTRUMENTS 'TMS320DSCX FAMILY.
3. US Patent Application 20070067652 System using bus arbiter to power down.3. US Patent Application 20070067652 System using bus arbiter to power down.
Claims (1)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2007145032/02A RU2367001C1 (en) | 2007-12-06 | 2007-12-06 | System for access to memory with adaptively adjustable speed of operation |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2007145032/02A RU2367001C1 (en) | 2007-12-06 | 2007-12-06 | System for access to memory with adaptively adjustable speed of operation |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2007145032A RU2007145032A (en) | 2009-06-20 |
RU2367001C1 true RU2367001C1 (en) | 2009-09-10 |
Family
ID=41025249
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2007145032/02A RU2367001C1 (en) | 2007-12-06 | 2007-12-06 | System for access to memory with adaptively adjustable speed of operation |
Country Status (1)
Country | Link |
---|---|
RU (1) | RU2367001C1 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2470350C2 (en) * | 2009-12-16 | 2012-12-20 | Интел Корпорейшн | INTERFACE LOGIC FOR MULTI-CORE SYSTEM-ON-A-CHIP (SoC) |
-
2007
- 2007-12-06 RU RU2007145032/02A patent/RU2367001C1/en not_active IP Right Cessation
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2470350C2 (en) * | 2009-12-16 | 2012-12-20 | Интел Корпорейшн | INTERFACE LOGIC FOR MULTI-CORE SYSTEM-ON-A-CHIP (SoC) |
Also Published As
Publication number | Publication date |
---|---|
RU2007145032A (en) | 2009-06-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5985777B1 (en) | Bus clock frequency scaling for bus interconnects, and related devices, systems, and methods | |
US7296174B2 (en) | Apparatus and method to interface two different clock domains | |
US9436506B2 (en) | Effective scheduling of producer-consumer processes in a multi-processor system | |
US6971034B2 (en) | Power/performance optimized memory controller considering processor power states | |
KR20190017639A (en) | Intelligent high bandwidth memory appliance | |
US8443122B2 (en) | Asynchronous upsizing circuit in data processing system | |
US20150149735A1 (en) | Memory system | |
US8010754B2 (en) | Memory micro-tiling | |
US11586361B2 (en) | Adaptive memory system | |
US10572183B2 (en) | Power efficient retraining of memory accesses | |
JP5237739B2 (en) | Information processing device | |
RU2367001C1 (en) | System for access to memory with adaptively adjustable speed of operation | |
WO2014004671A1 (en) | Maximum current throttling | |
CN116825160A (en) | Adaptive word line refresh | |
Tanabe et al. | Scaleable sparse matrix-vector multiplication with functional memory and gpus | |
US20040123176A1 (en) | Dynamically configurable clocking scheme for demand based resource sharing with multiple clock crossing domains | |
US20210360178A1 (en) | Local tone mapping circuit, image sensing device and operation method of the same | |
Jang et al. | Application-aware NoC design for efficient SDRAM access | |
US9196187B2 (en) | System and method of reducing power using a display inactive indication | |
US10110927B2 (en) | Video processing mode switching | |
Sell | The xbox one x scorpio engine | |
US20110099334A1 (en) | Core cluster, energy scalable vector processing apparatus and method of vector processing including the same | |
US20090129214A1 (en) | Memory control device | |
Truong et al. | A 167-processor computational array for highly-efficient DSP and embedded application processing | |
US20190066777A1 (en) | Per-pin compact reference voltage generator |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM4A | The patent is invalid due to non-payment of fees |
Effective date: 20101207 |