Lukas' second improvements
This commit is contained in:
@@ -51,12 +51,13 @@ Microelectronic Systems Design Research Group \\[3ex]
|
||||
The performance of today's computing systems depends in particular on the memory system utilized.
|
||||
With the increasing usage of DRAMs, also in mobile and embedded systems, it is important to select a memory configuration that fits the application well to provide high performance.
|
||||
However, this is a complex task within the system design due to the overwhelming number of possible configurations and their advantages and disadvantages.
|
||||
In particular, bandwidth and latency requirements of the application must be satisfied.
|
||||
Consequently, to verify these requirements, simulations of the system are essential to evaluate whether the components and configuration parameters used are suitable for the application.
|
||||
In particular, bandwidth and latency requirements must be satisfied.
|
||||
Consequently, to verify these requirements, simulations of the system are essential to evaluate whether the configuration parameters used are suitable for the application.
|
||||
Such a simulation can be accomplished with the DRAM simulation environment DRAMSys.
|
||||
A simulation with DRAMSys requires a realistic stimuli for the memory system that matches the application's behavior, which can be created by the time-consuming simulation of the application using processor core models.
|
||||
A simulation requires a realistic stimuli for the memory system that matches the application's behavior, which can be created by the time-consuming simulation of the application using processor core models.
|
||||
To overcome this drawback of very long simulation time, a faster method of creating stimuli for DRAMSys is developed in this thesis.
|
||||
In this method, access patterns are created by analyzing the application's behavior using dynamic binary instrumentation while it is running on real hardware.
|
||||
With our approach, we are able to simulate 73\% faster compared to gem5 FS while only losing 7\% in accuracy in respect of the bandwidth.
|
||||
|
||||
\vspace{1.0cm}
|
||||
|
||||
@@ -65,11 +66,12 @@ In this method, access patterns are created by analyzing the application's behav
|
||||
Die Leistung heutiger Rechensysteme hängt insbesondere von dem eingesetzen Speichersystem ab.
|
||||
Mit der zunehmenden Verbreitung von DRAMs auch in mobilen und eingebetteten Systemen ist es wichtig, eine Speicherkonfiguration zu wählen, welche gut zur Anwendung passt, um eine hohe Leistungsfähigkeit zu erzielen.
|
||||
Dies ist jedoch aufgrund der überwältigenden Anzahl möglicher Konfigurationen und ihrer Vor- und Nachteile eine komplexe Aufgabe innerhalb des Systemdesigns.
|
||||
Insbesondere die Anforderungen der Anwendung an Bandbreite und Latenzen müssen erfüllt werden.
|
||||
Folglich sind zur Überprüfung dieser Anforderungen Simulationen des Systems unerlässlich, um zu bewerten, ob die verwendeten Komponenten und Konfigurationsparameter für die Anwendung geeignet sind.
|
||||
Insbesondere Anforderungen an Bandbreite und Latenzen müssen erfüllt werden.
|
||||
Folglich sind zur Überprüfung dieser Anforderungen Simulationen des Systems unerlässlich, um zu bewerten, ob die verwendeten Konfigurationsparameter für die Anwendung geeignet sind.
|
||||
Solch eine Simulation kann mit der DRAM Simulationsumgebung DRAMSys durchgeführt werden.
|
||||
Eine Simulation mit DRAMSys erfordert realitätsnahe Stimuli für das Speichersystem, das dem Verhalten der Anwendung entspricht, welches mit einer zeitaufwändigen Simulation der Anwendung mit Prozessorkernmodellen erstellt werden kann.
|
||||
Eine Simulation erfordert realitätsnahe Stimuli für das Speichersystem, das dem Verhalten der Anwendung entspricht, welches mit einer zeitaufwändigen Simulation der Anwendung mit Prozessorkernmodellen erstellt werden kann.
|
||||
Um diesen Nachteil der sehr langen Simulationszeit zu überwinden, wird in dieser Arbeit eine neue Methode zur Erstellung von Stimuli für DRAMSys entwickelt.
|
||||
Bei dieser Methode werden Zugriffsmuster durch die Analyse des Verhaltens der Anwendung mittels Instrumentierung erstellt, während sie auf echter Hardware ausgeführt wird.
|
||||
Mit unserem Ansatz sind wir in der Lage, die Simulationen im Vergleich zu gem5 FS um 73\% zu beschleunigen, während wir in Bezug auf die Bandbreite nur 7\% an Genauigkeit verlieren.
|
||||
|
||||
\end{abstract}
|
||||
|
||||
Reference in New Issue
Block a user