<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">
<meta name="Generator" content="Microsoft Exchange Server">
<!-- converted from rtf -->
<style><!-- .EmailQuote { margin-left: 1pt; padding-left: 4pt; border-left: #800000 2px solid; } --></style>
</head>
<body>
<font face="Calibri" size="2"><span style="font-size:11pt;">
<div>Hello Balazs,</div>
<div>&nbsp;</div>
<div>We found something strange with McKernel when used multiple sockets.</div>
<div>When executing an HPCCG benchmark with openMP threads, it take much more time when threads are in different sockets.</div>
<div>We used numactl to set a cpu mask. (OMP_NUM_THREADS=2 ./mcexec numactl &#8211;C 0,2 ~/HPCCG 104&nbsp;104&nbsp;104)</div>
<div>For example, using HPCCG with 2 openMP threads, it take around 4.66s with Linux and McKernel using both thread on one socket, and it take 5.42s in McKernel using different sockets when Linux take always 4.66s.</div>
<div>Are you aware of this issue?<br>

Is there a mistake in our execution environment?</div>
<div>&nbsp;</div>
<div>We tried to use the &#8211;c parameter of mcexec to set a cpu mask in McKernel application, but it look like it does not have any effect on placement. Is it a deprecated feature or is it not its purpose? </div>
<div>&nbsp;</div>
<div>Thank you in advance for your help.</div>
<div>&nbsp;</div>
<div>Jérémie Finiel</div>
<div>&nbsp;</div>
<div>&nbsp;</div>
</span></font>
</body>
</html>