<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>designest.de - Fotograf Leipzig &#187; CUDA</title>
	<atom:link href="http://designest.de/tag/cuda/feed/" rel="self" type="application/rss+xml" />
	<link>http://designest.de</link>
	<description>design, designer, designest!</description>
	<lastBuildDate>Mon, 16 Jan 2012 21:51:33 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.3.1</generator>
	<atom:link rel="next" href="http://designest.de/tag/cuda/feed/?page=2" />

		<item>
		<title>[Update] iMac (early 2009) mit GT130 und NVIDIAs CUDA</title>
		<link>http://designest.de/2009/03/imac-early-2009-mit-gt130-und-nvidias-cuda/?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=imac-early-2009-mit-gt130-und-nvidias-cuda</link>
		<comments>http://designest.de/2009/03/imac-early-2009-mit-gt130-und-nvidias-cuda/#comments</comments>
		<pubDate>Tue, 24 Mar 2009 09:53:00 +0000</pubDate>
		<dc:creator>micha</dc:creator>
				<category><![CDATA[Newsblog]]></category>
		<category><![CDATA[Apple]]></category>
		<category><![CDATA[CUDA]]></category>
		<category><![CDATA[GT130]]></category>
		<category><![CDATA[Howto]]></category>
		<category><![CDATA[iMac]]></category>
		<category><![CDATA[NVIDIA]]></category>
		<category><![CDATA[Science]]></category>

		<guid isPermaLink="false">http://designest.de/?p=1214</guid>
		<description><![CDATA[]]></description>
			<content:encoded><![CDATA[<p class="BigFirst">Ich habe mir das <a class="extlink" href="http://www.nvidia.de/object/cuda_get_de.html">CUDA 2.0 Package</a> von NVIDA runtergeladen: die SDK und das Toolkit. Ich wollte mal sehen, was nun eigentlich die GT130 f&#252;r eine Grafikkarte ist. Es wird ja immer viel dar&#252;ber spekuliert.</p>
<p>Beide Pakete kann man recht einfach installieren. Beim Toolkit sollte man allerdings unbedingt darauf achten, bei der Installation die Option &#8220;Customize&#8221; oder &#8220;Anpassen&#8221; zu w&#228;hlen, um die notwendigen <em>CUDAKext</em> zu installieren.</p>
<p>Vorausgesetzt die Developer Tools (XCode Tools) von Leopard sind installiert, kann man nach einem Neustart das Terminal &#246;ffnen und in den CUDA Installationspfad wechseln: <code>cd /Volumes/Macintosh\ HD/Developer/CUDA/</code>. Schnell noch die Umgebungsvariablen in die <em>.bash_profile</em> schreiben:<br />
<code><br />
export NVSDKCUDA_ROOT=/usr/local/cuda<br />
export CUDA_LIB_PATH=/usr/local/cuda/SDK<br />
export PATH=/usr/local/cuda/bin:/usr/local/cuda/open64/bin:$PATH<br />
export DYLD_LIBRARY_PATH=/usr/local/cuda/lib:$DYLD_LIBRARY_PATH<br />
</code><br />
Dann mit <code>make</code> im oben genannten Pfad die Beispielprojekte kompilieren. Als n&#228;chstes hab ich dann geschaut, welche Eigenschaften die GT130 hat und das Beispielprogramm <em>deviceQuery</em> ausgef&#252;hrt: <code>./bin/darwin/release/deviceQuery</code>. Dabei kam folgendes zum Vorschein:<br />
<code><br />
There is 1 device supporting CUDA</p>
<p>Device 0: "GeForce 9600 GT"<br />
  Major revision number:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;1<br />
  Minor revision number:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;1<br />
  Total amount of global memory:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;536543232 bytes<br />
  Number of multiprocessors:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;8<br />
  Number of cores:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;64<br />
  Total amount of constant memory:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;65536 bytes<br />
  Total amount of shared memory per block:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;16384 bytes<br />
  Total number of registers available per block:&nbsp;8192<br />
  Warp size:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;32<br />
  Maximum number of threads per block:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;512<br />
  Maximum sizes of each dimension of a block:&nbsp;&nbsp;&nbsp;&nbsp;512 x 512 x 64<br />
  Maximum sizes of each dimension of a grid:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;65535 x 65535 x 1<br />
  Maximum memory pitch:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;262144 bytes<br />
  Texture alignment:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;256 bytes<br />
  Clock rate:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;0.34 GHz<br />
  Concurrent copy and execution:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Yes</p>
<p>Test PASSED<br />
</code></p>
<p>Das sieht bis auf einen Punkt doch alles ganz vern&#252;nftig aus. Die <em>Clock rate</em> ist nat&#252;rlich viel zu niedrig. Das liegt allerdings daran, dass die GT130 eine Grafikchip f&#252;r mobile Ger&#228;te ist und sie einen variable Taktrate hat. Die <em>0.34 GHz</em> ist die Power-Saving Clock Rate, also die Stromspar-Variante. Interessant w&#228;re also herauszubekommen, wie die maximale Clock rate aussieht.</p>
<p><strong>[UPDATE]</strong> Ich habe gerade gelesen, dass just gestern CUDA 2.1 (<a class="extlink"  href="http://developer.download.nvidia.com/compute/cuda/2_1/toolkit/cudatoolkit_2.1_macos.pkg">Toolkit</a>, <a class="extlink" href="http://developer.download.nvidia.com/compute/cuda/2_1/SDK/NVIDIA_SDK10_CUDA_2.1_macosx.pkg">SDK</a>) f&#252;r OS X erschienen ist. Werd ich heut abend gleich mal ausprobieren.</p>
<p>Also mit CUDA 2.1 ist die <em>Clock rate</em> stimmiger und liegt jetzt bei 1.3GHz:<br />
<code><br />
There is 1 device supporting CUDA</p>
<p>Device 0: "GeForce GT 130"<br />
  Major revision number:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;1<br />
  Minor revision number:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;1<br />
  Total amount of global memory:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;536543232 bytes<br />
  Number of multiprocessors:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;8<br />
  Number of cores:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;64<br />
  Total amount of constant memory:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;65536 bytes<br />
  Total amount of shared memory per block:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;16384 bytes<br />
  Total number of registers available per block:&nbsp;8192<br />
  Warp size:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;32<br />
  Maximum number of threads per block:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;512<br />
  Maximum sizes of each dimension of a block:&nbsp;&nbsp;&nbsp;&nbsp;512 x 512 x 64<br />
  Maximum sizes of each dimension of a grid:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;65535 x 65535 x 1<br />
  Maximum memory pitch:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;262144 bytes<br />
  Texture alignment:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;256 bytes<br />
  Clock rate:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;1.30 GHz<br />
  Concurrent copy and execution:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Yes</p>
<p>Test PASSED<br />
</code></p>
]]></content:encoded>
			<wfw:commentRss>http://designest.de/2009/03/imac-early-2009-mit-gt130-und-nvidias-cuda/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>

