<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" media="screen" href="/~d/styles/rss2russianfull.xsl"?><?xml-stylesheet type="text/css" media="screen" href="http://feeds.lexa.ru/~d/styles/itemcontent.css"?><rss xmlns:dc="http://purl.org/dc/elements/1.1/" version="2.0" xml:base="http://www.gpgpu.ru/rss.xml">
  <channel>
    <title>GPGPU.ru</title>
    <link>http://www.gpgpu.ru/rss.xml</link>
    <description />
    <language>ru</language>
          <atom10:link xmlns:atom10="http://www.w3.org/2005/Atom" rel="self" type="application/rss+xml" href="http://feeds.lexa.ru/gpgpu-ru" /><feedburner:info xmlns:feedburner="http://rssnamespace.org/feedburner/ext/1.0" uri="gpgpu-ru" /><atom10:link xmlns:atom10="http://www.w3.org/2005/Atom" rel="hub" href="http://pubsubhubbub.appspot.com/" /><feedburner:feedFlare xmlns:feedburner="http://rssnamespace.org/feedburner/ext/1.0" href="http://add.my.yahoo.com/rss?url=http%3A%2F%2Ffeeds.lexa.ru%2Fgpgpu-ru" src="http://us.i1.yimg.com/us.yimg.com/i/us/my/addtomyyahoo4.gif">Subscribe with My Yahoo!</feedburner:feedFlare><feedburner:feedFlare xmlns:feedburner="http://rssnamespace.org/feedburner/ext/1.0" href="http://www.newsgator.com/ngs/subscriber/subext.aspx?url=http%3A%2F%2Ffeeds.lexa.ru%2Fgpgpu-ru" src="http://www.newsgator.com/images/ngsub1.gif">Subscribe with NewsGator</feedburner:feedFlare><feedburner:feedFlare xmlns:feedburner="http://rssnamespace.org/feedburner/ext/1.0" href="http://feeds.my.aol.com/add.jsp?url=http%3A%2F%2Ffeeds.lexa.ru%2Fgpgpu-ru" src="http://o.aolcdn.com/favorites.my.aol.com/webmaster/ffclient/webroot/locale/en-US/images/myAOLButtonSmall.gif">Subscribe with My AOL</feedburner:feedFlare><feedburner:feedFlare xmlns:feedburner="http://rssnamespace.org/feedburner/ext/1.0" href="http://www.bloglines.com/sub/http://feeds.lexa.ru/gpgpu-ru" src="http://www.bloglines.com/images/sub_modern11.gif">Subscribe with Bloglines</feedburner:feedFlare><feedburner:feedFlare xmlns:feedburner="http://rssnamespace.org/feedburner/ext/1.0" href="http://www.netvibes.com/subscribe.php?url=http%3A%2F%2Ffeeds.lexa.ru%2Fgpgpu-ru" src="http://www.netvibes.com/img/add2netvibes.gif">Subscribe with Netvibes</feedburner:feedFlare><feedburner:feedFlare xmlns:feedburner="http://rssnamespace.org/feedburner/ext/1.0" href="http://fusion.google.com/add?feedurl=http%3A%2F%2Ffeeds.lexa.ru%2Fgpgpu-ru" src="http://buttons.googlesyndication.com/fusion/add.gif">Subscribe with Google</feedburner:feedFlare><feedburner:feedFlare xmlns:feedburner="http://rssnamespace.org/feedburner/ext/1.0" href="http://www.pageflakes.com/subscribe.aspx?url=http%3A%2F%2Ffeeds.lexa.ru%2Fgpgpu-ru" src="http://www.pageflakes.com/ImageFile.ashx?instanceId=Static_4&amp;fileName=ATP_blu_91x17.gif">Subscribe with Pageflakes</feedburner:feedFlare><feedburner:feedFlare xmlns:feedburner="http://rssnamespace.org/feedburner/ext/1.0" href="http://lenta.yandex.ru/settings.xml?name=feed&amp;url=http%3A%2F%2Ffeeds.lexa.ru%2Fgpgpu-ru" src="http://lenta.yandex.ru/i/addfeed.gif">?????? ? ??????.?????</feedburner:feedFlare><item>
    <title>Декабрьские новости</title>
    <link>http://www.gpgpu.ru/node/916</link>
    <description>&lt;p&gt;
Накопилось сразу много новостей, мимо которых нельзя пройти мимо.
&lt;h3&gt;OpenCL&lt;/h3&gt;
Месяц назад был объявлен OpenCL 1.2, тут о нем еще не писалось, потому что писать особо нечего: &lt;a href=http://www.streamcomputing.eu/blog/2011-11-19/difference-between-opencl-1-2-and-1-1/&gt;изменения мне кажутся не слишком значительными&lt;/a&gt; (ну кроме лучшей интеграции с DX11),  а реализаций все еще нет (но вот-вот могут появиться, см. ниже).

&lt;h3&gt;Nvidia&lt;/h3&gt;
&lt;!--break--&gt;
&lt;ul&gt;
&lt;li&gt;Вышел &lt;a href=http://developer.nvidia.com/cuda-toolkit-41&gt;CUDA Toolkit RC2&lt;/a&gt;, доступный всем без предварительной регистрации.  Судя по Release Notes, есть множество мелких (но существенных) изменений:
&lt;ul&gt;
&lt;li&gt;Компилятор теперь основан на LLVM, а не на Open32. Соответственно, возможны заметные изменения в эффективности в обе стороны, надо внимательно смотреть. Обещают ускорение up to 10%, но для некоторого кода жалуются на замедление.
&lt;li&gt;Существенно расширены библиотеки (NPP, cuSPARSE, cuRAND)
&lt;li&gt;P2P-communications (между картами, мимо CPU) теперь работают не только для Tesla, а для любых Fermi-карт.
&lt;li&gt;И много других мелких улучшений.
&lt;/ul&gt;
&lt;li&gt;К CUDA 4.1 вышел соответствующий &lt;a href=http://developer.nvidia.com/content/parallel-nsight-21-release-candidate-2-available&gt;Parallel NSight 2.1 RC2&lt;/a&gt;.
&lt;p&gt;В отличие от CUDA, он доступен пока только зарегистрированным девелоперам, причем не &lt;i&gt;старым зарегистрированным девелоперам&lt;/i&gt; (на сайте nvdeveloper.nvidia.com), а на &lt;a href=http://developer.nvidia.com/user/login&gt;полностью новом developer.nvidia.com&lt;/a&gt;
&lt;p&gt;
Для доступа к Parallel Nsight требуется одобрение вашей регистрации, в моем случае оно произошло в течение нескольких часов, ночью по калифорнийскому времени, а одобрение CUDA и вовсе прилетело мгновенно.
&lt;li&gt;Помянутый выше LLVM-компилятор &lt;a href=http://developer.nvidia.com/content/cuda-platform-source-release&gt;обещают заопенсорсить&lt;/a&gt;. Пока по этому адресу только форма регистрации, я зарегистрировался, посмотрим что дальше будет. В-принципе, JIT-компилятор CUDA, делающий код, заточенный под конкретное устройство на конкретной машине - полезная же вещь.
&lt;/ul&gt;
&lt;h3&gt;AMD&lt;/h3&gt;
&lt;ul&gt;
&lt;li&gt;AMD APP SDK 2.6 Preview недоступен с родного сайта AMD, но доступен с &lt;a href=http://www.gpu-tech.org/content.php/179-AMD-APP-SDK-2.6-is-available-for-download&gt;GPU-Tech.org&lt;/a&gt; (сайт временами лежит). Обещают помянутый выше OpenCL 1.2, пока не смотрел: для работы требуется Catalyst 11.12, который вышел только сегодня, пока не успел.
&lt;li&gt;AMD &lt;b&gt;тоже&lt;/b&gt; опенсорсит свой компилятор (из OpenCL в IL). Не в виде анонса, а в виде патчей к LLVM 2.9 &lt;a href=http://lists.cs.uiuc.edu/pipermail/llvmdev/2011-December/046136.html&gt;которые можно взять тут&lt;/a&gt;
&lt;/ul&gt;
&lt;h3&gt;Intel&lt;/h3&gt;
Это не  GPGPU, а data parallel, но все равно интересно. Интел зарелизил версию 1.1 своего &lt;a href=http://ispc.github.com/&gt;SPMD Program Compiler&lt;/a&gt;. BSD-лицензия, LLVM-based.
&lt;p&gt;
Это такой компилятор C-подобного языка, позволяющий легко писать SIMD- и (с нашлепкой для multi-threading) MultiCore/SMP код. В отличие от OpenCL для CPU, этот код может работать с данными прямо по месту, без их копирования в буферы, что для задач с низкой арифметической интенсивностью оказывается очень выгодно.&lt;div class="feedflare"&gt;
&lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=G_kSW4Q5L-w:rSjXHVfolzM:yIl2AUoC8zA"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?d=yIl2AUoC8zA" border="0"&gt;&lt;/img&gt;&lt;/a&gt; &lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=G_kSW4Q5L-w:rSjXHVfolzM:F7zBnMyn0Lo"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?i=G_kSW4Q5L-w:rSjXHVfolzM:F7zBnMyn0Lo" border="0"&gt;&lt;/img&gt;&lt;/a&gt; &lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=G_kSW4Q5L-w:rSjXHVfolzM:7Q72WNTAKBA"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?d=7Q72WNTAKBA" border="0"&gt;&lt;/img&gt;&lt;/a&gt; &lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=G_kSW4Q5L-w:rSjXHVfolzM:V_sGLiPBpWU"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?i=G_kSW4Q5L-w:rSjXHVfolzM:V_sGLiPBpWU" border="0"&gt;&lt;/img&gt;&lt;/a&gt;
&lt;/div&gt;&lt;img src="http://feeds.feedburner.com/~r/gpgpu-ru/~4/G_kSW4Q5L-w" height="1" width="1"/&gt;</description>
     <comments>http://www.gpgpu.ru/node/916#comments</comments>
 <category domain="http://www.gpgpu.ru/taxonomy/term/16">AMD</category>
 <category domain="http://www.gpgpu.ru/taxonomy/term/25">CUDA</category>
 <category domain="http://www.gpgpu.ru/taxonomy/term/52">Intel</category>
 <category domain="http://www.gpgpu.ru/taxonomy/term/22">NVidia</category>
 <category domain="http://www.gpgpu.ru/taxonomy/term/41">OpenCL</category>
 <category domain="http://www.gpgpu.ru/taxonomy/term/11">Обзоры веба</category>
 <pubDate>Wed, 14 Dec 2011 12:20:18 +0000</pubDate>
 <dc:creator>lexa</dc:creator>
 <guid isPermaLink="false">916 at http://www.gpgpu.ru</guid>
  </item>
  <item>
    <title>OpenCL tools &amp; compilers</title>
    <link>http://www.gpgpu.ru/node/898</link>
    <description>&lt;p&gt;Последние дни оказались богаты на всякие штуки для OpenCL:
&lt;dl&gt;
&lt;dt&gt;&lt;a href=http://clusterchimps.org/ocltools.php&gt;OpenCL Compiler tools&lt;/a&gt;&lt;/dt&gt;
&lt;dd&gt;Небольшая библиотека, позволяющая удобно компилировать OpenCL kernels заранее, сохраняя результат (можно - шифрованый). Цель - поэкономить на времени компиляции и на том, что kernel находится где-то внутри программы в исходных текстах.
&lt;p&gt;
Несколько смазывает впечатление то, что библиотека распространяется под GPL3, т.е. цель "спрятать kernel" под такой лицензией, очевидно, не может быть достигнута т.к. использующий библиотеку варез обязан тоже быть под GPL3+
&lt;/dd&gt;
&lt;dt&gt;&lt;a href=https://launchpad.net/pocl/trunk&gt;Portable OpenCL&lt;/a&gt;&lt;/dt&gt;
&lt;dd&gt;Реализация OpenCL (для CPU) на базе LLVM. OpenSource, BSD-style license. 
&lt;p&gt;
Не смотрел, но идея мне нравится.
&lt;/dd&gt;
&lt;dt&gt;&lt;a href=http://www.pcc.me.uk/~peter/libclc/&gt;libclc&lt;/a&gt;&lt;/dt&gt;
&lt;dd&gt;Реализация OpenCL для CPU в виде библиотеки, тоже поверх LLVM/Clang, хотя поминается и PTC
&lt;p&gt;
Анонсирую исключительно до кучи, на настоящий момент проект фактически пустой,  но вдруг там что-то разовьется со временем?
&lt;/dd&gt;
&lt;/dl&gt;
&lt;!--break--&gt;&lt;div class="feedflare"&gt;
&lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=RRFlJ_fmIrY:JWS_07FLuqM:yIl2AUoC8zA"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?d=yIl2AUoC8zA" border="0"&gt;&lt;/img&gt;&lt;/a&gt; &lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=RRFlJ_fmIrY:JWS_07FLuqM:F7zBnMyn0Lo"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?i=RRFlJ_fmIrY:JWS_07FLuqM:F7zBnMyn0Lo" border="0"&gt;&lt;/img&gt;&lt;/a&gt; &lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=RRFlJ_fmIrY:JWS_07FLuqM:7Q72WNTAKBA"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?d=7Q72WNTAKBA" border="0"&gt;&lt;/img&gt;&lt;/a&gt; &lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=RRFlJ_fmIrY:JWS_07FLuqM:V_sGLiPBpWU"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?i=RRFlJ_fmIrY:JWS_07FLuqM:V_sGLiPBpWU" border="0"&gt;&lt;/img&gt;&lt;/a&gt;
&lt;/div&gt;&lt;img src="http://feeds.feedburner.com/~r/gpgpu-ru/~4/RRFlJ_fmIrY" height="1" width="1"/&gt;</description>
     <comments>http://www.gpgpu.ru/node/898#comments</comments>
 <category domain="http://www.gpgpu.ru/taxonomy/term/77">LLVM</category>
 <category domain="http://www.gpgpu.ru/taxonomy/term/41">OpenCL</category>
 <category domain="http://www.gpgpu.ru/taxonomy/term/11">Обзоры веба</category>
 <pubDate>Thu, 20 Oct 2011 06:51:57 +0000</pubDate>
 <dc:creator>lexa</dc:creator>
 <guid isPermaLink="false">898 at http://www.gpgpu.ru</guid>
  </item>
  <item>
    <title>Административное: внутренние изменения на сайте</title>
    <link>http://www.gpgpu.ru/node/896</link>
    <description>&lt;p&gt;В последние дни на сайте было сделано несколько технологических изменений, призванных ускорить загрузку страниц сайта.
&lt;p&gt;
Если вы заметите какие-то проблемы, прежде всего слет авторизации (для авторизованных пользователей) - пишите в &lt;a href=http://www.gpgpu.ru/contact&gt;обратную связь&lt;/a&gt;, будем ловить.
&lt;p&gt;
Хотя, вроде бы, все эти проблемы были найдены и вычищены, но вдруг что-то не заметили.
&lt;!--break--&gt;&lt;div class="feedflare"&gt;
&lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=Pwwhvu0spOs:o69Gj9cwAeE:yIl2AUoC8zA"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?d=yIl2AUoC8zA" border="0"&gt;&lt;/img&gt;&lt;/a&gt; &lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=Pwwhvu0spOs:o69Gj9cwAeE:F7zBnMyn0Lo"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?i=Pwwhvu0spOs:o69Gj9cwAeE:F7zBnMyn0Lo" border="0"&gt;&lt;/img&gt;&lt;/a&gt; &lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=Pwwhvu0spOs:o69Gj9cwAeE:7Q72WNTAKBA"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?d=7Q72WNTAKBA" border="0"&gt;&lt;/img&gt;&lt;/a&gt; &lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=Pwwhvu0spOs:o69Gj9cwAeE:V_sGLiPBpWU"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?i=Pwwhvu0spOs:o69Gj9cwAeE:V_sGLiPBpWU" border="0"&gt;&lt;/img&gt;&lt;/a&gt;
&lt;/div&gt;&lt;img src="http://feeds.feedburner.com/~r/gpgpu-ru/~4/Pwwhvu0spOs" height="1" width="1"/&gt;</description>
     <comments>http://www.gpgpu.ru/node/896#comments</comments>
 <category domain="http://www.gpgpu.ru/taxonomy/term/4">gpgpu.ru</category>
 <category domain="http://www.gpgpu.ru/taxonomy/term/2">Новости сайта</category>
 <pubDate>Thu, 06 Oct 2011 08:19:13 +0000</pubDate>
 <dc:creator>lexa</dc:creator>
 <guid isPermaLink="false">896 at http://www.gpgpu.ru</guid>
  </item>
  <item>
    <title>Intel OpenCL 1.5: AVX, отладчик, но плохая производительность</title>
    <link>http://www.gpgpu.ru/node/895</link>
    <description>&lt;p&gt;
Пощупал вышедший вчера &lt;a href=http://software.intel.com/en-us/articles/opencl-sdk/&gt;Intel OpenCL SDK 1.5&lt;/a&gt;.
&lt;p&gt;
Заявленные новые фишки:
&lt;ul&gt;
&lt;li&gt;Поддержка AVX-векторизации (т.е. векторов в 256 бит)
&lt;li&gt;Отладчик
&lt;/ul&gt;
Имею сказать:
&lt;dl&gt;
&lt;dt&gt;Отладчик&lt;/dt&gt;
&lt;dd&gt;
Отладчик - работает. Пошаговая отладка, просмотр значений переменных, все отлично. С каким конкретно потоком работать - задается до запуска программы.
&lt;p&gt;
Несколько неудобно то, что путь до файла с исходными текстами передается в флагах компиляции. Казалось бы, компилятор все видит в момент компиляции, однако ж.
&lt;/dd&gt;
&lt;dt&gt;AVX и 256 бит&lt;/dt&gt;
&lt;dd&gt;
Генерируемый 256-битный код, на мой вкус, безумно странен. Да, 256-битные регистры (YMM) используются, но как-то &lt;b&gt;очень&lt;/b&gt; редко.
&lt;/dd&gt;
&lt;/dl&gt;
Для тестирования производительности я взял 6 примеров из AMD APP SDK и запустил их c Intel OpenCL 1.1, а потом с 1.5. Результат меня огорчил:
&lt;ul&gt;
&lt;li&gt;BitonicSort, EigenValue, Nbody: исполнение под OpenCL 1.5 в 2.5-3 раза медленнее.
&lt;li&gt;RadixSort: новая версия в 1.5 раза медленнее.
&lt;li&gt;SimpleConvolution: время исполнения не изменилось.
&lt;li&gt;Histogram: стало на 15% быстрее.
&lt;/ul&gt;
При этом Historgam  новый OpenCL отказывается векторизовать (на старый - не посмотрел), а все остальные - векторизуются и от того стало хуже.
&lt;p&gt;
&lt;s&gt;Помимо проблем с производительностью, у меня еще не запускается GUI к 64-битному Offline Compiler (комманд-лайн версия работает без проблем), с диагностикой "не найден файл" (а какой файл - не скажу).&lt;/s&gt; Проблема с ioclgui64 решается как написано в README: нужно явно прописать путь к Java Runtime, иначе или 32-битная версия ioclgui не находит 64-битную яву, или, наоборот, 64-битный gui страдает без явы 32-битной.
&lt;p&gt;
Мораль: хотите отладчика - ставьте новую версию. Для всех других использований рекомендовать ее трудно. Надеемся на скорый выход фиксов.&lt;div class="feedflare"&gt;
&lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=qczvoh5on8c:OoE6ZEDRitg:yIl2AUoC8zA"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?d=yIl2AUoC8zA" border="0"&gt;&lt;/img&gt;&lt;/a&gt; &lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=qczvoh5on8c:OoE6ZEDRitg:F7zBnMyn0Lo"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?i=qczvoh5on8c:OoE6ZEDRitg:F7zBnMyn0Lo" border="0"&gt;&lt;/img&gt;&lt;/a&gt; &lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=qczvoh5on8c:OoE6ZEDRitg:7Q72WNTAKBA"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?d=7Q72WNTAKBA" border="0"&gt;&lt;/img&gt;&lt;/a&gt; &lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=qczvoh5on8c:OoE6ZEDRitg:V_sGLiPBpWU"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?i=qczvoh5on8c:OoE6ZEDRitg:V_sGLiPBpWU" border="0"&gt;&lt;/img&gt;&lt;/a&gt;
&lt;/div&gt;&lt;img src="http://feeds.feedburner.com/~r/gpgpu-ru/~4/qczvoh5on8c" height="1" width="1"/&gt;</description>
     <comments>http://www.gpgpu.ru/node/895#comments</comments>
 <category domain="http://www.gpgpu.ru/taxonomy/term/41">OpenCL</category>
 <category domain="http://www.gpgpu.ru/taxonomy/term/1">Статьи</category>
 <pubDate>Tue, 27 Sep 2011 10:43:54 +0000</pubDate>
 <dc:creator>lexa</dc:creator>
 <guid isPermaLink="false">895 at http://www.gpgpu.ru</guid>
  </item>
  <item>
    <title>Статьи по понедельникам</title>
    <link>http://www.gpgpu.ru/node/892</link>
    <description>&lt;p&gt;
Не могу не поделиться очередным источником полезных ссылок по теме GPGPU.
&lt;p&gt;
Сайт &lt;a href=http://www.streamcomputing.eu/&gt;StreamComputing.eu&lt;/a&gt; (за новостями которого лично я слежу &lt;a href=http://twitter.com/#!/StreamComputing&gt;через Твиттер&lt;/a&gt;) завел очень полезный обычай: по понедельникам они публикуют подборки статей по тематике GPGPU, кластеров и всего подобного.
&lt;ul&gt;
&lt;li&gt;&lt;a href=http://www.streamcomputing.eu/blog/2011-09-12/pdfs-of-monday-12-september/&gt;подборка за 12 сентября&lt;/a&gt;
&lt;li&gt;&lt;a href=http://www.streamcomputing.eu/blog/2011-08-29/pdfs-of-monday-29-august/&gt;подборка за 29 августа&lt;/a&gt;
&lt;/ul&gt;
5-го сентября вроде что-то тоже было, но разрозненно и в твиттере.
&lt;p&gt;
Язык, увы, английский.
&lt;!--break--&gt;&lt;div class="feedflare"&gt;
&lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=1XvUrt33C3Q:vgT4gh6Zp9Q:yIl2AUoC8zA"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?d=yIl2AUoC8zA" border="0"&gt;&lt;/img&gt;&lt;/a&gt; &lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=1XvUrt33C3Q:vgT4gh6Zp9Q:F7zBnMyn0Lo"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?i=1XvUrt33C3Q:vgT4gh6Zp9Q:F7zBnMyn0Lo" border="0"&gt;&lt;/img&gt;&lt;/a&gt; &lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=1XvUrt33C3Q:vgT4gh6Zp9Q:7Q72WNTAKBA"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?d=7Q72WNTAKBA" border="0"&gt;&lt;/img&gt;&lt;/a&gt; &lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=1XvUrt33C3Q:vgT4gh6Zp9Q:V_sGLiPBpWU"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?i=1XvUrt33C3Q:vgT4gh6Zp9Q:V_sGLiPBpWU" border="0"&gt;&lt;/img&gt;&lt;/a&gt;
&lt;/div&gt;&lt;img src="http://feeds.feedburner.com/~r/gpgpu-ru/~4/1XvUrt33C3Q" height="1" width="1"/&gt;</description>
     <comments>http://www.gpgpu.ru/node/892#comments</comments>
 <category domain="http://www.gpgpu.ru/taxonomy/term/5">GPGPU</category>
 <category domain="http://www.gpgpu.ru/taxonomy/term/11">Обзоры веба</category>
 <pubDate>Tue, 13 Sep 2011 08:27:33 +0000</pubDate>
 <dc:creator>lexa</dc:creator>
 <guid isPermaLink="false">892 at http://www.gpgpu.ru</guid>
  </item>
  <item>
    <title>High Performance Linpack для CUDA/Fermi</title>
    <link>http://www.gpgpu.ru/node/888</link>
    <description>&lt;p&gt;Внезапно обнаружил, что High Performance Linpack для Fermi с начала августа доступен на &lt;a href='#link' onClick='return "https://nvdeveloper.nvidia.com";'&gt;сайте Nvidia для зарегистрированных девелоперов&lt;/a&gt;&lt;noscript&gt;&lt;noindex&gt;&lt;a href="https://nvdeveloper.nvidia.com" rel=noindex,nofollow&gt;&amp;nbsp;[link]&lt;/a&gt;&lt;/noindex&gt;&lt;/noscript&gt;.&lt;/p&gt;
&lt;p&gt;Презентация про эту штуку есть тут: &lt;a href='#link' onClick='return "http://www.nvidia.com/content/PDF/sc_2010/theater/Phillips_SC10.pdf";'&gt;CUDA Accelerated Linpack for Clusters&lt;/a&gt;&lt;noscript&gt;&lt;noindex&gt;&lt;a href="http://www.nvidia.com/content/PDF/sc_2010/theater/Phillips_SC10.pdf" rel=noindex,nofollow&gt;&amp;nbsp;[link]&lt;/a&gt;&lt;/noindex&gt;&lt;/noscript&gt;,  пишут про 350 GFLOP/s для DGEMM на Tesla M2050 (только GPU) и 435 GFLOP/s для комбинации M2050+8CPU (2xQuad core Xeon 2.66).  Для более мощной машины (CPU на 2.8 а не 2.33) показаны 475 GFLOP/s на DGEMM, 401 GFLOP/s для Linpack с одним GPU и 705 GFLOP/s с двумя GPU.&lt;br /&gt;
Нашлась еще статья китайцев: &lt;a href='#link' onClick='return "http://www.gputechconf.com/content/GTC/posters/2010/I23-Early-Linpack-Performance-Benchmarking-on-IPE-Mole-8.5-Fermi-GPU-Cluster.pdf";'&gt;Early Linpack Performance Benchmarking on IPE Mole 8.5 Fermi GPU Cluster&lt;/a&gt;&lt;noscript&gt;&lt;noindex&gt;&lt;a href="http://www.gputechconf.com/content/GTC/posters/2010/I23-Early-Linpack-Performance-Benchmarking-on-IPE-Mole-8.5-Fermi-GPU-Cluster.pdf" rel=noindex,nofollow&gt;&amp;nbsp;[link]&lt;/a&gt;&lt;/noindex&gt;&lt;/noscript&gt;, где есть цифирка про 200 TFLOP/s на кластере из 320 узлов, по 6 GPU на узел.&lt;/p&gt;
&lt;p&gt;С лицензией на этот HPL-Fermi мне непонятно. С одной стороны, при скачивании вылезает грозная EULА с которой надо согласиться. С другой стороны, рядом там лежит BSD-style лицензия, в самом пакете сохранены копирайты университета Теннеси, а в CUDA-специфичных файлах в начале написана BSD-style лицензия с оговоркой об использовании названия NVIDIA только по согласованию.&lt;/p&gt;
&lt;p&gt;Безопаснее считать, что лицензия - такая же, как у всего остального на девелоперском сайте ("без раздачи"), благо регистрируют там всех.&lt;/p&gt;
&lt;p&gt;Теоретически, пакет требует Tesla (т.к. требования по памяти GPU от 2Gb), на практике наверное можно уговорить и на что-то поменьше.&lt;/p&gt;
&lt;p&gt;Если у кого есть машина с парой новых Fermi, я бы с удовольствием эту штуку бы совместно с вами повоспитывал.&lt;/p&gt;&lt;div class="feedflare"&gt;
&lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=_DEQ6O2haJI:zNr7JcL6iJ0:yIl2AUoC8zA"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?d=yIl2AUoC8zA" border="0"&gt;&lt;/img&gt;&lt;/a&gt; &lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=_DEQ6O2haJI:zNr7JcL6iJ0:F7zBnMyn0Lo"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?i=_DEQ6O2haJI:zNr7JcL6iJ0:F7zBnMyn0Lo" border="0"&gt;&lt;/img&gt;&lt;/a&gt; &lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=_DEQ6O2haJI:zNr7JcL6iJ0:7Q72WNTAKBA"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?d=7Q72WNTAKBA" border="0"&gt;&lt;/img&gt;&lt;/a&gt; &lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=_DEQ6O2haJI:zNr7JcL6iJ0:V_sGLiPBpWU"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?i=_DEQ6O2haJI:zNr7JcL6iJ0:V_sGLiPBpWU" border="0"&gt;&lt;/img&gt;&lt;/a&gt;
&lt;/div&gt;&lt;img src="http://feeds.feedburner.com/~r/gpgpu-ru/~4/_DEQ6O2haJI" height="1" width="1"/&gt;</description>
     <comments>http://www.gpgpu.ru/node/888#comments</comments>
 <category domain="http://www.gpgpu.ru/taxonomy/term/25">CUDA</category>
 <category domain="http://www.gpgpu.ru/taxonomy/term/75">Fermi</category>
 <category domain="http://www.gpgpu.ru/taxonomy/term/76">Linpack</category>
 <category domain="http://www.gpgpu.ru/taxonomy/term/22">NVidia</category>
 <category domain="http://www.gpgpu.ru/taxonomy/term/11">Обзоры веба</category>
 <pubDate>Tue, 23 Aug 2011 08:39:53 +0000</pubDate>
 <dc:creator>lexa</dc:creator>
 <guid isPermaLink="false">888 at http://www.gpgpu.ru</guid>
  </item>
  <item>
    <title>NVidia OpenCL 1.1</title>
    <link>http://www.gpgpu.ru/node/881</link>
    <description>&lt;p&gt;NVidia в рассылке для девелоперов сообщает нам, что в драйверах начиная с 280.13 поддерживается OpenCL 1.1
&lt;p&gt;Я пощупал драйвера 280.18 для Win7/x64, и так оно и оказалось.
&lt;p&gt;
Проверил все примеры из AMD APP SDK, существенная часть которых раньше не работала с NVidia т.к. требовала OpenCL 1.1. Ситуация стала лучше, хотя и не идеальной:
&lt;ul&gt;
&lt;li&gt;Два примера должны бы работать, но не работают по причине разницы синтаксиса:
&lt;ul&gt;
&lt;li&gt;FluidSimulation2D ломается c диагностикой "не могу преобразовать вектора разных размеров" на конструкции вида int8 = unsigned + int8.
&lt;li&gt;GlobalMemoryBandwidth ломается на вызове "overloadable" функции native_divide()
&lt;/ul&gt;
&lt;li&gt;Еще три примера ломаются т.к. NVidia не поддерживает ряд расширений (что вполне ожидаемо):
&lt;ul&gt;
&lt;li&gt;DeviceFission - нет соответствующего расширения (хотя на Fermi его хотелось бы иметь, аппаратура то умеет)
&lt;li&gt;SimpleDX10 - нет интеграции с DX10
&lt;li&gt;TransferOverlap - работает, если не попросить для памяти флаг CL_MEM_USE_PERSISTENT_MEM_AMD
&lt;/ul&gt;
&lt;/ul&gt;
Но жизнь стала лучше. Например, поддерживаются 2D-изображения 16k-x-16k, вместо совершенно бессмысленных 4k-x-32k в предыдущих драйверах.
&lt;!--break--&gt;&lt;div class="feedflare"&gt;
&lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=lMU9rjYbJ8w:YsaFTvX-zVA:yIl2AUoC8zA"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?d=yIl2AUoC8zA" border="0"&gt;&lt;/img&gt;&lt;/a&gt; &lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=lMU9rjYbJ8w:YsaFTvX-zVA:F7zBnMyn0Lo"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?i=lMU9rjYbJ8w:YsaFTvX-zVA:F7zBnMyn0Lo" border="0"&gt;&lt;/img&gt;&lt;/a&gt; &lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=lMU9rjYbJ8w:YsaFTvX-zVA:7Q72WNTAKBA"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?d=7Q72WNTAKBA" border="0"&gt;&lt;/img&gt;&lt;/a&gt; &lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=lMU9rjYbJ8w:YsaFTvX-zVA:V_sGLiPBpWU"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?i=lMU9rjYbJ8w:YsaFTvX-zVA:V_sGLiPBpWU" border="0"&gt;&lt;/img&gt;&lt;/a&gt;
&lt;/div&gt;&lt;img src="http://feeds.feedburner.com/~r/gpgpu-ru/~4/lMU9rjYbJ8w" height="1" width="1"/&gt;</description>
     <comments>http://www.gpgpu.ru/node/881#comments</comments>
 <category domain="http://www.gpgpu.ru/taxonomy/term/22">NVidia</category>
 <category domain="http://www.gpgpu.ru/taxonomy/term/41">OpenCL</category>
 <category domain="http://www.gpgpu.ru/taxonomy/term/18">Анонсы</category>
 <pubDate>Sat, 06 Aug 2011 11:54:03 +0000</pubDate>
 <dc:creator>lexa</dc:creator>
 <guid isPermaLink="false">881 at http://www.gpgpu.ru</guid>
  </item>
  <item>
    <title>код второго кернела</title>
    <link>http://www.gpgpu.ru/node/878</link>
    <description>&lt;div class="geshifilter"&gt;&lt;div class="geshifilter-c" style="font-family: monospace;"&gt;__global__ &lt;span style="color: #993333;"&gt;void&lt;/span&gt; action_2 &lt;span style="color: #66cc66;"&gt;&amp;#40;&lt;/span&gt; &amp;nbsp;&lt;span style="color: #993333;"&gt;int&lt;/span&gt; &lt;span style="color: #66cc66;"&gt;*&lt;/span&gt;out,&lt;br /&gt;
&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &lt;span style="color: #993333;"&gt;int&lt;/span&gt; &lt;span style="color: #66cc66;"&gt;*&lt;/span&gt;final,&lt;br /&gt;
&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; size_t pitch,&lt;br /&gt;
&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &lt;span style="color: #993333;"&gt;int&lt;/span&gt; width,&lt;br /&gt;
&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &lt;span style="color: #993333;"&gt;int&lt;/span&gt; height&lt;span style="color: #66cc66;"&gt;&amp;#41;&lt;/span&gt;&lt;br /&gt;
&lt;span style="color: #66cc66;"&gt;&amp;#123;&lt;/span&gt;&lt;br /&gt;
&amp;nbsp; &amp;nbsp; &amp;nbsp;&lt;span style="color: #b1b100;"&gt;for&lt;/span&gt; &lt;span style="color: #66cc66;"&gt;&amp;#40;&lt;/span&gt;&lt;span style="color: #993333;"&gt;int&lt;/span&gt; r &lt;span style="color: #66cc66;"&gt;=&lt;/span&gt; &lt;span style="color: #cc66cc;"&gt;0&lt;/span&gt;; r &amp;lt; height; r&lt;span style="color: #66cc66;"&gt;++&lt;/span&gt;&lt;span style="color: #66cc66;"&gt;&amp;#41;&lt;/span&gt;&lt;br /&gt;
&amp;nbsp; &amp;nbsp; &amp;nbsp;&lt;span style="color: #66cc66;"&gt;&amp;#123;&lt;/span&gt;&lt;br /&gt;
&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &lt;span style="color: #993333;"&gt;int&lt;/span&gt; temp &lt;span style="color: #66cc66;"&gt;=&lt;/span&gt; &lt;span style="color: #cc66cc;"&gt;0&lt;/span&gt;;&lt;br /&gt;
&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &lt;span style="color: #993333;"&gt;int&lt;/span&gt; &lt;span style="color: #66cc66;"&gt;*&lt;/span&gt;row_o &lt;span style="color: #66cc66;"&gt;=&lt;/span&gt; &lt;span style="color: #66cc66;"&gt;&amp;#40;&lt;/span&gt;&lt;span style="color: #993333;"&gt;int&lt;/span&gt;&lt;span style="color: #66cc66;"&gt;*&lt;/span&gt;&lt;span style="color: #66cc66;"&gt;&amp;#41;&lt;/span&gt;&lt;span style="color: #66cc66;"&gt;&amp;#40;&lt;/span&gt;&lt;span style="color: #66cc66;"&gt;&amp;#40;&lt;/span&gt;&lt;span style="color: #993333;"&gt;char&lt;/span&gt;&lt;span style="color: #66cc66;"&gt;*&lt;/span&gt;&lt;span style="color: #66cc66;"&gt;&amp;#41;&lt;/span&gt;out &lt;span style="color: #66cc66;"&gt;+&lt;/span&gt; r &lt;span style="color: #66cc66;"&gt;*&lt;/span&gt; pitch&lt;span style="color: #66cc66;"&gt;&amp;#41;&lt;/span&gt;;&lt;br /&gt;
&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &lt;span style="color: #b1b100;"&gt;for&lt;/span&gt; &lt;span style="color: #66cc66;"&gt;&amp;#40;&lt;/span&gt;&lt;span style="color: #993333;"&gt;int&lt;/span&gt; c &lt;span style="color: #66cc66;"&gt;=&lt;/span&gt; &lt;span style="color: #cc66cc;"&gt;0&lt;/span&gt;; c &amp;lt; width; c&lt;span style="color: #66cc66;"&gt;++&lt;/span&gt;&lt;span style="color: #66cc66;"&gt;&amp;#41;&lt;/span&gt;&lt;br /&gt;
&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &lt;span style="color: #66cc66;"&gt;&amp;#123;&lt;/span&gt;&lt;br /&gt;
&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp;temp &lt;span style="color: #66cc66;"&gt;+=&lt;/span&gt; row_o&lt;span style="color: #66cc66;"&gt;&amp;#91;&lt;/span&gt;c&lt;span style="color: #66cc66;"&gt;&amp;#93;&lt;/span&gt;;&lt;br /&gt;
&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &lt;span style="color: #66cc66;"&gt;&amp;#125;&lt;/span&gt;&lt;br /&gt;
&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; final &lt;span style="color: #66cc66;"&gt;&amp;#91;&lt;/span&gt;r&lt;span style="color: #66cc66;"&gt;&amp;#93;&lt;/span&gt; &lt;span style="color: #66cc66;"&gt;=&lt;/span&gt; temp;&lt;br /&gt;
&amp;nbsp; &amp;nbsp; &amp;nbsp;&lt;span style="color: #66cc66;"&gt;&amp;#125;&lt;/span&gt;&lt;br /&gt;
&lt;span style="color: #66cc66;"&gt;&amp;#125;&lt;/span&gt;&lt;/div&gt;&lt;/div&gt;&lt;div class="feedflare"&gt;
&lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=e4DZtSWUl4I:5e_gezDTIFQ:yIl2AUoC8zA"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?d=yIl2AUoC8zA" border="0"&gt;&lt;/img&gt;&lt;/a&gt; &lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=e4DZtSWUl4I:5e_gezDTIFQ:F7zBnMyn0Lo"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?i=e4DZtSWUl4I:5e_gezDTIFQ:F7zBnMyn0Lo" border="0"&gt;&lt;/img&gt;&lt;/a&gt; &lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=e4DZtSWUl4I:5e_gezDTIFQ:7Q72WNTAKBA"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?d=7Q72WNTAKBA" border="0"&gt;&lt;/img&gt;&lt;/a&gt; &lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=e4DZtSWUl4I:5e_gezDTIFQ:V_sGLiPBpWU"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?i=e4DZtSWUl4I:5e_gezDTIFQ:V_sGLiPBpWU" border="0"&gt;&lt;/img&gt;&lt;/a&gt;
&lt;/div&gt;&lt;img src="http://feeds.feedburner.com/~r/gpgpu-ru/~4/e4DZtSWUl4I" height="1" width="1"/&gt;</description>
     <comments>http://www.gpgpu.ru/node/878#comments</comments>
 <pubDate>Wed, 03 Aug 2011 13:49:02 +0000</pubDate>
 <dc:creator>santarus</dc:creator>
 <guid isPermaLink="false">878 at http://www.gpgpu.ru</guid>
  </item>
  <item>
    <title>код первого кернела</title>
    <link>http://www.gpgpu.ru/node/877</link>
    <description>&lt;div class="geshifilter"&gt;&lt;div class="geshifilter-c" style="font-family: monospace;"&gt;__global__ &lt;span style="color: #993333;"&gt;void&lt;/span&gt; action &lt;span style="color: #66cc66;"&gt;&amp;#40;&lt;/span&gt; &amp;nbsp;&lt;span style="color: #993333;"&gt;int&lt;/span&gt; &lt;span style="color: #66cc66;"&gt;*&lt;/span&gt;test, &lt;br /&gt;
&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &lt;span style="color: #993333;"&gt;int&lt;/span&gt; &lt;span style="color: #66cc66;"&gt;*&lt;/span&gt;target, &lt;br /&gt;
&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &lt;span style="color: #993333;"&gt;int&lt;/span&gt; &lt;span style="color: #66cc66;"&gt;*&lt;/span&gt;out, &lt;br /&gt;
&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; size_t pitch, &lt;br /&gt;
&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &lt;span style="color: #993333;"&gt;int&lt;/span&gt; width, &lt;br /&gt;
&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &lt;span style="color: #993333;"&gt;int&lt;/span&gt; height&lt;span style="color: #66cc66;"&gt;&amp;#41;&lt;/span&gt;&lt;br /&gt;
&lt;span style="color: #66cc66;"&gt;&amp;#123;&lt;/span&gt;&lt;br /&gt;
&amp;nbsp; &amp;nbsp; &amp;nbsp; &lt;span style="color: #b1b100;"&gt;for&lt;/span&gt; &lt;span style="color: #66cc66;"&gt;&amp;#40;&lt;/span&gt;&lt;span style="color: #993333;"&gt;int&lt;/span&gt; r &lt;span style="color: #66cc66;"&gt;=&lt;/span&gt; &lt;span style="color: #cc66cc;"&gt;0&lt;/span&gt;; r &amp;lt; height; r&lt;span style="color: #66cc66;"&gt;++&lt;/span&gt;&lt;span style="color: #66cc66;"&gt;&amp;#41;&lt;/span&gt;&lt;br /&gt;
&amp;nbsp; &amp;nbsp; &amp;nbsp; &lt;span style="color: #66cc66;"&gt;&amp;#123;&lt;/span&gt;&lt;br /&gt;
&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp;&lt;span style="color: #993333;"&gt;int&lt;/span&gt; &lt;span style="color: #66cc66;"&gt;*&lt;/span&gt;row_t &lt;span style="color: #66cc66;"&gt;=&lt;/span&gt; &lt;span style="color: #66cc66;"&gt;&amp;#40;&lt;/span&gt;&lt;span style="color: #993333;"&gt;int&lt;/span&gt;&lt;span style="color: #66cc66;"&gt;*&lt;/span&gt;&lt;span style="color: #66cc66;"&gt;&amp;#41;&lt;/span&gt;&lt;span style="color: #66cc66;"&gt;&amp;#40;&lt;/span&gt;&lt;span style="color: #66cc66;"&gt;&amp;#40;&lt;/span&gt;&lt;span style="color: #993333;"&gt;char&lt;/span&gt;&lt;span style="color: #66cc66;"&gt;*&lt;/span&gt;&lt;span style="color: #66cc66;"&gt;&amp;#41;&lt;/span&gt;test &lt;span style="color: #66cc66;"&gt;+&lt;/span&gt; r &lt;span style="color: #66cc66;"&gt;*&lt;/span&gt; pitch&lt;span style="color: #66cc66;"&gt;&amp;#41;&lt;/span&gt;;&lt;br /&gt;
&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp;&lt;span style="color: #993333;"&gt;int&lt;/span&gt; &lt;span style="color: #66cc66;"&gt;*&lt;/span&gt;row_o &lt;span style="color: #66cc66;"&gt;=&lt;/span&gt; &lt;span style="color: #66cc66;"&gt;&amp;#40;&lt;/span&gt;&lt;span style="color: #993333;"&gt;int&lt;/span&gt;&lt;span style="color: #66cc66;"&gt;*&lt;/span&gt;&lt;span style="color: #66cc66;"&gt;&amp;#41;&lt;/span&gt;&lt;span style="color: #66cc66;"&gt;&amp;#40;&lt;/span&gt;&lt;span style="color: #66cc66;"&gt;&amp;#40;&lt;/span&gt;&lt;span style="color: #993333;"&gt;char&lt;/span&gt;&lt;span style="color: #66cc66;"&gt;*&lt;/span&gt;&lt;span style="color: #66cc66;"&gt;&amp;#41;&lt;/span&gt;out &lt;span style="color: #66cc66;"&gt;+&lt;/span&gt; r &lt;span style="color: #66cc66;"&gt;*&lt;/span&gt; pitch&lt;span style="color: #66cc66;"&gt;&amp;#41;&lt;/span&gt;;&lt;br /&gt;
&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp;&lt;span style="color: #b1b100;"&gt;for&lt;/span&gt; &lt;span style="color: #66cc66;"&gt;&amp;#40;&lt;/span&gt;&lt;span style="color: #993333;"&gt;int&lt;/span&gt; c &lt;span style="color: #66cc66;"&gt;=&lt;/span&gt; &lt;span style="color: #cc66cc;"&gt;0&lt;/span&gt;; c &amp;lt; width; c&lt;span style="color: #66cc66;"&gt;++&lt;/span&gt;&lt;span style="color: #66cc66;"&gt;&amp;#41;&lt;/span&gt;&lt;br /&gt;
&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp;&lt;span style="color: #66cc66;"&gt;&amp;#123;&lt;/span&gt;&lt;br /&gt;
&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp;row_o&lt;span style="color: #66cc66;"&gt;&amp;#91;&lt;/span&gt;c&lt;span style="color: #66cc66;"&gt;&amp;#93;&lt;/span&gt; &lt;span style="color: #66cc66;"&gt;=&lt;/span&gt; row_t&lt;span style="color: #66cc66;"&gt;&amp;#91;&lt;/span&gt;c&lt;span style="color: #66cc66;"&gt;&amp;#93;&lt;/span&gt; &lt;span style="color: #66cc66;"&gt;+&lt;/span&gt; target&lt;span style="color: #66cc66;"&gt;&amp;#91;&lt;/span&gt;c&lt;span style="color: #66cc66;"&gt;&amp;#93;&lt;/span&gt;;&lt;br /&gt;
&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp;&lt;span style="color: #66cc66;"&gt;&amp;#125;&lt;/span&gt;&lt;br /&gt;
&amp;nbsp; &amp;nbsp; &amp;nbsp; &lt;span style="color: #66cc66;"&gt;&amp;#125;&lt;/span&gt;&lt;br /&gt;
&lt;span style="color: #66cc66;"&gt;&amp;#125;&lt;/span&gt;&lt;/div&gt;&lt;/div&gt;&lt;div class="feedflare"&gt;
&lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=yncNYd-IuVU:zkccBVXNl2U:yIl2AUoC8zA"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?d=yIl2AUoC8zA" border="0"&gt;&lt;/img&gt;&lt;/a&gt; &lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=yncNYd-IuVU:zkccBVXNl2U:F7zBnMyn0Lo"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?i=yncNYd-IuVU:zkccBVXNl2U:F7zBnMyn0Lo" border="0"&gt;&lt;/img&gt;&lt;/a&gt; &lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=yncNYd-IuVU:zkccBVXNl2U:7Q72WNTAKBA"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?d=7Q72WNTAKBA" border="0"&gt;&lt;/img&gt;&lt;/a&gt; &lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=yncNYd-IuVU:zkccBVXNl2U:V_sGLiPBpWU"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?i=yncNYd-IuVU:zkccBVXNl2U:V_sGLiPBpWU" border="0"&gt;&lt;/img&gt;&lt;/a&gt;
&lt;/div&gt;&lt;img src="http://feeds.feedburner.com/~r/gpgpu-ru/~4/yncNYd-IuVU" height="1" width="1"/&gt;</description>
     <comments>http://www.gpgpu.ru/node/877#comments</comments>
 <pubDate>Wed, 03 Aug 2011 13:42:51 +0000</pubDate>
 <dc:creator>santarus</dc:creator>
 <guid isPermaLink="false">877 at http://www.gpgpu.ru</guid>
  </item>
  <item>
    <title>CUDA by Example на русском</title>
    <link>http://www.gpgpu.ru/node/873</link>
    <description>&lt;p&gt;&lt;span class="inline inline-left"&gt;&lt;img src="http://www.gpgpu.ru/sites/gpgpu.ru/files/images/cudabyexample.jpg" alt="" title=""  class="image image-_original " width="200" height="282" /&gt;&lt;/span&gt;&lt;/p&gt;
&lt;p&gt;Нам сообщают, что вышел русский перевод книги &lt;a href='#link' onClick='return "http://developer.nvidia.com/cuda-example-introduction-general-purpose-gpu-programming";'&gt;CUDA by Example&lt;/a&gt;&lt;noscript&gt;&lt;noindex&gt;&lt;a href="http://developer.nvidia.com/cuda-example-introduction-general-purpose-gpu-programming" rel=noindex,nofollow&gt;&amp;nbsp;[link]&lt;/a&gt;&lt;/noindex&gt;&lt;/noscript&gt;.&lt;/p&gt;
&lt;p&gt;ISBN: 978-5-94074-504-4, 978-0-13-138768-3&lt;/p&gt;
&lt;p&gt;Доступна в онлайн-магазинах. например в &lt;a href='#link' onClick='return "http://www.ozon.ru/context/detail/id/6743358";'&gt;Озоне&lt;/a&gt;&lt;noscript&gt;&lt;noindex&gt;&lt;a href="http://www.ozon.ru/context/detail/id/6743358" rel=noindex,nofollow&gt;&amp;nbsp;[link]&lt;/a&gt;&lt;/noindex&gt;&lt;/noscript&gt; и  &lt;a href='#link' onClick='return "http://www.labirint.ru/books/287450";'&gt;Лабиринте&lt;/a&gt;&lt;noscript&gt;&lt;noindex&gt;&lt;a href="http://www.labirint.ru/books/287450" rel=noindex,nofollow&gt;&amp;nbsp;[link]&lt;/a&gt;&lt;/noindex&gt;&lt;/noscript&gt;.&lt;/p&gt;
&lt;p&gt;Я (исходный) английский вариант не читал, поэтому  спиратил нашел в ознакомительных целях,  быстро пролистал и удалил :). &lt;/p&gt;
&lt;p&gt;Книга производит очень приятное впечатление как по порядку изложения материала, так и по полноте: помимо базовых вещей не забыты текстуры, не забыто взаимодействие с OpenGL/DX.  В ней нет ничего про "продвинутые оптимизации", а вот как базовое изложение - очень понравилось.&lt;/p&gt;
&lt;p&gt;О качестве русского перевода пока ничего сказать не могу.&lt;/p&gt;
&lt;div class="image-clear"&gt;&lt;/div&gt;&lt;div class="feedflare"&gt;
&lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=UOrhO3fgghI:P7ZcMmP6BB4:yIl2AUoC8zA"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?d=yIl2AUoC8zA" border="0"&gt;&lt;/img&gt;&lt;/a&gt; &lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=UOrhO3fgghI:P7ZcMmP6BB4:F7zBnMyn0Lo"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?i=UOrhO3fgghI:P7ZcMmP6BB4:F7zBnMyn0Lo" border="0"&gt;&lt;/img&gt;&lt;/a&gt; &lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=UOrhO3fgghI:P7ZcMmP6BB4:7Q72WNTAKBA"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?d=7Q72WNTAKBA" border="0"&gt;&lt;/img&gt;&lt;/a&gt; &lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=UOrhO3fgghI:P7ZcMmP6BB4:V_sGLiPBpWU"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?i=UOrhO3fgghI:P7ZcMmP6BB4:V_sGLiPBpWU" border="0"&gt;&lt;/img&gt;&lt;/a&gt;
&lt;/div&gt;&lt;img src="http://feeds.feedburner.com/~r/gpgpu-ru/~4/UOrhO3fgghI" height="1" width="1"/&gt;</description>
     <comments>http://www.gpgpu.ru/node/873#comments</comments>
 <category domain="http://www.gpgpu.ru/taxonomy/term/25">CUDA</category>
 <category domain="http://www.gpgpu.ru/taxonomy/term/5">GPGPU</category>
 <category domain="http://www.gpgpu.ru/taxonomy/term/22">NVidia</category>
 <category domain="http://www.gpgpu.ru/taxonomy/term/18">Анонсы</category>
 <category domain="http://www.gpgpu.ru/taxonomy/term/10">программирование GPU</category>
 <pubDate>Fri, 08 Jul 2011 07:56:10 +0000</pubDate>
 <dc:creator>lexa</dc:creator>
 <guid isPermaLink="false">873 at http://www.gpgpu.ru</guid>
  </item>
  <item>
    <title>Вышли CUDA 4.0 &amp; Parallel Nsight 2.0 (релизы)</title>
    <link>http://www.gpgpu.ru/node/863</link>
    <description>&lt;p&gt;Вышли релизные версии:
&lt;ul&gt;
&lt;li&gt;&lt;a href=http://developer.nvidia.com/cuda-toolkit-40&gt;NVidia CUDA 4.0&lt;/a&gt;
&lt;li&gt;&lt;a href=http://developer.nvidia.com/nvidia-parallel-nsight&gt;Parallel Nsight 2.0&lt;/a&gt;
&lt;/ul&gt;
&lt;p&gt;
Какой-то принципиальной разницы с RC2-версиями из документации не видно, каких-то критичных багов в RC2 я тоже не находил.
&lt;p&gt;
Вот в драйверах разница заметна, копирование хост-видеокарта и обратно в драйвере 270.81 (доступен по первой ссылке) где-то на 10% быстрее, чем в текущем 270.61 WHQL.
&lt;!--break--&gt;&lt;div class="feedflare"&gt;
&lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=VBicr5NskSg:AJp5QyDe3EI:yIl2AUoC8zA"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?d=yIl2AUoC8zA" border="0"&gt;&lt;/img&gt;&lt;/a&gt; &lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=VBicr5NskSg:AJp5QyDe3EI:F7zBnMyn0Lo"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?i=VBicr5NskSg:AJp5QyDe3EI:F7zBnMyn0Lo" border="0"&gt;&lt;/img&gt;&lt;/a&gt; &lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=VBicr5NskSg:AJp5QyDe3EI:7Q72WNTAKBA"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?d=7Q72WNTAKBA" border="0"&gt;&lt;/img&gt;&lt;/a&gt; &lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=VBicr5NskSg:AJp5QyDe3EI:V_sGLiPBpWU"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?i=VBicr5NskSg:AJp5QyDe3EI:V_sGLiPBpWU" border="0"&gt;&lt;/img&gt;&lt;/a&gt;
&lt;/div&gt;&lt;img src="http://feeds.feedburner.com/~r/gpgpu-ru/~4/VBicr5NskSg" height="1" width="1"/&gt;</description>
     <comments>http://www.gpgpu.ru/node/863#comments</comments>
 <category domain="http://www.gpgpu.ru/taxonomy/term/7">NVidia CUDA</category>
 <category domain="http://www.gpgpu.ru/taxonomy/term/11">Обзоры веба</category>
 <pubDate>Sat, 28 May 2011 16:56:36 +0000</pubDate>
 <dc:creator>lexa</dc:creator>
 <guid isPermaLink="false">863 at http://www.gpgpu.ru</guid>
  </item>
  <item>
    <title>Свежие GPGPU tools</title>
    <link>http://www.gpgpu.ru/node/843</link>
    <description>&lt;p&gt;В последние дни оба основных разработчика GPU обновили свои GPGPU toolkits до CUDA 4.0 RC2 и APP SDK 2.4, соответственно.&lt;/p&gt;
&lt;dl&gt;
&lt;dt&gt;CUDA 4.0 RC2&lt;/dt&gt;
&lt;dd&gt;CUDA 4.0 &lt;a href='#link' onClick='return "http://developer.nvidia.com/cuda-toolkit-40";'&gt;доступна для скачивания&lt;/a&gt;&lt;noscript&gt;&lt;noindex&gt;&lt;a href="http://developer.nvidia.com/cuda-toolkit-40" rel=noindex,nofollow&gt;&amp;nbsp;[link]&lt;/a&gt;&lt;/noindex&gt;&lt;/noscript&gt; без пароля и регистрации с &lt;a href='#link' onClick='return "http://developer.nvidia.com";'&gt;Nvidia developer zone&lt;/a&gt;&lt;noscript&gt;&lt;noindex&gt;&lt;a href="http://developer.nvidia.com" rel=noindex,nofollow&gt;&amp;nbsp;[link]&lt;/a&gt;&lt;/noindex&gt;&lt;/noscript&gt;.
&lt;p&gt;В RC2 исправлено некоторое количество проблем RC1, подробнее см. &lt;a href='#link' onClick='return "http://developer.download.nvidia.com/compute/cuda/4_0_rc2/toolkit/docs/4.0_Release_Notes_Errata.txt";'&gt;Release Notes Errata&lt;/a&gt;&lt;noscript&gt;&lt;noindex&gt;&lt;a href="http://developer.download.nvidia.com/compute/cuda/4_0_rc2/toolkit/docs/4.0_Release_Notes_Errata.txt" rel=noindex,nofollow&gt;&amp;nbsp;[link]&lt;/a&gt;&lt;/noindex&gt;&lt;/noscript&gt;. &lt;/p&gt;
&lt;p&gt;Новые свойства данной версии &lt;a href='#link' onClick='return "http://www.gpgpu.ru/node/283";'&gt;уже описывались на этом сайте&lt;/a&gt;&lt;noscript&gt;&lt;noindex&gt;&lt;a href="http://www.gpgpu.ru/node/283" rel=noindex,nofollow&gt;&amp;nbsp;[link]&lt;/a&gt;&lt;/noindex&gt;&lt;/noscript&gt;, кроме того смотрите &lt;a href='#link' onClick='return "http://developer.download.nvidia.com/CUDA/training/cuda4_0_feature_intro.mp4";'&gt;запись вебинара Nvidia&lt;/a&gt;&lt;noscript&gt;&lt;noindex&gt;&lt;a href="http://developer.download.nvidia.com/CUDA/training/cuda4_0_feature_intro.mp4" rel=noindex,nofollow&gt;&amp;nbsp;[link]&lt;/a&gt;&lt;/noindex&gt;&lt;/noscript&gt; на ту же тему.&lt;br /&gt;
&lt;/p&gt;&lt;/dd&gt;
&lt;dt&gt;AMD Accelerated Parallel Processing (APP) SDK  2.4&lt;/dt&gt;
&lt;dd&gt;Основное новшество новой версии &lt;a href='#link' onClick='return "http://developer.amd.com/gpu/AMDAPPSDK/Pages/default.aspx";'&gt;APP SDK&lt;/a&gt;&lt;noscript&gt;&lt;noindex&gt;&lt;a href="http://developer.amd.com/gpu/AMDAPPSDK/Pages/default.aspx" rel=noindex,nofollow&gt;&amp;nbsp;[link]&lt;/a&gt;&lt;/noindex&gt;&lt;/noscript&gt; (бывший Stream SDK) - поддержка процессоров AMD Fusion, как десктопных (A-series) так и энергоэкономных (C и E-series). Сказать про эту поддержку что-либо практическое мне сложно за неимением таких процессоров. Кроме того, много улучшено по мелочи: скорость FFT, поддержка профайлинга, поддержка OpenCL binary kernels.
&lt;p&gt;Небольшая странность происходящего заключается в том, что в требованиях поминается драйвер (Catalyst) версии 11.4, тогда как найти такой драйвер для 64-битных Windows мне не удалось (в блоге AMD поминается Early Preview для 32-бит), а Catalyst 11.3 вышел буквально чуть больше недели назад.&lt;br /&gt;
&lt;/p&gt;&lt;/dd&gt;
&lt;/dl&gt;&lt;div class="feedflare"&gt;
&lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=2znFmW0k3Ug:bi7SccihNeg:yIl2AUoC8zA"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?d=yIl2AUoC8zA" border="0"&gt;&lt;/img&gt;&lt;/a&gt; &lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=2znFmW0k3Ug:bi7SccihNeg:F7zBnMyn0Lo"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?i=2znFmW0k3Ug:bi7SccihNeg:F7zBnMyn0Lo" border="0"&gt;&lt;/img&gt;&lt;/a&gt; &lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=2znFmW0k3Ug:bi7SccihNeg:7Q72WNTAKBA"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?d=7Q72WNTAKBA" border="0"&gt;&lt;/img&gt;&lt;/a&gt; &lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=2znFmW0k3Ug:bi7SccihNeg:V_sGLiPBpWU"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?i=2znFmW0k3Ug:bi7SccihNeg:V_sGLiPBpWU" border="0"&gt;&lt;/img&gt;&lt;/a&gt;
&lt;/div&gt;&lt;img src="http://feeds.feedburner.com/~r/gpgpu-ru/~4/2znFmW0k3Ug" height="1" width="1"/&gt;</description>
     <comments>http://www.gpgpu.ru/node/843#comments</comments>
 <category domain="http://www.gpgpu.ru/taxonomy/term/16">AMD</category>
 <category domain="http://www.gpgpu.ru/taxonomy/term/25">CUDA</category>
 <category domain="http://www.gpgpu.ru/taxonomy/term/22">NVidia</category>
 <category domain="http://www.gpgpu.ru/taxonomy/term/41">OpenCL</category>
 <category domain="http://www.gpgpu.ru/taxonomy/term/53">Stream SDK</category>
 <category domain="http://www.gpgpu.ru/taxonomy/term/11">Обзоры веба</category>
 <pubDate>Fri, 08 Apr 2011 06:45:09 +0000</pubDate>
 <dc:creator>lexa</dc:creator>
 <guid isPermaLink="false">843 at http://www.gpgpu.ru</guid>
  </item>
  <item>
    <title>CUDA 4.0</title>
    <link>http://www.gpgpu.ru/node/283</link>
    <description>&lt;p&gt;
NVidia &lt;a href=http://pressroom.nvidia.com/easyir/customrel.do?easyirid=A0D622CE9F579F09&amp;version=live&amp;prid=726171&amp;releasejsp=release_157&amp;xhtml=true&gt;анонсировала CUDA 4.0&lt;/a&gt;
&lt;p&gt;
С моей колокольни интересны две вещи:
&lt;ul&gt;
&lt;li&gt;GPU Direct 2.0 т.е. прямая пересылка данных между (нескольки) картами, не задействуя память (и процессор?) хоста.
&lt;li&gt;Унифицированная адресация на GPU и на хосте. Я это понял так, что адресное пространство общее, никаких отдельных сudaMemcpy. 
&lt;/ul&gt;
Рассказы про остальные фишки лично меня не впечатлили (Thrust и так уже был, MPI не волнует), но будем посмотреть вживую (начиная с 4 марта).
&lt;p&gt;
"Интересные фишки" тоже &lt;i&gt;будем посмотреть&lt;/i&gt;: про GPI Direct на онлайн-конференции был задан вопрос "это только для Tesla", а в момент ответа у меня пропал звук. С унифицированной адресацией у меня есть непонимание, как на эту схему ложится асинхронная передача.
&lt;p&gt;
Другими словами, 4-5 марта надо ломиться на nvdeveloper и брать бету на поиграться.
&lt;!--break--&gt;
&lt;p&gt;
Интересно, что будет дальше с OpenCL: текущие версии его достаточно близки по идеологии к CUDA 2.x-3.x и почти нет разницы на чем программировать. Сейчас может оказаться, что CUDA сильно удобнее в разработке... а с другой стороны вот новые макбуки с ATI какбэ намекают мне про OpenCL...&lt;div class="feedflare"&gt;
&lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=cL1nHG46SAU:vDuAnxaxISE:yIl2AUoC8zA"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?d=yIl2AUoC8zA" border="0"&gt;&lt;/img&gt;&lt;/a&gt; &lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=cL1nHG46SAU:vDuAnxaxISE:F7zBnMyn0Lo"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?i=cL1nHG46SAU:vDuAnxaxISE:F7zBnMyn0Lo" border="0"&gt;&lt;/img&gt;&lt;/a&gt; &lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=cL1nHG46SAU:vDuAnxaxISE:7Q72WNTAKBA"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?d=7Q72WNTAKBA" border="0"&gt;&lt;/img&gt;&lt;/a&gt; &lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=cL1nHG46SAU:vDuAnxaxISE:V_sGLiPBpWU"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?i=cL1nHG46SAU:vDuAnxaxISE:V_sGLiPBpWU" border="0"&gt;&lt;/img&gt;&lt;/a&gt;
&lt;/div&gt;&lt;img src="http://feeds.feedburner.com/~r/gpgpu-ru/~4/cL1nHG46SAU" height="1" width="1"/&gt;</description>
     <comments>http://www.gpgpu.ru/node/283#comments</comments>
 <category domain="http://www.gpgpu.ru/taxonomy/term/7">NVidia CUDA</category>
 <category domain="http://www.gpgpu.ru/taxonomy/term/18">Анонсы</category>
 <pubDate>Mon, 28 Feb 2011 15:56:31 +0000</pubDate>
 <dc:creator>lexa</dc:creator>
 <guid isPermaLink="false">283 at http://www.gpgpu.ru</guid>
  </item>
  <item>
    <title>Конкурс HPC-GPGPU проектов</title>
    <link>http://www.gpgpu.ru/node/274</link>
    <description>&lt;p&gt;
Не могу не отрекламировать конкурс:
&lt;p&gt;
&lt;a href=http://www.t-platforms.ru/ru/gpukonkurs&gt;Эффективное использование GPU-ускорителей при решении больших задач&lt;/a&gt;
&lt;p&gt;
(дальше просто копированием с сайта конкурса, c его страницы и с пресс-релиза):
&lt;blockquote&gt;
&lt;p&gt;
Конкурс будет проводиться в три этапа.
&lt;p&gt;
На первом этапе (до 28 февраля) участники конкурса проходят процедуру регистрации и предоставляют заявки. По итогам первого этапа будет отобрано до 30 проектов, каждому из которых будет выделено поощрительное финансирование на начальный этап проведения работ в размере 100 тысяч рублей.
&lt;p&gt;
На втором этапе (до 25 апреля 2011) участники должны будут предоставить отчеты по результатам пробных работ первого этапа. Подключиться к участию в конкурсе можно на любом этапе его проведения. В частности, к участию во втором этапе допускаются новые проекты, заявка по которым на первом этапе не подавалась. По окончании второго этапа экспертной комиссией будет выбрано 15 заявок и выделено финансирование в размере 200 тысяч рублей на каждую задачу.
&lt;p&gt;
На третьем этапе (до 30 сентября 2011) участники должны предоставить отчеты о проделанной работе в виде научно-популярной статьи. Как и на втором этапе, допускается подача заявок по новым проектам, которые не участвовали на первом и втором этапах. По окончании третьего этапа будут подведены итоги конкурса и объявлены восемь проектов, которые получат по 500 тысяч рублей каждый на продолжение своих исследований. Награждение победителей пройдет в конце ноября 2011 года на 7-й суперкомпьютерной конференции RSC 2011.
&lt;/blockquote&gt;
&lt;!--break--&gt;
К сожалению, из того, что написано на сайте, непонятно, предоставляется ли машинное время на эти "n тысяч рублей", или же дают денег и сколько надо машинного времени.
&lt;p&gt;
В &lt;a href=http://www.t-platforms.ru/ru/about/allnews/263-gpukonkursnews.html&gt;пресс-релизе&lt;/a&gt; написано еще, что подлючиться к конкурсу можно на любом этапе.
&lt;p&gt;
Как мне кажется, всем у кого уже есть работающее HPC/GPGPU приложение - имеет смысл подключиться, времени это потребует не так много, а эффект может быть приятным. 
&lt;p&gt;
Еще немного копипасты:
&lt;blockquote&gt;
&lt;h4&gt;Критерии конкурентного отбора&lt;/h4&gt;
&lt;p&gt;
Отбор и оценку конкурсных работ будет проводить комиссия, состоящая из ведущих российских экспертов в области высокопроизводительных вычислений. Отбор будет проводиться по следующим критериям:
&lt;ul&gt;
&lt;li&gt;Востребованность приложения, его соответствие поставленным целям;
&lt;li&gt; Обоснование рациональности использования высокопроизводительных вычислений на графических ускорителях для решения выбранной задачи, в том числе экономический эффект;
&lt;li&gt; Оригинальность реализации;
&lt;li&gt;Уровень сложности приложения.
&lt;/ul&gt;
&lt;/p&gt;
&lt;/blockquote&gt;
Подача заявок и порядок их описания - по ссылкам со &lt;a href=http://www.t-platforms.ru/ru/gpukonkurs&gt;страницы конкурса&lt;/a&gt;.&lt;div class="feedflare"&gt;
&lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=74tblwSHDJo:-gFhmBBZIUw:yIl2AUoC8zA"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?d=yIl2AUoC8zA" border="0"&gt;&lt;/img&gt;&lt;/a&gt; &lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=74tblwSHDJo:-gFhmBBZIUw:F7zBnMyn0Lo"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?i=74tblwSHDJo:-gFhmBBZIUw:F7zBnMyn0Lo" border="0"&gt;&lt;/img&gt;&lt;/a&gt; &lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=74tblwSHDJo:-gFhmBBZIUw:7Q72WNTAKBA"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?d=7Q72WNTAKBA" border="0"&gt;&lt;/img&gt;&lt;/a&gt; &lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=74tblwSHDJo:-gFhmBBZIUw:V_sGLiPBpWU"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?i=74tblwSHDJo:-gFhmBBZIUw:V_sGLiPBpWU" border="0"&gt;&lt;/img&gt;&lt;/a&gt;
&lt;/div&gt;&lt;img src="http://feeds.feedburner.com/~r/gpgpu-ru/~4/74tblwSHDJo" height="1" width="1"/&gt;</description>
     <comments>http://www.gpgpu.ru/node/274#comments</comments>
 <category domain="http://www.gpgpu.ru/taxonomy/term/5">GPGPU</category>
 <category domain="http://www.gpgpu.ru/taxonomy/term/18">Анонсы</category>
 <category domain="http://www.gpgpu.ru/taxonomy/term/73">МГУ</category>
 <category domain="http://www.gpgpu.ru/taxonomy/term/74">Т-Платформы</category>
 <pubDate>Thu, 03 Feb 2011 07:44:52 +0000</pubDate>
 <dc:creator>lexa</dc:creator>
 <guid isPermaLink="false">274 at http://www.gpgpu.ru</guid>
  </item>
  <item>
    <title>Новости одной строкой</title>
    <link>http://www.gpgpu.ru/node/270</link>
    <description>&lt;p&gt;Вдруг накопилось много мелких, но довольно существенных новостей, которые анонсирую одним текстом:
&lt;dl&gt;
&lt;dt&gt;Parallel Nsight Pro стал бесплатным&lt;/dt&gt;
&lt;dd&gt;
Pro-версия Parallel Nsight теперь раздается бесплатно (раньше - только версия Standard). &lt;a href=http://parallelnsight.nvidia.com/content/parallel-nsight-download&gt;Берут отсюда&lt;/a&gt;, требуется регистрация.
&lt;p&gt;Профессиональная версия отличается наличием отладчика.
&lt;/dd&gt;
&lt;dt&gt;Поддержка OpenCL включена в ATI/AMD Catalyst 11.x&lt;/dt&gt;
&lt;dd&gt;
До версии Catalyst 10.10, для поддержки OpenCL нужны были девелоперские драйвера, которые входили в Stream SDK. Начиная с 10.10 - появилась специальная версия с включенным OpenCL, которая ставилась как обычные драйвера, но пользователю нужно было специально скачивать эту версию.
&lt;p&gt;
В 11.1 (11.0 я пропустил и потому не знаю) все наоборот - в стандартный драйвер поддержка OpenCL входит, но если вам оно не надо, то можно скачать обрезанную версию на 20 мегабайт поменьше.
&lt;p&gt;
Другими словами, пользователя можно просить "поставь стандартные драйвера 11.x и будет тебе счастье.
&lt;p&gt;
Берут &lt;a href=http://support.amd.com/us/gpudownload/Pages/index.aspx&gt;из стандартного места для Catalyst&lt;/a&gt;
&lt;/dd&gt;
&lt;dt&gt;AMD выпустил готовый комплект преподавателя для курса по OpenCL&lt;/dt&gt;
&lt;dd&gt;AMD/ATI предлагает преподавателям готовый комплект из 13 презентаций и трех примеров кода (два примера - микроскопические, один - NBody), предназначенный для чтения лекций в университетах.
&lt;p&gt;Про качество мне судить трудно, но посмотреть всяко имеет смысл.
&lt;p&gt;&lt;a href=http://developer.amd.com/zones/OpenCLZone/universities/pages/default.aspx&gt;Берут отсюда&lt;/a&gt;
&lt;/dd&gt;
&lt;/dl&gt;
&lt;!--break--&gt;&lt;div class="feedflare"&gt;
&lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=Qvo3Fju_o3A:36Xe5Z-6FT8:yIl2AUoC8zA"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?d=yIl2AUoC8zA" border="0"&gt;&lt;/img&gt;&lt;/a&gt; &lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=Qvo3Fju_o3A:36Xe5Z-6FT8:F7zBnMyn0Lo"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?i=Qvo3Fju_o3A:36Xe5Z-6FT8:F7zBnMyn0Lo" border="0"&gt;&lt;/img&gt;&lt;/a&gt; &lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=Qvo3Fju_o3A:36Xe5Z-6FT8:7Q72WNTAKBA"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?d=7Q72WNTAKBA" border="0"&gt;&lt;/img&gt;&lt;/a&gt; &lt;a href="http://feeds.lexa.ru/~ff/gpgpu-ru?a=Qvo3Fju_o3A:36Xe5Z-6FT8:V_sGLiPBpWU"&gt;&lt;img src="http://feeds.feedburner.com/~ff/gpgpu-ru?i=Qvo3Fju_o3A:36Xe5Z-6FT8:V_sGLiPBpWU" border="0"&gt;&lt;/img&gt;&lt;/a&gt;
&lt;/div&gt;&lt;img src="http://feeds.feedburner.com/~r/gpgpu-ru/~4/Qvo3Fju_o3A" height="1" width="1"/&gt;</description>
     <comments>http://www.gpgpu.ru/node/270#comments</comments>
 <category domain="http://www.gpgpu.ru/taxonomy/term/16">AMD</category>
 <category domain="http://www.gpgpu.ru/taxonomy/term/25">CUDA</category>
 <category domain="http://www.gpgpu.ru/taxonomy/term/22">NVidia</category>
 <category domain="http://www.gpgpu.ru/taxonomy/term/41">OpenCL</category>
 <category domain="http://www.gpgpu.ru/taxonomy/term/72">Parallel Nsight</category>
 <category domain="http://www.gpgpu.ru/taxonomy/term/11">Обзоры веба</category>
 <pubDate>Thu, 27 Jan 2011 21:06:13 +0000</pubDate>
 <dc:creator>lexa</dc:creator>
 <guid isPermaLink="false">270 at http://www.gpgpu.ru</guid>
  </item>
  </channel>
</rss>

