ページ更新: 2014-03-04 (火) (1147日前)

(2014-01-03)

メインPCのCPUを入れ変えた。

CPU とマザーボードを同時に交換するのは、2006年11月以来だ。 (CPUは Core2 E6600 → Q6700 → Q9550 で、マザーボードは P5BEP45-UD3P)

今回の目的の1つは、CUDA を 2世代 (できれば3世代) 試せるPCを組みこと。あと、来年出る Maxwell やその後の Volta でも使えるようにすること。

目次

[編集]

メモ #

[編集]

ケースファン交換 (2014-02-22) #

ケース前面ファンを他のPCに付け替えたかったので、ケース前面の12cmファンを買った。ついでに新たに背面用にも8cmファン購入した。 たまたまPWMファン買ったけど、マザーボードの4pinがPWMに対応して無いかも(電圧制御)。

[編集]

Transactional Synchronization Extensions (2014-02-04) #

[編集]

CUDA #

GPUボードとチップの仕様:

chipCCcorememoryband (bit)speed (GB/s)power (W)Bus
GTX 660 2GBGK1063.0SMX*5 (192*5)GDDR5 2048 MB192144.2140PCIe 3.0 x16ELSA GeForce® GTX 660 S.A.CGeForce GTX 660
GTS 450 1GBGF1162.1SM*4 (48*4)GDDR5 1024 MB12857.7106PCIe 2.0 x16ELSA GLADIAC GTS 450 SPGeForce GTS 450
9500 GTG961.18 * 4GDDR3 512 MB12825.659PCIe 2.0 x16ELSA GLADIAC 795 GT DDR3 512MBGeForce 9500 GT
  • 2015-11-05 CUDA Toolkit 7.5.18 付属ドライバに変えたら、9500 GT が映らなくなった。このドライバのサポート範囲は 900 〜 400 なので、9シリーズはサポート外だった。9シリーズ用ドライバって同居できるかどうか判らない。でもこれまで同居していた気もする。バックアップしてから試してみるつもり。

CUDA-Z 0.8.207 report (2014-01-19):

Memory Copy9500 GTGTS 450参考 GTS 450 + X79GTX 660参考 GTX 660 (GIGABYTE GV-N660OC-2GD) + Q77 PCIe 3.0x16
Host Pinned to Device (MiB/s)693.426 (PCIe 2.0x2)3092.19 (PCIe 2.0x8)5675.875972.90 (PCIe 3.0x8)11404.7
Host Pageable to Device (MiB/s)657.311 (PCIe 2.0x2)2508.96 (PCIe 2.0x8)3927.714106.13 (PCIe 3.0x8)3449.13
Device to Host Pinned (MiB/s)797.854 (PCIe 2.0x2)3207.69 (PCIe 2.0x8)6173.746263.53 (PCIe 3.0x8)11650.97
Device to Host Pageable (MiB/s)746.792 (PCIe 2.0x2)2607.22 (PCIe 2.0x8)4263.074422.61 (PCIe 3.0x8)5056.23
Device to Device (GiB/s)3.993823.176323.383248.059245.8297
GPU Core Performance
Single-precision Float (Gflop/s)88.9256399.166399.1081193.491250.47
Double-precision Float (Gflop/s)n/a50.087450.088585.563689.7585
32-bit Integer (Giop/s)15.8853200.092200.062341.036357.726
24-bit Integer (Giop/s)88.9321199.983199.966340.757356.942
  • Z87 の PCIe 3.0 x16を 2つに分けているので、CPU <-> GPU 間のメモリ転送速度が遅い。
    • X79 chipset のマザーボードなら回避できるが、高いので使わなかった。
  • 9500 GT → GTS 450 で、float32 4.5倍, int32 12.5倍, int24 2.25倍 の差があると, int24に収まらない処理をCC=1.1で性能を出すのは難しそうだ。
  • GF116 (Fermi 2nd) では int32<->float32変換 + float32で演算するコストと、int32だけで演算するコストの差が少なかったけど、 GK106 (Kepler) ならfloat32で演算したほうが性能が出せるかも。
[編集]

構成 #

マザーボード: ASUS Z87-PLUS

CPU: Intel Core i7-4770s (TDP 65W, 4C8T)

メモリ: PC3-12800(DDR3-1600) 8GB 2枚組

電源: SilverStone SST-ST75F-P (750W)

ケース: TORICA CA400S2-B9S : 2003-06-15 に購入したものを引き続き使用

USB 3.0ヘッダ/2.0ヘッダ→フロントパネル: Ainex PF-004A

Blu-ray, HDD, USB-FDD は PC/GIGABYTE EP45-UD3P を流用した。

  • Blu-ray: HL-DT-ST BD-RE GGW-H20N
  • C: INTEL SSDSA2CW300G3 (OS, アプリケーション)
  • D: Seagate ST1000DX001 seagate
  • E: Seagate ST2000DM001 seagate

GPU: (TDPの合計 305W)

スロットの配置:

No種別カード注釈
1PCIe 2.0 x1(none)
2PCIe 3.0 x8GTX 660PCIe 3.0 x16をスロット2と5で分割
3PCIGTX 660
4PCIe 2.0 x1(USB 2.0 panel 2port)
5PCIe 3.0 x8GTS 450PCIe 3.0 x16をスロット2と5で分割
6PCI(USB 2.0 panel 4port)
7PCIe 2.0 x29500 GT

内部:

IMGP0968.jpg

IMGP0972.jpg

背面:

IMGP0978.jpg

IMGP0977.jpg

IMGP0976.jpg

前面:

IMGP0980.jpg

Windows エクスペリエンス インデックス (Windows 7):

コンポーネント旧PC新PC
プロセッサ7.37.7Core2 Quad Q9550 (4C4T) → Core i7-4770s (4C8T)
メモリ (RAM)7.37.8DDR2-800 → DDR3-1600
グラフィックス7.27.9GTS 450 → GTX 660
[編集]

動作確認、組み立て (2014-01-13) #

1. ボール紙の上で組み立てて、動作を確認。

  • マザーボード, CPU, メモリ16GB, ビデオ GTX 660
  • 初期動作確認: Windows 8 起動OK, メモリ 16GB認識したことを確認
  • memtest86+ 実行 1周50分くらい
  • BIOS を 1707 (2013.12.25) に更新

2. ケースに組み込み

3. ドライバ更新

  • あらかじめダウンロードしたチップセットドライバ Version 9.4.0.1026 (2013.10.04) をインストール