ページ更新: 2017-07-09 (日) (13日前)

(2014-01-03)

使用期間: 2014-01-03 〜 (使用中)

メインPCのCPUを入れ変えた。

CPU とマザーボードを同時に交換するのは、2006年11月以来だ。 (CPUは Core2 E6600 → Q6700 → Q9550 で、マザーボードは P5BEP45-UD3P)

今回の目的の1つは、CUDA を 2世代 (できれば3世代) 試せるPCを組みこと。あと、来年出る Maxwell やその後の Volta でも使えるようにすること。

目次

[編集]

メモ #

[編集]

ビデオカード交換 (2017-07-09) #

ビデオカード を NVIDIA GTX 1060 3GB (玄人志向 | GF-GTX1060-3GB/OC/DF) に交換した。

  • 旧: NVIDIA GTX 660 (Kepler: CC=3.0) + GTS 450 (Fermi 2nd: CC=2.1)) + GT9500 (G96: CC=1.1)
  • 新: GTX 1060 (Pascal: CC=6.1)

スロットの配置:

No種別カード注釈
1PCIe 2.0 x1(none)
2PCIe 3.0 x16GTX 1060
3PCI(GTX 1060)
4PCIe 2.0 x1(USB 2.0 panel 2port)
5PCIe 3.0 x8(none)
6PCI(USB 2.0 panel 4port)
7PCIe 2.0 x2(none)

モニタ3台との接続方法:

Noモニタビデオカード側コネクタモニタとの接続方法
1HD2452WHDMIHDMI → HD2452W
2L565DVIDVI → L565
3L997Display PortDisplay Port →「Display Port オス → HDMI メス アダプタ (R1140A)」→「HDMIオス → DVIオス アダプタ (PL-HDDV02)」→ L997

CUDA-Z http://cuda-z.sf.net/ のレポート:

CUDA-Z Report
=============
Version: 0.10.251 64 bit http://cuda-z.sf.net/
OS Version: Windows x86 6.1.7601 Service Pack 1
Driver Version: 384.76
Driver Dll Version: 9.0 (6.14.13.8476)
Runtime Dll Version: 6.50

Core Information
----------------
	Name: GeForce GTX 1060 3GB
	Compute Capability: 6.1
	Clock Rate: 1733.5 MHz
	PCI Location: 0:1:0
	Multiprocessors: 9
	Threads Per Multiproc.: 2048
	Warp Size: 32
	Regs Per Block: 65536
	Threads Per Block: 1024
	Threads Dimensions: 1024 x 1024 x 64
	Grid Dimensions: 2147483647 x 65535 x 65535
	Watchdog Enabled: Yes
	Integrated GPU: No
	Concurrent Kernels: Yes
	Compute Mode: Default
	Stream Priorities: Yes

Memory Information
------------------
	Total Global: 3072 MiB
	Bus Width: 192 bits
	Clock Rate: 4004 MHz
	Error Correction: No
	L2 Cache Size: 48 KiB
	Shared Per Block: 48 KiB
	Pitch: 2048 MiB
	Total Constant: 64 KiB
	Texture Alignment: 512 B
	Texture 1D Size: 131072
	Texture 2D Size: 131072 x 65536
	Texture 3D Size: 16384 x 16384 x 16384
	GPU Overlap: Yes
	Map Host Memory: Yes
	Unified Addressing: Yes
	Async Engine: Yes, Bidirectional

Performance Information
-----------------------
Memory Copy
	Host Pinned to Device: 11.1643 GiB/s
	Host Pageable to Device: 4763.86 MiB/s
	Device to Host Pinned: 11.4276 GiB/s
	Device to Host Pageable: 5000.41 MiB/s
	Device to Device: 70.6489 GiB/s
GPU Core Performance
	Single-precision Float: 3426.72 Gflop/s
	Double-precision Float: 113.013 Gflop/s
	64-bit Integer: 272.1 Giop/s
	32-bit Integer: 1262.1 Giop/s
	24-bit Integer: 947.407 Giop/s

Generated: Sun Jul 09 09:05:55 2017
[編集]

ケースファン交換 (2014-02-22) #

ケース前面ファンを他のPCに付け替えたかったので、ケース前面の12cmファンを買った。ついでに新たに背面用にも8cmファン購入した。 たまたまPWMファン買ったけど、マザーボードの4pinがPWMに対応して無いかも(電圧制御)。

[編集]

Transactional Synchronization Extensions (2014-02-04) #

[編集]

CUDA #

GPUボードとチップの仕様:

chipCCcorememoryband (bit)speed (GB/s)power (W)Bus
GTX 660 2GBGK1063.0SMX*5 (192*5)GDDR5 2048 MB192144.2140PCIe 3.0 x16ELSA GeForce® GTX 660 S.A.CGeForce GTX 660
GTS 450 1GBGF1162.1SM*4 (48*4)GDDR5 1024 MB12857.7106PCIe 2.0 x16ELSA GLADIAC GTS 450 SPGeForce GTS 450
9500 GTG961.18 * 4GDDR3 512 MB12825.659PCIe 2.0 x16ELSA GLADIAC 795 GT DDR3 512MBGeForce 9500 GT
  • 2015-11-05 CUDA Toolkit 7.5.18 付属ドライバに変えたら、9500 GT が映らなくなった。このドライバのサポート範囲は 900 〜 400 なので、9シリーズはサポート外だった。9シリーズ用ドライバって同居できるかどうか判らない。でもこれまで同居していた気もする。バックアップしてから試してみるつもり。

CUDA-Z 0.8.207 report (2014-01-19):

Memory Copy9500 GTGTS 450参考 GTS 450 + X79GTX 660参考 GTX 660 (GIGABYTE GV-N660OC-2GD) + Q77 PCIe 3.0x16
Host Pinned to Device (MiB/s)693.426 (PCIe 2.0x2)3092.19 (PCIe 2.0x8)5675.875972.90 (PCIe 3.0x8)11404.7
Host Pageable to Device (MiB/s)657.311 (PCIe 2.0x2)2508.96 (PCIe 2.0x8)3927.714106.13 (PCIe 3.0x8)3449.13
Device to Host Pinned (MiB/s)797.854 (PCIe 2.0x2)3207.69 (PCIe 2.0x8)6173.746263.53 (PCIe 3.0x8)11650.97
Device to Host Pageable (MiB/s)746.792 (PCIe 2.0x2)2607.22 (PCIe 2.0x8)4263.074422.61 (PCIe 3.0x8)5056.23
Device to Device (GiB/s)3.993823.176323.383248.059245.8297
GPU Core Performance
Single-precision Float (Gflop/s)88.9256399.166399.1081193.491250.47
Double-precision Float (Gflop/s)n/a50.087450.088585.563689.7585
32-bit Integer (Giop/s)15.8853200.092200.062341.036357.726
24-bit Integer (Giop/s)88.9321199.983199.966340.757356.942
  • Z87 の PCIe 3.0 x16を 2つに分けているので、CPU <-> GPU 間のメモリ転送速度が遅い。
    • X79 chipset のマザーボードなら回避できるが、高いので使わなかった。
  • 9500 GT → GTS 450 で、float32 4.5倍, int32 12.5倍, int24 2.25倍 の差があると, int24に収まらない処理をCC=1.1で性能を出すのは難しそうだ。
  • GF116 (Fermi 2nd) では int32<->float32変換 + float32で演算するコストと、int32だけで演算するコストの差が少なかったけど、 GK106 (Kepler) ならfloat32で演算したほうが性能が出せるかも。
[編集]

構成 #

マザーボード: ASUS Z87-PLUS

CPU: Intel Core i7-4770s (TDP 65W, 4C8T)

メモリ: PC3-12800(DDR3-1600) 8GB 2枚組

電源: SilverStone SST-ST75F-P (750W)

ケース: TORICA CA400S2-B9S : 2003-06-15 に購入したものを引き続き使用

USB 3.0ヘッダ/2.0ヘッダ→フロントパネル: Ainex PF-004A

Blu-ray, HDD, USB-FDD は PC/GIGABYTE EP45-UD3P を流用した。

  • Blu-ray: HL-DT-ST BD-RE GGW-H20N
  • C: INTEL SSDSA2CW300G3 (OS, アプリケーション)
  • D: Seagate ST1000DX001 seagate
  • E: Seagate ST2000DM001 seagate

GPU: (TDPの合計 305W)

スロットの配置:

No種別カード注釈
1PCIe 2.0 x1(none)
2PCIe 3.0 x8GTX 660PCIe 3.0 x16をスロット2と5で分割
3PCIGTX 660
4PCIe 2.0 x1(USB 2.0 panel 2port)
5PCIe 3.0 x8GTS 450PCIe 3.0 x16をスロット2と5で分割
6PCI(USB 2.0 panel 4port)
7PCIe 2.0 x29500 GT

内部:

IMGP0968.jpg

IMGP0972.jpg

背面:

IMGP0978.jpg

IMGP0977.jpg

IMGP0976.jpg

前面:

IMGP0980.jpg

Windows エクスペリエンス インデックス (Windows 7):

コンポーネント旧PC新PC
プロセッサ7.37.7Core2 Quad Q9550 (4C4T) → Core i7-4770s (4C8T)
メモリ (RAM)7.37.8DDR2-800 → DDR3-1600
グラフィックス7.27.9GTS 450 → GTX 660
[編集]

動作確認、組み立て (2014-01-13) #

1. ボール紙の上で組み立てて、動作を確認。

  • マザーボード, CPU, メモリ16GB, ビデオ GTX 660
  • 初期動作確認: Windows 8 起動OK, メモリ 16GB認識したことを確認
  • memtest86+ 実行 1周50分くらい
  • BIOS を 1707 (2013.12.25) に更新

2. ケースに組み込み

3. ドライバ更新

  • あらかじめダウンロードしたチップセットドライバ Version 9.4.0.1026 (2013.10.04) をインストール