Announcement

Collapse
No announcement yet.

ช่วยที เครื่องใส่ GPU 2 ตัวรันงานเร็วกว่าเครื่องใส่ GPU 3 ตัว?

Collapse
X
 
  • Filter
  • Time
  • Show
Clear All
new posts

  • ช่วยที เครื่องใส่ GPU 2 ตัวรันงานเร็วกว่าเครื่องใส่ GPU 3 ตัว?

    เพิ่งประกอบไป 2 เครื่อง เอามารันงานด้าน AI ที่ต้องใช้ CUDA core มากๆ

    เครื่องนึงใส่ Galax GTX 1080 Ti 2 ตัว บอร์ด Aorus Z270X Gaming 7
    อีกเครื่องใส่ EVGA GTX 1080 Ti 3 ตัว บอร์ด Aorus Z270X Gaming 9

    นอกนั้นเหมือนกัน คือ แรม 32 GB ซีพียู core i7 7700k

    ตอนรัน แรมเครื่องใช้ไปแค่ 4 GB กว่าๆ ส่วนแรมการ์ดจอใช้ไป 9 GB กว่าๆ

    เครื่องแรกใช้เวลา 45 นาทีรันงานเสร็จ
    เครื่อง 2 ใช้เวลา 65 นาที
    ข้อมูลเดียวกันโปรแกรมเดียวกันเป๊ะ

    ลองถอดการ์ดจอเครื่องที่ 2 ตัวนึง เหลือ 2 ตัว ทีนี้รัน 2 ชั่วโมงก็ยังไม่เสร็จ เลยปิดโปรแกรมไปขี้เกียจรอ

    ผม monitor การ์ดจอเครื่องที่ 2 ขณะรัน มีค่า load ต่ำมากๆ ส่วน GPU วิ่งอยู่แถวๆ 200-300 GHz

    งงอะครับ ช่วยแนะนำทีครับ ทำไงให้เครื่องที่ 2 เร็วกว่า

    ป.ล. 1) ที่ใช้ 2 เครื่องเพราะกะว่าทำงานเสร็จจะขายตัวนึง เพราะตอนนั้นคงไม่ได้ใช้งานหนักมาก
    ป.ล. 2) ยังไม่ได้ overclock

  • #2
    Originally posted by encipher View Post
    เพิ่งประกอบไป 2 เครื่อง เอามารันงานด้าน AI ที่ต้องใช้ CUDA core มากๆ

    เครื่องนึงใส่ Galax GTX 1080 Ti 2 ตัว บอร์ด Aorus Z270X Gaming 7
    อีกเครื่องใส่ EVGA GTX 1080 Ti 3 ตัว บอร์ด Aorus Z270X Gaming 9

    นอกนั้นเหมือนกัน คือ แรม 32 GB ซีพียู core i7 7700k

    ตอนรัน แรมเครื่องใช้ไปแค่ 4 GB กว่าๆ ส่วนแรมการ์ดจอใช้ไป 9 GB กว่าๆ

    เครื่องแรกใช้เวลา 45 นาทีรันงานเสร็จ
    เครื่อง 2 ใช้เวลา 65 นาที
    ข้อมูลเดียวกันโปรแกรมเดียวกันเป๊ะ

    ลองถอดการ์ดจอเครื่องที่ 2 ตัวนึง เหลือ 2 ตัว ทีนี้รัน 2 ชั่วโมงก็ยังไม่เสร็จ เลยปิดโปรแกรมไปขี้เกียจรอ

    ผม monitor การ์ดจอเครื่องที่ 2 ขณะรัน มีค่า load ต่ำมากๆ ส่วน GPU วิ่งอยู่แถวๆ 200-300 GHz

    งงอะครับ ช่วยแนะนำทีครับ ทำไงให้เครื่องที่ 2 เร็วกว่า

    ป.ล. 1) ที่ใช้ 2 เครื่องเพราะกะว่าทำงานเสร็จจะขายตัวนึง เพราะตอนนั้นคงไม่ได้ใช้งานหนักมาก
    ป.ล. 2) ยังไม่ได้ overclock
    ถอดการ์ดจอ จากเครื่องที่ช้า 3 ตัวออกให้เหลือ 2 ตัว แล้วเอา ใบที่ถอด ไปเสียบใช้กับเครื่อง 2 ตัวที่เร็วกว่าตอนแรกดูครับ ว่าเปลี่ยนแล้วได้ผลเร็วกว่าไหม

    Comment


    • #3
      ถ้าเหมือนกันหมดทุกอย่าง ก็ไม่น่าจะช้า ถ้าช้าก็แสดงว่า เครื่องมีปัญหาสักอย่าง

      Comment


      • #4
        ซีพียูมี PCIe bus lens แค่ 16 เลน คอนฟิคมันได้แค่สองการ์ด 1x16, 2x8, 1x8+2x4....มั้ง

        Comment


        • #5
          เกิดจากคอขวดหรือเปล่าครับ เพราะยังไง cpu ก็มี pci-e 16len ตายตัว

          ส่วนเจ้าบอร์ด z270-gaming 9 pci-e มันไปวิ่งผ่าน chip PLX อีกที

          Comment


          • #6
            ขอบคุณครับ จะลองดูครับ

            Comment


            • #7
              กำลังสงสัยคอขวด ที่อาจเกี่ยวกับ PCIe bus ของบอร์ดเหมือนกันครับ เพราะ spec 2 เครื่องเหมือนกันหมดทุกอย่าง ยกเว้นเมนบอร์ด

              Comment


              • #8
                ซีพียูเค้าล็อกไว้ครับ PCIe ทำได้แค่ 2 ชุดครับแพทเทิร์นก็ตามนั้น ผมก๊อบมาจากหน้าเว็บอินเทล

                Comment


                • #9
                  เข้าไปดูในเว็บ Intel มา ค่า config ของ PCIe express คือ Up to 1x16, 2x8, 1x8+2x4
                  หมายความว่าใส่การ์ดจอได้ 3 ตัวบน PCIe แต่ความเร็วเป็น ตัวแรก x8 อีก 2 ตัวเป็น x4.... ผมเข้าใจถูกมั้ยครับ?

                  แต่พอลองเอาการ์ดจอออกไปตัวนึง เหลือ 2 ตัว แล้วรองรันงานใหม่ มันนานขึ้นกว่าเท่าตัวเลย เลยแปลกใจน่ะครับ

                  Comment


                  • #10
                    ประเด็นคือเครื่องที่มีการ์ดจอ 3 ตัว พอเอามาถอดเหลือ 2 ตัวก็ยังวิ่งช้าอยู่ (2 ชม+)

                    ผมว่าอาจจะมีปัญหาที่การ์ดจอครับ ลองสลับการ์ดจอดูก่อนครับ

                    Comment


                    • #11
                      Originally posted by encipher View Post
                      เข้าไปดูในเว็บ Intel มา ค่า config ของ PCIe express คือ Up to 1x16, 2x8, 1x8+2x4
                      หมายความว่าใส่การ์ดจอได้ 3 ตัวบน PCIe แต่ความเร็วเป็น ตัวแรก x8 อีก 2 ตัวเป็น x4.... ผมเข้าใจถูกมั้ยครับ?

                      แต่พอลองเอาการ์ดจอออกไปตัวนึง เหลือ 2 ตัว แล้วรองรันงานใหม่ มันนานขึ้นกว่าเท่าตัวเลย เลยแปลกใจน่ะครับ
                      งงๆอยู่เหมือนกันครับ ดึกแล้วตาลาย @@ เออมี + ด้วย ก็คงตามนั้นครับ แต่ไงใช้ GPUz ส่องดู ระหว่างที่การ์ดจอทำงานอยู่ครับว่าวิ่งเท่าไหร่ แต่ละการ์ดวิ่งเท่าไหร่

                      Comment


                      • #12
                        ลองเช็คการตั้งค่าในโปรแกรมดูให้ละเอียดว่าตั้งให้ใช้การ์ดจอช่วยประมวลผลเหมือนกันไหม มันต้องมีอะไรผิดปกติแน่ๆ

                        ส่วน PCIe ไม่น่าเกี่ยว เพราะการช่วยประมวลผลแบบนี้ไม่ได้ใช้แบนวิธมากเหมือนตอนเล่นเกม(ขึ้นอยู่กับงานแหละว่าทำงานแบบไหน)

                        Comment


                        • #13
                          จขกท ทดสอบดูครับ ว่า เครื่องแรก ปรับให้ วิ่ง x4 แล้ว ความเร็วตกหรือไม่ ดูครับ
                          จะได้รู้ว่า ความเร็ว pci มีผลจริงหรือไม่



                          จขกท ลองตรวจสอบดูว่า เครื่องที่มีปัญหานั้น การ์ดจอ วิ่ง x8 sli 2 ใบอยู่หรือไม่ครับ เสียบถูกช่องหรือไม่ คร่าวๆ
                          Last edited by THEFOOL; 5 Jul 2017, 15:25:03.

                          Comment


                          • #14
                            ขอบคุณทุกท่านมากครับ พรุ่งนี้จะลองปรับตามที่แนะนำมาดูครับ

                            วันนี้ลองถอดการ์ดจอออก 1 ใบเหลือรัน 2 ใบ ผลออกมาดีใกล้เคียงเครื่องแรก รัน 1 ครั้งใช้เวลา ~45 นาที แต่พอใส่กลับเข้าไปเป็น 3 ใบเหมือนเดิม กลับใช้เวลา ~55 นาทีซะงั้น

                            เข้าไปอ่านกระทู้คนอื่นๆใน NVIDIA Developer
                            บางคนก็บอกว่า gtx 1080 ti วิ่งบนบัสขั้นต่ำ x8 เท่านั้น
                            บางคนว่าเป็นคอขวดที่ซีพียู เพราะ 7700k รองรับ PCIe สูงสุดแค่ 16 lane
                            บางคนก็ว่าเมนบอร์ดมันดีเกินซีพียู

                            ข้อสงสัยผมคือ ตอนรันโปรแกรม ผมเปิดโปรแกรมมอนิเตอร์การ์ดจอ เห็นมันโหลดข้อมูลเข้าไปนะ แต่ GPU load กลับเป็น 0%

                            และที่สงสัยเบิ้ลเลยคือ เอาโปรแกรมเดียวกันมารันบน macbook pro ดันใช้เวลาแค่ ~42 นาที ทั้งที่ spec ต่ำกว่าทุกอย่าง และไม่ได้ใช้งาน GPU ด้วย

                            Comment


                            • #15
                              ลืม ลักษณะงานคือ โปรแกรมจะส่งข้อมูลที่มีแต่ตัวเลขไปรัน เป็นงานเน้นวิเคราะห์และคำนวณข้อมูล ใช้ multi-thread เลยเน้นที่ CUDA core, memory, speed ไม่ได้ทำด้านกราฟฟิก

                              ผมเห็นฝรั่งรันเทียบเครื่องที่ใช้ gtx 1080 ti 8 ตัว กับซีพียู xeon 2 ตัว เร็วกว่าใส่ gtx 1080 ti ตัวเดียว กว่า 5 เท่า

                              แล้วสงสัยพวกนักขุดเหมืองเค้าใส่การ์ดจอกันที 6 ใบ มันแตกต่างไงกับเครื่องผมอะ งง 555

                              Comment

                              Working...
                              X