Announcement

Collapse
No announcement yet.

ARM ROOM นั่งคุยเรื่อง arm และ risc tecnology

Collapse
X
 
  • Filter
  • Time
  • Show
Clear All
new posts

  • อันนี้โครงสร้าง AI server ที่นิยมกันในตอนนี้นะครับ GPU Driven Machinelerning

    https://www.anandtech.com/show/15866...vers-announced
    https://www.gigabyte.com/th/GPU-Serv...Z51-rev-100#ov




    CPU จะทำหน้าที่แค่ผู้จัดการระบบครับ จะมีแค่ 2-4 ตัวแค่นั้นแหละ ที่เหลือ GPU ล้วนๆครับ
    คำสั่ง FMA ใช้แค่รับ-ส่งข้อมูล ไปกลับให้ GPU และ User ครับ ไม่ได้ใช้อะไรมากกว่านั้น มันเหมือนโรงงานน่ะครับ CPU เหมือน Office
    ทำหน้าที่รับงานเข้า จัดการหาวัตถุดิบจาก Storage และ ส่งวัตถุดิบ จาก Storage ไปให้ GPU ซึ่งคือ LINE ผลิต
    เมื่อ GPU ทำงานเสร็จ ก็ส่ง ผลิตภัณท์มายัง Office และ Office จัดส่งให้ลูกค้าไป ตามนี้ครับ ซึ่งตรงนี้
    ไม่ต้องเรียกใช้ AVX512 อะไรเลยครับ ใช้ FMA256 ให้พอ แบบที่ผมพูดเรื่อง Linus ข้างบนก็พอแล้ว

    อาจมีงับแรงๆไปบ้าง แต่ครบถ้วนครับ สำหรับ AMD AI ครับ ต่อกันตามสบายครับ
    Last edited by ssk; 16 Jul 2020, 21:18:40.

    Comment


    • คําสั่ง sh.a.ในไรเซ่นไว้ทําไรมั่งอัพเยอะอ่านไม่ทัน
      Linux. Linusเทียบกับ apple แล้วเคอรเนล
      เค้ามันใช้ทั้งโลก เจออะไรเยอะแยะ อาจจะมากว่า
      M.s. มือถือ ยันserver. ทุกสถาปัตย. แกพูดด่า
      ไรคงต้องฟัง แต่ A.v.x 512ผมว่าน้าจะเดินหน้า
      นะตรับ คิดว่าอินเทลดึง amd. มาเล่นด้วย
      ซึ่งแดงคงไม่ปฏิเสธแต่อย่างที่ Linus กล่าว
      ซีพียุทํามาให้ดีๆๆก่อนค่อยมาบ้ายัดชุดคําสั่ง

      F. M. A. 3-4 รึเป่าครับคําสั่งมาในf. X. หนิ
      Last edited by micronz; 17 Jul 2020, 02:00:08.

      Comment


      • FMA4 น่ะ แล้วก็ตัดออกเพราะ
        งานส่วนใหญ่ใช้ FMA3 ครับ

        ส่วน avx512 ถึงเวลามันก็ต้องมี
        แต่คงอีกพักนึง ดู alder lake ที่ linus
        ด่า atomcore ที่จับยัดมาเป็น little
        Core ยังต้องใส่ avx 2 มาทั้งๆที่ปรกติ
        ไม่มี วันนึง ryzen ก็ต้องมี หลักๆมันเพื่อเพิ่ม
        FP troughput มากกว่าเรื่อง ML น่ะ
        Last edited by ssk; 17 Jul 2020, 02:47:58.

        Comment


        • ว่างมาเสริมนิดนึง ทำไมผมถึงพูดว่า
          เพื่อ througput นะครับ
          ทำความเข้าใจง่ายๆ ข้อมูลแต่ละชนิด
          ต้อง ใช้ CU ให้ถูก
          Int ต้องใช้ int unit ทำงาน และรับส่งข้อมูล
          FP ต้องใช้ FP unit ทำงาน และรับส่งข้อมูล

          เปรียบง่ายๆ
          - int คือของแข็งต้องส่งทางสายพาน
          - FP คือของเหลวต้องส่งปั๊มส่งทางท่อ
          จะส่งข้ามกันไม่ได้ แต่ในระบบ มี bus คือถนน
          ทั้ง int และ FP มันใส่รถไปครับ
          รถขนกล่อง กับ รถถังน้ำครับ แล้ว
          ไปเลี้ยวเข้า โรงงานไครโรงงานมัน

          FP unit จึงต้องสัมพันกับปริมานงาน
          จะใช้ปั๊มแรงๆตัวเดียว หรือจะใช้ปั๊มย่อย
          อยู่ที่การออกแบบระบบ สำคัญคือที่ flowrate
          ต่างหากครับ

          Comment


          • Originally posted by ssk View Post
            FMA4 น่ะ แล้วก็ตัดออกเพราะ
            งานส่วนใหญ่ใช้ FMA3 ครับ

            ส่วน avx512 ถึงเวลามันก็ต้องมี
            แต่คงอีกพักนึง ดู alder lake ที่ linus
            ด่า atomcore ที่จับยัดมาเป็น little
            Core ยังต้องใส่ avx 2 มาทั้งๆที่ปรกติ
            ไม่มี วันนึง ryzen ก็ต้องมี หลักๆมันเพื่อเพิ่ม
            FP troughput มากกว่าเรื่อง ML น่ะ
            Fma4. อินเทลไม่เอาครับ fma3ใส่ในฮาสเวล
            เป็นต้นมาตอนนี้ตายละเหรอครับ. Fma4
            ไรเซ่นมีมะ
            Last edited by micronz; 17 Jul 2020, 18:25:14.

            Comment


            • ราสเบี้ยน pi.4คนเล้นเยอะเข้าสู่การควบ
              คุมระบบอัติโนมัติเยอะ

              เลบน่าจะเป็นจ้าวแรกที่จะเพิ่มกานเชื่อมต่อ
              N. V. Me. ชลอการซื้อดีละ555

              - - - Updated - - -

              ลืมลิ่งค์
              https://www.blognone.com/node/117535

              Comment


              • Mercedes. Benz จับมือพี่เขียวเราละ
                ซูฮกว่าเจ๋งจิงไม่ง้อคอนโซล
                https://droidsans.com/mercedez-partn...f-driving-car/

                Comment


                • Originally posted by micronz View Post
                  Mercedes. Benz จับมือพี่เขียวเราละ
                  ซูฮกว่าเจ๋งจิงไม่ง้อคอนโซล
                  https://droidsans.com/mercedez-partn...f-driving-car/
                  น่าจะมาใน Mercedes EQS รถไฟฟ้าโคตรหรูและแรง แรงทั้งสมรรถนะและราคา

                  Comment


                  • เพิ่งซื้อบอรด์พี่เขียวมาลองครับ Jetson nano ไม่รู้ Detect ใบหน้า ได้เรื่องอย่างไรบ้างขอลองก่อนๆ

                    Comment


                    • Originally posted by Amethystx View Post
                      เพิ่งซื้อบอรด์พี่เขียวมาลองครับ Jetson nano ไม่รู้ Detect ใบหน้า ได้เรื่องอย่างไรบ้างขอลองก่อนๆ
                      ไว้ติดอาจถามครับ ผมก็ลองเล่นๆอยู่ แต่ของผมเอามาจับคนอู้

                      Comment


                      • Originally posted by micronz View Post
                        Fma4. อินเทลไม่เอาครับ fma3ใส่ในฮาสเวล
                        เป็นต้นมาตอนนี้ตายละเหรอครับ. Fma4
                        ไรเซ่นมีมะ
                        เห็นว่าตัดออกนะครับ เพราะมันมี 4 Operand เหมือนจะเปลืองๆ เลยตัดออกไป
                        ที่เคยอ่านใน wiki ตอนเขียนตารางกับนั่งเถียงคนนะครับ
                        สารภาพว่า มาอ่านจริงๆจังๆ ตอนเตะมันนี่แหละ
                        ก่อนนี้สิงอยู่เรื่องการทหาร ดาราศาสตร์ มอไซด์<ว่าจะขี่ 2 ล้อเที่ยวน่ะ
                        Last edited by ssk; 17 Jul 2020, 20:56:42.

                        Comment


                        • Originally posted by Amethystx View Post
                          เพิ่งซื้อบอรด์พี่เขียวมาลองครับ Jetson nano ไม่รู้ Detect ใบหน้า ได้เรื่องอย่างไรบ้างขอลองก่อนๆ
                          ลงLinux หรือครับ อัพเดทมาดูครับ
                          ของผมกลับบ้านจะล้างUbuntu.
                          ลงmx. Linux. เค้าไปsnap ละ จะลอง
                          ตัวเบาแถมฮิตอันดับ 1ในดิสโทรวอต


                          Single boardงรอเล่นราสเบี้ยนเวอร์ชั่นตามข่าว
                          N.v.me.

                          ข่าวดีมีบอร์ด ริคสวี มาอัพเดทด้วยถูกสัส
                          คุยเรื่อง arm risc.มันกว้างดีนะไม่ต้อง
                          หมกมุ่นกะนวัตกรรม x86 จับเจ่า 5555
                          โลกคอมพิวเตอร์ โมบายล์กันหมดละยุคนี้
                          Last edited by micronz; 17 Jul 2020, 21:24:53.

                          Comment


                          • Hot chip มี คนทำ risc-v มาเปิดตัวเยอะนะ
                            ยิ่งค่ายจีนหลักๆด้วย ผลของสงครามการค้า พี่แกดิ้นสุดตัวจริงๆ

                            Sleepy Intel Ice Lake Xeons Take Longer to Ramp Up Frequency Than Expected

                            XENON ขี้เซา บิดขี้เกียจนานกว่าจะลุกมาทำงานได้ เค้าว่าแบบนี้นะ


                            https://www.tomshardware.com/news/sl...p-up-frequency


                            A recent patch to the Linux kernel (via Phoronix) points to an interesting problem with Intel's nearly-mythical 10nm+ Ice Lake Xeon processors: The CPUs take longer than expected to return to normal frequencies after exiting certain sleep states, which then impacts performance consistency due to 'uncertain' CPU clock rates.

                            The severity of the issue isn't clear, but If nothing else, it does show Intel's that work on the Ice Lake Xeon processors continues, albeit with some challenges. Due to a report that Intel has been hit by another delay to its server programs, we reached out to the company last week to confirm if the schedule still remains on track. The company responded "We remain on track to deliver 10nm Ice Lake to customers in 2H20."

                            We'll see. Back to the issue at hand. Processors fall into various C-States (sleep) to reduce overall power consumption during idle periods. C-States have different degrees of power savings for each core, with the deepest levels of sleep involving stopping core clocks, flushing caches, and reducing voltage to extract the utmost in power savings. Additionally, Package C-States can apply that reduce power and clocks for resources on the CPU package that are shared by all the cores, like fabrics and the uncore.

                            The deeper the sleep state, the more power each processor can save. However, resuming to full speed from deeper sleep states requires more time than lighter sleep states. According to the report, that process seems to take longer with certain power states for the Ice Lake Xeon processors.

                            An Intel 'kernel test robot' posted the patch and explained the issue. As Phoronix points out, the fix comes from an Intel employee, meaning the company likely encountered the issue in its own testing. The explanation of the issue reads as follows:

                            "On ICX platform, the CPU frequency will slowly ramp up when woken up from C-states deeper than/equals to C1E. Although this feature does save energy in many cases this might also cause unexpected result. For example, workload might get unstable performance due to the uncertainty of CPU frequency. Besides, the CPU frequency might not be locked to specific level when the CPU utilization is low.

                            "Thus this patch disables C1E auto-promotion and expose C1E as a separate idle state, so that the C1E and C6 can be disabled via sysfs when necessary."


                            To fix the problem, the system can disable the C1E and C6 states entirely, thus preventing the chip from entering into the lower sleep states. The engineer elaborates on the problem further:

                            "Besides C1 and C1E, the exit latency of C6 was measured by a dedicated tool. However the exit latency (41us) exposed by _CST is much smaller than the one we measured (128us). This is probably due to the _CST uses the exit latency when woken up from PC0+C6, rather than PC6+C6 when C6 was measured. Choose the latter as we need the longest latency in theory."

                            Here we see that the problem stems from how the exit latency (the amount of time it takes the CPU to pop back to full speed) is measured, and then exposed to the kernel. ACPI_CST, which communicates the C-States information to the kernel, lists the latency as measured when the processor was in a PC0+C6 state. That means that one or more cores may be in a C6 sleep state, but the rest of the package (fabric and uncore) is still chugging along at full speed (PC0). In this state, it takes the core only 41us to resume normal operation.

                            However, when the processor enters the PC6+C6 state, the package also powers down (PC6 state) along with the cores, so it takes longer for the processor to regain its full speed. Intel measured the sleep exit latency in these conditions at 128us, so it appears the kernel is merely being given the wrong sleep exit values.

                            Just to get an idea of how this differs from other Intel processors, we searched around for the typical sleep exit latency for a Skylake-based processor.

                            (Image credit: Metropolia University of Applied Sciences)
                            We referred back to an interesting bachelor's thesis [PDF] by Vladislav Govtva from the Metropolia University of Applied Sciences that was published early last year. He measured the sleep exit latency from several different generations of Intel processors, and above we can see his results with an Intel Xeon Platinum 8170M (Skylake).

                            Govtva measured the maximum wake latency (the same as exit latency) from a C6 state as ~108us, which is 20us faster than the Ice Lake processor. There are likely differing measurement criteria involved here, but a simple comparison of the number yields an 18.5% increase in sleep exit latency.

                            It appears Intel has "fixed" the problem by allowing the system to disable certain sleep states under certain conditions, but it's possible this is just a corner case that won't apply to many types of applications. We're reaching out to Intel for further clarification, but given that Ice Lake hasn't been officially released, we don't expect to learn much.

                            Advertisement

                            It will be interesting to see if Intel continues to tune this parameter further as it works through teething pains. Phoronix posits that the patch could make it into the Linux 5.9 cycle that opens next month, but could result in higher power consumption in exchange for more performance.
                            CPU INTEL มันขี้เกียจๆขึ้นด้วยมั้ง เค้าเลยต้องออก Insider preview ให้ใช้ก่อน จะได้ไม่เสียเวลาตอนสลึมสลือ AMD ส่งทีหลังได้ เพราะน่าจะส่ง REPORT กลับมาทัน พร้อมกับ INTEL นั่นแหละ
                            Last edited by ssk; 18 Jul 2020, 07:10:34.

                            Comment


                            • Originally posted by ssk View Post
                              Hot chip มี คนทำ risc-v มาเปิดตัวเยอะนะ
                              ยิ่งค่ายจีนหลักๆด้วย ผลของสงครามการค้า พี่แกดิ้นสุดตัวจริงๆ

                              Sleepy Intel Ice Lake Xeons Take Longer to Ramp Up Frequency Than Expected

                              XENON ขี้เซา บิดขี้เกียจนานกว่าจะลุกมาทำงานได้ เค้าว่าแบบนี้นะ


                              https://www.tomshardware.com/news/sl...p-up-frequency




                              CPU INTEL มันขี้เกียจๆขึ้นด้วยมั้ง เค้าเลยต้องออก Insider preview ให้ใช้ก่อน จะได้ไม่เสียเวลาตอนสลึมสลือ AMD ส่งทีหลังได้ เพราะน่าจะส่ง REPORT กลับมาทัน พร้อมกับ INTEL นั่นแหละ
                              ช่ายครับ ซิงเกิ้ลบอร์ดใช้ risc.. V ก็ได้ๆๆถูกๆ
                              แต่เหนื่อยฝังลีนุกส์ ข้อเสัยน่าจะเป็นลงหุ่น
                              กระป๋องไม่ได้ แต่หลายคนซื้อราสเบี้ยนมา
                              ก็ไม่ได้ลง แอนดรอยด์

                              Comment


                              • เดี๋ยวอาทิตย์หน้างานสะดวกๆ แล้วจะแกมาลองครับเฮียไม้ขอน ssk อาทิตย์นี้ผมอย่างวุ่น 55

                                Comment

                                Working...
                                X