Photonics – Chinese

Photonics – Chinese

Topics related to Lumerical and more, in Chinese language.

关于仿真速度的疑问。

    • 220151209
      Subscriber

      电脑CPU为5900X,12核24线程,对于同一个仿真文件,在Resource里面设置不同的Processes,速度不同:

      1. Processes=2,thread=1,capacity=1,仿真时间3min25s,cpu占用17%;
      2. Processes=4,thread=1,capacity=1,仿真时间3min45s;
      3. Processes=8,thread=1,capacity=1,仿真时间3min44s;
      4. Processes=12,thread=1,capacity=1,仿真时间3min58s;
      5. Processes=12,thread=2,capacity=1,仿真时间4mi25s;
      6. Processes=24,thread=1,capacity=1,仿真时间4min24s,cpu占用100%;

      我之前一直认为核心数越多仿真速度越快,但我发现仿真速度在12核24线程的cpu中,越小的processes,cpu占用越少,仿真速度反而越快,难以理解,CPU全占用应该是仿真速度最快才对。

      FDTD仿真速度主要由单核性能还有内存大小/转速决定的吗?对于多核处理器,FDTD仿真速度提升并不明显,processes设置过大仿真速度反而下降。

      如何根据电脑CPU来科学设置Processes?

    • Guilin Sun
      Ansys Employee
      "一直认为核心数越多仿真速度越快"不太正确。并行计算有一个Scale的问题,你可以找一些文献看看,比如网上 https://www.pianshen.com/article/37191571191/ 并行计算不仅仅只是分块计算,而是每个计算是否任务量饱满,还有管理成本,特别是FDTD,在每一个步长上不同的块都需要交换数据,参见 Ansys Insight: 关于FDTD 并行计算的有关问题 所以你的仿真测试再次证实并非核数越多越好。另外,Process和Thread,进程与线程在并行计算时的方式也不同,再加上CPU,更复杂。结果也与仿真文件的特性有关,是仿真区需要很多内存还是监视器需要很多内存,测试结果可能不同。实际上相同的文件在不同机器或者操作系统中的速度很可能不同,因为这个还与硬件有关,比如CPU总线的带宽、不同核之间的通讯速率以及带宽等。 因此,需要测试。
    • 220151209
      Subscriber

      "一直认为核心数越多仿真速度越快"不太正确。并行计算有一个Scale的问题,你可以找一些文献看看,比如网上 https://www.pianshen.com/article/37191571191/

      并行计算不仅仅只是分块计算,而是每个计算是否任务量饱满,还有管理成本,特别是FDTD,在每一个步长上不同的块都需要交换数据,参见 Ansys Insight: 关于FDTD 并行计算的有关问题

      所以你的仿真测试再次证实并非核数越多越好。另外,Process和Thread,进程与线程在并行计算时的方式也不同,再加上CPU,更复杂。结果也与仿真文件的特性有关,是仿真区需要很多内存还是监视器需要很多内存,测试结果可能不同。实际上相同的文件在不同机器或者操作系统中的速度很可能不同,因为这个还与硬件有关,比如CPU总线的带宽、不同核之间的通讯速率以及带宽等。

      因此,需要测试。

      /forum/discussion/comment/138471#Comment_138471

      感谢您的解答。
    • Ken_hu
      Subscriber
      您好,我想问一下AMD和Intel的CPU哪家的用于电磁仿真比较好呢?最近打算入手5900x或者12700k。
    • 220151209
      Subscriber
      同学你好,我用的是R9-5900X的主机,刚好实验室也有i7-9700(不带K)的电脑,我自己做了对比,AMD平台:5900x 内存32G 频率 3600 Intel平台:9700 内存32G 频率 2667 我发现:对于一个40M的仿真文件,AMD的主机用时仅仅快了1min,有时候甚至持平及反超。我的intel平台的电脑内存频率更低,为第9代cpu,仅8核8线程,但在跑仿真上不输12核24线程的5900X 我个人认为Intel在Lumerical FDTD仿真上更有优势,我原来以为AMD会很强,虽然AMD在渲染、游戏上,5900X都吊打intel,但是实际测试中发现intel跑FDTD更快。 所以我会推荐你用11900k,10900K,11700k,10700K之类的cpu来进行FDTD仿真,搭配3200Mhz的内存,最好上64G容量。 至于12700k,有一个问题,就是intel的新架构是大小核,我不知道这对仿真是否有影响,还未有机会测试。在近期的一些测评中发现,很多主板厂商推出了关闭12700k,12900k小核的功能,否则在玩游戏或者其他生产力活动时会卡顿甚至无响应,所以我不敢给你推荐12700k。
    • Ken_hu
      Subscriber
      好的,谢谢答主的耐心回复。确实网上也有测试AMD和Intel平台的,有关介绍也提到intel的mkl库,AVX-512指令类型这些影响。刚好有入手一个12700k,毕竟不知道以后intel是不是都往大小核发展,有空的话可以和答主对比一下5900x看看。☺️
Viewing 5 reply threads
  • The topic ‘关于仿真速度的疑问。’ is closed to new replies.