关于仿真速度的疑问。

- November 17, 2021 at 8:40 am
  220151209
  Subscriber
  电脑CPU为5900X，12核24线程，对于同一个仿真文件，在Resource里面设置不同的Processes，速度不同：
  Processes=2，thread=1，capacity=1，仿真时间3min25s，cpu占用17%;
  Processes=4，thread=1，capacity=1，仿真时间3min45s;
  Processes=8，thread=1，capacity=1，仿真时间3min44s;
  Processes=12，thread=1，capacity=1，仿真时间3min58s;
  Processes=12，thread=2，capacity=1，仿真时间4mi25s;
  Processes=24，thread=1，capacity=1，仿真时间4min24s，cpu占用100%;
  我之前一直认为核心数越多仿真速度越快，但我发现仿真速度在12核24线程的cpu中，越小的processes，cpu占用越少，仿真速度反而越快，难以理解，CPU全占用应该是仿真速度最快才对。
  FDTD仿真速度主要由单核性能还有内存大小/转速决定的吗？对于多核处理器，FDTD仿真速度提升并不明显，processes设置过大仿真速度反而下降。
  如何根据电脑CPU来科学设置Processes？
- November 17, 2021 at 4:50 pm
  
  Guilin Sun
  Ansys Employee
  
  "一直认为核心数越多仿真速度越快"不太正确。并行计算有一个Scale的问题，你可以找一些文献看看，比如网上 https://www.pianshen.com/article/37191571191/ 并行计算不仅仅只是分块计算，而是每个计算是否任务量饱满，还有管理成本，特别是FDTD，在每一个步长上不同的块都需要交换数据，参见 Ansys Insight: 关于FDTD 并行计算的有关问题所以你的仿真测试再次证实并非核数越多越好。另外，Process和Thread，进程与线程在并行计算时的方式也不同，再加上CPU，更复杂。结果也与仿真文件的特性有关，是仿真区需要很多内存还是监视器需要很多内存，测试结果可能不同。实际上相同的文件在不同机器或者操作系统中的速度很可能不同，因为这个还与硬件有关，比如CPU总线的带宽、不同核之间的通讯速率以及带宽等。因此，需要测试。
- November 18, 2021 at 1:37 am
  
  220151209
  Subscriber
  
  "一直认为核心数越多仿真速度越快"不太正确。并行计算有一个Scale的问题，你可以找一些文献看看，比如网上 https://www.pianshen.com/article/37191571191/
  并行计算不仅仅只是分块计算，而是每个计算是否任务量饱满，还有管理成本，特别是FDTD，在每一个步长上不同的块都需要交换数据，参见 Ansys Insight: 关于FDTD 并行计算的有关问题
  所以你的仿真测试再次证实并非核数越多越好。另外，Process和Thread，进程与线程在并行计算时的方式也不同，再加上CPU，更复杂。结果也与仿真文件的特性有关，是仿真区需要很多内存还是监视器需要很多内存，测试结果可能不同。实际上相同的文件在不同机器或者操作系统中的速度很可能不同，因为这个还与硬件有关，比如CPU总线的带宽、不同核之间的通讯速率以及带宽等。
  因此，需要测试。
  /forum/discussion/comment/138471#Comment_138471
  感谢您的解答。
- November 29, 2021 at 4:14 am
  
  Ken_hu
  Subscriber
  
  您好，我想问一下AMD和Intel的CPU哪家的用于电磁仿真比较好呢？最近打算入手5900x或者12700k。
- November 29, 2021 at 5:23 am
  
  220151209
  Subscriber
  
  同学你好，我用的是R9-5900X的主机，刚好实验室也有i7-9700（不带K）的电脑，我自己做了对比，AMD平台：5900x 内存32G 频率 3600 Intel平台：9700 内存32G 频率 2667 我发现：对于一个40M的仿真文件，AMD的主机用时仅仅快了1min，有时候甚至持平及反超。我的intel平台的电脑内存频率更低，为第9代cpu，仅8核8线程，但在跑仿真上不输12核24线程的5900X 我个人认为Intel在Lumerical FDTD仿真上更有优势，我原来以为AMD会很强，虽然AMD在渲染、游戏上，5900X都吊打intel，但是实际测试中发现intel跑FDTD更快。所以我会推荐你用11900k，10900K，11700k，10700K之类的cpu来进行FDTD仿真，搭配3200Mhz的内存，最好上64G容量。至于12700k，有一个问题，就是intel的新架构是大小核，我不知道这对仿真是否有影响，还未有机会测试。在近期的一些测评中发现，很多主板厂商推出了关闭12700k，12900k小核的功能，否则在玩游戏或者其他生产力活动时会卡顿甚至无响应，所以我不敢给你推荐12700k。
- November 29, 2021 at 7:37 am
  
  Ken_hu
  Subscriber
  
  好的，谢谢答主的耐心回复。确实网上也有测试AMD和Intel平台的，有关介绍也提到intel的mkl库，AVX-512指令类型这些影响。刚好有入手一个12700k，毕竟不知道以后intel是不是都往大小核发展，有空的话可以和答主对比一下5900x看看。☺️