标签云
大数据 chia挖币 全闪存存储 专业设计工作站 22口交换机 串口服务器 NVIDIA RTX 30 2U2路机架服务器 40G/100G交换机 36口光纤交换机 NVIDIA 服务器 poe千兆交换机 12口交换机 26口工业交换机 高性能计算工作站 数据中心防火墙 4U双路服务器 英伟达P4 MAXHUB会议平板 32口交换机 企业级高端全闪存储系统 19RU路由器 32口百兆交换机 万兆交换机 DAS存储 主要应用在国家党政军系统及重点行业客户等。 3U双路服务器 7U机架服务器 44口工业交换机 防火墙 全千兆管理交换机 入门级全闪存存储系统 3U机架服务器 48万兆口交换机 NVIDIA P40 硬盘阵列 大数据服务器 1RU路由器 多速率交换机 32口千兆交换机 工业设计工作站 10GE/40GE交换机 入门级存储 二层百兆交换机 扩展文件存储 模块化交换机 安全路由器 全闪存 专业防火墙 保护用户私密数据信息 闪存 服务器 高密度服务器 通信交换机 D2机箱 桌面防火墙 并行存储系统 3口千兆交换机 25口交换机 8RU路由器
这里首先强调一点:无论你选哪款 GPU,首先要确保它的内存能满足你的需求。为此,你要问自己几个问题:
我要拿 GPU 做什么?是拿来参加 Kaggle 比赛、学深度学习、做 CV/NLP 研究还是玩小项目?
为了实现我的目标,我需要多少内存?
使用上述成本 / 性能图表来找出最适合你的、满足内存标准的 GPU;
我选的这款 GPU 有什么额外要求吗?比如,如果我要买 RTX 3090,我能顺利地把它装进我的计算机里吗?我的电源瓦数够吗?散热问题能解决吗?
针对以上问题,林海天成给出了一些建议:
什么情况下需要的内存 >= 11GB?
上面说过,如果你要使用预训练 transformer 或从头训练小型 transformer,你的内存至少要达到 11GB;如果你要做 transformer 方向的研究,内存最好能达到 24GB。这是因为,之前预训练好的那些模型大多都对内存有很高的要求,它们的预训练至少用到了 11GB 的 RTX 2080 Ti。因此,小于 11GB 的 GPU 可能无法运行某些模型。
除此之外,医学影像和一些 SOTA 计算机视觉模型等包含很多大型图像的任务(如 GAN、风格迁移)也都对内存有很高的要求。
总之,多留出来一些内存能让你在竞赛、业界、研究中多一丝从容。
什么情况下<11 GB 的内存就够用了?
RTX 3070 和 RTX 3080 性能都很强大,就是内存有点小。但在很多任务中,你确实不需要那么大的内存。
如果你想学深度学习,RTX 3070 是最佳选择,因为把模型或输入图像缩小一点就能学到大部分架构的基本训练技巧。
对于原型神经网络而言,RTX 3080 是迄今为止性价比最高的选择。在原型神经网络中,你想用最少的钱买最大的内存。这里的原型神经网络涉及各个领域:Kaggle 比赛、为初创公司开拓思路 / 模型、以及用研究代码进行实验。RTX 3080 是这些场景的最佳选择。
假设你要领导一个研究实验室 / 创业公司,你可以把 66-80% 的预算投到 RTX 3080 上,20-33% 用于推出带有强大水冷装置的 RTX 3090。这是因为,RTX 3080 性价比更高,而且可以通过一个 slurm 集群设置作为原型机共享。由于原型设计应该以敏捷的方式完成,所以应该使用更小的模型和更小的数据集,RTX 3080 很适合这一点。一旦学生 / 同事有了一个很棒的原型模型,他们就可以在 RTX 3090 机器上推出该模型并将其扩展为更大的模型。
建议汇总
总之,RTX 30 系列是非常强大的,值得大力推荐。选购时还要注意内存、电源要求和散热问题。如果你在 GPU 之间有一个 PCIe 插槽,散热是没有问题的。否则,RTX 30 系列需要水冷、PCIe 扩展器或有效的鼓风机卡。
林海天成表示,他会向所有买得起 RTX 3090 的人推荐这款 GPU,因为在未来 3-7 年内,这是一款将始终保持强大性能的显卡。他认为,HBM 内存在未来的三年之内似乎不会降价,因此下一代 GPU 只会比 RTX 3090 的性能提升 25% 左右。未来 5-7 年有望看到 HBM 内存降价,但那时你也该换显卡了。
对于那些算力需求没那么高的人(做研究、参加 Kaggle、做初创公司),林海天成推荐使用 RTX 3080。这是一个高性价比的解决方案,而且可以确保多数网络的快速训练。
RTX 3070 适合用来学深度学习和训练原型网络,比 RTX 3080 便宜 200 美元。
如果你觉得 RTX 3070 还是太贵了,可以选择一个二手 RTX 2070。现在还不清楚会不会有 RTX 3060,但如果你确实预算有限,可以选择再等等。
联系电话
微信扫一扫