首页 > 新闻 > 专家观点 >

IBM Platform HPC计算模式及网络配置剖析

2014-06-25 13:38:54   作者:   来源:ZDNetserver频道   评论:0  点击:11649


  06月19日消息:在上一篇文章《IBM Platform HPC应用及组件解析》中,详细介绍了Platform HPC在单一产品中提供完整的高性能计算(HPC)管理解决方案,在本文中将更为详细的解读Platform HPC的运行模式、集群节点、管理节点、计算节点、可视化节点、登陆节点、集群网络、公共网络、配置网络、管理网络、应用网络。

  运作模式

  图中示例的高可用环境是用于显示如何设计一个Platform HPC集群部署,这只是几种可能配置之一。在我们的示例中,有4个网络(公共网络、配置网络、管理网络和应用网络)以及一个共享的集群存储,外加一个双节点GPFS集群。

闂傚倸鍊搁崐鎼佸磹閹间礁纾归柟闂寸绾惧綊鏌熼梻瀵割槮缁炬儳缍婇弻鐔兼⒒鐎靛壊妲紒鐐劤缂嶅﹪寮婚悢鍏尖拻閻庨潧澹婂Σ顔剧磼閹冣挃闁硅櫕鎹囬垾鏃堝礃椤忎礁浜鹃柨婵嗙凹缁ㄥジ鏌熼惂鍝ョМ闁哄矉缍侀、姗€鎮欓幖顓燁棧闂備線娼уΛ娆戞暜閹烘缍栨繝闈涱儐閺呮煡鏌涘☉鍗炲妞ゃ儲鑹鹃埞鎴炲箠闁稿﹥顨嗛幈銊╂倻閽樺锛涘┑鐐村灍閹崇偤宕堕浣镐缓缂備礁顑呴悘婵嬫倵椤撶喍绻嗛柕鍫濈箳閸掍即鏌涢悤浣镐簽缂侇喛顕ч埥澶娢熻箛鎾剁Ш闁轰焦鍔欏畷銊╊敊鐠侯煈鏀ㄧ紓鍌氬€风粈渚€顢栭崟顖涘殑闁告挷鐒﹂~鏇㈡煙閹规劦鍤欑痪鎯у悑閹便劌顫滈崱妤€骞嬮梺绋款儐閹瑰洭骞冨⿰鍫熷殟闁靛鍎崑鎾诲锤濡や胶鍙嗛梺鍝勬处濮樸劑宕濆澶嬬厵闁告劘灏欓悞鍛婃叏婵犲嫮甯涢柟宄版嚇瀹曘劍绻濋崒娑欑暭闂傚倷娴囧畷鐢稿窗閸℃稑纾块柟鎯版缁犳煡鏌曡箛鏇烆€屾繛绗哄姂閺屽秷顧侀柛鎾寸懇椤㈡岸鏁愰崱娆戠槇濠殿喗锕╅崢鍏肩濠婂懐纾奸柣鎰靛墮椤庢粌顪冪€涙ɑ鍊愮€殿喗鐓¢、妤呭礋椤戣姤瀚奸梻浣告贡鏋繛鎾棑缁骞樼€靛摜顔曢柣鐘叉厂閸涱厼鐓傞梺杞扮閻楀﹥绌辨繝鍥ч柛娑卞枛濞呫倝姊虹粙娆惧剬闁告挻绻勯幑銏犫攽閸モ晝鐦堥梺绋挎湰缁嬫垵鈻嶉敐鍜佹富闁靛牆绻掗崚浼存煏閸喐鍊愭鐐插暞缁傛帞鈧絽鐏氶弲顒€鈹戦悙鏉戠仸閽冮亶鎮归崶鈺佷槐婵﹨娅i幏鐘诲灳閾忣偆浜堕梻浣藉吹閸o附淇婇崶顒€绠查柕蹇曞Л閺€浠嬫倵閿濆簼绨介柛濠勫仱濮婃椽妫冨ù銈嗙洴瀹曟﹢濡搁妷顔藉枠濠电姷鏁告慨鐑藉极閸涘﹥鍙忛柣鎴f閺嬩線鏌熼梻瀵割槮缁炬崘顫夐妵鍕冀椤愵澀绮堕梺缁樺笒閻忔岸濡甸崟顖氱闁瑰瓨绻嶆禒鑲╃磼閻愵剙鍔ゆい顓犲厴瀵鎮㈤悡搴n槶閻熸粌绻掗弫顔尖槈閵忥紕鍘介梺瑙勫劤椤曨厼煤閹绢喗鐓欐い鏃傜摂濞堟粓鏌℃担鐟板闁诡垱妫冮崹楣冩嚑椤掍焦娅﹀┑鐘垫暩婵參骞忛崘顔肩妞ゅ繐鍟版す鎶芥⒒娓氣偓閳ь剚绋撻埞鎺楁煕閺傝法肖闁瑰箍鍨归埞鎴犫偓锝庝簻缁愭稑顪冮妶鍡樼闁瑰啿绉瑰畷顐⑽旈崨顔规嫽婵炶揪绲介幉锛勬嫻閿熺姵鐓欓柧蹇e亝鐏忕敻鏌嶈閸撴艾顫濋妸锔芥珷婵°倓鑳堕埞宥呪攽閻樺弶鎼愮紒鐘垫嚀闇夐柨婵嗙墕閳ь兛绮欐俊鎼佸煛閸屾粌寮抽梻浣告惈閸熺娀宕戦幘缁樼厱閹艰揪绱曢敍宥囩磼鏉堚晛浠辨鐐村笒铻栧ù锝呭级鐎氫粙姊绘担鍛靛綊寮甸鍕仭闁靛ň鏅涚粈鍌溾偓鍏夊亾闁告洦鍓涢崢鐢告⒑閹勭闁稿鎳庨悾宄扮暆閳ь剟鍩€椤掑喚娼愭繛鍙夌矒瀵偆鎷犲顔兼婵炲濮撮鎰板极閸ヮ剚鐓熼柟閭﹀弾閸熷繘鏌涢悙鍨毈婵﹦绮幏鍛存嚍閵壯佲偓濠囨⒑闂堚晝绉剁紒鐘虫崌閻涱喛绠涘☉娆愭闂佽法鍣﹂幏锟�...

  图:在物理硬件上部署Platform HPC集群

  集群节点

  管理节点、计算节点和可视化节点可以用于Platform HPC集群中,每个节点都有自己的作用。

  管理节点

  管理节点是第一个安装在集群中的节点,每个集群都需要一个管理节点。它控制集群中的其他节点。在PHPC的早期版本中,这个节点也被称为头节点或者主节点。管理节点的角色是一个在用户站点的部署节点,包含在集群中运行应用所需的所有软件组件。在管理节点连接到一个集群节点之后,它为计算节点配置和部署客户端软件。安装在管理节点上的软件提供以下功能:

  - 行政、管理和监控集群
  - 安装计算节点
  - 无状态和有状态的管理
  - 资源库管理和更新
  - 集群配置管理
  - HPC套件管理
  - 配置模板管理
  - 应用模板管理
  - 使用Platform MPI套件加速并行应用处理和应用扩展
  - 使用Platform LSF套件进行工作负载管理、监控和报告
  - 用户登录、编制和提交作业到集群
  - 充当防火墙把集群与外部节点和网络阻隔开
  - 充当服务器面向多个服务,例如DHCP、TFTP、HTTP以及可选的DNS、LDAP、NFS以及NTP

  计算节点

  计算节点是专为计算密集型应用设计,以满足计划用例的功能要求。计算机节点是通过管理节点配置和更新的,在集群中执行计算任务。工作负载管理系统(Platform LSF)在计算节点上设置作业位置数和CPU核心数。

  在计算节点配置好之后,会安装操作系统(OS)分布、Platform LSF套件(工作负载管理代理、监控和资源管理代理)、Platform MPI套件以及其他定制软件(用户定义)。这个计算节点中可以有一些本地磁盘用于操作系统和临时存储运行应用。也可以配置操作系统在无盘系统上启动,以提高I/O性能(使用无状态配置)。

  计算节点还加载NFS,或者可以配置GPFS实现共享存储。这些计算节点可以协同工作使用MPI解决问题。这是由连接到高速互连网络实现的。一些应用在模拟过程中不要求每个计算节点上必须有大磁盘存储空间。不过,大型模型可能不适合可用的内存空间,必须在核心外解决,然后从强大的本地存储中受益。

相关阅读:

  • 0

  • 0

  • 0

  • 0

  • 0

  • 0

  • 0

  • 0

分享到:           收藏

专题