欢迎您 本站地址:  

返回首页   返回冷知识   中国象棋  其他软件  外语串烧  视频号副业  吓人音效  法律类书籍  应用工具源码  国际电话区号大全 


全球最快计算机天河二号的研发意义是什么?

  先说超算这东西NB不,按说技术指标什么的应该没什么假,最快就是最快,最大就是最大,但是建超级计算机这个东西如同盖摩天大楼,第一造出来也不代表你掌握了核心的技术,第二这东西不是美日不能建,而是建出来除了好看外,没有多大“意义” 。
于是问题回到了“意义”上。
天河二的意义在哪?很可惜,作为直接接触负责提供“意义”的政府部门的人士,我只能告诉你到现在为止,谁都没想好这货能干嘛。
  这也是为什么美日欧不搞这玩意的原因。
  这段话的“第一”、“第二”不尊重实际、误导性十足,表明作者要么是什么都不懂,要么是故意来知乎上搅浑水。
“第一造出来也不代表你掌握了核心的技术”的意思是:你造出了世界第一的计算机与你有没有掌握核心技术没有太大的关系,你可能掌握了,也可能没有掌握。
显然,作者想表达的意思是,你虽然造出了世界第一的计算机,但是你没有掌握核心技术。
这难道是说:即使没有掌握核心技术也能够造出世界第一的计算机来吗?这就真不能理解当年曼海姆大学的Hans Meuer教授(现任国际超级计算大会主席)为什么要搞出个TOP500榜单并且能够20多年来一直受到国际的重视了!   制造并运用一台超级计算机所需的技术包括核心处理器、网络互联、容错性、操作系统、编程平台、制造工艺、应用软件等。
第一,如此多的CPU如何一起协同工作,提供高速运算,这是体系结构应当解决的问题。
而天河二号中采用的新型异构多态体系结构是继天河一号多阵列可配置协同并行体系结构发展而来。
多态异构体系结构技术是中国率先提出并使用的,当今处于国际领先地位。
  第二,核心处理器也就是通常所说的CPU,但新型异构多态体系结构的天河二号中,它还包括用于加速运算的MIC(可以理解为GPU)等。
天河二号采用的CPU是Intel的Xeon和自主生产的FT1500, MIC是Intel的Phi协处理器。
Xeon + Phi构成了主要的计算结点,而FT1500组成服务阵列。
处理器方面,天河二号采用了国外的CPU,FT1500的性能也是不错的,所以总体结论是中国在处理器的设计制造方面是落后国际先进水平的。
  第三,多个处理器共同完成一项任务时,需要进行数据的交互,如同一个团队共同干一个活需要交流沟通一样。
2个处理器的数据传输可很容易地实现;10个处理器的数据传输也可以轻易实现,但可想而知会略为复杂;当处理器的数目进一步增加,到达100个,100个,1w个,10w个,100w个时,这种复杂度的问题就不是那么容易解决的了。
可以想象TCP/IP协议和全世界大大小小的路由节点就是为了解决这种问题而出现的。
但超级计算机内部的数据传输与互联网之间的数据交流不同,超级计算机内部每个节点之间都可以进行数据传输,传输的量还很大,因此对带宽有着极高的要求。
天河二号采用的光电混合的自主定制高速互连系统,性能是当前国际上最先进的商用互连系统的2倍,继续保持国际领先地位(详见:“天河二号”超级计算机获核心关键技术突破。
我参加过新闻发布会,虽然引用只是QQ新闻,但内容是可靠的)。
  第四,容错性。
同样的一个东西多了,有一个或几个出问题的可能就大了。
如何保证在一个或多个部件出问题的条件下,其他部件继续有效地工作,是容错性设计应当解决的问题。
这方面的技术我理解不深,从天河二号新闻发布会的情况了解,它也是处理国际先进水平的。
  第五,操作系统。
有了硬件,如何管理硬件来完成给定的任务,是操作系统的工作。
平时我们所说的装机就是指装操作系统。
家用台式机或笔记本的操作系统管理一个四核或八核的CPU算是很多的了。
但超级计算机的操作系统需要管理三百万个处理器核,这个技术难度大家自己去想想吧。
天河二号采用的是麒麟操作系统,由国防科大自主研制开发。
  第六,制造工艺。
现在的超级计算机的体积都很大,如何将这么多的处理器组装在一定的空间内,并进行良好的散热,是需要解决的问题。
这里看数据:以高密度高精度结构工艺为例,天河二号共170个机柜,占地面积与天河一号基本相同,但性能却是它的11.6倍;与此前排名世界第一的美国“泰坦”系统相比,占地面积是它的85%,性能却是它的近两倍。
(详见:“天河二号”超级计算机获核心关键技术突破)   第七,应用软件。
应用软件的开发与维护是个长周期的过程,在这方面,一些国外软件具有它的优势。
  有没有掌握核心技术,各位应该自有定论了吧。
  “第二这东西不是美日不能建,而是建出来除了好看外,没有多大“意义””,读完这话,可以看出两层意思:一是超级计算机没有多大的“意义”;二是,因为这个原因所以美日没有造,从而也就没有和中国去抢,所以中国才拿了世界第一。
本文第二部分再来讲“意义”,我们先来看看top500的今年6月的统计   就top500榜单上的超级计算机而言,美国有252台,中国66台,日本30台,英国29台,法国23台,等等。
中国拥有的超级计算机数量是世界第二,而第一美国相当于中国的4倍!而近年来世界第一的计算机,2010年6月是美国橡树岭国家实验室的“美洲豹”(Jaguar),制造经费约为1.4亿美元,持续速度1.759 petaFLOPS(每秒…千万亿次);2010年11月是中国天津超算中心的“天河-1A”,制造经费约为6亿元人民币,持续速度2.566 petaFLOPS;2011年6月是日本神户的理化学研究所的“京”(K-Computer),持续速度8.162petaFLOPS;2011年11月仍然是“京”,技续速度10.510petaFLOPS;2012年6月是属于美国能源部和美国国家核安全管理局的“红衫”(Sequoia),持续速度16.325petaFLOPS;2012年11月是美国橡树岭国家实验室的“泰坦”(Titan),持续速度17.59petaFLOPS;2013年6月是中国广州超算中心的“天河二号”,持续速度33.862petaFLOPS。
  美国252台,日本30台,欧盟约80台,真是不知道“这也是为什么美日欧不搞这玩意的原因。
”这样一个结论是怎么来的!一楼作者根本是不知道行情啊。
而如果HPC真的没有意义,美日又造这么多台做什么?连这点行情都不了解,笔者真心难以想象,会有人找你去给HPC拉应用。
  采购这家伙花掉了广州市政府近30个亿,每年的维护费用至少是几个亿,每年维护这货花的钱甚至可能就接近广州市政府一年的信息化经费总预算!关于这点,一年的维护费用达到几个亿,除了几千万的电费之外,其他的开销还请一楼作者具体说明一下,或者是给出数据来源。
  于是广州市到处在给这玩意找“意义”,可惜必须用到超级计算机的行业,基本上一只手就数得过来,无非是基础物理、天体物理、大气环境、灾难预测之类的国家投入的基础科研,这些整个广东省甚至华南都基本没有;至于可能用超级计算机的行业,比如生物医药、机械、材料甚至电脑动画之类的,对他们来说用这货的性价比无比之低,用超算几乎不会在这些公司的考虑范围之内。
  举个例子,某公司用自己的实验室做一个模拟花3天,用超算花10分钟就得,看起来提高了效率,但要用这10分钟超算的费用可能就在百万级别,之前还要有N天到N星期的调试。


哪个公司会愿意用?至于那些可能用得上的基础研究,很遗憾这项目虽然科技部挂了个名,但是是交给广州市自己搞并自付盈亏的,中央连个面都没兴趣露,不可能帮你找基础研究业务并买单,即便有,中科院能绕过不到200公里之外嫡系的深圳超算中心,去找广州这个?   而广东省那几个头牌大学都跟基础研究不沾边,同样爱莫能助;至于给国外科研机构用嘛。

呵呵这可是国防科大建的计算机。
  首先,“广东省那几个头牌大学都跟基础研究不沾边”,真的是这样吗?就说华南理工大学,它就拥有高分子材料广东省教育厅重点实验室(广东省重点实验室),中山大学有广东省海洋资源与近岸工程重点实验室、广东省地质过程与矿产资源探查重点实验室等(中山大学 SUN YAT-SEN UNIVERSITY)。
这里仅仅列出广东省几个头牌大学的基础研究相关的实验室,更多应用超级计算机的研究实验室我就不一一列举了。
  第二,使用超级计算机的行业,从天津超算中心的官网的给出的应用案例来看,有石油勘探、动漫渲染、生物医药、高端设备制造、航空航天、天气预报、浩洋环境工程、遥感数据处理、大型土木工程应用、基础科学研究等,远不止一楼给出的那四项。
  第三,“这些整个广东省甚至华南都基本没有”。
退一步说,即使这些项目广东和华南没有,就不能建在广州了?难道一楼作者还认为当今是蒸汽朋克时代,工厂都要建在自家门口么?这种荒谬的距离逻辑还体现在“中科院能绕过不到200公里之外嫡系的深圳超算中心”里。
HPC提供的是服务,你给我待处理的初始数据和处理应用程序,我就给你运算,并给出相应的运算结果。
整个过程可以通过互联网的远程访问来实现。
距离,在信息时代根本不是问题。
再者,本文第二部分我会告诉大家,当计算量大了的时候,并非是超级计算机就可以用,而一定要用速度更快的机器。
一楼作者在这里暴露了他的无知,笔者再次难以相信他是给HPC找“意义”的。
如果说有“找意义”这一工作的话。
  第四,“10分钟超算的费用可能就在百万级别”,关于这点,二楼回复中给出了一个回答,这里不赘述。
  第五,“至于给国外科研机构用嘛。

呵呵这可是国防科大建的计算机”,这里作者的逻辑是,因为是作为军校的国防科大造的东西,所以就不能给外国用。
这里(中国超级计算机天河一号远程服务好莱坞)是同样为国防科大造的天河一号用于好莱坞大片的渲染的介绍,这里(欧盟超级计算合作项目在津启动 天河一号成主角)是中国与欧盟超算中心在天河一号的基础上共同开展项目的介绍。
  于是最大的可能是在年内组装完毕,取得世界记录后就分拆成低级别的计算中心,降低成本和维护费用(至少可以关一部分省点电,每年空转的耗电量都至少是大千万级的),以期吸引点用户 - 可惜即便如此,也仍然不会有多大用武之地。
  “取得世界记录后就分拆成低级别的计算中心”,这么多么外行的说法啊!前文已经提到,超级计算机与计算机集群相比的优势在于它可以处理节点交互密集型的计算任务。
一楼作者认为这是计算机集群呢?仅仅是亚马逊提供云服务的平台呢?看来一楼作者是不知道了,现在拿了世界第一个天河二号还只是整个项目的一半而已,天河二号还要继续扩容,最终规模是现在的两倍左右。
“至少可以关一部分省点电,每年空转的耗电量都至少是大千万级的”表达出作者以为超级计算机一开就必须全开,一关就得全关的想法。
这个不多说了。
  同时国防科大也会在湖南组一套差一点的超算中心,湖南省出钱。
一机双卖,国防科大和Intel乐坏了。


  一机双卖确实是一机双卖,但不知道一楼作者知不知道,卖给国家超算长沙中心的超级计算机是天河1A的一个小型版,那台机器都已经运转了两年了,只是近期才要搬到湖南大学刚修好的超算中心而已。
这和天河二号完全是两码事。
  补充下信息,据说这套系统功率是3万千瓦(此贴新闻说1.7万千瓦,说3万可能是包括精密空调等设备),电费自己算。
第一,据说,是据谁说的?第二,天河二号”峰值功率24MW,即2.4万千瓦,而非3万瓦。
这包含了17.6MW的计算机功耗和6.4MW的散热功率。
第三,这是峰值功耗,只有满负荷运转时才能达到这个功率,一般待机时可以给待机机柜断电,因此一般会低于这个功耗。
当然,少是少了些钱,但这样算起来一年几千万应该还是有的。
小库提示

扫描下方二维码,访问手机版。