陈十一好像起初打算在清华搞那个计算中心?



所有跟贴·加跟贴·新语丝读书论坛http://www.xys.org/cgi-bin/mainpage.pl

送交者: bingo 于 2006-5-31, 11:01:25:

 
http://166.111.37.205/Construction-Education/Center/introduction/center-introduction.asp

关于成立清华大学

大规模科学与工程计算研究中心

的建议报告

(吴子牛,陈十一,金石,张东晓)

二〇〇二年九月二十二日

英文名称:Massive Computing Center for Science and Engineering (MCCSE)

内容提要

一、背景

1 科学中心计划

2 大规模科学与工程计算研究的作用与地位

3 国际上科学计算中心的发展情况

4 我校现有计算机条件与大规模科学与工程计算研究中心的关系

5 从航空航天对高性能计算模拟看我们建立中心的必要性

6 清华大学成立中心的前景与意义

二、中心的作用

1 总体目标

2 促进清华大学学科交叉与信息交流

3为计算科学与工程研究提供先进的计算技术和设备

4 培养高水平的年轻研究人员

5 为应用部门提供科学工程计算咨询,成为连接清华与社会的桥梁

三、研究计划

1 水资源研究,南水北调问题

2 数值奥运

3 大规模分子动力学和跨层次模拟

4 航天飞机返回地面的数值模拟

5 其它问题

四、中心的结构

1 硬件平台

2 人员与组织结构 (待商椎)

3组织形式(待商椎)

五、经费需求

六、中心建议人介绍

七、疑问回答

 

 

致谢:该建议报告,除中心建议人外,得到了机械学院过增元院长、符松副院长和力学系杨卫教授等人的大力支持,他们甚至还亲自提供了部分材料。中心建议人的部分学生和秘书参与了部分翻译和打印工作。

 

 

一、背景

1 科学中心计划

大规模科学与工程计算中心属于一种科技中心计划。在论述计算中心的背景之前,我们先对美国NSF资助的科技中心计划作一个介绍,以便能从更一般的层次理解计算中心的作用和地位,以及在清华大学建立该中心的迫切性。

1.1美国科技中心计划成立的背景

美国科技中心计划是在1987年由美国国家科学基金会(NSF)推出的一项科研计划。其目的是长期稳定地资助能将研究、教育和知识转移活动集成为一体的、以大学为基地的研究中心。它被称为集成合作伙伴计划。它在各大学、各学科之间、各研究所之间,甚至在社会各界(包括产业界)之间架起了桥梁,能实现集成创新的目标。

科技中心为人们提供了探索具有挑战性、复杂性的科研问题的机会,研究这些问题往往需要具备多学科的专业知识、高风险的举措、使用最先进的仪器和设施,以及需要长期的、高强度的经费支持。它能消除学科之间、大学与政府机构以及与产业界之间的传统障碍,创造了研究和教育领域中领导和管理的崭新模式。

建立中心的主要考虑是,未来大多数最激动人心的研究将不会发生在传统的自然科学学科领域,而是多学科交叉领域,研究人员必须具备更加广泛的专业知识,而获取这些知识并且有效利用这些知识来解决大型复杂问题的有效途径就是建立多学科研究中心。

NSF资助科技中心的三大目标是:

当研究计划十分复杂或解决这些问题的资源需求只能以校园为中心的研究中心来解决时(因为他们在规模、时间、设备设施方面有优势),提供探索科学技术的机会。
让来自大学、非营利机构、产业界和国家实验室的科研人员和学生能参加科研计划,以便增加专业人员的培训和就业能力,使他们认识到科学发现的潜在应用,同事建立一个增加在社会各界之间的知识转移的机制。
提供稳定长期的支持。

1.2国科技中心计划的发展与运作模式

科技中心计划实施十五年以来,已经成立了36个中心。

NSF对每个中心的资助强度为每年150-400万美元。除此之外,科技中心还吸引了其它政府机构和私营企业的配套资金。

中心在运行过程中,如果没有通过评审,就会被淘汰。通过评审的中心也会在运行十年左右被要求毕业(即不再得到NSF资助)。中心毕业后,往往会拥有一支兵强马壮的研究队伍和一定数量的高质量研究成果,完全有能力竞争申请来自其它资助单位的经费,不至于因NSF的断奶而饿死。通过科技中心计划的孵化,科技中心将长大成人,完全可以在竞争环境下进入良性循环,走上独立自主的发展道路。

1.3科技中心计划的作用

中国科技信息研究所张保明用三高总结了科技中心的作用:

首先,中心进行了高水平的研究与开发,科技中心的论文被引用率高出平均水平69%。论文作者来自产业界的非常多。
其次,达到了高质量人才教育的目的。到1995年,已经有762名大学教师参与了25个科技中心的工作,平均每个中心有30名教师参加。有500多名博士后及约1000名研究生参与了各中心工作,平均每个中心有21名博士后和40名研究生。
高效地促进了知识转移。通过推动研究成果的开发、利用和传播,促进了信息在研究中心和学术界产业界之间的双向流动。

2 大规模科学与工程计算研究的作用与地位

21世纪是信息科技的世纪,科学与工程计算是本世纪科学技术领域中最激动人心的一部分。

科学计算现在和理论、试验一样,成为科学研究的一种重要手段。随着高性能(Multi-teraflop)计算机的出现,通过计算机模拟,人们能够对物理参数超出现有试验能力与复杂度的各种情况进行研究,也能对那些在实验室无法实现的现象进行研究。可以说,在我们对科学现象的理解和对复杂工程与社会系统的建模等方面,计算机模拟正起着越来越重要的作用。

计算机模拟包括了多学科间的交叉研究。在今天,这种方法不仅被用来求解复杂数学和物理问题中出现的偏微分方程,还被广泛应用于复杂的社会、经济和大规模的工程系统,而这些问题采用传统方法是很难解决的。

虽然世界上已经有了许多科学与工程计算中心,但这一领域仍处于相当新的阶段,是科学研究的朝阳工业,具有巨大的开拓潜力。清华大学的中心成立后,将会为科学计算提供一个世界一流的研究与交流环境,并推动理工院系在科学与工程研究领域走向世界最前沿。

我们建议在清华大学成立大规模科学工程计算研究中心,利用海外杰出学者和清华自身在该领域的杰出人才,建立一个具有世界水平、对国家科学工程经济有重大影响的研究和交流基地。该中心的建立将使清华占据此科学研究最活跃领域之一的制高点,以拥有一流人才和设备而成为国家重点项目的有力竞争者,以丰富的人才资源为社会各界提供服务与咨询,并造就出一批一流的年轻研究人员,从而促进校内理工科研究人员的合作与交流,并加速交叉与新兴学科的发展。

 

3 国际上科学计算中心的发展情况

在美国、欧洲、日本和新加坡等地,中心作为连接科学、工程、数学和计算机科学的桥梁和纽带,已经成为一个日益发展壮大的综合多种学科的科学领域。在美国顶尖的50所大学中,除了那4个主要的由NSF(国家科学基金会)赞助的计算机中心(每年超过1500万美元)外,几乎每所大学都拥有自己的不同规模的中心项目。一般来说,中心作为一个独立的学院项目,是直接对院长负责的,并且有着自己的博士、硕士教育课程。

一直以来,中心就是一个能够吸引众多优秀大学毕业生的地方,一方面,中心为学生们提供了一个良好的进一步学习深造的环境,另一方面,中心也通过一批批学生的努力参与,不断的发展着自己,提高着自己解决日益复杂的科学工程问题的能力。中心的出现同时也引起了美国的一些基金组织,如NSF和DOE,对信息科学和计算科学等交叉领域的广泛关注。另外还有一点值得说明一下,各工业部门和国家实验室对中心的人才需求量是很大的。现在在校园内,中心已经在多个学科之间建立起了交叉研究项目,如工程类、艺术类、生物医学类、计算机类和环境科学类等,它们之间研究的开展已初具规模。

在UIUC,中心项目是由一个程序委员会负责的。这个委员会由CSE的主管主持,委员由每个参与院系指派一名代表担当。所有成员单位都要定期的举办一些系级会议。在这里,中心主要由工程院资助,但并不仅仅局限在院内的各个系。UIUC内参与到中心项目中的院系包括有:航空航天工程、大气科学、化学工程、建筑工程、计算机科学、电子与计算机工程、材料科学与工程、数学、机械与工业工程、原子能工程、物理和理论与应用力学。

斯坦福大学的中心项目始建于1987年,能够授予包括数学、计算机科学、运筹学、统计学、工程化学、工程力学和工程电子专业等多个院系在内的博士和硕士学位。这个项目建立的初衷,是由于学校意识到社会上对具有数学和计算机交叉知识的研究生有着广泛的需要,而当时的计算机科学主要依赖于对基础科学技术的应用。

应该指出的是,虽然中心已经存在了相当长的一段时间,但是从多方面看来,就科学和工程中的模拟技术而言,清华大学正处于一个相当关键的时刻。在过去的十几年中,模拟技术已经成为了生产、设计和决策中的一个重要组成部分,是从事科学研究的一种重要的基本工具。这和现阶段计算能力的大幅提高是密不可分的,我们现在可以解决许多复杂的实际问题,而这一切在多年以前还是不可能实现的。清华大学的中心成立后,必将能在燃烧、计算MEMS、纳米装置、飞行器设计、电子设计自动化、生物医学装置设计、计算生物学、计算化学、材料和图像处理等诸多方面的研究中起到重要的枢纽作用。

 

4 我校现有计算机条件与大规模科学与工程计算研究中心的关系

清华大学计算机系与同方开发了清华同方探索108等并行机群。部分单位已经购置了这种机器,同事也有不少单位自己动手搭建了规模或大或小的微机并行机群。这些机器运算速度一般在千亿次每秒以下。虽然针对某些问题发挥了十分积极的作用,但不能替代高性能机器用于大规模科学与工程计算。主要表现在如下方面:

运算速度达不到现在大规模科学计算所需要的每秒万亿次甚至几十万亿次以上的要求。
管理困难,各自经营。人力资源浪费很大。以工程力学系流体力学计算与分析实验室为例,通过百人计划经费购置了一台38CPU峰值速度约每秒500亿次的清华同方探索机群。结果因为没有人力集中管理,每位使用者都得单独摸索。并且机器对环境和气候要求比较高,所以最后实验室无法独立管理,不得不花高价委托给赛尔公司管理。
单独由计算机系发展计算机平台,往往因人员问题和学科本身问题,计算机平台的研制会局限于与所在的学科特点相关联,满足不了用作公共平台的要求。
 

5 从航空航天对高性能计算模拟看我们建立中心的必要性

大规模并行计算近几年发展迅猛,已应用于航空领域的气动分析与设计。波音公司已经应用大规模并行计算技术为商用和军用飞机设计服务,如在F-18E/F的设计中,采用大规模并行计算技术,使用了近5000万网格点进行全机流场CFD模拟,最终发现了中等攻角经常发生单侧机翼突然失速的原因,而这一现象在风洞实验中却一直无法重现。波音并预测在今后几十年内可实现全机的直接数值模拟。

我国航空领域的CFD(计算流体力学)研究已经取得了相当的成就,但在飞机设计中的应用水平,距离美国等先进国家尚有巨大的差距。究其原因,一方面在于目前CFD数值模拟的结果在精度、可信度等方面尚不能满足工程应用的要求,另一方面则是由于CFD模拟计算时间过长,尚不能达到飞机设计对气动力分析时效性要求。大规模并行计算一方面允许使用更为完备的数理模型,更为密集的网格点数,从而改善模拟的精准度,另一方面也可以提高计算速度,使设计者能够及时获得分析结果。

随着大规模并行计算技术以非常廉价的方式获得了计算数度和容量的成量级的突破,人们逐渐发现突破CFD对传统湍流模式的依赖,而直接进行能高保真地模拟湍流机理的大涡模拟乃至直接数值模拟研究已经成为湍流研究的必然趋势。欧洲于1997年-2002年开展了LESFOIL计划,通过对翼型的LES研究,摸清了LES在欧洲航空工业中的可行性及其对计算机资源的需求。美国政府自2000年开始资助以斯坦福大学为首的五所一流大学开展航空发动机整体的气动热力仿真,预计于2007年可完成全尺寸的以大涡模拟为基础的大规模并行数值仿真,届时计算速度也将由2000年的1TFLOPS扩展至100TFLOPS。

大规模并行计算近几年在国内也渐成气候,有关部门在硬件上的投入已见成效。并行计算软件也有一定发展。清华大学近几年的湍流模拟已经立足于一定规模的并行计算,在湍流模式研究、湍流的LES和DNS研究都具国内领先地位,有一定国际影响。在超音速流混合层的直接数值模拟研究中,网格点数已大达1400万。大规模科学与工程计算平台的建立必将使我校的湍流研究水平提高到国际先进水平。

6 清华大学成立中心的前景与意义

清华大学中心的重要职能之一就是开发适合于科学和工程计算的应用软件,为工业生产中出现的设计、控制及优化等问题提供最直接的咨询服务,并且建立起一支能够应用现有软件解决实际问题的一流的人才队伍。我们在这里提到的软件和计算机科学中的计算机软件并不是同一个概念,举例来说,待开发的这套软件中应包含有以偏微分方程的数值解法为基础的流体力学方法,有能够设计纳米装置的分子动力学方法,也应该有能够控制机器人运动的优化设计方法。

从事此项研究开发的最终目的是要建立起中国自己的技术应用软件和咨询业务,而这一领域,从本质上来说,现阶段在中国还处于空白状态。据估计在美国,每年由应用软件及其相关咨询服务所创造的价值高达上千亿美元。但目前在中国开发技术软件还存在两大不利条件:首先是中国现有的大多数公司,包括汽车行业和建筑行业,使用的技术软件和咨询服务均来自于欧美国家;其次是在中国还缺乏对技术咨询人才的培养与重视。尽管如此,在中国,应用软件行业的潜力仍是巨大的,而且现在面临的机遇也是极好的,对那些与国防建设有关的领域就更是如此了。据估计,中国每年仅就流体力学相关软件的花费就达到了一千万美元。

现在,通过电子商务与科学计算的结合,清华大学定将在应用软件的开发技术领域产生量的飞跃,并极有可能在发展中国家中取得领先地位。在当今这个科技、经济迅猛发展的时代,应用软件研究的成果商业化已成为一种不可避免的趋势。

 

二、中心的作用

 

中心包含两部分,一部分是计算机平台,另一部分是科学计算研究群体(含讲席教授团)。 计算机平台为公共平台,面向整个清华大学,用于解决各系独立引进的机器无法适应的大规模科学与工程计算问题。科学计算群体主要由讲席教授等骨干开展国际前沿科学计算问题研究并协调各系科学计算问题的交叉与合作。

 

1 总体目标

促进清华大学校内外多学科间的交叉研究与信息交流;
利用先进的计算技术及中心高水平研究人员参与并研究国家的重要项目;
为计算科学与工程研究提供先进的计算技术和设备;
培养高水平的年轻研究人员;
为应用部门提供科学工程计算咨询,成为连接清华与社会的桥梁

 

2 促进清华大学学科交叉与信息交流

由于科学与工程研究的需要,清华理工科研究人员均应用科学计算作为计算研究工具。本中心的建立,将以科学计算为纽带,加强不同学科的研究人员的交流与合作,从而有希望产生新的研究成果,并孕育出新的交叉学科研究领域。中心将以论坛及colloquium形式,请国外科学工程计算的权威人士作学术演讲,进一步活跃清华的学术气氛及不同学科的交流与渗透。

 

3为计算科学与工程研究提供先进的计算技术和设备

尽管清华有许多院系的研究人员以科学计算为主要研究工具,单凭一个院系的力量,难以支持目前增长的大规模计算模拟的需要。成立一个校级的中心,将以拥有最先进的计算技术和设备为全校的科研提供一个服务平台,使每位需要以计算机模拟为研究手段的人员享受最优越的计算条件及服务,从而大大增加清华师生的研究能力,为科研上的突破提供工具上的保证。

 

4 培养高水平的年轻研究人员

除拥有目前活跃在世界学术舞台的一流人才组成的讲席教授团外,中心亦将邀请一批国外优秀人才为访问及兼职教授。杰出的教授阵营及活跃的国内外学术交流将为中心的博士后、博士研究生提供优越的成长环境。此外,我们将与数学科学系及周培源应用数学中心合作,每年开设一批科学与工程计算的基础与前沿性课程(如物理、生物中的数学问题,现代科学计算方法,随机分析等等),使中心的年轻人员既有扎实的基础训练,又了解国际研究领域的最新发展,中心将成立国内第一,世界领先的科学计算人才培养基地。

 

5 为应用部门提供科学工程计算咨询,成为连接清华与社会的桥梁

 

三、研究计划

 

各院系对大规模科学与工程问题计算有各自的需求。例如,纳米技术的发展,需要用到分子动力学的方法。目前的计算条件,只能处理几万个分子。这永远满足不了要求。国家体育总局发布了科技奥运科研项目。数值奥运(交通、物流、人员疏散、火灾发展与扑灭、生物恐怖袭击)对计算机条件要求极高。水利系和汽车系分别提出了数值黄河与数值轿车的概念。

与我校有关的国家重大项目许多问题与大规模科学计算有关。比如,705专题所涉及的气动问题,就需要对全机进行大涡模拟,对大规模计算有不可替代的需求。另外,火灾科学973计划也涉及特殊火行为和扩散的数值模拟。所有这些,都是目前分散的计算条件无法解决的。

中心除了自然在上述问题中发挥不可替代的作用外,还可以组织一些前沿重大问题的研究。下面举几个例子。

1 水资源研究,南水北调问题

随着中国目前城市化和工业化进程的开展,优质水资源的短缺问题已经对地区社会、经济的进一步发展构成了严重的威胁。从基础建设的角度出发,对这一问题的解决势在必行,为此,中国政府正投入大量资金,加紧三峡坝区和南水北调等工程的建设。为确保工程的顺利实施,有必要就这些工程对地区生态环境的影响,和如何实现对新、老水资源的有效开发、利用和再分配作一个全面的分析。

近几年在中国,一方面需水量不断增加,而另一方面水质却在不断恶化。如何实现对水资源的有效管理成为摆在我们面前的首要问题之一。由于未经处理的工业废水和生活污水的大量排放,地表水和地下水的水质、水量都在迅速下降。优质水体的可用性将在很大程度影响工农业生产和人民的日常生活。

为了更好的管理现有的水资源,提高水资源的可用性,我们可以采用高性能的综合盆地、分水岭模拟技术。这项技术可以把水体的可用性和地域气候、地表水、地下水、植被、污染的传播等各种影响因素联系起来。但是具体操作起来要注意到,这些影响因素的发展进程在时间和空间尺度上存在着很大的差异,例如,对于气候因素的研究应基于20-50公里的规模,而对另一些现象研究,如河流-地下蓄水层-植物体系中三者的相互作用和地表-大气中水、能量的传播过程,模型必须要具有较高的分辨率(~1米)。要将模拟结果从局部扩展到整个地区,还需要采用一种放大处理,也就是要将各物理影响因素在比较粗糙的分辨率水平上进行总体匹配。将水体可用性的各影响因素联系起来并进行放大处理的技术是一个重大的科学挑战,对于解决研究水资源中遇到的不确定问题和预测工作也有着重要的意义。

2 数值奥运

中心对2008年北京奥运会的积极作用主要体现在两个方面:1、信息技术和数字奥运;2、体育科学与工程中的数值建模与模拟。

第一个研究方向主要涉及高性能计算在IT业、安全保障和绿色奥运诸领域内的应用。由于政治、经济、社会等诸多方面的影响,越来越多的组织部门参与到北京的奥运建设中来。很明显,如果我们现在能够把已有的一些奥运相关技术与高性能的并行计算技术结合起来,那么在奥运会的组织、建设和运转过程中,这些技术的应用水平就将得到巨大的提高。例如并行计算中的快速数据采集算法将会使身份验证和指纹识别工作进行得迅速而有效。再如对污染物传播过程的计算机模拟可以帮助人们在发生紧急状况的时候,如遇到恐怖袭击时,能够组织起有效的撤离和疏散。

第二个研究的重点包括对体育产品、体育设施的新型设计与改进,以帮助提高运动员的竞技水平。众所周知,在全球范围内,科学都对体育产生了巨大的影响。现在,许多国家都成立了专门的体育研究机构,旨在了解体育科学、提高运动员成绩。但是到目前为止,还没有哪个国家将高性能计算机模拟技术应用于体育领域。

我们有理由相信,借助于计算机模拟技术,我们肯定能够进一步提高运动员的运动水平,更加合理的使用体育设备,并且能够开发出更好的体育器材。

3 大规模分子动力学和跨层次模拟

目前,国际在大规模分子动力学计算的最高水平已经达到十亿原子量级;在简化的量子力学计算达到十万原子的量级;基于第一原理的计算也达到数百个原子的水平。在这样的计算规模下,可以对很多物理、力学和材料问题做出直接的定量描述。更为引人注目的是,可以用大规模计算作为“计算显微镜(Computational Microscope)而发现新的现象。如美国IBM公司利用其”白色巨型机“发现了超音速断裂的可能性,并通过十亿原子的计算而定量模拟了加工硬化及材料由韧变脆的全过程。通过适度规模的量子力学计算还可以定量表达量子点的行为。而我们现在的计算能力只能达到一百万原子的分子动力学计算和一百个原子的量子力学计算,成为我们在这一方面基础研究的主要瓶颈。我们原来在跨层次模拟方面具有一定优势,但由于计算手段的不足,在最近五年被人超过。因此,形成大规模计算手段是建设国际一流大学的当务之急。

4 航天飞机返回地面的数值模拟

随着我国航天事业的发展,对宇航卫星器的气动分析与设计将成为高科技领域的这一重要方向。由于航天卫星器飞行的高度已突破传统流体力学适应的范围,需要对稀薄气体的玻尔兹曼方程直接进行数值模拟。由于玻尔兹曼方程定义在相空间,其求解比流体力学的计算量大的多,因此对计算机设备的要求比普通民用与军用飞机要高的多,我们预计,随着CCSE的建立及超大规模计算机的引进,将使我们有能力从事此尖端领域的研究,从而为国家航天部门提供重要的设计数据。陈十一、金石教授多年来对玻尔兹曼方程有许多原创性工作,是国际知名的该领域的研究者,为此类问题数值方法的设计将提供技术上的指导。

5 其它问题

当然,还可以组织其他项目研究,比如沙尘暴问题的研究,数值奥运,生物组织的研究,多尺度物理与材料计算问题(MEMS, Nanotechnology)。

 

四、中心的结构

1 硬件平台

1.1 高性能计算的现状与未来

一提到高性能计算,人们就会想到当年美国的克雷机,国内的银河、曙光系列。高性能计算概念的外延有了新的拓展,不再是当年的“大盒子”,PC机群乃至Beowulf机群也成为现在高性能计算用户的选择;如果我们把眼光放远一点,网格计算(Grid computing)将在4-5年内成为高性能计算的代名词;在进一步说,十年以后,量子计算将走向实用,计算技术将发生根本的变革,比特以及字节(Byte)将被量子比特(qubit)取代。

1994年,美国航空航天总署(MASA)的戈达德(Goddard)太空飞行中心的科技人员建超了世界上第一组PC机群超级计算机,当时的目标只是达到1G(10亿)次浮点运算(GFLOPS),只是现在个人电脑的运算水平。当时达到这一水平的商用计算机价格是100万美元,研究人员用不起,只好自己动手攒,他们给自己攒的这台PC机群起了个名字:Beowulf,Beowulf是英国中世纪史诗中的一个英雄。5年前,攒一台PC机群高性能计算机只是美国NASA、加州理工学院喷气推进实验室、美国洛斯阿拉莫斯国家实验室的研究人员能干得,今天已经成为一种流行趋势,只要有钱,攒一台TFLOPs 的超级计算机不是难事。

美国政府对于某些国家出口高性能计算技术有明确的限制规定,中国也是其中之一。限制的基本单位是MTOPS(Million of Theoretical Operation Per Second,百万次理论操作每秒),在2001年以前,美国政府对高性能计算技术的出口限制在28,000MTOPS以下,而由10台CPU主频1.5G赫兹、双处理器的PC组成的机群性能就突破这一限制;2001年,这一限制提高到85,000MTOPS,10台CPU主频2.2G赫兹、4处理器的PC组成的机群性能就可以突破;2002年美国政府的限制又提高了到195,000MTOPS,这一限制比不上10台CPU主频,3G赫兹、8处理器的PC组成的机群性能。目前世界最高性能的计算机“地球模拟器”在日本,美国人希望到日本用这台最高性能计算机也受到限制。日本方面要求美国研究人员提供所有算法等资料才允许上机。美国人受不了这个气,研制千万亿次超高性能计算机已经提上议事日程。

在个人电脑领域居领先地位的德尔(DELL)公司在8月13日发布了其高性能计算机群(High Performance Computing Cluster HPCC)的增强方案,这一方案可以提供128结点的PC机群,支持采用双Intel至强处理器的DELL PC服务器,操作系统可采用Red Hat Linux 7.3 professional,8个节点系统的价格为75,000美元。

另一方面,著名的Cray(克雷)公司正在开发Cray XI超级计算机。8月15日,美国能源部宣布已经确定美国橡树岭国家实验室为测试Cray XI超级计算机的单位,如果测试成功,橡树岭国家实验室将购买这一系统。据称,Cray XI有32个处理器,是美国第一台把向量处理与大规模并行计算能力集成在一个体系结构里的超级计算机。日本的“地球模拟器”也具有向量处理能力。

美国能源科学办公室主任雷蒙.奥巴赫说,这一措施是美国高性能计算一揽子计划初始措施中的一项,这一揽子计划的目标是为美国科学提供从事21世纪科学研究必备的计算能力,确保美国科学研究的领先地位。Cray XI的目标是赶上并超过日本的“地球模拟器”。

超级计算机是分档次的,Dell的高性能计算机群同Cray XI代表了超级计算机发展的两个方面:前者是普及,商业化;后者是尖端,是真正的高精尖。

8月20日,美国圣迭戈超级计算中心(The San Diego Supercomputer Center,SDSC)与Entropia 公司宣布,两家单位合作,部署了名为DCGrid的PC网格计算方案。这一方案能够利用现有个人电脑的冗余计算能力,使得SDSC能够拥有前所未有的强大计算能力,以处理生物学以及分子的计算任务。据称,有150万台个人电脑参与了。

在此之前,8月19日,百时美施贵公司宣布与平台计算公司(Platform Computing Inc.)合作,为生命科学研究建设一个世界最大的企业桌面网格系统,百时美施贵公司位于美国北部的研究机构的数千台台式机与Linux服务器连接成机群,形成高效、高可用性、虚拟的计算基础设施,最终达到加速开发药物的目的。

这些信息向我们传达了一个信息,网格计算正在成为现实,至少在生命科学领域是如此。关于量子计算的科学新闻几乎天天都有,如果有兴趣可以到Google网站搜索,只要输入Quantum Computing,就可以查到大量有关量子计算的信息。

1.2 联想推出实测速度超过万亿次计算机

一台实测运算速度达到每秒万亿次以上的超级计算机,今天在北京中关村诞生。

此台由联想集团推出的、具有自主知识产权核心技术的超级计算机,运算速度可达每秒1.027万亿次,达到目前公布的世界前500名超级计算机排行榜中的第24位的水平,前23位的计算机均为日本和美国制造。

据联想总裁杨元庆介绍,9月初联想万亿次计算机将作为国家“973”重大项目“大规模科学计算研究”的重要装备,安装在中国科学院数学与系统科学研究院,用于计算流体学、石油地震资料处理、油藏模拟、气候模式计算、材料科学计算、DNA与蛋白质等。

杨元庆举例说,用高分辨率大气环流模式模拟全球一天的气候变化,在某些大型计算机上需要运行20小时,而联想万亿次机只需两分钟。再如,模拟某油田区域的剩余储油量几十年的变化规律,用现有大型机要算好几天,而用1/4规模的联想万亿次计算机只要4小时。

超级计算机的诞生标志着国内大型IT企业开始进入高性能研发工作的产品化、工程化具有重要意义,也将为我国高性能计算及其相关的基础科学研究带来更大、更宽广的发展空间。

超级计算机过去只是实验室里为少数科学家服务的工具,属于计算机领域的“阳春白雪”,但是现在已经广泛应用于经济、社会各个领域。美国至少一半的超级计算机服务于政府部门。随着移动通讯和因特网的迅速发展,超级计算机正在形成全球年产值上千亿美元的产业。超级计算机还被广泛应用于电影制作,《侏罗纪公园》和《泰坦尼克号》等影片都应用了超级计算机。壳牌石油公司运用超级计算机加以模拟集中处理,结果发明了一种激光探测地下油床的新技术,为这个公司发现了3亿桶原油。超级计算机已经成为继理论科学、实验科学之后,人类认识自然的第三大科学方法。

就在一周前,日本研制成功演算速度每秒85.1万亿次的超级计算机,成为目前世界上速度最快的计算机。

1.3 中心平台打算

建议中心将购置一台IBM-SP超级计算机或联想Cluster,拥有512个结点,峰值速度达到1 Teraflop,内存为512×2G。中心将利用升级方式,更新大型机器,避免现代机器发展迅速从而容易被淘汰的局面。硬件平台将交给原计算(机)中心管理。

2 人员与组织结构 (待商椎)

主任:1人 (面向国内外招聘)

副主任:1人 (由清华大学全职教授担任)

讲席教授职位一个:将组成3-4人的讲席教授团,每人每年在中心工作三个月左右

全职教授:3人

并行机器技术工程师:1-2人

整体工程技术员:1人

博士后:3-5人

博士研究生:5-10人

办公文秘人员:6人

访问教授:6人 各两月

组织形式(待商椎)
中心主任:负责中心整体规划和发展、对外关系,主任可以是兼职

副主任:协助主任负责具体规划的实施,副主任必须是清华大学全职教师

全职教授:每位全职教授必须负责一个重大方向的详细事务,聘任各自重大方向的访问学者、兼职教师,负责本方向与学校其他单位研究的交叉与合作。

教授委员会:教授委员会由中心正副主任、中心3名正教授和外聘四名正教授组成。

并行机器技术工程师:计算设备的建设的具体实施。

整体工程技术员:负责中心的整体场地建设、发展和维护。

文秘人员:正副主任和全职教授秘书各一名,中心接待秘书一名。

 

五、经费需求

清华大学支付12,000,000元,中心同时向包括教育部在内的上级单位寻求同等数量的配套资金,用于购买超级计算机。另外,每年给中心一定的运行费用。

中心还会向一些政府基金会寻求长期的经济支持,例如中国国家科学基金会,教育部,中国技术科学部等。要求持续资金保障的目的是为了能够参与大规模的国家重点研究。

 

六、中心建议人

(中心建议人简历见附件)

吴子牛 39岁,清华大学教授,教育部长江特聘教授,CFD Journal地区编辑。

陈十一 46岁,美国约翰-霍普金斯大学机械系系主任和北京大学教授,教育部长江特聘教授,Journal of Computational Physics副主编等多份国际刊物的编辑。

金 石 39岁,美国威斯康星(麦迪逊)教授,清华大学教育部长江讲座教授,Communications in Mathematical Science 主编及多份国际刊物编委。

张东晓 35岁,美国Los Alamos 国家实验室研究员,Water Resources Research和 Society of Petroleum Engineers Journal 副主编。

 

 

 

 

 

 

 

 

 

 

七、疑问回答

 

1对大型机器的需求问题:

并不是所有从事科学与工程计算的科研人员需要大型机器. 但许多学科

的突破需要大型机器, 例如计算流体学、石油地震资料处理、油藏模拟、气

候模式计算、材料科学计算、DNA与蛋白质.因此计算中心的机器是针对学

校对大型机器有需求的单位或个人设立的.由于中心具备学科发展和服务平

台双重作用,所以机器平台可以以中等规模起步.似需求再逐步扩充.

2软件移植问题:

某些在小型机器上运行良好的软件,移植到大型机器上需要做适当修改.如前

所述,大型机器只是为了解决小型机器没法解决的复杂问题.串行程序的并行

化已经有成熟的方式,只需要对程序做外围改造.这些改造工作与问题本身的

建模编程以及数据处理分析等相比是微不足道的. 做学位论文的绝大部分学

生,都有了将程序并行化的经验.因此,程序移植不会成为大家使用大型机器的

瓶颈.

3机器过时问题:

首先,机器过时对所有设备都一样,是不可避免的.另外以学校的力量来维持设

备升级,所节省的资金比分散到各单位要多得多.

4机器管理问题:

目前许多系有自己的小规模并行机器,力学系就有三台并行机器.基本上处于学生管理状态.以学校中心名义,委托计算机系集中管理大型设备,只会比各单位无组织的管理更好.





所有跟贴:


加跟贴

笔名: 密码(可选项): 注册笔名请按这里

标题:

内容(可选项):

URL(可选项):
URL标题(可选项):
图像(可选项):


所有跟贴·加跟贴·新语丝读书论坛http://www.xys.org/cgi-bin/mainpage.pl