关于我们 中心资源 中心业务 上机服务 应用成果 最新动态
               
常见问题            

 
 
技术服务工程师
如您有任何上机方面的技术问题,请联系上海海计信息技术有限公司技术与服务部相关技术服务工程师:
 
姚仲寅  基础科学应用技术支持
电话:86-21-61872210
Email:zyyao@ssc.net.cn
 
范怀良  工程与工业应用技术支持
电话:86-21-61872208
Email:hlfan@ssc.net.cn
 

丁峻宏  技术与服务部经理
电话:86-21-61872207
Email:jhding@ssc.net.cn

 
 
科学计算常见问题:
 

>>上机基础
1.我对Linux不熟,急需进行计算工作,能使用上海超算的机器吗?

可以,有两个办法:
(a)可登录Xfinity,我方开发的一个借助网页登录的平台工具,供您进行一些科学和工程计算软件的使用。完全图形化界面,使用方便。
(b)联系相关我方技术服务人员进行沟通。一般的计算任务不涉及复杂的命令行应用。


2.主机是24小时不停运转的吗?万一停电,已运行的程序怎么办?
一般情况下,主机是7×24小时运转。为确保机器可以24小时正常稳定安全高效运行,我方制定了两个措施:
(a)一整套周密详细的维护计划。主机每年1-2次停机维护。主机停机维护信息会通过上海超级计算中心网站(www.ssc.net.cn)和用户邮件提前通知,以便用户做好准备。
(b)针对停电这种突发情况。主机采用双路供电,一个出现问题后,另一个会自动切换。在两路供电均无法工作的情况下,会启动UPS系统供电,但是UPS的支撑时间很短,仅供紧急关机做准备。
系统断电后,正在运行的程序将中断,但用户数据一般情况下不会丢失。但特别建议建议用户对所运行的程序和重要数据进行定期或专门备份,以免丢失。主机不应作为用户数据的长期存放地。


3.是不是我计算时用的核数越多,题目算的速度越快?
不一定,这需要根据您的程序来定。每个程序都有“阈值“,超过一定的核数,损耗反而大大上升,运算速度会下降。


4.作业运行时间有没有限制?
我方对用户作业运行的时间没有限制。


>>主机登录
1.如何远程登录上海超算,上传下载数据?

首先登录上海超算的VPN页面vpn.ssc.net.cn,输入自己的VPN账号和密码;
然后选择“主机应用“,点击”开始VPN客户端“,连接到上海超算VPN服务器;也可登录上海超算的VPN页面vpn.ssc.net.cn后,点击“官网最新客户端软件下载链接“,下载相应版本的客户端软件进行安装使用。
VPN登录完成以后即可通过putty、Xshell等终端登录工具连接到上海超算的主机上;
要进行数据传输也可使用FileZilla、FLASHfxp等FTP工具上传下载。


2.我是Linux/MacOS用户,登录到上海超算主机有什么不同吗?
同样需要先登录VPN页面,但需下载客户端,如下图所示。登录成功后会看到上述页面,点击“官网最新客户端软件下载链接“,即会出现如下页面,Linux/MacOS用户可以据此来下载客户端,并按使用手册来安装、使用。
完成后Linux用户进入命令行界面,使用telnet进行登录:telnet 192.168.235.10
按提示输入用户名、密码 即登录成功。
MacOS用户同理,进入命令行界面使用telnet完成登录。


3.我的登录、传输速度很慢,如何解决?
(a)联系您的网管,确定您的网络环境稳定;
(b)确定您有足够的带宽连接互联网(具有较快外网或校外网连接和下载速度);
(c)可尝试登录指定的VPN站点(一般情况下,系统会根据您的IP地址自动选择较快的VPN站点);
中国科技网用户请登录VPN:vpncst.ssc.net.cn
教育网用户请登陆VPN: vpncer.ssc.net.cn
(d)查看您是否正在使用其他的VPN工具,或锐捷客户端等,此类工具的使用可能会影响和上海超算的网络连接;
(e)可联系您的网管,确认您的网络环境是否支持IPV6,上海超算有专用IPV6登录站点;
(f)联系我方技术服务人员协助解决您的问题。


4.登录之后我发现无法使用wget,git等命令进行下载,这是为什么?
出于安全考虑,主机无法连接外部网络进行wget等下载、软件包更新操作。


5.我有大量的数据需上传/下载,通过网络很难完成该怎么办?
您可以直接将数据盘快递给我方技术服务人员,我们会帮助进行上传/下载工作并将数据盘快递回去。


>>主机使用
1.我如何在主机上安装软件?

可以,有两个办法:
(a)如果您有源码包,可联系我方技术服务人员协助安装;
(b)常用的开源软件,主机已有预先编译好的版本,可联系我方技术服务人员协助安装;
(c)用户须自行负责相关软件的版权问题。


2.我想在主机上自行编译软件,需注意哪些问题?
(a)首先确定您的软件的系统要求、编译器版本要求、依赖的软件包,主机上已预装了一部分工具软件,可联系我方技术服务人员获得相关信息;
(b)设置好编译环境,准备好软件包,登录到主机的编译节点来进行编译测试;


3.我发现主机的编译器版本很低,无法满足我的需要,怎么办?
主机出于系统稳定性、可用性的需要,编译器和库文件的更新周期较长,因此建议您:
(a)联系我方技术服务人员,或者自行在目录下安装编译器和其他工具软件,注意需在.bashrc里设置相应的路径;
(b)一些系统底层的api如glibc的版本无法进行更新。


4.我的软件和输入文件已准备好,如何在主机上进行计算?
请阅读用户上机手册或联系我方技术服务人员为您进行上机指导培训。


5.为什么我的作业总是排队(PEND)?
作业提交后,可通过bjobs命令查询账号本身提交作业的情况。PEND意为已提交系统运行的作业正在等待资源,尚未进行运算。原因有如下几类:
(a)您账号空闲的资源授权数(一般为CPU授权数,即申请账号时被授予的CPU权限数目与您账号正在占用(包括已预约的资源)的CPU总数之差)不足以运行您的下一个排队等候的作业。您可以继续排队等候账号中的其他作业结束,或终止自己正在运行的作业以空出资源授权数。
(b)作业申请使用的队列资源不足,没有足够的CPU供新作业使用,在其他作业运行结束后,系统会根据队列的调度策略对该队列所有排队作业进行统一调度。您可以继续排队等候,或使用其他队列。
关于队列的排队策略以及当前队列资源负荷,可以参考用户使用手册。
(c)一些特殊设置,如想在score队列中独占节点,或是想提交到某特定节点等。


6.正在运行的作业,我如何查询其状态?
查看一般的状态使用bjobs命令,获取详细信息可使用”bjobs -l”;
另外一般软件都会有输出文件,请密切关注您提交作业所在的目录是否有文件的更新。


7.如何知晓我的作业是否正常结束?
作业终止的时候系统会发送一个以output开头的文件到您提交作业所在的目录下,您可以查看该文件的输出信息来确认作业是否正常结束,如果作业异常终止,一些错误信息也会报告在output文件里。此外,您也可以查看您使用的计算软件的输出文件来进行确认。


8.我的作业报错了该如何处理?
若您无法判断出错原因,请保留报错作业所在目录下的所有文件,将报错作业的作业号和所在目录反馈给我方技术服务人员,我方技术服务人员将协助您进行分析和处理。


9.登录主机后,用户账号下操作响应较慢或无响应是什么造成的?
可能的原因如下:
(a)外部网络速度慢导致操作响应慢;
(b)系统繁忙或故障导致响应较慢或无响应;
(c)操作命令本身需要一定时间执行完毕。如du、more、cat较大文件等。

 
 
工程计算常见问题:
 

1.如何登录超算中心的主机?
中心为工程计算用户提供的计算资源为“蜂鸟“机群,用户可直接通过Xfinity平台入口登录(http://Xfinity.net.cn),输入账号和密码后进行相应操作。
Xfinity计算平台的功能和使用介绍可参见相应的用户手册


2.上海超算中心工程软件有哪些?工程软件使用的硬件资源有多少?
上海超算拥有大多数目前主流的工程软件,如结构力学中的LS-DYNA, Hyperworks,MSC.Nastran,Abaqus,Ansys等,流体力学中的Fluent,CFX,Starccm+等。为方便不同用户使用,同一软件也部署了多个版本。
超算中心会根据不同软件用户的日常使用需求,定期进行对应硬件与软件资源的调整,具体硬件和软件信息可查看网站中“中心资源”一栏,或联系我方技术服务人员进一步咨询。


3.常见的工程软件是否支持调用用户的子程序?用户自编译独立运行程序呢?
上海超算中心针对需要调用用户子程序的软件预留了相关的窗口界面,对于使用Linux下命令行方式提交的作业,也设置了相应的参数,用户可以方便快捷的提交作业。
在蜂鸟计算平台上也开设了特殊队列专门支持用户自编译程序的使用。


4.用户远程通过平台上传下载数据时,对IP和端口有无限制?
凡是能够通过外网访问Xfinity计算平台的用户都可以采用远程方式上传下载数据,但用户IP访问需要得到企业IT部门协助,以事先开通Xfinity平台所要求的端口权限。


5.Xfinity的操作界面友好性如何?可否通过xfinty进入命令行模式?
对于linux基础较薄弱的用户来说,通过Xfinity平台提交作业方便快捷,Xfinity集用户管理、项目管理、提交作业、文件管理、命令行、作业管理与监控于一体,具有良好的可视化、清晰的界面、方便的操作,目前越来越多的工业企业和工程计算用户选择了Xfinity平台。
Xfinity平台也提供了进入命令行模式的渠道,用户可以采用先登录Xfinity平台再进入命令行模式的方式,来代替传统的通过VPN连接内网进入命令行的方式。


6.一般的工程计算用户申请多少硬件资源进行计算比较合适?
针对不同行业领域的工业用户、使用不同的软件队列、建立规模不等的计算模型,都对使用硬件资源的最佳匹配有很大关系,具体可联系咨询我方技术服务人员。


7.使用Xfinity平台对浏览器有无限制?
建议用户使用IE、Firefox、Chrome等主流浏览器。使用主流浏览器不仅安全性高,而且对Xfinity平台的兼容性好。如果使用IE浏览器,建议使用IE8~IE11之间的版本。


8.提交计算后,怎么来判断作业的不同运行状态?
有几个最常见的Xfinity平台作业状态显示关键词:
PENDING――表示作业已经提交,但处于排队状态中;
ACTIVE――表示作业处于正常计算状态中;
TERNINATED――表示用户自行中断作业;
DONE――表示作业正常结束;
EXIT――作业状态显示为exit的原因很多,多数为异常中断作业,比如模型在计算时发散、作业初始化错误、license异常等等。如果用户发现作业出现类似状态显示,而自己无法判定原因时,可联系我方技术服务人员共同查找分析原因。


9.可否支持批处理作业提交?
经我方安全评估通过,可以开放命令行权限以支持用户利用脚本进行批处理作业提交。但对恶意使用脚本占用硬件资源的用户作业,我方有权予以随时处理。


10.什么作业在本地Windows环境下可正常计算,上传至超算主机linux环境下无法计算?
此类问题需要调试以排查具体原因,如软件版本差异、并行模式区别、文件格式转化、或者文件传输过程中异常中断造成的文件数据缺失等,建议联系我方技术服务人员一起查找问题。


11.如果远程下载数据较慢,是否可通过远程图形的方式进行前后处理工作?
我方已部署远程图形工作站和数款常用工程计算软件,以方便用户在特殊情况下在远端开展计算结果的快速前后处理工作。具体使用情况请咨询我方技术服务人员。

 
 
用户技术培训问题:
 

1.贵单位有无用户培训?涉及哪些内容?费用如何
上海超级计算中心每年第四季度会组织一次用户培训,时间约为1~2日,课程分别面向基础科学研究/工程与工业计算两个领域的上机用户。常见培训内容请参见“文档与培训”一栏。
正式用户有免费培训名额。


2.如何联系参加用户培训?
我方正式上机用户,可联系技术服务人员了解详情,提前预约。
非我方正式上机用户,届时请关注网站发布的通知公告,或直接联系市场专员徐小姐以了解最新动态(Tel:86-21-61872203;Email:wyxu@ssc.net.cn)。

 
 
  • 沪ICP备05062382
  • Copyright @ 2002-2005 Shanghai Supercomputer Center All Rights Reserved
  • 电话:021-61872222 传真:021-61872288
  • 地址:上海市浦东张江高科技园区郭守敬路585号  邮编:201203