joplatform 赚钱宝lsf 一般多少钱

比特客户端
您的位置:
详解大数据
详解大数据
详解大数据
详解大数据
IBM Platform LSF产品功能解析之三
关键字:Platform
   Platform LSF(Load Sharing Facility)产品系列是强大的工作负载管理平台,用于要求苛刻的分布式关键业务型环境。
  IBM Platform LSF附加产品
  IBM Platform LSF拥有一系列可选附加组件,旨在帮助其实现工作负载管理、进而提升用户生产效率。
  1.IBM Platform Application Center
  IBM Platform Application Center提供一套可自定制化Web界面,帮助用户管理作业并分析集群资源利用状况。它还提供一套易用性出色的使用界面,能够在无需编程的前提下实现作业提交。用户可以查看作业状态及作业结果,对作业进行操作(例如挂起或恢复),并对作业输入、输出及错误文件实现可视化。
  IBM Platform Application Center Jobs标签
  IBM Platform Application Center还提供一套信息仪表板,其中包含大量细节信息――例如集群健康状况以及集群性能统计结果,还包括每台主机的资源使用情况报告。大家可以创建一套机架配置以代表当前环境,并通过rackconfig命令将设备分配至合适的机架。
  最大支持能力:IBM Platform Application Center能够支持的最大机架尺寸为42U(不可配置)。
  IBM Platform Application Center仪表板
  该软件提供多种最为常用的应用程序模板,能够通过定制及发布实现解决方案的快速创建。除此之外,用户还可以针对具体需求创建属于自己的模板,从而使作业提交更简便、更快速、错误率更低。
  该产品提供一系列内置集群分析报告功能。这些报告涵盖集群改进过程中所涉及的各种常见类型。用户也可以通过Web界面创建自定义报告以满足特定需求。
  IBM Platform Application Center报告标签
  IBM Platform Application Center还可以与IBM Platform License Scheduler(简称LS)与IBM Platform Process Manager(简称PPM)相集成。这种集成化方案能够帮助用户以可视化方式掌握整个集群的许可使用情况。大家可以通过一套Web界面对作业流程执行以及触发流程进行监控;也就是说,大家能够以集中化方式控制LSF集群的全局状态。
  IBM Platform Application Center帮助文件
  2.IBM Platform RTM
  随着集群规模及工作负载的不断增长,集群管理员需要更为强大的工具以完成集群管理及监控任务,从而确定有可能对性能产生负面影响的各类问题。此外,管理员们还需要一款能够追踪集群各方面状态、同时又无需通过多种来源进行集群信息收集的工具。
  IBM Platform通过为IBM Platform LSF环境提供一套综合性工作负载监控、报告以及管理工具以解决上述问题:
  - 提供指向集群内工作负载与主机具体信息的访问途径;
  - 允许用户创建警告及多种图形类型;
  - 为日志可视化提供一套界面,允许用户通过GUI执行常见管理任务(例如重启LSF集群进程并对作业进行操作)――全部工作都通过同一套集中式Web界面实现;
  - 提供对多个集群进行监控的能力,从而帮助用户轻松对多种环境的管理并收集全局集群使用情况指标。
  备注: IBM Platform RTM利用Cacti作为功能丰富的图形化用户界面框架,旨在为用户提供面向特定LSF环境的监控、报告以及提示功能。Cacti是一套完全基于RRDTool的图形解决方案,由Cacti Group负责开发。LSF功能当中还包括Cacti插入机制,因此大家可以将二者协同运用。IBM Platform RTM除了提供特定LSF监控及报告功能之外,还包含开源Cacti工具包所具备的各类功能。如果大家熟悉Cacti,那么对IBM Platform RTM GUI也一定不会感到陌生。
  IBM Platform RTM当中的报告机制与IBM Platform Application Center有所不同,区别在于前者会提供关于集群各个方面的细节信息。在IBM Platform RTM报告当中,用户可以深入掌握集群资源的使用情况以及工作负载流程。最显著的实例就是与作业相关的交付信息。在IBM Platform RTM当中,大家可以对作业提交信息进行可视化处理。在IBM Platform RTM中,大家能够查看关于作业执行环境、作业状态历史记录、作业图以及主机曲线图等各类信息,从而直观了解作业的整个执行流程。而在IBM Platform Application Center当中,我们只能获得一小部分此类信息。
  IBM Platform RTM作业细节信息标签
  IBM Platform RTM能够帮助集群管理员处理以下任务:
  - 确定问题
  - 监控整个集群
  - 通过识别闲置资源并消除瓶颈以实现性能优化
  - 强化用户生产效率并改进服务水平
  - 规划能力
  - 降低成本
  重要提示:IBM Platform RTM 8.3尚不支持IBM通用并行文件系统(简称GPFS)监控。
  3.IBM Platform Process Manager
  IBM Platform Process Manager是一款工作负载管理工具,用于帮助用户创建并管理流程定义,从而实现及Windows环境下的业务流程目标。所谓“流程定义”,其中包含作业、作业组、子流程及其彼此间的关系(反映工作项目及其相互依赖性)。除了创建作业流程定义之外,用户还可以利用IBM Platform Manager进行作业调度。该工具由以下几部分组成:
  Process Manager Server
  Process Manager Client
  CProcess Manager Designer
  • Flow Editor
  • Calendar Editor
  CFlow Manager
  大家可以利用故障转移主机为Process Manager Server提供冗余机制。正如图4-10中的IBM Platform Process Manager组件所示。
  IBM Platform Process Manager组件
  用户可以在Process Manager Client当中创建作业流程定义,而后将其提交至Process Manager Server当中。Process Manager Server在流程当中管理作业依赖性并控制指向IBM Platform LSF主节点主机的提交操作。IBM Platform LSF主节点主机负责提供资源管理及负载平衡机制、运行作业并将作业状态返回至Process Manager Server。用户可以通过IBM Platform Process Manager监控作业流程状态,如下图所示。
  IBM Platform Process Manager数据流
  在Flow Editor当中,用户可以轻松实现对作业流程的图形化定义。在Flow Editor的帮助下,大家可以创建作业及其相互关系,并勾勒它们基于文件或者时间的依赖性。
  大家可以参阅下图所示的简单作业流程定义实例。
  IBM Platform Process Manager流程定义
  在Flow Editor当中,大家还可以基于预定义应用程序模板进行作业创建。IBM Platform Process Manager提供扩展功能,允许用户在无需进行大量编程的前提下向LSF环境之外的应用程序提交工作内容。大家也可以通过创建自己的应用程序模板,创建结果能够被转化为简单的用户界面、通过对作业进行可视化配置的方式促进作业提交。
  该软件为用户提供多种模板。其中zOS_Template.xml模板位于安装目录的JS_HOME/8.3/examples子目录之下。在被移动到JS_HOME/work/templates目录之下时,其就会以界面的形式为用户服务,详见下图。
  IBM Platform Process Manager应用程序定义
  在Calendar Editor(同样由Platform Process Manager提供)的帮助下,用户能够轻松进行日程计划定义。这些日程计划能够交由Process Manager使用,从而计算出哪些作业或者流程需要在哪些具体日期加以运行。此后,用户则能够利用Flow Manager查看并控制这些运行当中的流程,并在流程结束后获得历史信息记录。
  4.IBM Platform License Scheduler
  IBM Platform License Scheduler负责控制组织内部所共享的软件许可。它的作用在于帮助轻松实现更具灵活性的分层式许可共享策略。这些策略能够准确反映业务需求、带来理想的利用效率并贯彻企业的整个生产过程。
  IBM Platform License Scheduler与FlexNet产品协同运作,共同控制并监督许可使用情况。它能够与其它多台负责向不同集群提供许可的许可服务器相对接,如下图所示。
  IBM Platform License Scheduler许可分配
  IBM Platform License Scheduler管理许可令牌的调度工作,但它实际上也充当着负责提供许可的许可服务器。应用程序会不断从许可服务器处重新获取许可,而且这一过程并不涉及许可调度。IBM Platform License Scheduler与LSF集群中的作业进行交互。
  当作业需要许可以运行应用程序时,这套许可调度方案会提前为其提供令牌、从而支持应用程序的实际运行。LSF当中的可用令牌数量与FlexNet所提供的数量保持一致。处于运行状态的作业所使用的许可数量永远不能超过可用许可数量。下图所示为IBM Platform LSF如何在提交作业时与IBM Platform License Scheduler进行交互。
  IBM Platform License Scheduler作业提交
  许可令牌会根据由用户定义的一系列许可调度策略交付给作业。不过这些策略并不影响作业调度机制的优先级。作业仍然会依据IBM Platform LSF集群当中所定义的策略进行分配――也就是说,LSF策略的优先级高于许可调度策略。
  操作模式
  IBM Platform License Scheduler支持两种操作模式:
  - 集群模式(下图)专注于最大限度提升许可利用率(这种模式在IBM Platform License Scheduler 8.0中刚刚出现)。用户可以对单一集群的许可储备及共享策略进行配置,而不必再涉及其它集群。每个集群也都会出现作业(以及许可)的抢占情况。
  IBM Platform License Scheduler集群模式
  在集群模式下,许可令牌会在对应作业结束之后由LSF回收并重新使用(对于短期作业来说,这种方式能够带来更主的许可利用效率)。而在项目模式下,IBM Platform License Scheduler会在实际分配许可令牌之前检查各LSF集群上许可持有者的需求。这种对全部集群上全部项目进行信息收集与评估的方式会拖慢各个调度周期。
  -项目模式(下图)关注许可持有者所使用的许可。项目可以跨越多个集群存在。
  IBM Platform License Scheduler项目模式
  分配策略
  在IBM Platform License Scheduler当中,大家可以对不同项目或者集群之间的许可令牌共享策略进行配置。具体分配策略根据所采取的操作模式而有所不同:
  -集群模式:
  -静态分配策略:将一部分许可分配给集群,而且许可数量永远不会改变。
  -动态分配策略:将一部分许可分配给集群,但许可数量能够根据集群的实际需求作出改变。具体数量由预先定义的缓冲方案决定。
  项目模式:用户可以在集群模式下通过配置同时采取两种分配策略。具体信息请参阅第48页的“服务水平协议(简称SLA)保障调度”。
  C公平共享分配策略:将一部分许可分配给每一个项目,但根据实际需求决定所使用的许可数量。如果需求超出了可用许可数量,也仍然只能使用可用范围内的许可。不存在抢占机制。如果需要对许可进行重新分配,作业会停止运行、直到许可重新分配过程结束。
  C持有与抢占分配策略:将全部共享许可分配给每一个许可项目。所持有的共享许可也将得到分配。未使用的许可会被共享给任意需求。不过当实际需求超出可用许可数量时,持有共享会以抢占的方式得到回收。
  C主动持有分配策略:主动持有允许持有方自动根据项目活动情况作出判断。活动项目所占用的持有许可以百分比形式表现。每个项目实际持有的许可数量会根据项目本身的活动情况发生改变,用户能够将持有百分比调整至100%以上以支持活动持有者的作业流程。
  C非共享许可分布策略:一部分许可定为非共享类型。
  在未被使用时,这部分许可会处于保留状态而不会归入共享范畴。
  服务水平协议(简称SLA)保障调度
  SLA保障调度机制允许站点保障作业组运行过程中所必需的资源供应。作业可以根据用户、公平共享组、项目、许可项目、队列、应用程序配置文件或者以上几种分类方式的其它组合进行分组。许可资源保障机制只能在IBM Platform License Scheduler处于集群模式下时才能正常起效。SLA保障调度的配置流程在IBM Platform LSF当中实现。
  是否需要采用SLA保障调度机制取决于服务类以及资源池的配置情况。服务类允许作业访问受保障资源。作业可以在提交时明确被附加在某个服务类上,例如“bsub Csla服务类名称”。或者,作业也可以在特定条件下被自动附加到服务类当中。举例来说,如果某项作业由服务类定义,则在提交至特定项目时该作业将自动被附加至对应SLA。
  用户可以对服务类进行配置,从而限制被附加到对应SLA中的作业――例如从属于项目1的作业。服务类所使用的资源来自资源池。
  资源池为服务类中的作业提供最低资源保障。当用户对资源池进行配置时,用户在资源池内定义的共享资源会被分配给每一个经过定义的服务类。资源池能够为任意类型的资源提供保障机制(如下图)。
  IBM Platform License Scheduler保障资源池
  服务类能够利用来自不同资源池的资源,而资源池可以向不同服务类分配资源。图4-19所示为服务类SLA1使用来自资源池Guarantee Pool 1与Guarantee Pool 2的资源。Guarantee Pool 1资源池保证附加至SLA 1的作业能够使用50个插槽。而Guarantee Pool 2资源池则保证附加至SLA 1的作业能够使用50套许可。
  IBM Platform License Scheduler示例
  除了对服务类的共享资源进行配置之外,大家也能够以可选方式对未被使用的许可进行出借策略配置。出借机制可能被限制为只面向短期作业。大家还可以限制出借策略,从而确保保障性资源处于负载挂起状态。
[ 责任编辑:子叶 ]
去年,手机江湖里的竞争格局还是…
甲骨文的云战略已经完成第一阶段…
软件信息化周刊
比特软件信息化周刊提供以数据库、操作系统和管理软件为重点的全面软件信息化产业热点、应用方案推荐、实用技巧分享等。以最新的软件资讯,最新的软件技巧,最新的软件与服务业内动态来为IT用户找到软捷径。
商务办公周刊
比特商务周刊是一个及行业资讯、深度分析、企业导购等为一体的综合性周刊。其中,与中国计量科学研究院合力打造的比特实验室可以为商业用户提供最权威的采购指南。是企业用户不可缺少的智选周刊!
比特网络周刊向企业网管员以及网络技术和产品使用者提供关于网络产业动态、技术热点、组网、建网、网络管理、网络运维等最新技术和实用技巧,帮助网管答疑解惑,成为网管好帮手。
服务器周刊
比特服务器周刊作为比特网的重点频道之一,主要关注x86服务器,RISC架构服务器以及高性能计算机行业的产品及发展动态。通过最独到的编辑观点和业界动态分析,让您第一时间了解服务器行业的趋势。
比特存储周刊长期以来,为读者提供企业存储领域高质量的原创内容,及时、全面的资讯、技术、方案以及案例文章,力求成为业界领先的存储媒体。比特存储周刊始终致力于用户的企业信息化建设、存储业务、数据保护与容灾构建以及数据管理部署等方面服务。
比特安全周刊通过专业的信息安全内容建设,为企业级用户打造最具商业价值的信息沟通平台,并为安全厂商提供多层面、多维度的媒体宣传手段。与其他同类网站信息安全内容相比,比特安全周刊运作模式更加独立,对信息安全界的动态新闻更新更快。
新闻中心热点推荐
新闻中心以独特视角精选一周内最具影响力的行业重大事件或圈内精彩故事,为企业级用户打造重点突出,可读性强,商业价值高的信息共享平台;同时为互联网、IT业界及通信厂商提供一条精准快捷,渗透力强,覆盖面广的媒体传播途径。
云计算周刊
比特云计算周刊关注云计算产业热点技术应用与趋势发展,全方位报道云计算领域最新动态。为用户与企业架设起沟通交流平台。包括IaaS、PaaS、SaaS各种不同的服务类型以及相关的安全与管理内容介绍。
CIO俱乐部周刊
比特CIO俱乐部周刊以大量高端CIO沙龙或专题研讨会以及对明星CIO的深入采访为依托,汇聚中国500强CIO的集体智慧。旨为中国杰出的CIO提供一个良好的互融互通 、促进交流的平台,并持续提供丰富的资讯和服务,探讨信息化建设,推动中国信息化发展引领CIO未来职业发展。
IT专家新闻邮件长期以来,以定向、分众、整合的商业模式,为企业IT专业人士以及IT系统采购决策者提供高质量的原创内容,包括IT新闻、评论、专家答疑、技巧和白皮书。此外,IT专家网还为读者提供包括咨询、社区、论坛、线下会议、读者沙龙等多种服务。
X周刊是一份IT人的技术娱乐周刊,给用户实时传递I最新T资讯、IT段子、技术技巧、畅销书籍,同时用户还能参与我们推荐的互动游戏,给广大的IT技术人士忙碌工作之余带来轻松休闲一刻。
微信扫一扫
关注Chinabyte新闻资讯 >
IBM Platform LSF产品功能解析之一(2)
作者: 佚名
上图展示了如下步骤:
1. 提交一份作业
从LSF客户端,或者是一个运行bsub命令的服务器上提交一份作业,当提交这份作业时,如果不指定哪个队列,这份作业就会被提交到系统默认的队列中,作业在队列中等待安排,这些作业处于等待状态。
2. 调度作业
后台的主进程mbatchd将处理队列中的作业,在一个预定的时间间隔里将这些作业按设定的计划,传递给主调度进程mbschd。
主调度进程mbschd评估这份工作时,根据作业的优先权制定调度决策、调度机制和可利用资源。主调度进程选择最佳的主机,在哪里作业可以运行,并将它的决策返回给后台主进程mbatchd。主负载信息管理进程(LIM)收集资源信息,主LIM与mbatchd主进程交流这些信息,反过来mbatchd主进程使用之前交流信息支持调度决定。
3. 分配作业
Mbatchd主进程一收到Mbschd发过来的决定,立即分配作业到主机。
4. 运行作业
从属批处理进程(sbatchd),从Mbatchd主进程接到要求,为这份作业创建一个子Sbatchd和一个执行环境,通过使用一个远程执行服务器开始这个作业。
5. 返回输出
当一个作业完成时,如果这个作业没有任何问题,它处于一个完成状态。如果有错误作业无法完成,这份作业处于退出状态。Sbatchd传达作业信息,包括错误提示和给Mbatchd的输出信息。
6. 给客户端发邮件
Mbatchd通过邮件给提交主机反馈作业输出信息、作业错误、提示信息、作业信息。
调度程序的特点
平台有一套先进的特点:
公平竞争调度
基于拓扑结构的调度
并行作业和串行作业控制
高级资源预留调度
饥饿作业调度
许可证调度
服务协议满足调度
绝对优先级调度
应用程序断点和恢复
作业array调度
自定义调度器插件
平台的基础结构是为关键性的组件提供故障容错而设计的,有助于从一个故障中恢复过来,具体工作调度如下:
如果一个主程序不能再用,另一个候补主程序接管任务。在主程序和候补主程序必须通过工作目录共享来协同工作。
2. 节点和节点组
当节点或者节点组不能工作,不可获得时,只有在其上运行的作业受到影响(重新拍发,失败退出,会根据提交时的设置来反应)。
作业提交时可以定义为可重新运行模式,这样当作业失败时,可以重新运行。
或者在作业提交时定义了checkpoint,这样当作业重新运行时会从断点处继续运行。
LSF为这些组件提供了故障容错,一个LSF集群可以在部分网络故障时将工作网络隔离运行。容错取决于系统日志记录档,这个记录档在系统中记录了每一步操作。
不可否认,IBM Platform LSF平台使用内部的用户管理机制,也为第三方安全机构的整合提供了安全插件,例如轻量级目录访问协议(LDAP)、开放的安全系统认证(Kerberos)、活动目录(Active Directory)。
对于IBM Platform LSF 平台集群的安全性,有两个步骤要求:首先,检查用户的密码是否有效,然后检查用户的权限。在IBM Platform LSF平台上,可以创建一个自定义的可执行文件(eauth),可以为用户、主机和后台程序提供外围的身份认证。
在IBM Platform LSF平台的客户终端和服务器之间的认证数据流中,这些机制提供了一个安全的转移数据,通过创建自己的自定义可执行文件,可以设定集群的安全要求。
多集群支持
IBM Platform LSF 平台提供了多集群支持,不同的集群在不同的位置上,可以通过单一的Platform LSF来进行管理。这个方法使负载管理和集群管理变得容易,也使得基础构架获得高度可扩展性,多集群使得用户可获得更多的资源,提高生产率、资源利用率和性能。
作为强大的工作负载管理平台,用于要求苛刻的分布式HPC环境,它提供智能的策略驱动的调度功能,支持利用所有计算基础架构资源并确保最优的应用程序性能。
【编辑推荐】
【内容导航】
&第 1 页: &第 2 页:
李雪丽互动关注领域最近文章
了不起的IT经理
论坛与活动
我们的团队
如果您非常迫切的想了解IT领域的最新产品与技术信息,那么订阅邮箱将是您的最佳途径之一。
本网站依据国家相关规定准备了相应的稿酬,但由于客观原因无法支付。如您是这篇文章或图片的著作权人或其他权利人,请与本网站联系。本网站在确认您的身份后将予以支付。
如果您有任何其他意见,请与本网站联系,
本网站将在进行核实后24小时内采取相关措施。谢谢合作!
Copyright&2005- 版权所有 未经许可 请勿转载
北京市公安局海淀分局备案编号:号Platform LSF让科技局拥有100%的计算利用率_数据中心_服务器存储_it产品与服务_赛迪网
Platform LSF让科技局拥有100%的计算利用率
新加坡科技局(A*STAR)致力于推动和促进对新加坡来说意义重大、影响深远的世界级科学研究。作为东南亚规模最大的政府资助的研究机构
发布时间: 15:27&&&&&&&&来源:&&&&&&&&作者:云中子
【赛迪网讯】新加坡科技局(A*STAR)致力于推动和促进对新加坡来说意义重大、影响深远的世界级科学研究。作为东南亚规模最大的政府资助的研究机构,A*STAR监管14家生物医学、物理学和工程研究机构,并为行业合作伙伴提供智力资本、人力资本和产业资本,从而支持新加坡的主要经济群落。A*STAR还支持众多大学、医院和研究中心的研究工作,并与其他的地方和国际合作伙伴进行合作。
  资源不够 用户不满
  高性能计算(HPC)技术为A*STAR各项计算密集型研究提供了有力支持。尽管多年来A*STAR不断地增强硬件能力、确保软件环境的一致性,但没有足够的计算资源来满足众多用户和研究项目的需求,导致用户极度不满,却一直影响着A*STAR的发展。A*STAR需要一款全球领先的调度器以最大限度地利用现有资源,提高整个计算资源的利用率。
  A*STAR的计算研究中心主任Marek Michalewicz博士说:“我们有许多不同的机器,每个机器装有不同的操作系统和调度器。我们渴望在所有计算机平台上安装单一的工作负载调度器,从而可以迅速而轻松地管理和移动作业。我们要寻找市面上最优秀的工作负载调度器。”。
  最优化的解决方案
  A*STAR考察了多个不同的解决方案,最后选择了Platform LSF。Platform LSF是是业界领先的最为广泛使用的工作负载管理软件,在在可靠性、响应时间、可操作性、可维护性等方面有较大的优势。
  作为强大和全面的工作负载管理软件,Platform LSF能以动态调配的方式运行研究人员的应用软件,它提供的负载调度功能让A*STAR充分利用服务器集群,提高服务器集群利用率。
  Marek Michalewicz博士继续说:“我们认为,Platform LSF无疑是最优化的解决方案。对新加坡的许多组织机构来说,Platform LSF是首选的调度器,我们也认识到了它有望为A*STAR带来的好处。”
  接近100%的利用率
  由于Platform LSF充当了面向所有计算平台的统一工作负载调度器,A*STAR很快就发现资源利用率得到了提升。Marek Michalewicz博士接着说;“Platform LSF对我们的用户社区来说最合适不过了。它不仅使得移动和调度作业极其容易,还意味着需要新资源时,我们可以很迅速地提升新资源的利用率。在短短五六周内,这个利用率就有望提升到高达100%。”
  借助Platform LSF,Marek Michalewicz博士及其团队得以确保合理的资源分配给了合理的用户,实现了效率最大化。同时,简化的作业提交大幅缩短了设置时间、减少了操作错误,这意味着可减少进行管理的时间,增加进行研究的时间。
责任编辑:云中子
关键词阅读:
1(共条评论)
2(共条评论)
3(共条评论)
4(共条评论)
5(共条评论)
据戴尔大中华区企业方案和联盟策略部企业技...
联系我们:
广告发布:
方案、案例展示:
京ICP000080号 网站-3
&&&&&&&&京公网安备45号Platform LSF让新加坡科技局拥有100%计算资源利用率
Platform LSF让新加坡科技局拥有100%计算资源利用率 时间: 17:12:05作者:CNET科技资讯网文章来源:CNET科技资讯网 本文关键词:
没有足够的计算资源来满足众多用户和研究项目的需求,影响着新加坡科技局(A*STAR)的发展。A*STAR需要一款全球领先的调度器以最大限度地利用现有资源,提高整个计算资源的利用率。在采用了Platform LSF后,A*STAR迅速地提升了资源的利用率,实现了效率最大化,同时,简化的作业提交大幅缩短了设置时间、减少了操作错误,这意味着可减少进行管理的时间,增加进行研究的时间。
新加坡科技局(A*STAR)致力于推动和促进对新加坡来说意义重大、影响深远的世界级科学研究。作为东南亚规模最大的政府资助的研究机构,A*STAR监管14家生物医学、物理学和工程研究机构,并为行业合作伙伴提供智力资本、人力资本和产业资本,从而支持新加坡的主要经济群落。A*STAR还支持众多大学、医院和研究中心的研究工作,并与其他的地方和国际合作伙伴进行合作。
资源不够 用户不满
高性能计算(HPC)技术为A*STAR各项计算密集型研究提供了有力支持。尽管多年来A*STAR不断地增强硬件能力、确保软件环境的一致性,但没有足够的计算资源来满足众多用户和研究项目的需求,导致用户极度不满,却一直影响着A*STAR的发展。A*STAR需要一款全球领先的调度器以最大限度地利用现有资源,提高整个计算资源的利用率。
A*STAR的计算研究中心主任Marek Michalewicz博士说:“我们有许多不同的机器,每个机器装有不同的操作系统和调度器。我们渴望在所有计算机平台上安装单一的工作负载调度器,从而可以迅速而轻松地管理和移动作业。我们要寻找市面上最优秀的工作负载调度器。”。
最优化的解决方案
A*STAR考察了多个不同的解决方案,最后选择了Platform LSF。Platform LSF是是业界领先的最为广泛使用的工作负载管理软件,在在可靠性、响应时间、可操作性、可维护性等方面有较大的优势。
作为强大和全面的工作负载管理软件,Platform LSF能以动态调配的方式运行研究人员的应用软件,它提供的负载调度功能让A*STAR充分利用服务器集群,提高服务器集群利用率。
Marek Michalewicz博士继续说:“我们认为,Platform LSF无疑是最优化的解决方案。对新加坡的许多组织机构来说,Platform LSF是首选的调度器,我们也认识到了它有望为A*STAR带来的好处。”
接近100%的利用率
由于Platform LSF充当了面向所有计算平台的统一工作负载调度器,A*STAR很快就发现资源利用率得到了提升。Marek Michalewicz博士接着说;“Platform LSF对我们的用户社区来说最合适不过了。它不仅使得移动和调度作业极其容易,还意味着需要新资源时,我们可以很迅速地提升新资源的利用率。在短短五六周内,这个利用率就有望提升到高达100%。”
借助Platform LSF,Marek Michalewicz博士及其团队得以确保合理的资源分配给了合理的用户,实现了效率最大化。同时,简化的作业提交大幅缩短了设置时间、减少了操作错误,这意味着可减少进行管理的时间,增加进行研究的时间。
上一篇:下一篇:
&&&& 分享到:
您看到此篇文章时的感受是:
的相关文章的相关文章
最受关注的文章:
最新更新文章:
科技疯?数码

我要回帖

更多关于 ibm platform lsf 的文章

 

随机推荐