打造坚实的平台 迎向开放
目前,清华大学云存储只限于在学校内部使用,同时在全国七八个大学和一些软件园区中使用,并没有向社会开放。武永卫教授谈到,其主要原因是云存储是以数据为核心的应用,所以对网络的要求比较高,校园网提供了一个很好平台和网络环境,为云存储的使用提供了有利的条件,创造良好的用户体验。另外,也是出于对数据安全性和敏感性的考虑。
谈到对未来的发展规划,武永卫教授表示:“我们希望把不同区域的云存储互相链接起来,比如说上海高校的学生,可能加入清华的某一个社区,这样大家可以产生更广泛意义上的数据共享。”
武永卫教授介绍会将云存储打造成一个基础平台,然后在这个基于数据的基础平台上开发更多的应用和服务,像现在非常普遍的手机上小应用一样。但是前提是要将基础平台做好,否则应用便无从谈起。“而且平台技术含量要比做应用技术含量更高,从大学的角度来说,我们更关注做系统结构,把平台做好。把平台真正做好以后,我们鼓励开放,并提供平台接口,每个人可以基于我们平台开发自己的应用,就像苹果或者国内的百度一样。我们以后肯定也要朝着这个方向努力,但目前要做的是把平台做好。”他说。
云存储底层架构
在云存储的底层架构方面,清华大学采用开源的分布式文件系统,并在此基础上,针对个人存储做了一些优化和改进,他介绍道:“针对普通用户的文件存储系统的元数据量会比较大,因此我们设计了一个分布式元数据管理系统;再比如说个人的文档文件在许多时候都需要随即修改,因此如何改善用户使用体验就显得比较重要,我们在这些方面花了比较多的时间和精力。”
此外,武永卫教授透露,在清华大学的云存储实验平台中,已开始使用自主研制的分布式文件系统。
对于分布式处理,面对的数据量通常比较大,也需要大量的硬盘,并通过软件和硬件的协作来达到稳定性、可靠性。作为非商业性的科研单位,清华大学的存储平台也是免费向校园提供使用的,因此在性能和成本的平衡方面,清华大学也有自身的考虑。“我们云存储的应用,用到了很多戴尔的存储设备,我们也通过买很多的硬盘,来扩容设备。” 武永卫教授说道。
更多资讯和高性能计算解决方案可访问高性能计算社区。