3 信息管理的需求
云服务即便被“矮化”叙述为一种通常基础设施服务,其海量数据、高性能/高访问量以及低成本也是一个不可忽视的特性。每年全球新产生的数据急剧增长,然而只有当这些数据被有效地组织和管理后,它们才具有真正的价值。这是非常简单的道理,EMC 内容管理与归档(CMA)部门主管Mark Lewis有个形象的比方。我们每个人都希望拥有一个大车库,但是如果车库里东西太多又杂乱无章地放置,要找某个工具偏偏找不着,不得不去超市买个新的,那么这个车库的价值就大打折扣了。信息同样如此,如果我们能对存储在数据中心的信息进行有效的组织和管理,提供对信息的无远弗届的访问能力,那么这些信息的价值将大大增加。
云中信息管理第一个要求就是确定哪些信息是需要保存的。Mark Lewis认为,如果数据本身价值超过了保存它们所需要的代价,那么留下它们就是划算的。苹果的iTune就是一个合适的例子,那些一年只有一次下载量的歌曲都值得被保存在服务器上。每首这样的歌曲能够提供98美分的利润。当然保存数据有不同的代价,通过分层的数据存储架构,那些价值较低,需要保存多年的数据可以被转移到相对便宜的存储当中。
显然,要解决的第二个问题就是信息的价值评估,即如何将需要保存的数据按照其价值分级。价值评估通常要受到公司政策和国家法规的影响,需要提供基于策略的信息管理。对于信息的重要性和价值,公司通常有很多复杂的策略。有些公司认为访问频繁的数据更有价值,有些公司认为数据的创造者表明了其价值,比如技术公司的CTO创建的文档就可能要比其他人的文档更重要一些。不同的公司往往根据其业务性质而采用不同的策略。类似的,有些国家对企业数据有严格的法律规定。比如美国规定如果消费者订阅了某种服务,相应的记录必须保存多年,北欧的国家规定如果客户取消了他在某家企业的账户,那么企业必须保证删除他的个人数据。又比如Data Islandia,冰岛的一家数据保存服务商用物理隔离的方法来保证来自不同国家的数据不被混在一起。该公司业务是保留用户硬盘,分部于全球用户的磁盘在被空运到冰岛的路上就被装入不同的集装箱,有美国集装箱,欧洲集装箱等等。种种规定不一而足。除此以外,如果数据在多个应用之间共享,那么在不同应用中其价值可能差别很大。因此,数据本身和它的价值评估策略必须区分开来,数据本身必须是自描述的(self-descriptive),除了安全上的考虑,数据本身不能强加任何限制策略。只有这样,整个数据存储架构才能适应多方面的需求。这个过程可能是长期的,公司的利益考虑和国家法律都会成为设计灵活数据存储架构的动力。
云服务提供信息管理服务的另一个问题就是如何找到需要的信息。要高效的找到某条记录,必须依靠它的元数据。使用XML等格式来标注信息是非常必要的。要标注大量已有数据通常需要大量的人力物力投入,有些数据甚至都不是电子版的。在那些跨国企业中,元数据很可能需要用多种语言标注。一种简单的策略是只标注那些被用到的数据,至于其他的数据,还是让它们过期吧。有了元数据,用户就可以对数据进行多维的检索。在药品行业,你可以通过药品名称,适应症等多种维度来检索需要的药品,这往往比传统的关键词检索更有效率。元数据相比数据本身的另一个优势是,元数据是可以移动的。根据某些国家的规定,数据本身不能转移,而在某些情况下,企业需要对数据进行全盘的管理。这时候元数据就可以代替数据,被移动到需要的位置。
上述问题是云环境下,企业进行用户信息管理所需要解决的一般性问题。但是如果这些用户本身就是企业的职员,那么问题就更加复杂了。因为在这种情况下,企业不仅需要为管理用户的信息,还需要提供一个帮助用户分享资源,协同工作的环境。一个简单的例子就是公司内部的维基百科(Wikipedia)。在这种“内云环境”下,资源的共享程度比“外云环境”更高,对信息权限的控制也更为严格。任何一个用户都可以在自己权限范围内对公有信息进行有效地管理,而且信息的更新需要及时通知那些相关的用户。一般意义上的云信息管理不能完全满足这种附加需求。EMC的Documentum推出了转为企业用户定制的具有云特性的信息管理平台。它提供了一系列措施,来帮助用户既高效,又安全地管理他们需要知道的信息。