为进一步推进人工智能的发展,谷歌再放大招!
近日,谷歌宣布一个新动态,为它的NoSQL数据库服务Bigtable添加了一项超有创新性的功能,那就是通过完全托管的分层存储,帮助企业降低应用的复杂性,同时能进一步节省成本。
成本与访问之间如何实现二者平衡?
通过分析来看,谷歌这次新功能的核心玩法,就是把高性能固态硬盘(SSD)里那些不常被访问的数据,自动“搬家”到不常访问的存储区域。可别以为数据搬了家就访问不了啦,应用程序或者查询该咋访问还咋访问,一点都不受影响。这么一操作,企业数据存储成本降下来了,数据该访问还能访问,完美解决了成本和访问“两难全”的问题。
云存储分级这事儿,在降低企业成本方面其实不算啥新鲜玩意儿。但以前企业操作起来可麻烦了,得在数据库外面折腾存储分级。有分析师就说了,以后企业肯定更乐意直接在数据库里头搞存储分级。
那些一直靠高速固态硬盘“吃饭”的企业,成本压力那叫一个大。为了省点钱,只能把不常访问的数据转移到便宜点的存储介质上。可这么干也有问题,传统做法又复杂又容易有延迟。为啥呢?因为要访问冷数据,可能就得换系统,还得干等着,这延迟一上来,效率就大打折扣。
现在,谷歌现在通过同一个数据库,就能让热数据和冷数据都能被访问到,把那些麻烦事儿都给解决了。
如今,几乎所有超大规模的公司都有存储产品,像谷歌的云存储、亚马逊的S3还有Azure的Blob存储。这些产品都提供不同等级的存储,有频繁访问的(热度)、不常访问的(冷)还有归档等级的,而且都和自家的数据库产品集成。但以前那种集成模式,数据库会把冷数据扔到外部系统去,企业就得管着两个独立的系统,还得处理数据移动的事儿,访问热数据和冷数据可能还得用不同的查询方式,麻烦得很。
还有,从冷层和归档层拿数据,成本也高。就拿谷歌来说,从冷存储层和归档层取回数据,每GB分别要收0.02美元和0.05美元,这钱是用来覆盖超出运行和网络费用的存储等级取回成本的。AWS和Azure也收数据检索费,不过AWS有自动分层还不用取回费的选项,Azure有归档层。
AI工作负载成本控制的“救星”
分析师觉得,谷歌给Bigtable加的这个新能力,对搞人工智能工作负载(特别是那种有代理性的)的企业来说,意义可大了去了。现在这类企业的成本那是一路飙升,有了这个新能力可以让AI应用更省成本。
在AI Agent时代,数据就像洪水一样,向量索引啥的特别多。企业为了节省成本,就只能挑那些经常访问或者更新的矢量嵌入。可这么干,好多有价值的数据就被“晾”在一边了。
而谷歌新功能的引入,对AI Agent时代影响非同小可。因为企业产生大量数据,非常容易失控,为了省钱,就只能挑着用数据。但现在有了新功能,企业就能试试用数据(像矢量嵌入、上下文日志啥的)的新表示方式,说不定能推动人工智能再往前迈一大步。
HyperFRAME Research Walter的人工智能堆栈实践负责人斯蒂芬妮·沃尔特·西明(Stephanie Walter Simming)也说,这功能给企业提供了个“务实”的选择。企业不用花全部SSD的钱,就能扩展大量向量工作负载,且不用花更多的钱。
谷歌其他数据库也有类似“绝活”
这里得提一嘴,自动存储分级可不是Bigtable独有的本事。谷歌的分布式数据库Spanner里也有这个功能选项,今年3月就推出了。这说明谷歌在数据库存储优化这块,那是下了大功夫,全面布局、深入探索,就想着给企业提供更高效、更省钱的存储解决方案。
谷歌给NoSQL Bigtable加上分层存储功能,在企业数据存储领域那可是个大突破。它把企业在数据存储成本和复杂性方面的难题都给解决了,还给人工智能这些新兴技术发展帮了大忙。随着这功能慢慢推广应用,企业能收获更多的经济效益和发展机会!