- 阿里云EMR Serverless Spark 版正式开启商业化
阿里云 EMR Serverless Spark 版已于2024年9月14日正式商业化售卖,本文将简要介绍 EMR Serverless Spark 的产品优势、应用场景、支持地域,及计费模式等。
李代丽 · 2024-10-15 10:16 - Apache Hudi 从零到一之并发控制
对 Hudi 表的每一次提交都构成一个事务,无论是添加新数据还是执行表服务作业。并发控制旨在协调同时执行的事务,以确保其正确性和一致性,同时维持卓越的性能。
李代丽 · 2024-10-15 09:26 - 存算分离是数据架构必然趋势?
存算分离架构是一种新的数据架构的设计范式,自上而下分为数据分析层、计算层和存储层,其中计算层和存储层解耦合,都是独立的分布式服务。
李代丽 · 2024-10-12 10:45 - 如何在数据处理阶段确保数据集成效率?
在当今信息爆炸的时代,数据已成为企业和组织决策的重要依据。然而,收集到的数据往往存在各种问题,如不完整、不准确、不一致等,这些问题会严重影响数据分析的结果和决策的正确性。
李代丽 · 2024-10-12 09:51 - 亚马逊云科技正式上线Meta Llama 3.2模型
亚马逊云科技宣布,Meta的新一代模型Llama 3.2,包括其首款多模态模型,现已在Amazon Bedrock和Amazon SageMaker中正式可用。
李代丽 · 2024-10-10 10:07 - 大模型能给大数据开发领域带来什么?
随着大数据时代的到来,数据的价值日益凸显,而如何从海量数据中提取有价值的信息成为了一个挑战。AI大模型的出现,为大数据领域带来了新的机遇和变革。本文将探讨大模型在大数据领域的应用场景,以及当前落地的情况。
李代丽 · 2024-10-09 17:41 - 央企布局大模型背后,优先建设哪些场景?
国资央企正快马加鞭推动大模型布局,按照“数据为根、算力为本、以用促研”的思路,发挥各自之所长,挖掘场景之所需,探索中国特色的“大模型技术体系”。
李代丽 · 2024-10-08 17:03 - 国家数据局发布《关于促进企业数据资源开发利用的意见(征求意见稿)》
为贯彻落实党的二十届三中全会决策部署,培育全国一体化数据市场,促进企业数据资源合规高效开发利用,国家数据局会同有关部门研究起草了《关于促进企业数据资源开发利用的意见》,现向社会公开征求意见。
李代丽 · 2024-10-08 16:50 - K8s自动扩缩容工具 Karpenter 跨越1.0 里程碑
Karpenter 1.0 的发布不仅标志着其从测试阶段的成熟,也为 Kubernetes 集群的自动扩缩容管理带来了更多稳定性和功能性。
李代丽 · 2024-09-29 09:19 - 联想陈振宽:持续升级算力战略框架,推动AI算力高效赋能
在混合式AI框架中,个人大模型和企业大模型,以及在其基础上开发的个人智能体和企业智能体,将与公有大模型共存、互补,提供更加个性化的服务,同时在算力效率、成本考量、数据隐私等方面实现全面升级。
李代丽 · 2024-09-29 09:11 - 震惊!上交所系统被股民买崩,导致交易延迟
上海证券交易所(简称:上交所)发布公告称,由于大量投资者集中涌入,导致股票竞价交易系统出现异常,该交易所在第一时间就相关情况进行排查,不久后得到恢复。
李代丽 · 2024-09-27 18:13 - 数据仓库建设方案和经验总结
不论是数据同步还是数据的使用,数据治理至关重要。比如在数据同步过程中,出现了不合法的数据格式,在源库中存储没有问题,同步就会出现一些问题。另外在数据分析时,特别是数值分析,出现的数值是字符型就无法分析了。
李代丽 · 2024-09-27 09:52 - 降本70%%!金融支付公司 Yuno 的数据湖实践
Apache Hudi 是一个数据湖框架,它通过支持对大型数据集进行高效的摄取、更新和删除来简化云存储上的数据管理。它还提供增量摄取和与实时数据源的出色兼容性等优势。
李代丽 · 2024-09-23 17:30 - 从技术思维到业务视角,云架构师要像CFO一样用数据说话
在领导架构团队时,我们需要紧跟时代,进行思维转变,那就是当以CFO的财务智慧为镜,而非仅遵循CIO的技术导向。
李代丽 · 2024-09-23 15:14 - 首个云上 AI 原生全栈可观测平台来了!阿里云可观测产品全新升级
2024云栖大会,阿里云发布全新的 AI 原生全栈可观测平台,首次实现云上 AI 大模型从训练到推理再到应用的全链路实时观测、告警与诊断。
李代丽 · 2024-09-21 11:33