AWS 今日通過其 SageMaker 和 S3 Tables 工具推出新服務,承諾提供更加規范且具有成本效益的 AI 數據管道。
作為圓周率日貢獻的一部分,這家云計算巨頭宣布 SageMaker Unified Studio 正式發布。AWS 分析副總裁 Sirish Chandrasekaran 向 Blocks and Files 表示,這是一個集成了 AWS 數據分析和 AI/ML 服務的單一開發環境。
它整合了該公司的 Lakehouse 平臺和作為治理層的 SageMaker Catalog。"通過這個工作室,你可以在同一個地方完成從 SQL、分析、數據準備、數據集成、模型構建到生成式 AI 應用開發的所有工作。"
他表示,SageMaker AI 增加了新模型,如 Claude 3.7 Sonnet 和 Deepseek R1。
"我們為 Anthropic、Meta 和 Amazon 的特定模型添加了對延遲敏感的推理功能。我們還簡化了如何使用 Bedrock 來開發原型應用程序并在團隊成員之間共享的方式。"
AWS 還宣布可以在 SageMaker Lakehouse 中訪問 S3 Tables。"現在你可以運行 SQL、Spark 作業、模型構建和生成式 AI 應用。你可以將 S3 Table 數據與 Lakehouse 中的其他數據結合起來,無論是在 Redshift 中的原生分區 S3 數據,還是本地和聯邦數據源,都可以整合在一起。"
他表示,這些都將幫助使用 AWS 服務的公司為其 AI 項目建立更好的數據基礎。
"我們的觀點是,差異化是通過數據實現的,因為每個現代企業都是數據企業,而對你公司來說獨特的就是你的數據。"
他說:"我們越來越多地看到,數據孤島正在減緩客戶的發展速度",這是因為在同一位置匯集數據或不同團隊之間協作存在挑戰。同時,在其他組織中,這些孤島正在變得模糊。
顯然,一些公司正在急于整合數據以投入 AI 領域。這引發了人們對傳統數據管理規范和技能被擱置的擔憂。Chandrasekaran 表示他看到的情況恰恰相反。"我從許多公司看到的是,他們現在意識到加快發展的方式是回歸基礎。"
"我們重新構想 SageMaker Lakehouse 的很大一部分是能夠在數據所在位置進行查詢。你現在不需要將數據從 Redshift 傳輸到 S3 或從 S3 傳輸到 Redshift。你可以從 Redshift 查詢 Lake 數據。"
他說這減少了數據重復,"這顯然可以節省成本,聯邦數據源也是如此。"
同時他表示,公司深刻意識到治理的需求,"但我認為這個新世界的不同之處在于,治理不再僅僅是關于合規性。它關乎信心。"這包括對 AI 項目使用和訓練可信數據的信心,"以及對你的 AI 遵守負責任 AI 使用政策的信心。"