在2023年7月,Databricks公司首次公布开发生成式AI助理的计划,现在他们已经正式推出这个新功能。
除Databricks Assistant外,该供应商还透露, AI-Generated Comments现在也可供所有客户使用。对于现有客户,这两个功能都是免费的
Databricks Assistant类似于很多分析和数据管理供应商正在开发的生成式AI聊天机器人,使客户能够使用自然语言来准备和分析数据,以及开发数据和人工智能产品,而不需要使用代码。 AI-Generated Comments是Databricks Unity Catalog的一部分,可与Databricks Assistant一起工作,利用生成式AI来描述数据表和列,以提高人工智能生成的响应的准确性。
BARC U.S分析师Kevin Petrie表示,供应商在发布Databricks Assistant等工具并推出预览版后,下一步通常是全面提供给所有客户,而让生成式AI工具普遍可用很重要。
他说:“AI Assistant和AI Comments都已经全面推出,这表明我们正在超越供应商炒作的阶段,进入生产产品和主流部署阶段。”
Databricks推出其人工智能助理的时机在很大程度上与其他数据平台供应商保持一致。
例如,微软在Fabric的Power BI中提供AI助理,AWS在多个工具中提供Q。而Snowflake的人工智能助理仍在预览中,Redshift的AWS助理和谷歌BigQuery中的Gemini也处于预览中。
然而,Constellation Research公司分析师Doug Henschen表示,由于大多数人工智能助理相似,生成式AI的时代才刚刚开始,一个供应商是否比另一个供应商更快地将其人工智能助理推向市场,这并不很重要。
他表示:“Databricks在宣布新功能后的3到6个月内就全面推出该功能,这非常好。但现在生成式AI还处于早期阶段,我觉得,从现在起一年后,没有多少人会记得哪个供应商最先全面提供AI助理,这也不会带来巨大的竞争差异。”
Databricks总部位于旧金山,他们是一家数据平台供应商,通过开发Delta Lake存储格式,该供应商帮助开创了数据湖屋。数据湖屋将仓库的结构化数据存储能力与湖泊的非结构化数据存储能力相结合,使用户能够整合数据,以获得对其企业的更具竞争力的视图。
自OpenAI推出ChatGPT以来的19个月里,大型语言模型的能力有了显著提高,Databricks扩展了其平台,其中包括开发生成AI模型和应用程序的环境。
为此,2023年6月,Databricks收购了MosaicML,作为现在Databricks人工智能和机器学习能力的基础。最近,在6月12日的用户会议上,该供应商宣布推出新功能,以提高模型准确性,提高数据和人工智能安全性,并降低开发生成模型和应用程序的成本。
简化和效率
长期以来,数据管理和分析供应商都在寻找方法,使其平台易于使用,并可供企业内任何员工访问,以使他们从数据中受益。
然而,他们的工具很复杂,通常需要编写代码来执行任务,还需要数据素养培训来解释输出,这阻碍这种工具被广泛使用。尽管随后出现自然语言处理(NLP)和低代码/无代码功能,但企业中只有约四分之一的员工积极使用分析来指导他们的工作。
生成式AI有可能通过实现真正的自然语言交互来改变这种情况,而过去的NLP工具的词汇量有限,仍然需要培训和专业知识才能使用。同样重要的是,生成式AI工具可以通过减少执行任务所需的代码量,使那些已经拥有数据专业知识的人更有效率。
因此,Databricks以及很多数据管理和分析供应商现在都将生成式AI作为产品开发的重点。
除了Databricks的竞争对手数据平台供应商,例如Snowflake,还有很多更专业的供应商(例如Alteryx、Alation、Informatica、MicroStrategy、Qlik和Tableau)正在开发生成式AI工具以帮助客户管理和分析数据。
大多数供应商认为使数据管理和分析更容易的最常见的功能之一是人工智能驱动的助理,AI助理可实现真正的自然语言处理(NLP)。Databricks Assistant就是这样一个工具,在6月27日普遍提供之前,其开发和预览仅用了不到一年时间。
该工具可访问企业的元数据,以开发对该企业的语义理解,随后使用户能够提出与企业具体相关的问题,并让Databricks Assistant提供准确的回复。
Databricks Assistant现在位于Databricks环境中的每个页面上,而不仅仅是几个特定位置,可用于帮助处理数据发现和建模等任务。最终,它还将生成AI和BI驱动的仪表板和图表,尽管该功能现在正在预览中。
此外,Databricks表示,该工具符合企业在Unity Catalog中建立的安全和治理标准,并符合高度监管行业中的合规标准。
Henschen说:“Databricks助理是典型的生成式AI助理。”
他继续说道,与数据管理供应商开发的大多数其他人工智能助理一样,Databricks Assistant面向管理员、数据科学家、数据工程师和高级用户。
Henschen说:“最大的好处是节省时间和提高生产力。”
Databricks在一篇博客文章中宣布正式推出该AI助理和AI-Generated Comments,该供应商表示,在公共预览期间,Databricks Assistant每月有15万名活跃用户,这些用户报告生产力提高了50%。
Petrie表示,鉴于广泛使用和提高效率的潜力,使Databricks Assistant普遍可用非常重要。
然而,他说,鉴于Databricks免费提供这些工具,而不是为其使用收取额外费用,这可能意味着在生成式AI开发的这种早期阶段,提供生成式AI功能既与营销有关,也与创造利润有关。
此外,Petrie指出,虽然NLP工具降低了处理数据所需的技术技能,但检查所有生成式AI所生成内容的准确性至关重要。
他指出:“Databricks表示,通过减少所需的技术技能(特别是编码),这些GenAI功能将来使数据管理民主化。虽然这是真的,但我相信所有这些功能仍然需要人类专家的监督、检查和事实核查。否则,生成式AI可能将错误带入生产中。”
Databricks Assistant是生成式AI驱动的界面,客户可以通过它来利用数据,而AI-Generated Comments是一个幕后功能,主要提供相关信息以告知响应。
通过为表格和列添加描述性注释,客户可以提高生成式AI输出的准确性。然而,如果手动添加此类评论,则是费力的过程。 AI-Generated Comments 使用人工智能自动填充这些描述。
下一步
随着Databricks Assistant和AI-Generated Comments现在普遍可用,Henschen表示,Databricks明智的做法是继续添加生成式AI功能,使其工具更易于使用。
当Databricks大约十年前首次推出其平台时,他们的平台主要是针对技术专家。其用户通常是开发复杂模型和应用程序的数据科学家,而不是自助业务分析师。
然而,竞争对手Snowflake在首次开发其平台时将易用性作为优先事项。尽管Snowflake没有像Databricks那样优先考虑生成人工智能,但在吸引潜在新客户时,它的优势在于没有技术专业知识的用户同样可以访问。
因此,Databricks在简化其工具使用方面做得越多越好,最近他们还宣布支持无服务器操作,以简化管理。
Henschen说:“AI助理可以推动更多人使用该平台,因此更多针对商业用户的生成式AI功能将有所帮助,特别是在AI/BI方面。”
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
作者
翻译
相关推荐
-
Oracle Exadata更新提升性能以满足AI需求
甲骨文的Exadata平台的最新版本现已普遍可用,此次更新带来性能提升,主要针对AI、分析和在线事务处理工作负 […]
-
人类监督使自动化数据治理成为可能
并非数据治理的所有方面都应该自动化,但你可以部署AI和机器学习,在仔细的人工监督下自动执行重复和耗时的合规检查 […]
-
MySQL与PostgreSQL:两款主流开源数据库对比
MySQL和PostgreSQL是两款最流行的开源SQL数据库,两者都可以很好地作为通用数据库。在这两者之间, […]
-
Java、JDBC和Postgres
现在越来越多的企业开始部署PostgreSQL,为什么呢?当你看到这个许可开源数据库所提供的功能,你就不会对此 […]