的用数面 ,大模型之道规划落地背企业级AI
文|白 鸽。数 。企业
生成式AI对国际的划落雕琢,在数据上表现得酣畅淋漓。地背的用
跟着AI大模型年代的面大模型到来,非结构化数据(图片、数音视频等)比重日益添加。企业IDC数据显现 ,划落2025年非结构化数据现已占有整个已知数据的地背的用90%以上 。
为了让AI更好地辨认和了解这些数据 ,面大模型一场环绕数据的数“向量化”革新正在悄然打开。
以最重要的企业查找场景为例 ,Data x AI年代企业的划落需求正在发生改动。曩昔,地背的用查找只需求做好全文检索、面大模型结构化查找分词等“要害词查找”,但现在的用户需求现已变成了向量查找 、语义查找、多模态混合查找等等,“猜你要搜”“图片查找”都成了常态 。
举个最简略的比如,之前咱们手机相册找相片 ,不能用要害词查找,就算用户体会最好的苹果手机,也最多只能按“人脸辨认”的人物分类。但现在咱们都能够用要害词来寻觅相片 ,本质上,便是图片在数据层面 ,做到了“向量化”。
这个看似纤细的改动,却是在数据层面满意掀起一场巨浪的蝴蝶效应。
OceanBase(以下简称OB) CTO杨传辉以为,AI对数据库的改动正在呈现在两个方面