Red Hat, Inc. et Elastic ont annoncé une collaboration élargie pour offrir des expériences de recherche de nouvelle génération prenant en charge les modèles de génération augmentée de récupération (RAG) en utilisant Elasticsearch comme solution de base de données vectorielle privilégiée intégrée à Red Hat OpenShift AI. Avec cette collaboration, Red Hat et Elastic fournissent aux entreprises les outils dont elles ont besoin pour fournir, maintenir et affiner les solutions RAG au fil du temps sur une plateforme unique et cohérente. Alors que les organisations sont confrontées à la double demande d'ajouter des solutions d'IA à leurs opérations tout en minimisant les risques, RAG occupe le devant de la scène pour l'intégration de grands modèles de langage (LLM) dans les applications d'entreprise.

RAG permet aux équipes informatiques de combiner les avantages des LLM avec des magasins de données privés pour former des modèles avec des données ciblées et privées sans modifier le modèle sous-jacent lui-même. Une recherche efficace est essentielle, car il peut s'avérer coûteux de demander aux LLM les informations correctes en utilisant des référentiels privés à grande échelle. La récupération avec des contrôles basés sur les rôles permet de maintenir les protections autour des données sensibles tout en les utilisant pour former des LLM à usage général. Red Hat OpenShift AI et Elasticsearch peuvent aider les organisations à tirer le meilleur parti de RAG au niveau de l'infrastructure MLOps et de l'application.

Red Hat OpenShift AI fournit une plateforme d'opérations d'apprentissage automatique (MLOps) fiable pour automatiser, construire, régler, déployer et surveiller les modèles à l'échelle. Parallèlement, Elasticsearch fournit une base de données vectorielle et une solution de recherche hybride robuste pour la mise à l'échelle et l'extraction des réponses de l'IA, avec des fonctions de recherche et de sécurité avancées pour rendre les résultats plus applicables aux utilisateurs finaux. Red Hat prend en charge les outils Elasticsearch pour les développeurs d'applications RAG et d'IA générative (GenAI) à l'aide d'Elasticsearch Relevance EngineTM (ESRETM), qui comprend une recherche vectorielle intégrée et des modèles de transformation, permettant aux développeurs de créer une recherche de nouvelle génération avec des données d'entreprise propriétaires.

ESRE permet aux organisations de créer des déploiements optimisés pour la sécurité en utilisant leurs données structurées et non structurées propriétaires, et permet aux développeurs de créer des applications de recherche sémantique et de RAG en utilisant une variété de modèles d'apprentissage machine (ML) tiers, ainsi que des outils de l'écosystème de fournisseurs tels que Cohere, LangChain et LlamaIndex. Red Hat OpenShift AI associé à Elasticsearch permet un support client plus approfondi et plus complet, ainsi qu'une innovation et une intégration plus poussées avec le vaste écosystème de partenaires IA de Red Hat. Les implémentations réussies de GenAI contribuent à renforcer la confiance dans les solutions d'IA, ce qui entraîne une plus grande adoption de l'IA et, en fin de compte, un plus grand choix d'utilisateurs sur le marché de l'IA.

Cette extension de la collaboration existante entre Red Hat et Elastic illustre l'impact positif que l'IA peut avoir sur les applications d'entreprise et sur le marché en général. En rencontrant les entreprises là où elles en sont dans leur adoption de l'IA, Red Hat les aide à exploiter des données souvent sous-utilisées, ce qui peut constituer un facteur de différenciation majeur pour les organisations.