Bitban Technologies ha integrado en su CMS un sistema de IA que entiende el lenguaje y transforma la forma en que los medios acceden a sus archivos. Búsquedas semánticas, recomendaciones y organización inteligente de la información permiten a los periodistas trabajar con mayor rapidez y enriquecer sus contenidos. Así lo explicó Jesús Serrano, responsable de IA de Bitban Technologies, en una charla con Codely, que resumimos en este artículo.
Hasta hace bien poco, buscar en un archivo periodístico era una tarea lenta y, muchas veces, frustrante. Los redactores dependían de motores de búsqueda basados en palabras clave, probando distintas combinaciones para encontrar la información adecuada.
En la actualidad, la inteligencia artificial ha cambiado las reglas del juego. Gracias a técnicas como los embeddings y la búsqueda semántica, los gestores de contenidos, como es el caso de bCube CMS, son capaces de comprender el significado de una consulta y devolver resultados relevantes, aunque no contenga las palabras exactas.
Esto supone un salto enorme para el trabajo en las redacciones: localizar antecedentes de un caso judicial, seguir la evolución de un tema durante décadas o evitar repetir enfoques ya publicados es ahora más rápido y eficiente, gracias al lenguaje natural.
Pie de foto: Jesús Serrano durante el encuentro virtual con Rafa Gómez Casas, cofundador de Codely.
En una reciente charla organizada por Codely (plataforma de formación online para programadores), Jesús Serrano, Team Leader de IA en Bitban Technologies, desgranó cómo funciona este cambio dentro de bCube CMS, nuestro gestor de contenidos especializado en medios de comunicación. (Puedes ver el episodio completo en el canal de YouTube de Codely).
Serrano explicó cómo la IA no sólo genera texto, sino que se convierte en una herramienta de búsqueda, clasificación y contextualización que permite a las redacciones trabajar con mayor rapidez y precisión, y contar mejores historias.
Bitban lleva más de 15 años proporcionando infraestructura tecnológica a grandes medios de comunicación como RTVE, Mediaset, elDiario.es o Prensa Ibérica. Esto significa millones de noticias acumuladas durante décadas. Organizar y recuperar este caudal informativo ha sido siempre un desafío: la IA lo está resolviendo con búsquedas semánticas y embeddings.
Los embeddings son representaciones matemáticas del lenguaje que permiten aproximar el significado de palabras, frases o documentos para calcular similitudes. Al transformar el texto en vectores, un sistema de IA puede calcular similitudes de forma mucho más precisa que con una búsqueda tradicional. (ver nuestro glosario de términos sobre inteligencia artificial y su aplicación en el periodismo).
Esto permite, por ejemplo:
En vez de limitarse a “coincidencias exactas”, el CMS aproxima la intención de la consulta y devuelve resultados relevantes. Según explicó Jesús a Rafa Gómez Casas, cofundador de Codely, hemos pasado de búsquedas tradicionales basadas en palabras clave, a un sistema que entiende realmente el contenido. Los embeddings están cambiando por completo el paradigma de búsqueda.
Pie de foto: captura de bCube Assistant, el asistente de IA de bCube CMS. Ejemplo de consulta semántica.
Con esta solución, el redactor puede elaborar un artículo preguntando al sistema (mediante un sencillo chatbot, en el mismo editor de la noticia) por contenidos relacionados que estén en la base de datos del CMS, e incorporarlos fácilmente en la edición del texto. Esto conlleva un ahorro considerable de tiempo para el periodista, que ya no necesitará probar combinaciones de palabras clave para encontrar material de archivo: bastará con formular una pregunta o consulta en lenguaje natural y el CMS devolverá la información más relevante.
Así, el artículo se reforzará con contexto histórico, citas o fuentes previas, y evitará redundancias, al no repetir enfoques ya publicados. Un valor añadido al trabajo editorial que mejora el archivo como herramienta de investigación periodística, favorece la creación de especiales temáticos o líneas cronológicas y permite comparar narrativas a lo largo del tiempo.
Para un redactor de un medio, los embeddings convierten el archivo en una base de conocimiento viva y navegable por conceptos, en vez de un simple buscador de palabras.
Una de las claves técnicas del sistema es el chunking, es decir, dividir cada texto en fragmentos de alrededor de 2.000 caracteres. De cada bloque se genera un embedding, que se almacena en una base de datos especializada en el manejo de vectores.
Además de ganar en eficiencia, esta técnica permite que el sistema responda con rapidez y precisión a consultas concretas: en lugar de devolver un artículo completo, ofrece el párrafo o fragmento relevante. Asimismo, evita duplicidades, optimiza el almacenamiento y reduce costes.
Fuente: presentación de Jesús Serrano.
Según recalca nuestro líder de IA, en apariencia este flujo de trabajo es sencillo, pero muy poderoso en la ejecución. Cada vez que se publica una noticia en el CMS, se activa un proceso que la divide en fragmentos, genera embeddings y los almacena en una base vectorial. De este modo, cada artículo queda “indexado semánticamente” en cuestión de segundos, a través de sus fragmentos convertidos en embeddings. Bitban trabaja con Milvus, base de datos especializada en vectores, que permite escalar y mantener controlados los costes, al ser una solución diseñada específicamente para este tipo de operaciones.
Tradicionalmente, los medios digitales han confiado en motores de búsqueda como Elasticsearch, que funcionan bien con keywords pero tienen limitaciones cuando se busca profundidad semántica. Con los embeddings, el CMS puede recomendar artículos relacionados de forma mucho más coherente.
El sistema de bCube CMS es modular y funciona con múltiples clientes de forma simultánea. Así, cada medio de comunicación puede mantener su propio espacio de datos, garantizando independencia y seguridad. Además, al ser un sistema API-first, es posible conectarlo con otros CMS distintos sin grandes complicaciones.
Para Jesús Serrano, un punto clave es la elección de modelos de embeddings. Bitban trabaja con Gemini y OpenAI, y permite que cada cliente use su propia API Key, adaptándose a los acuerdos específicos que cada medio de comunicación tiene con los distintos proveedores tecnológicos (Google, Microsoft, etc.)
La experiencia muestra que no siempre un modelo más grande es mejor. Según explica nuestro experto, a menudo, versiones más ligeras ofrecen resultados muy similares, con un coste menor. La principal diferencia radica en el orden que devuelven los resultados más cercanos. Así, la mejor estrategia es empezar con lo más eficiente (el modelo más ligero posible) y escalar sólo si es necesario.
Cada embedding generado tiene un coste económico, ya sea con OpenAI, Gemini u otros proveedores. Por ello, resulta crucial encontrar el equilibrio entre la precisión y la eficiencia. Al prescindir de almacenar datos redundantes como títulos o subtítulos en cada fragmento, se consigue reducir considerablemente la factura.
Así, la optimización no sólo es una cuestión técnica, sino también financiera. Cuanto menos embeddings innecesarios se generen, más sostenible será el sistema a largo plazo.
La charla de Jesús Serrano con Codely deja claro que la inteligencia artificial ya no es un experimento futurista: es una herramienta práctica que está transformando al periodismo. Gracias a la búsqueda semántica y a los embeddings, los redactores acceden de manera más inteligente al inmenso archivo de noticias que tienen a su disposición.
La clave del éxito está en la combinación de tres factores: un buen diseño de la arquitectura del sistema, una gestión eficiente de costes y la capacidad de escalar sin perder precisión. Lo que antes requería búsquedas manuales tediosas, hoy se resuelve con consultas naturales y resultados relevantes al instante.
Los medios que adopten estas tecnologías podrán ofrecer a su audiencia experiencias más ricas, con noticias mejor contextualizadas y recomendaciones más afinadas. Al mismo tiempo, sus periodistas dispondrán de un aliado poderoso en la redacción diaria. El futuro de la prensa digital ya está aquí, y viene acompañado de vectores, embeddings y mucha inteligencia artificial.
______
Si quieres comprobar cómo tu medio se puede beneficiar de la Inteligencia Artificial para ahorrar costes y dotar de mayor eficiencia a la redacción, te invitamos a que te pongas en contacto con nosotros y conozcas nuestra solución de IA, bCube Synapse, un copiloto editorial que entiende el estilo y las necesidades de cada medio, respetando la esencia del periodismo.
Nuestro equipo de expertos estará encantado de explicarte personalmente la herramienta, y cómo se puede adaptar a tu medio y a tus necesidades concretas.